Google Imagen Video Dan Phenaki Ialah Dua Kecerdasan Buatan Menjana Video Dari Teks

Diterbitkan pada Okt 6, 2022. Diubah suai kali terakhir pada . oleh .

Terdapat beberapa kecerdasan buatan yang boleh menjana imej dengan DALL.E dan Stable Diffusion merupakan dua yang paling dikenali. Minggu lalu Meta memperlihatkan Make-A-Video yang menjana video dari teks yang diberikan pengguna. Tidak ketinggalan hari ini ialah Google yang mengumumkan dua kecerdasan buatan dengan kemampuan yang sama.

Imagen Video dan Phenaki yang dibangunkan serentak boleh menjana video pendek berdasarkan input teks yang diberikan oleh pengguna. Imagen Video menjana video menggunakan sistem Imagen yang sebelum ini hanya menjana imej. Sebanyak 16 bingkai gambar pada kadar 3FPS dijana oleh Imagen Video pada resolusi 24×48 pixel. Ia kemudiannya dinaik taraf ke 128 bingkai, 24PFS pada resolusi 720P menggunakan kecerdasan buatan.

Menurut Google, Imagen Video turut mempunyai satu kelebihan dimana ia boleh memahami arahan apabila disuruh menjana teks dalam video oleh pengguna. Ciri yang masih belum mampu dilakukan kecerdasan buatan yang menjana imej serta video yang lain.

Phenaki pula boleh menjana video sehingga dua minit berdasarkan input teks yang lebih panjang. Sebuah video cerita pendek misalnya boleh dijana oleh Phenaki. Perbezaan antara kedua-dua kecerdasan buatan ini menurut Google ialah kualiti video Phenaki adalah lebih rendah berbanding Imagen Video.

Kerana Imagen Video dan Phenaki dibangunkan oleh Google, kedua-dua pasukan kini akan bekerjasama untuk menghasilkan kecerdasan buatan yang menjana video yang lebih baik serta berkualiti tinggi.

komen


© Amanz / 2022 Kami