OmniHuman-1 Oleh Bytedance Boleh Menjana Video Palsu Dengan Hanya Sekeping Gambar

OmniHuman-1 ialah sebuah lagi model kecerdasan buatan (AI) generatif yang boleh menjana video palsu dengan mudah. Untuk menjana sebuah video palsu, OmniHuman-1 hanya memerlukan sekeping gambar dan satu sampel audio. Dalam demo yang dikongsi oleh penyelidik, video CEO NVIDIA Jensen Huang menyanyi telah dihasilkan berdasarkan gambar beliau ketika memancarkan GPU H200.

Model telah dilatih menggunakan kandungan video sepanjang 19,000 jam. Selain menjana video baharu berdasarkan gambar, OmniHuman-1 juga boleh menyunting video dengan perubahan dilakukan pada pergerakan asal dan audio asal. Contohnya ialah seperti video di bawah di mana audio nyanyian asal Taylor Switft digantikan dengan beliau kini menyanyikan lagu dalam bahasa Jepun daripada sumber audio berasingan. Pergerakan tubuh dan mulut diselarikan dengan audio baharu dengan cukup baik.

Menurut Bytedance lagi, OmniHuman-1 turut boleh menjadi video pada pelbagai saiz nisbah skrin dan juga lebih baik dalam menghasilkan pergerakan tangan yang realistik berbanding model-model AI menjana video sebelum ini. Kualiti video yang dijana adalah bergantung kepada kualiti gambar yang digunakan sebagai sumber. Untuk mencuba OmniHuman-1, sila ke laman GitHub rasmi di bawah.

[sumber] OmniHuman-1 [/sumber]

OmniHuman-1 Oleh Bytedance Boleh Menjana Video Palsu Dengan Hanya Sekeping Gambar

Komen