Perisian Dihasilkan Bagi Membuatkan Pergerakan Bibir Di Dalam Video Bergerak Mengikut Audio Yang Berbeza

Teknologi yang kami paparkan hari ini sedikit menakutkan dan pasti menimbulkan perasaan paranoid. University of Washington telah berjaya menghasilkan perisian yang membolehkan pergerakan bibir individu di dalam video diubah bagi mengikut sebarang audio yang dipilih. Dengan kata lain ini ialah “photoshop untuk video” yang selama ini dianggap hanya fiksyen filem Hollywood.

Berita baik di sini ialah bagi menghasilkan pergerakan bibir yang selari dengan audio yang dipilih, pembangun program ini meneliti 14 jam video percakapan Barack Obama. Program kemudian menggunakan teknik jaringan neural untuk menghasilkan bentuk mulut yang menepati audio yang digunakan. Mereka sedang berusaha untuk mengurangkan sampel video yang perlu dianalisis kepada sejam sahaja di masa hadapan.

Buat masa ini program mereka masih di peringkat awal dan ia akan diperlihatkan dengan lebih mendalam pada acara SIGGGRAPH 2017 yang akan berlangsung 2 Ogos hadapan.

Program ini dibangunkan untuk tujuan melancarkan panggilan video secara atas talian. Kerap kali audio di dalam panggilan video adalah jelas tetapi terdapat sela masa pada paparan video. Dengan teknologi ini, masalah yang disebutkan dapat diselesaikan. Ia turut boleh digunakan untuk membolehkan video pengolokan tokoh ternama yang telah meninggal dunia dapat dihasilkan dari contoh rakaman suara mereka.

Sebuah teknologi yang menarik telah dihasilkan. Ia mengingatkan kami kepada Project VoCo yang membolehkan audio pengolokan dihasilkan menggunakan sampel suara individu. Jika VoCo ialah “Photoshop untuk audio”, projek ini adalah “photoshop untuk video”.

Perisian Dihasilkan Bagi Membuatkan Pergerakan Bibir Di Dalam Video Bergerak Mengikut Audio Yang Berbeza

Komen