Kecerdasan Buatan Yang Menghasilkan Peta Kedalaman 3D Dari Gambar 2D Dibangunkan

Diterbitkan pada Ogos 27, 2021. Diubah suai kali terakhir pada . oleh .

Sensor 3D ToF mula digunakan pada telefon pintar bagi membolehkan kesan bokeh yang lebih realistik dihasilkan dalam gambar yang diambil. Maklumat 3D ini disimpan pada data meta gambar bagi membolehkan gambar disunting di kemudian hari untuk kesan bokeh yang berbeza. Teknologi ini masih lagi baharu menyebabkan berbilion gambar dua dimensi yang telah diambil tidak mempunyai data meta tersendiri.

Tetapi penyelidik dari Simon Fraser University di Kanada berjaya menghasilkan kecerdasan buatan mengesan kedalaman dari imej dua dimensi semata-mata. Teori yang digunakan ialah mata manusia boleh membezakan imej latar belakang dengan di hadapan dengan membezakan saiz objek secara relatif. Menggunakan rangkaian neural, kecerdasan buatan diajar untuk membezakan saiz objek untuk menghasilkan peta kedalaman secara

anggaran.

Yang menariknya ialah apabila imej resolusi rendah digunakan untuk mengajar, kecerdasan buatan lebih mudah membezakan objek di dalam gambar tetapi tidak begitu baik untuk melihat keperincian objek seperti jari-jari pada roda motosikal. Imej resolusi tinggi menghasilkan peta kedalaman yang terperinci tetapi sukar membezakan objek yang rata. Oleh itu bagi menghasilkan peta kedalaman 3D yang tepat, sistem perlu memproses imej resolusi rendah dan resolusi tinggi secara serentak. Peta kedalaman 3D bukan sahaja boleh dijana dari gambar tetapi juga dari lukisan.

Bagi yang berminat untuk mengetahui lebih lanjut mengenai teknik yang digunakan, kertas kajian boleh diakses menerusi pautan ini.

Komen sekarang

komen

© Amanz / 2021 Kami