Penggunaan Pembelajaran Mesin Tensorflow Untuk Memulihara Tulisan 1000 Tahun Kuzushiji

Penggunaan Pembelajaran Mesin Tensorflow Untuk Memulihara Tulisan 1000 Tahun Kuzushiji

Diterbitkan pada July 11, 2019 oleh .

Pada acara Solve With AI yang diadakan oleh Google bertempat di Tokyo, mereka turut berkongsi projek-projek melibatkan kecerdasan buatan yang berkaitan dengan budaya tempatan. Salah satu projek menarik adalah pemuliharaan tulisan Kuzushiji yang kini berusia lebih dari 1,000 tahun dan diambang kepupusan.

Tulisan Kuzushiji ini merupakan tulisan Jepun yang digunakan dari dahulu sehinggalah kerajaan Meiji mengubah tulisan Jepun pada abad ke 18. Terdapat berbilion dokumen yang direkodkan menggunakan tulisan Kuzushiji, namun kurang dari 0.01% yang dapat membaca ini.

 

Menurut pengkaji tulisan dan juga pengarah projek pemuliharaan tulisan Kuzushiji iaitu Tarin Clanuwat, meskipun warga Jepun pandai memelihara barangan dan alatan, namun berikutan kebolehan membaca ini tidak turun kepada generasi baru dan tidak wujud sebagai silibus pembelajaran di alam persekolahan, bakal menyebabkan tulisan yang digunakan beribu tahun lamanya ini pupus begitu sahaja.

Menyedari masalah ini, beliau cuba untuk melakukan kamus penterjemah tulisan Kuzushiji kepada tulisan Jepun moden. Menurut beliau, jika beliau berjaya himpunkan setiap pengkaji tulisan Kuzushiji yang wujud untuk menterjemah dokumen-dokumen yang ditulis dalam tulisan tersebut, ia akan memakan masa selama 500 tahun untuk setiap pengkaji tersebut selesai menterjemah.

Disini beliau melihat peluang Kecerdasan Buatan untuk melakukan proses sebegini. Dengan pembelajaran mesin yang dapat mengecam bentuk, ia dapat mempercepat proses menterjemah. Dan tujuan asas mereka termasuklah membangunkan sistem Pengecaman Huruf Secara Optikal (OCR – Optical Character Recognition) dan juga dapat mewujudkan pangkalan data yang menghimpunkan kesemua maklumat yang ditulis menggunakan Kuzushiji.

Mereka berjaya membangunkan dua komponen utama iaitu KuroNET dan pengecaman huruf Kuzushiji yang menggunakan Tensorflow. KuroNET yang dibangunkan dapat melakukan pengecaman satu muka surat yang mengandungi tulisan Kuzushiji dalam masa dua saat dan kurang dari satu jam untuk sesebuah buku. Dari segi kejituan, ia mempunyai kadar kejituan (Accuracy Rate) sebanyak 85%.

Dengan masa dua saat sahaja yang diperlukan untuk menterjemah dokumen yang ditulis menggunakan Kuzushiji, ia merupakan satu prestasi yang baik dan harus dipuji. Manfaat teknologi kecerdasan buatan disini semestinya memudahkan kerja renyah, dan tidak memerlukan ramai pengkaji mahupun masa 500 tahun lamanya (dari setiap pengkaji) untuk melakukan penterjemahan tulisan ini.

Untuk masa hadapan, Tarin turut berkongsi yang mana apa yang dibangunkan oleh beliau dan pasukan akan dapat dikongsikan dengan orang ramai. Perisian yang dibangunkan akan diberikan dalam bentuk sumber terbuka (Open Source) dan hasil dari kajian ini membolehkan jutaan dokumen yang ditulis dalam Kuzushiji boleh dibaca ramai.

Dan apabila banyak dokumen dan buku yang ditulis dalam Kuzushiji boleh dibaca ramai, ia sudah tentu dapat membuka peluang untuk meneroka budaya-budaya Jepun yang berusia beribu tahun lamanya.


TIPS & ULASAN