Carian
Google Menggunakan Data Google Docs dan Sheets Pengguna Untuk Melatih AI
April 8, 2024 Effi Saharudin

Pagi tadi OpenAI dilaporkan menggunakan transkrip lebih 1 juta jam video daripada YouTube untuk melatih GPT-4 tanpa kebenaran Google atau pemilik kandungan. Google turut mengaku melakukan perkara yang sama tetapi ia selari dengan terma dan syarat YouTube. Tetapi Google juga didapati menggunakan data pengguna Google Docs dan Google Sheets untuk melatih AI mereka.

Terma dan syarat polisi privasi Google telah dikemaskini pada Julai 2023 yang membolehkan data pengguna perkhidmatan mereka digunakan bagi tujuan latihan AI. Google walau bagaimanapun berkata ini hanya berlalu sekiranya pengguna memberikan kebenaran untuk terlibat dalam ujian ciri-ciri baharu.

Untuk melatih model bahasa raya (LLM) yang menjadi asas kepada kecerdasan buatan (AI), bertrilion data berkualiti diperlukan. Apa yang berlaku sekarang ialah kekurangan data yang akan membuatkan latihan LLM menjadi semakin sukar dalam masa terdekat walaupun perkakasan untuk AI semakin berkuasa.

Apa yang mungkin berlalu ialah AI secara tidak sengaja dilatih menggunakan karya yang dijana oleh AI generatif. Seperti Auroboros kepala akan akhirnya menelan ekor dan AI di masa hadapan mungkin tidak akan dapat mencapai tahap AGI seperti diramalkan.

Komen