Harvard University hari ini berkongsi yang mereka kelak akan menawarkan dataset berkualiti tinggi untuk hampir satu juta buku, yang boleh digunakan siapa sahaja dalam melatih model kecerdasan buatan masing-masing. Untuk tujuan ini, Harvard turut menerima dana daripada pihak Microsoft dan juga OpenAI.
Dataset berkenaan akan mengandungi buku-buku yang dikategorikan dibawah domain awam, terdiri daripada pelbagai genre, dan bahasa.
Penawaran ini dijangka akan menjadikannya sebagai asas – serta memudahkan pelbagai syarikat baharu untuk membangunkan dan melatih model masing-masing. Namun, seperti biasa, dalam mendapatkan kelebihan untuk sesuatu model, latihan dataset tambahan diperlukan yang boleh ditambah oleh pembangunnya sendiri dari semasa ke semasa.