Wikimedia Enterprise kini menawarkan sebahagian set data Wikipedia kepada syarikat yang ingin menggunakannya untuk melatih model kecerdasan buatan (AI). Mereka bekerjasama dengan Keggle – sebuah anak syarikat Google – untuk menawarkan set data terpilih dalam Bahasa Inggeris dan Perancis.

Data telah dioptimasi untuk melatih model dengan ia tidak mengandungi pautan dan kod untuk memformat teks seperti yang ditawarkan di Wikpedia. Langkah menawarkan set data ini dilakukan kerana trafik laman yang dihentam teruk oleh bot yang ingin mencuri artikel bagi melatih model tanpa kebenaran. Bulan lalu Wikipedia berkata jumlah trafik yang mengakses kandungan multimedia meningkat 50% tahun lalu disebabkan aktiviti bot.
Keggle akan membayar Wikipedia Enterprise untuk menggunakan data ini. Pada waktu yang sama semua data yang digunakan akan memberikan atribut kembali di bawah pelesenan Creative Commons Attribution-Share-Alike 4.0 dan GNU Free Documentation License (GFDL).