Terdapat beberapa model bahasa raya (LLM) di pasaran hari ini – termasuk dalam bahasa Inggeris dan bahasa Malaysia. Menambah kepada penawaran, kini sekumpulan pengkaji di UAE hadir dengan penawaran bahasa raya Arab dalam bentuk sumber terbuka, dinamakan Jais.
Ia dinamakan Jais, bersempena dengan nama puncak gunung tertinggi di UAE. Projek ini merupakan usahasama diantara beberapa pihak, termasuk universiti di sana yang memfokuskan kecerdasan buatan.

Model bahasa raya Jais ini hadir dengan 13 bilion parameter, yang mana merupakan kombinasi bahasa Arab dan juga Inggeris. Gabungan digunakan dalam melatih model ini, disebabkan kekurangan data dalam Arab buat masa ini. 13 bilion parameter ini dilatih melibatkan 116 bilion token data berbahasa Arab dan 279 bilion token data berbahasa Inggeris.
Penawaran Jais dalam bentuk sumber terbuka dijangka memberi perkembangan arena kecerdasan buatan dalam bahasa Arab, sekaligus membawa pembangunan yang memudahkan lebih 400 juta pengguna bahasa Arab di dunia.
Bagi anda yang berminat, boleh menyemak laman rasmi Jais dalam mempelajari lanjut berkaitan penawaran dan kertas teknikalnya, atau menyemak laman Hugging Face untuk melihat kod sumber Jais.