ChatGPT dilatih menggunakan data sehingga tahun 2021. Oleh sebab itu jawapan yang diberikan kadang kala kurang tepat dan mungkin ketinggalan zaman. Bagi menyelesaikan isu ini, OpenAI menghasilkan GPTBot yang melakukan carian internet bagi mendapatkan maklumat yang terkini. Tetapi muncul isu etika apabila data daripada laman bukan milik OpenAI digunakan tanpa kebenaran untuk melatih ChatGPT.
Bagi mengelakkan isu ini daripada berulang dan juga mengelakkan diri mereka berhadapan dengan lebih banyak saman penyalahgunaan harta intelek, OpenAI kini memberikan kuasa kepada pemilik laman untuk menghalang GPTBot. Dengan memasukkan fail teks Robots.txt atau menghalang alamat IP, GPTBot tidak lagi boleh membaca kandungan pada laman tanpa kebenaran.
Penggunaan data terbuka untuk melatih kecerdasan buatan menjadi isu hangat sejak setahun kebelakangan ini. Ia adalah antara sebab mengapa Elon Musk mengenakan sekatan sementara di Twitter kerana beliau mendakwa data pengguna digunakan untuk melatih AI. Dalam kes saman yang difailkan di Amerika Syarikat pula, beberapa penulis mendakwa OpenAI menggunakan ribuan buku untuk melatih ChatGPT tanpa memberikan pampasan.