Pemilik situs web memiliki mekanisme sederhana untuk memberi tahu Kecerdasan Apple bukan untuk mengikis situs guna keperluan pelatihan, dan kabarnya platform besar seperti Facebook dan New York Times menggunakannya.
Apple telah menawarkan penerbit jutaan dolar untuk hak untuk menghapus situs mereka, berbeda dengan Google yang percaya bahwa semua data harus tersedia secara bebas untuk melatih modul bahasa AI yang besar. Sebagai bagian dari ini, Apple menerapkan sistem di mana sebuah situs dapat mengatakan dalam file tertentu bahwa situs tersebut tidak ingin dicuri.
File itu adalah file teks sederhana disebut robots.txtdan menurut Berkabelbanyak sekali penerbit besar sedang memilih untuk menggunakan ini untuk memblokir pelatihan AI Apple.
Berkas robots.txt ini tidak menimbulkan hambatan teknis terhadap pengikisan, bahkan tidak juga merupakan hambatan hukum, dan ada beberapa perusahaan yang diketahui mengabaikan pemblokiran.
Kabarnya, banyak situs berita yang memblokir Apple Intelligence. Beberapa yang signifikan antara lain:
- Surat kabar New York Times
- Indonesia
- Daftar Craigslist
- Timblr
- Waktu Keuangan
- Atlantik
- Amerika Serikat Hari Ini
- Conde Nast
Dalam kasus Apple, Berkabel mengatakan bahwa dua studi utama minggu lalu menunjukkan bahwa sekitar 6% hingga 7% situs web dengan lalu lintas tinggi memblokir alat pencarian Apple, yang disebut Applebot-Extended. Kemudian studi lebih lanjut oleh Ben Welsh, yang juga dilakukan minggu lalu, mengatakan bahwa lebih dari 25% situs yang diperiksa memblokirnya.
Perbedaan ini disebabkan oleh situs web dengan lalu lintas tinggi yang diteliti. Sebagai perbandingan, studi Welsh menemukan bahwa bot OpenAI diblokir oleh 53% situs berita yang diperiksa, dan Google-Extended milik Google diblokir oleh hampir 43%.
Berkabel menyimpulkan bahwa meskipun situs mungkin tidak peduli apakah Apple Intelligence mengikisnya, alasan utama rendahnya angka pemblokiran adalah bot AI Apple kurang dikenal sehingga perusahaan tidak menyadarinya.
Namun Apple Intelligence tidak sepenuhnya bersembunyi dalam kegelapan, dan AppleBot-Extended adalah superset dari AppleBot. Itu pertama kali ditemukan oleh situs pada bulan November 2014, dan secara resmi diungkapkan oleh Apple pada Mei 2015.
Jadi selama sepuluh tahun, AppleBot telah mencari dan mengikis situs web, dan melakukannya untuk memberi daya Siri dan pencarian Spotlight.
Oleh karena itu, kecil kemungkinan pemilik situs web belum pernah mendengar tentang Apple Intelligence, dan lebih mungkin mereka pernah mendengar tentang Apple yang membuat transaksi bernilai jutaanSementara negosiasi masih berlangsung, atau mungkin akan segera dimulai, beberapa situs sengaja memblokir Apple Intelligence.
Itu termasuk Surat kabar New York Timesyang juga menggugat OpenAI atas pelanggaran hak cipta karena pengikisan AI-nya.
“Sebagaimana yang dijelaskan dalam undang-undang dan ketentuan layanan The Times, pengambilan atau penggunaan konten kami untuk tujuan komersial dilarang tanpa izin tertulis kami sebelumnya,” kata Charlie Stadtlander dari surat kabar tersebut. “Yang penting, undang-undang hak cipta tetap berlaku terlepas dari apakah tindakan pemblokiran teknis diberlakukan atau tidak.”