Produk Google Penelusuran dilaporkan dapat menggunakan konten dari penayang meskipun mereka telah memilih keluar dari pelatihan kecerdasan buatan (AI). Sesuai laporan, seorang eksekutif Google DeepMind mengungkapkan informasi tersebut selama kesaksian dalam kasus antimonopoli perusahaan yang sedang berlangsung terhadap Departemen Kehakiman AS. Eksekutif tersebut dilaporkan menyoroti bahwa konten semacam itu tidak digunakan dalam model AI yang dikembangkan oleh DeepMind. Raksasa teknologi yang berbasis di Mountain View itu dilaporkan menjelaskan bahwa konten untuk pencarian dikelola oleh mekanisme terpisah yang menggunakan standar web robots.txt.
Google Mengikuti Berbeda untuk Model AI, Produk Pencarian
Menurut laporan Bloomberg, Eli Collins, Wakil Presiden Produk di Google DeepMind, mengkonfirmasi bahwa aturan untuk mematuhi keputusan penerbit untuk memilih keluar dari pelatihan AI berbeda untuk model AI dari DeepMind dan produk Pencarian perusahaan.
Pengacara yang mewakili Departemen Kehakiman dalam kasus antimonopoli, Diana Aguilar, dilaporkan menghasilkan dokumen yang menyoroti bahwa 80 miliar dari 160 miliar token yang digunakan untuk melatih model AI Google berasal dari konten yang telah dipilih oleh penerbit dari pelatihan AI. Collins dilaporkan menanggapi bahwa model DeepMind tidak menggunakan konten setelah penerbit memilih keluar dari pelatihan AI.
Namun, ketika Aguilar dilaporkan mempertanyakan apakah model Gemini AI dapat menggunakan konten yang sama jika dimasukkan ke dalam produk Penelusuran, Collins mengkonfirmasi bahwa itu “benar”, selama kasus penggunaannya berada di dalam Penelusuran. Khususnya, ini akan mencakup model Gemini yang mendukung Ikhtisar AI Google dan Mode AI yang baru-baru ini diluncurkan.
Ini berarti metode opt-out tradisional tidak cukup untuk mencegah Google menggunakan konten dari penayang. Raksasa teknologi itu telah memperbarui kebijakan privasinya pada Juni 2023 untuk mencerminkan bahwa mereka akan menggunakan semua data Internet yang tersedia untuk umum untuk melatih model bahasanya. Di sini, data Internet yang tersedia untuk umum mengacu pada situs web apa pun yang tidak memiliki paywall atau halaman pendaftaran wajib, membatasi aksesnya ke publik.
Seorang juru bicara Google kemudian mengatakan kepada Bloomberg bahwa aturan untuk alat AI berbasis Pencarian berbeda, karena penerbit hanya dapat “menolak data mereka digunakan di Search AI jika mereka memilih untuk tidak diindeks untuk pencarian.” Penayang dapat melakukannya dengan menonaktifkan standar web robots.txt yang memungkinkan bot crawler Google mengakses konten untuk mengindeksnya di hasil penelusuran.
Namun, ini juga akan memastikan bahwa halaman web ini tidak muncul ketika pengguna menggunakan mesin pencari Google untuk mencari topik. Ini secara efektif membuat penerbit tidak memiliki pilihan selain menerima perusahaan melatih model AI-nya pada data tersebut.
Kasus antimonopoli yang sedang berlangsung berusaha membuktikan bahwa Google memiliki monopoli di ruang pencarian dan AI. Amit Mehta, seorang Hakim Distrik AS yang memimpin kasus ini, didesak oleh Departemen Kehakiman untuk memaksa raksasa teknologi itu menjual Google Chrome dan membagikan data yang digunakannya untuk menghasilkan hasil pencarian. Namun, tidak ada tindakan seperti itu yang disarankan untuk produk AI perusahaan.