Dalam perlombaan untuk membangun model LLM yang paling mampu, beberapa perusahaan teknologi bersumber dari konten berhak cipta untuk digunakan sebagai data pelatihan, tanpa mendapatkan izin dari pemilik konten.
Meta adalah salah satu dari daftar panjang perusahaan yang sekarang digugat karena kegiatan yang diduga melanggar ini, termasuk gugatan class action yang diajukan oleh penulis termasuk Richard Kadrey, Sarah Silverman, dan Christopher Golden. Kasing ini memiliki sudut pembajakan yang jelas, karena meta menggunakan perpustakaan buku bajakan sebagai materi pelatihan.
Meta mengakui penggunaan sumber -sumber tidak resmi ini sejak awal. Namun, pada saat yang sama, perusahaan menolak tuduhan pelanggaran hak cipta, mencatat bahwa itu akan bergantung pada pertahanan penggunaan yang adil, setidaknya sebagian.
Gugatan terbentuk
Awal tahun ini, Meta mencoba mengurangi ruang lingkup pertempuran hukum, meminta pengadilan untuk memberhentikan dua dari tiga klaim utama.
Meta berpendapat bahwa dugaan pelanggaran di bawah Akses Data Komputer Komprehensif California dan Undang -Undang Penipuan (CDAFA) tidak bertahan. Hal yang sama diterapkan pada klaim bahwa meta menghapus informasi manajemen hak cipta (CMI), yang akan melanggar DMCA. CMI adalah informasi yang termasuk dalam karya berhak cipta, yang antara lain dapat mengidentifikasi pemilik hak cipta.
Khususnya, Meta tidak meminta pemecatan keluhan pelanggaran hak cipta inti. Sebaliknya, dikatakan yakin bahwa itu dapat “membantah tuduhan tanpa jasa ini” pada penilaian ringkasan.
Untuk referensi:
Klaim 1: Pelanggaran Hak Cipta Langsung (tidak ada pemecatan yang diminta)
Klaim 2: Penghapusan Informasi Manajemen Hak Cipta
Klaim 3: Pelanggaran CDAFA
Akhir pekan lalu, Hakim Pengadilan Federal Vince Chhabria menolak klaim CDAFA, seperti yang diminta Meta. Namun, klaim penghapusan CMI selamat dari mosi untuk memberhentikan. Sementara hakim tidak percaya bahwa pengupasan data yang dilindungi hak cipta akan meningkatkan materi pelatihan, Meta mungkin telah menghapusnya untuk menyembunyikan dugaan pelanggarannya.
“[P]Laintoff telah secara memadai menuduh bahwa meta sengaja menghapus CMI untuk menyembunyikan pelanggaran hak cipta. Penggugat menuduh bahwa meta 'tahu bahwa Llama terutama' rawan 'untuk menghafal dan menghasilkan output CMI' kecuali CMI dihapus dari data pelatihannya, ”tulis Hakim Chhabria.
Akibatnya, kasus ini berlanjut dengan klaim penghapusan CMI. Namun, dalam skema yang lebih besar, klaim pelanggaran hak cipta utama cenderung menjadi masalah terpanas terpanas. Ini semakin menggeser fokus dari penggunaan buku Meta sebagai data pelatihan, ke dugaan berbagi buku -buku ini dengan pihak ketiga melalui BitTorrent.
Penulis meminta penilaian ringkasan parsial
Dalam pengajuan yang sangat dihapus, pada hari Senin penulis pindah untuk penilaian ringkasan. Mereka meminta pengadilan untuk memerintah dan meta bertanggung jawab atas pelanggaran hak cipta langsung dengan mendapatkan buku bajakan dari perpustakaan bajak laut melalui Bittorrent.
Para penulis berpendapat bahwa bukti yang tersedia, termasuk pernyataan dari karyawan meta, memperjelas bahwa perusahaan membajak jutaan karya berhak cipta.
Penggunaan yang adil bukanlah pembelaan di sini, Negara Penggugat, menunjukkan bahwa pengadilan sebelumnya telah memutuskan bahwa jenis 'pembajakan yang tidak dimitugasikan dari karya berhak cipta' ini tidak berkualitas untuk pembelaan penggunaan yang adil.

Meta dapat berargumen bahwa penggunaan buku bajakan sebagai data pelatihan AI memenuhi syarat sebagai penggunaan yang adil. Namun, penulis menunjukkan bahwa dugaan pembagian buku bajakan perusahaan teknologi dengan pengguna Bittorrent lainnya, yang khas untuk transfer torrent, jelas melanggar.
“Bahkan jika Pengadilan memutuskan bahwa analisis penggunaan yang adil berlaku untuk pembajakan Meta yang tak ternilai dan penggunaan torrenting untuk mendapatkan salinan bajakan dari buku -buku berhak cipta penggugat, itu harus memberikan ringkasan ringkasan kepada penggugat di bawah empat faktor penggunaan Meta untuk membuat miliar pirah yang lebih tinggi untuk mendapatkan milies pirah.
Elemen 'berbagi dengan orang lain' ini berada di pusat proses pengumpulan bukti penulis, di mana dugaan pengunggahan buku bajakan melalui Bittorrent mendapat perhatian besar.
Teori 'lintah'
Pada hari yang sama pekan lalu ketika Hakim Chhabria memutuskan mosi parsial untuk memberhentikan, ia juga memutuskan permintaan penulis untuk melakukan penemuan tambahan untuk mendukung klaim pelanggaran hak cipta inti mereka.
Para penulis sebelumnya menuduh meta berbagi salinan buku bajakan dengan pihak ketiga ketika mengunduh data perpustakaan bayangan melalui BitTorrent. Meta menanggapi ini dengan menyatakan bahwa itu menghindari penyemaian Data Perpustakaan Bajak Laut salah satu, tetapi itu tidak menghentikan penulis untuk menggali.
Karena “penyemaian” biasanya mengacu pada keadaan di mana pengguna Bittorrent memiliki salinan lengkap file yang diunduh, para pemegang hak menjadi tertarik pada aktivitas “lintah” Meta.
Leeching mengacu pada keadaan di mana salinan lengkap torrent belum diunduh. Namun, karena sifat protokol BitTorrent, lintah mungkin masih mengunggah bit file yang sudah mereka miliki untuk mengintip dalam kawanan yang sama. Penulis curiga bahwa meta mungkin telah melakukannya.
Penemuan tambahan termasuk istilah “lintah” serta banyak permintaan terkait torrent lainnya, di antaranya penulis berharap menemukan senjata merokok.
Lapangan bermain baru?
Sementara kasus ini dimulai dengan tuduhan bahwa Meta menggunakan buku -buku yang dilindungi hak cipta sebagai data pelatihan, kegiatan torrenting terus mendapatkan kepentingan. Ini masuk akal dari perspektif pemegang kanan karena memiliki potensi untuk mengidentifikasi pelanggaran langsung, yang cenderung tidak dilindungi oleh penggunaan yang adil.
Meta, bagaimanapun, tampak semakin frustrasi dengan perkembangan baru dalam kasus ini. Dalam tanggapannya, ia meminta pengadilan untuk membatasi penemuan mengenai “teori baru 'lintah',” dengan alasan bahwa itu belum pernah ditangani sebelumnya.
“Antara lain, penggugat tidak boleh diizinkan untuk memperkenalkan seorang ahli baru dan melaporkan topik yang baru diungkapkan tentang“ lintah ”—sisari yang tidak ditemukan dalam produksi Februari 2025 atau pengaduan ketiga yang diubah oleh penggugat,” tulis Meta.
Meta ahli mengacu pada Dr. Choffnes yang, dalam laporan ahli yang disegel, mungkin menjabarkan nuansa bittorrent dan terminologi terkait.
Penulis juga meminta dokumen dan informasi tambahan dari Meta. Ini termasuk instalasi, penggunaan, dan log konfigurasi klien torrent. Khususnya, permintaan ini dengan jelas membedakan fase penyemaian dan lintah.
Setelah mendengar kedua belah pihak, Hakim Chhabria mengizinkan penulis untuk melakukan penemuan tambahan. Dipasangkan dengan mosi kemarin untuk penilaian ringkasan, jelas bahwa aktivitas lintah Meta akan tetap berada di bawah sorotan saat kasusnya bergerak maju.
– –
Salinan pesanan dan pengajuan yang dirujuk dalam artikel ini tersedia melalui Free.Law's CourtListener.