Dalam perlombaan untuk membangun LLMS yang paling mampu, beberapa perusahaan teknologi telah bersumber dari konten berhak cipta untuk digunakan sebagai data pelatihan, tanpa mendapatkan izin dari pemilik konten.
Banyak dari perusahaan -perusahaan itu sekarang digugat karena dugaan pelanggaran hak cipta. Daftar ini termasuk Meta, yang menghadapi gugatan class action yang diajukan oleh penulis Richard Kadrey, Sarah Silverman, dan Christopher Golden, antara lain.
Kasing ini memiliki sudut pembajakan yang jelas, karena meta menggunakan Bittorrent untuk mengunduh arsip buku bajakan untuk digunakan sebagai bahan pelatihan. Khususnya, penulis berpendapat bahwa, selain menyalin buku-buku bajakan dari arsip Anna dan Z-Library, dalam proses yang sama meta juga mengunggah buku bajakan kepada pihak ketiga.
Bulan lalu, kedua belah pihak mengajukan mosi untuk penilaian ringkasan. Gerakan Meta sangat bergantung pada pertahanan penggunaan yang adil. Sementara itu, penulis berpendapat bahwa pengunduhan jutaan buku tidak dapat diklasifikasikan sebagai penggunaan yang adil, karena sumber buku jelas melanggar hak cipta.
“Implikasi yang tidak kontroversial adalah bahwa untuk digunakan secara adil untuk diterapkan, pekerjaan yang disalin pasti telah diperoleh secara sah secara sah,” tulis para penulis.
Profesor IP mendukung argumen penggunaan yang adil meta
Minggu ini, sekelompok profesor hukum IP menyerahkan “teman pengadilan” atau brief amicus, mendukung pembelaan penggunaan yang adil meta. Para profesor, termasuk para sarjana dari Harvard, Emory, Universitas Boston, dan Universitas Santa Clara, memiliki pandangan berbeda tentang dampak AI tetapi disatukan dalam sikap hak cipta mereka.

Brief menekankan bahwa dugaan penggunaan buku bajakan Meta sebagai data pelatihan dapat dianggap sebagai penggunaan yang adil. Sumber data pelatihan tidak determinatif, selama ini digunakan untuk membuat produk baru dan transformatif, menurut mereka.
“Undang -undang kasus, termasuk preseden sirkuit pengikat, berpendapat bahwa penyalinan internal, dibuat dalam perjalanan menciptakan pengetahuan baru, adalah penggunaan transformatif yang sangat disukai oleh doktrin penggunaan yang adil,” tulis para profesor.
Penggunaan transformatif: pembajakan atau tidak
Argumen para profesor berpusat di sekitar konsep “penggunaan transformatif.” Mereka mencatat bahwa menggunakan buku -buku di luar tujuan asli 'membaca' mereka untuk membuat model AI, mengubah tujuan penggunaan. Menyalin internal ini, menurut mereka, termasuk dalam kategori pengadilan secara konsisten diakui sebagai penggunaan yang adil, juga dikenal sebagai “penggunaan yang tidak ekspresif”.
Amicus Brief mengutip beberapa kasus untuk mendukung garis penalaran mereka. Ini termasuk Sempurna 10 v. Amazon Gugatan, di mana Sirkuit Kesembilan menemukan bahwa itu adalah penggunaan yang adil ketika Google membuat thumbnail menggunakan gambar yang disalin dari situs “bajak laut” yang tidak sah, karena alat pencarian gambar yang dihasilkan transformatif.

Para penulis mengutip kasus yang bertentangan, tetapi para profesor mencatat bahwa kasus -kasus di mana penggunaan yang adil ditolak biasanya melibatkan pelanggaran hak cipta terkait dengan konsumsi pribadi, daripada menggunakan konten untuk menciptakan sesuatu yang baru.
Brief membedakan kasus ini dari yang dikutip oleh penggugat, yang melibatkan penyalinan tidak sah untuk penggunaan konsumtif langsung (misalnya, mengunduh untuk kenikmatan pribadi). Sebaliknya, salinan internal Meta diduga tidak dirasakan oleh manusia tetapi digunakan untuk membangun alat baru.
“Penggunaan yang adil, seperti hak cipta secara keseluruhan, 'bukanlah hak istimewa yang disediakan untuk yang berperilaku baik',” catatan singkat. “Doktrin Penggunaan yang Adil harus fokus pada konsekuensi dari keputusan untuk pengetahuan dan ekspresi. Pertimbangan lain harus ditinggalkan untuk rezim hukum lainnya.”
Komentar para profesor tampaknya berhubungan dengan penggunaan buku -buku internal Meta, sebagai materi pelatihan untuk LLMS. Perlu dicatat, bagaimanapun, bahwa penulis juga menuduh meta mengunggah buku-buku ini ke sharer file lain sambil mendapatkan salinan mereka sendiri.
Amicus Brief tidak membahas masalah ini secara langsung, tetapi bolak-balik sebelumnya di pengadilan menunjukkan bahwa mengunggah kemungkinan akan menjadi titik pusat pertengkaran saat kasusnya bergerak maju.
'Pelanggaran hak cipta bukanlah jawabannya'
Amicus Brief sebagian besar ditargetkan untuk potensi penggunaan buku sebagai input pelatihan, yang diakui oleh Meta dan perusahaan lain. Apakah ini adalah penggunaan yang adil adalah pertanyaan kunci yang harus diputuskan oleh ini dan pengadilan lainnya.
Negara -negara lain, termasuk Jepang, dilaporkan telah membuat pengecualian dalam undang -undang mereka untuk memungkinkan perusahaan teknologi melatih LLM pada materi yang dilindungi hak cipta, tanpa izin.
AS tidak memiliki pengecualian seperti itu, tetapi para profesor mendesak pengadilan untuk mempertimbangkan penggunaan yang adil. Seperti yang ditunjukkan oleh VCR dan inovasi lainnya, hak cipta seharusnya tidak menghalangi alat baru dan mengembangkan teknologi.
“Pemilik hak cipta sering meramalkan bahwa teknologi baru, dari fotokopi ke rumah VCR ke internet, akan menciptakan bencana bagi pemilik hak cipta dan bahwa penggunaan yang adil perlu menyusut untuk melindunginya; sebagai gantinya, teknologi baru telah dibuat secara rutin
Pasar baru, ”tulis mereka.
“Apa pun risiko AI-dan mungkin ada banyak-membuat tindakan menciptakan set data pelatihan skala besar sebagai pelanggaran hak cipta bukanlah jawabannya.”
– –
Salinan Amicus Curiae Brief yang diusulkan, yang diberikan oleh pengadilan kemarin, tersedia di sini (PDF)