En çok satan iki romancı, Çarşamba günü bir San Francisco federal mahkemesinde OpenAI aleyhine dava açtı ve önerilen bir toplu davada şirketin yapay zeka sohbet robotunu “eğitmek” için telif hakkı korumalı fikri mülkiyeti kullandığını iddia etti.
Yazarlar Mona Awad ve Paul Tremblay, ChatGPT’nin kısmen romanlarını izinleri olmadan “yutarak” eğitildiğini iddia ediyor. Üretken yapay zeka, geleneksel bir programlama yönteminden vazgeçen ve bunun yerine kullanıcı komutlarına doğal ve gerçeğe yakın yanıtlar üretmek için büyük miktarda metin çıkaran ve büyük dil modelleri olarak bilinen iki yazılım programı tarafından desteklenir.
İstendiğinde ChatGPT, Tremblay’in “The Cabin at the End of the World” ve Awad’ın “Bunny” ve “13 Ways of Look at a Fat Girl” şarkılarının son derece ayrıntılı özetlerini yayınladı. Her iki yazar da bunun, romanlarının sohbet robotunu eğitmek için kullanıldığının kanıtı olduğunu iddia ediyor ve dosyalama, ChatGPT’nin romanlarıyla ilgili istemlere verdiği yanıtları içeriyor.
Davaya göre, OpenAI’nin üretken sohbet robotlarını eğitmek için kullandığı malzemenin çoğu, Awad ve Tremblay tarafından yazılan ve “OpenAI tarafından izinsiz, kredisiz ve tazminatsız kopyalanan” kitaplar da dahil olmak üzere telif hakkıyla korunan çalışmalardan geliyor.
Dava, büyük dil modellerini eğitmek için çeşitli materyallerin kullanıldığını, ancak kitapların “büyük dil modelleri için eğitim veri setlerinde önemli bir bileşen olduğunu, çünkü kitapların yüksek kaliteli uzun biçimli yazının en iyi örneklerini sunduğunu” iddia ediyor.
Haziran 2018’de OpenAI, GPT-1’i BookCorpus’u kullanarak eğittiğini açıkladı. , Fantezi ve Romantik.
“Kitapları, okuyucuların ücretsiz olarak kullanabileceği yayınlanmamış romanları barındıran Smashwords.com adlı bir web sitesinden kopyaladılar. Bununla birlikte, bu romanlar büyük ölçüde telif hakkı altındadır.
Yazar Paul Tremblay.
(Alen Amato)
Şikayete göre, şirketin büyük dil modellerinin daha sonraki yinelemeleri, önemli ölçüde daha büyük miktarlarda telif hakkı korumalı kitaplar kullanılarak eğitildi. GPT-3’ü tanıtan Temmuz 2020 tarihli bir makalede şirket, eğitim veri setinin %15’inin OpenAI’nin basitçe “Kitaplar1” ve “Kitaplar2” olarak adlandırdığı “iki internet tabanlı kitap külliyatından” geldiğini açıkladı.
Dava, OpenAI’nin GPT-3 hakkındaki makalesinde ortaya çıkan sayılara dayanarak, Books1’in kabaca 63.000 başlık içereceğini ve Books2’nin yaklaşık 294.000 başlık içereceğini tahmin ediyor.
“OpenAI Dil Modelleri, Davacıların (ve diğerlerinin) çalışmalarından alınan ve içlerinde saklanan anlamlı bilgiler olmadan çalışamayacağı için, OpenAI Dil Modelleri, Davacıların izni olmadan yapılan ve münhasır haklarını ihlal eden türev çalışmaları ihlal etmektedir. Telif Hakkı Yasası.”
Yine Çarşamba günü, bir düzine anonim müşteri adına kamu yararına çalışan bir hukuk firması olan Clarkson tarafından daha geniş bir toplu dava açıldı ve OpenAI’yi “bilgilendirilmiş rızaları veya bilgileri olmadan” İnternet kullanıcılarından özel, bazen tanımlayıcı bilgileri kaldırmakla suçladı. ” Rolling Stone’daki bir habere göre. Uzmanlar, AI’nın yeni içerik oluşturmak için web’den gelen bilgileri kullanma konusunda daha usta hale gelmesiyle daha fazla davanın takip edileceğini tahmin ediyor.