(資料圖)
一些視覺藝術(shù)家已經(jīng)就使用他們的圖像作為文本到圖像生成器的訓(xùn)練數(shù)據(jù)提起訴訟?,F(xiàn)在,兩位知名小說家對OpenAI提起了他們自己的集體訴訟,指控ChatGPT和Bing Chat背后的公司侵犯了版權(quán),因為該公司涉嫌使用他們的書作為訓(xùn)練數(shù)據(jù)。這似乎是第一個因使用文本(而不是圖像或代碼)作為訓(xùn)練數(shù)據(jù)而提起的訴訟。
在2006年的一個案件中,Blake vs Google,一位作家起訴搜索引擎緩存了他的作品并通過搜索提供緩存版本。然而,美國地區(qū)法院駁回了該訴訟,認(rèn)為谷歌對數(shù)據(jù)的緩存是合理使用。Robert C. Jones法官寫道,將文件保存在緩存中是一種轉(zhuǎn)換性使用(用于確定合理使用的四個因素之一),而且它不會損害作品的潛在市場(另一個因素)。因此,僅僅是在其服務(wù)器上以緩存的形式存儲受版權(quán)保護的數(shù)據(jù)并不能使谷歌承擔(dān)責(zé)任。
然而,使用受版權(quán)保護的創(chuàng)意作品作為訓(xùn)練數(shù)據(jù),與為搜索編制索引的內(nèi)容有相當(dāng)大的不同。人們可以說,如果法律碩士能夠重復(fù)書中的關(guān)鍵細節(jié),那就是損害了這些作品的市場,它不是真正的轉(zhuǎn)化。另一方面,如果一個人寫了一本書的情節(jié)摘要,這一般不會觸犯版權(quán)法。最終,這些問題將因為像這樣的訴訟案而得到?jīng)Q定。
OpenAI并不是唯一一家使用受版權(quán)保護的材料進行培訓(xùn)甚至輸出的公司。谷歌SGE,該公司的新搜索體驗,經(jīng)常一字不差地剽竊整個句子和段落的版權(quán)。