- 01 舊金山一位聯邦法官裁定,Anthropic公司使用圖書訓練其Claude大語言模型的行為,構成美國版權法下的“合理使用”。
- 02 但法官同時指出,Anthropic將這些圖書存儲在其資料庫中的行為侵犯了著作權,不屬于合理使用范疇。
- 03 該裁決是首個在生成式AI背景下,直接回應“合理使用”爭議的司法裁決,對AI行業具標志性意義。
6月25日消息,綜合路透社與美聯社報道,舊金山一位聯邦法官于周一晚間裁定,Anthropic公司在未經授權的情況下使用圖書訓練其人工智能系統,依據美國版權法屬于合法行為。
在AI行業這一關鍵問題上,美國聯邦地區法官威廉·阿爾蘇普(William Alsup)支持了科技公司的立場。他表示,Anthropic公司以安德里亞·巴茨(Andrea Bartz)、查爾斯·格雷伯(Charles Graeber)和柯克·華萊士·約翰遜(Kirk Wallace Johnson)的圖書為Claude大語言模型提供訓練數據,這一行為構成“合理使用(fair use)”。
阿爾蘇普寫道:“就像任何立志成為作家的閱讀者一樣,Anthropic的大語言模型訓練的目的,并非是要復刻或取代原作,而是要實現根本性的轉變,創造出與原作截然不同的新內容。”
不過,阿爾蘇普也指出,Anthropic將這些作家的圖書存儲在其“核心資料庫”中,侵犯了著作權,并不屬于合理使用的范疇。
針對這一裁決,Anthropic發言人及原告作家律師截至周二尚未就此回應置評請求。
去年,這幾位作家對Anthropic提起訴訟,認為這家由亞馬遜和谷歌母公司Alphabet投資的企業,未經許可和補償,使用了他們圖書的盜版版本,用于訓練Claude以響應人類指令。
這一集體訴訟是眾多類似案件之一,作家、新聞機構及其他版權方也在針對OpenAI、微軟和Meta等公司,就其AI訓練行為提起訴訟。
合理使用原則允許在特定情形下,未經版權持有人同意使用受版權保護的作品。
合理使用已成為科技公司在相關訴訟中的主要法律抗辯理由。阿爾蘇普此番判決也是首個在生成式人工智能背景下,直接回應該問題的司法裁決。
AI公司辯稱,其系統對受版權保護內容的使用屬于合理利用,能夠創造全新且具轉化性的內容;而如果被強制要求為訓練數據向版權方支付費用,可能會遏制AI產業的發展。
Anthropic在法庭上表示,公司對圖書的使用屬于合理使用,并認為美國版權法“不僅允許,甚至鼓勵”其AI訓練,因為這有助于推動人類創造力。公司稱,其系統復制圖書的目的是“學習原告的寫作風格,提取其中不受版權保護的信息,并據此開發革命性技術”。
而版權方則認為,AI公司非法復制其作品,用以生成與其競爭的內容,進而威脅到自身的生計。
阿爾蘇普在周一的裁決中認同Anthropic的觀點,認為其訓練行為“極具轉化性”。
不過,法官也裁定,Anthropic仍須就涉嫌盜用作品一事,于今年12月接受審判。公司最早通過從網絡“影子圖書館”(指盜版書籍的在線存儲庫)下載盜版書而獲得這些內容。
根據舊金山聯邦法院披露的文件,Anthropic員工內部曾對使用盜版網站的合法性表達過擔憂。此后,Anthropic調整了策略,聘請了前谷歌Google Books負責人湯姆·特維(Tom Turvey)。Google Books是一個可搜索的數字圖書館,曾多年應對版權訴訟并最終獲勝。
法庭文件顯示,在特維的幫助下,Anthropic開始大批量購買紙質圖書,拆除裝訂后逐頁掃描,然后將數字化內容輸入其AI模型。但法官指出,這并不能消除其早期的盜版行為。
阿爾蘇普寫道:“Anthropic后續購買了此前從網上盜取的圖書,這一舉措并不能免除其盜竊責任,但可能會影響其最終需承擔的法定賠償金額。”(易句)
(本文由AI翻譯,網易編輯負責校對)