2024年度十大著作權事例 | 黃玉燁教授點評“AI大模型訓練版權問題引發(fā)全球關注”

2025-01-23 17:54:31　來源: 知產力

北京舉報

分享至

編者按

近日，“2024年度十大著作權事例評選發(fā)布會”在北京大學成功舉辦，本次會議由北京大學國際知識產權研究中心、北京市律師協(xié)會著作權法律專業(yè)委員會主辦，知產力提供媒體支持，知產寶提供數(shù)據(jù)支持，會上發(fā)布了“2024年度十大著作權事例”。為了方便社會各界了解、參考，知產力近期將陸續(xù)發(fā)布專家對十大著作權事例的點評。本期分享中南財經(jīng)政法大學知識產權學院院長黃玉燁對“2024年度十大著作權事例”之六——“AI大模型訓練版權問題引發(fā)全球關注”的點評。

點評人黃玉燁

中南財經(jīng)政法大學知識產權學院院長

AI時代，AI被運用于各類創(chuàng)作場景中，輸入指令并生成文本、圖片、視頻，如ChatGPT、“文心一言”等產品具有極強的語言分析能力和內容輸出能力，不僅能夠根據(jù)用戶需求生成相應文本，而且內容篇幅大、輸出效率高、表達更規(guī)范。但同時也帶來版權侵權風險。從機器學習過程看，AI生成內容需要事先匯總輸入大規(guī)模數(shù)據(jù)，并在自然語言處理系統(tǒng)中形成數(shù)據(jù)副本并以此為基礎反復進行數(shù)據(jù)訓練，屬于對已有數(shù)據(jù)的數(shù)字化復制行為。根據(jù)版權法原理，如果輸入的數(shù)據(jù)中包含未經(jīng)授權使用的數(shù)字作品或者版權法所保護的數(shù)據(jù)庫中的數(shù)據(jù)，且不存在合理使用、法定許可等法定排除事由的，那么該行為可能侵害他人的版權。在實踐中，也發(fā)生了諸多大模型訓練數(shù)據(jù)版權侵權糾紛，例如美國已有眾多版權人提起了針對AIGC技術或服務提供者訓練數(shù)據(jù)侵犯版權的訴訟，其中最知名的是《紐約時報》起訴微軟和OpenAI非法使用其數(shù)百萬篇受版權保護的文章來訓練ChatGPT進行聊天，并開發(fā)其他人工智能，侵犯了其版權。2024年3月21日，法國競爭管理局聲明，谷歌大語言模型Bard未經(jīng)許可使用出版商和新聞機構的線上內容，違背了歐盟版權指令，對谷歌母公司Alphabet、谷歌、谷歌愛爾蘭和谷歌法國公司共罰款2.5億歐元。在中國，被媒體譽為“全球AIGC平臺侵權第一案”的判決中確認了涉案平臺侵犯了原告對涉案作品“奧特曼”享有的復制權、改編權。然而，如果將大模型訓練行為視為版權侵權，可能遏制人工智能技術創(chuàng)新和產業(yè)發(fā)展，還可能引發(fā)超大規(guī)模訴訟。

AI技術廣泛運用于大模型訓練數(shù)據(jù)行為的版權合法性問題引起了國際范圍內相關國際組織和各國政府的高度重視，并試圖采取有效舉措來平衡技術創(chuàng)新、產業(yè)發(fā)展與版權保護之間的關系。2019年通過的《歐盟數(shù)字化單一市場之著作權指令提案》修正案，規(guī)定了文本與數(shù)據(jù)挖掘的合理使用，即對于合法獲取的作品或其他受保護客體，研究機構和文化遺產機構出于科學研究目的所進行的文本與數(shù)據(jù)挖掘屬于合理使用行為。在美國作家協(xié)會訴谷歌公司案中依靠轉換性使用制度，將文本與數(shù)據(jù)挖掘的應用納入了合理使用范疇。英國、日本等國也在版權法中規(guī)定了數(shù)據(jù)處理著作權侵權的例外。2020年我國著作權法修訂征求意見時，包括本人在內的許多專家曾建議增加文本與數(shù)據(jù)挖掘合理使用制度的規(guī)定，但是非常遺憾，最后沒有被采納。2024年2月，WIPO發(fā)布《生成式人工智能：知識產權導航》報告，旨在幫助企業(yè)了解知識產權風險，考慮采取潛在的保障措施；2024年2月2日，英國上議院通信和數(shù)字委員會發(fā)布《大型語言模型和生成式人工智能》報告，呼吁英國政府重新進行戰(zhàn)略平衡，在應對安全和社會風險的同時，抓住新技術帶來的機遇，并提出了保護版權、應對直接風險等十項核心建議；2024年3月13日，歐洲議會批準了具有里程碑意義的《人工智能法》，以規(guī)范人工智能系統(tǒng)的開發(fā)、檢索、訓練和應用，其宗旨是既要保護個人的合法權利，也要推動新技術的創(chuàng)新和應用；2024年7月，日本文化事務局版權處發(fā)布《關于人工智能與版權的清單和指南》，旨在為AI相關方提供版權風險緩解措施，并指導版權持有者如何保護自己的權利；2024年2月29日，我國網(wǎng)絡安全標準化技術委員會（TC260）發(fā)布了《生成式人工智能服務安全基本要求》技術文件，從語料安全、模型安全等多個維度規(guī)定了生成式人工智能服務在安全方面的基本要求。

上述立法、報告、指南與實踐，為平衡版權保護與促進AI技術創(chuàng)新、產業(yè)發(fā)展的關系提供了有益的幫助。但是，要真正解決大模型訓練數(shù)據(jù)行為的版權合法性問題，如何適用和判定作品的合理使用制度，在AI技術飛速發(fā)展與廣泛運用過程中，AIGC服務提供者應當承擔什么樣的注意義務與法律責任，都還需要我們去進一步探索。

附：2024年度十大著作權事例之六

AI大模型訓練版權問題引發(fā)全球關注

入選理由：AI大模型訓練涉及到大量作品的使用，如何合理、有效解決此間的版權問題，使新技術的發(fā)展服務于內容產業(yè)的繁榮而不是取而代之，是值得持續(xù)思考的問題。一些國家和組織提出的披露訓練數(shù)據(jù)、增強人工智能產業(yè)透明度等要求，已獲廣泛認可。各國的努力體現(xiàn)了平衡技術創(chuàng)新與版權保護方面的考量，在力求抓住新技術帶來的機遇的同時，又要求重視版權的歸屬、侵權與責任認定等問題，確保創(chuàng)意產業(yè)從業(yè)人員的權益得到有效保護。這為實現(xiàn)技術創(chuàng)新與版權保護的和諧發(fā)展提供了有益的思路和啟示，為國際版權法的發(fā)展提供了有益的借鑒和參考，推動了全球范圍內對AI生成內容版權問題的關注和探討，有利于推動版權法律制度與時俱進，也將促使人工智能相關產業(yè)主體在研發(fā)、訓練模型及使用人工智能等環(huán)節(jié)重新審視其與版權的關系，調整現(xiàn)有的業(yè)務模式和發(fā)展策略，實現(xiàn)內容產業(yè)與技術發(fā)展的良性互動。

（本文僅代表作者觀點，不代表知產力立場）

封面來源 | 知產力編輯 | 布魯斯

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.