過(guò)去幾個(gè)月,AI 圈一樁樁版權(quán)案接連爆出。
迪士尼拉著環(huán)球影業(yè),把 Midjourney 告上法庭,指控它在沒(méi)打一聲招呼的情況下,就學(xué)會(huì)了畫《星球大戰(zhàn)》和《小黃人》。
圖片巨頭 Getty Images 則抓住了 Stability AI 的現(xiàn)行—— AI 不僅「吃」了它數(shù)百萬(wàn)張帶版權(quán)的圖片,甚至在生成的新圖里,還心虛地「吐」出了那個(gè)標(biāo)志性的水印,像個(gè)作案后忘了擦掉指紋的笨賊。
這些案子的起因都源于那個(gè)讓所有 AI 公司夜不能寐的問(wèn)題: 用來(lái)訓(xùn)練模型的海量數(shù)據(jù),究竟算不算「贓物」?
最近,兩場(chǎng)判決落槌,似乎給出了一個(gè)答案。Anthropic 和 Meta 在版權(quán)官司中都獲勝讓許多人以為警報(bào)已經(jīng)解除。但細(xì)看之下,這場(chǎng)勝利并非這么簡(jiǎn)單——法官在判決書里悄悄留下了一些暗示。
從表面上看,案情并不復(fù)雜。一群作家指控這兩家公司用他們寫的書來(lái)訓(xùn)練大模型,這是偷竊。AI 公司則辯稱,這叫「變革性使用」,是學(xué)習(xí),不是抄襲,屬于法律允許的「合理使用」。
出人意料的是,法官采納了 AI 公司的說(shuō)法。他們認(rèn)為,用書籍訓(xùn)練 AI,和直接復(fù)制書籍來(lái)賣是兩碼事,確實(shí)有「變革性」,而且原告作家們也沒(méi)能拿出有力證據(jù),證明自己的書因此就賣不出去了。
于是,判決落下,AI 公司贏了。至少,新聞標(biāo)題是這么寫的。
法官在判詞里留下的「伏筆」,可能才是整個(gè)案件真正的轉(zhuǎn)折點(diǎn)。
在 Meta 的案子里,Chhabria 法官幾乎是手把手地給原告「復(fù)盤」。他毫不留情地指出,原告的訴訟策略簡(jiǎn)直一團(tuán)糟。「判決并不意味著Meta的行為就合法了,」他寫道,「只是因?yàn)檫@批原告沒(méi)能說(shuō)服我。他們問(wèn)錯(cuò)了問(wèn)題,也拿錯(cuò)了證據(jù)。」
這番話,無(wú)異于在法庭上公開(kāi)遞出了一份「訴訟指南」: 這次算你們僥幸過(guò)關(guān),下次來(lái)個(gè)更懂行的,結(jié)局就難說(shuō)了。
另一邊,審理 Anthropic 案的 Alsup 法官,則對(duì)另一件事耿耿于懷: 這些 AI 公司用來(lái)訓(xùn)練的數(shù)據(jù),很多是從盜版網(wǎng)站上扒下來(lái)的。「原罪」問(wèn)題,讓他十分惱火。
「你們明明有合法渠道,卻偏要走捷徑,」他警告道,「用非法手段獲取的東西,別指望能用‘合理使用’這塊擋箭牌來(lái)洗白。」他甚至補(bǔ)充說(shuō),后來(lái)再去合法掃描,也抹不掉最初的「偷竊」行為。
這番話,等于在 AI 公司看似堅(jiān)固的勝利上,預(yù)埋了一顆定時(shí)炸彈。今天的問(wèn)題解決了,但歷史舊賬隨時(shí)可能被翻出來(lái)。
而真正致命的威脅,是那個(gè)被這兩場(chǎng)官司巧妙繞開(kāi)的問(wèn)題: AI「說(shuō)」出來(lái)的話,算不算侵權(quán)?
訓(xùn)練過(guò)程可以被解釋為「學(xué)習(xí)」,但如果 AI 能一字不差地「背誦」出《哈利·波特》呢?最近的一項(xiàng)研究就揭示了這個(gè)令人不安的事實(shí):Meta 的模型記住了《哈利·波特與魔法石》超過(guò) 40% 的原文。 AI 不再只是個(gè)學(xué)生,它成了一個(gè)藏著海量盜版書的移動(dòng)硬盤。
該圖表顯示了讓模型從《哈利·波特與魔法石》各部分生成 50 個(gè) token 的摘錄的難易程度,線越深,重現(xiàn)該部分內(nèi)容就越容易
對(duì)此,Alsup 法官也早已劃下紅線:「 如果 AI 的輸出內(nèi)容直接抄襲了原作,那就是另一回事了。版權(quán)方完全可以拿著這些證據(jù),再告一次,而且勝算會(huì)大得多。」
所以,這場(chǎng)勝利到底意味著什么?
對(duì)于 Meta、OpenAI 這樣的巨頭來(lái)說(shuō),這或許只是爭(zhēng)取了更多的時(shí)間。他們財(cái)力雄厚,背后是頂尖的律師團(tuán)隊(duì),已經(jīng)開(kāi)始花錢與各大媒體和出版商簽署授權(quán)協(xié)議。對(duì)他們而言,版權(quán)問(wèn)題正在從一個(gè)法律風(fēng)險(xiǎn),轉(zhuǎn)變?yōu)橐豁?xiàng)可以計(jì)算的商業(yè)成本。
但對(duì)于那些規(guī)模較小、依賴開(kāi)源數(shù)據(jù)的 AI 公司來(lái)說(shuō),警報(bào)遠(yuǎn)未解除。他們沒(méi)有雄厚的資本去支付天價(jià)的授權(quán)費(fèi),也經(jīng)不起漫長(zhǎng)的官司消耗。一旦版權(quán)的「清算」全面開(kāi)始,他們很可能就是第一批倒下的。
而對(duì)于創(chuàng)作者來(lái)說(shuō),局面則更加復(fù)雜。他們或許有機(jī)會(huì)通過(guò)授權(quán)獲得一些收入,但這筆錢,能否彌補(bǔ)一個(gè)被 AI 內(nèi)容沖擊得七零八落的市場(chǎng)?
說(shuō)到底,這兩場(chǎng)官司并沒(méi)有給出一個(gè)最終答案,反而讓問(wèn)題變得更具體、更棘手了。這場(chǎng)圍繞版權(quán)的博弈,沒(méi)有因?yàn)閹状闻袥Q而結(jié)束,它只是從法庭上的唇槍舌劍,延伸到了談判桌前的真金白銀。
這場(chǎng)關(guān)于數(shù)據(jù)、創(chuàng)意與 AI 的博弈,或許才剛剛開(kāi)始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.