99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI一本正經(jīng)地胡說(shuō)八道,有種辦法可以識(shí)破它

0
分享至

近年來(lái),生成式人工智能在文本、圖像、音樂(lè)等領(lǐng)域大放異彩。然而,隨著生成式人工智能變得越來(lái)越強(qiáng)大,人們?cè)絹?lái)越難以鑒別AI生成的內(nèi)容。

近日,Google DeepMind 研究團(tuán)隊(duì)在《Nature》上發(fā)表的封面文章提供了一種文本水印方案,可以提高AI生成文本的檢測(cè)精度。

AI生成內(nèi)容檢測(cè)的必要性

在文本、圖像和音樂(lè)中,AI生成的文本是最難以檢測(cè)的。因?yàn)楝F(xiàn)有的圖像和音樂(lè)生成技術(shù)尚未像文本生成技術(shù)一樣發(fā)達(dá),AI生成的圖像和音樂(lè)往往有某些非自然的視覺(jué)或聽(tīng)覺(jué)特征。AI生成的內(nèi)容在整體上效果較好,但具體到細(xì)節(jié)就顯得不夠自然。在圖像和音樂(lè)中,也可以人工添加人類難以發(fā)現(xiàn)的水印,在后期檢測(cè)中通過(guò)水印篩選出AI生成的作品。

然而在文本中難以直接添加人類不可見(jiàn)的水印,這是因?yàn)槲谋九c圖像和音樂(lè)不同,每一個(gè)文字都是完全可見(jiàn)的。同時(shí),可用于訓(xùn)練AI的文本數(shù)據(jù)也遠(yuǎn)多于圖像和音樂(lè)。在龐大的、基于人類寫(xiě)作的語(yǔ)料庫(kù)的訓(xùn)練之下,AI已經(jīng)非常擅長(zhǎng)模擬人類的表達(dá)方式和語(yǔ)言習(xí)慣,甚至能夠調(diào)整文本的風(fēng)格和語(yǔ)氣,這使得AI生成的文本難以直接檢測(cè)。

盡管AI生成的文本與人類創(chuàng)作的文本難以分辨,但AI生成的內(nèi)容可能帶有事實(shí)性的錯(cuò)誤,并不能保證可靠性。無(wú)法辨別來(lái)源的內(nèi)容可能會(huì)導(dǎo)致虛假信息的傳播,也帶來(lái)了學(xué)術(shù)作弊、版權(quán)爭(zhēng)議等種種問(wèn)題。

比如,在“杭州取消機(jī)動(dòng)車依尾號(hào)限行”假新聞事件中,網(wǎng)友用AI技術(shù)生成的“假新聞”行文嚴(yán)謹(jǐn)、語(yǔ)氣措辭得當(dāng),也基本符合官方通報(bào)的格式,導(dǎo)致了錯(cuò)誤信息大規(guī)模傳播。美國(guó)科技新聞網(wǎng)站CNET在三個(gè)月之內(nèi)上線了70多篇用AI技術(shù)生成的新聞報(bào)道,卻被發(fā)現(xiàn)其中存在大量基礎(chǔ)性錯(cuò)誤,包括計(jì)算錯(cuò)誤、金融概念誤解等,不得不暫時(shí)叫停AI項(xiàng)目重新審核。

為了避免AI技術(shù)的濫用,我們需要一種方法辨別文本是否由AI生成。

主流檢測(cè)方法:事前與事后檢測(cè)

檢測(cè)AI生成的文本是一個(gè)分類問(wèn)題,我們的主要目標(biāo)是區(qū)分一個(gè)文本片段是由AI生成的還是由人類創(chuàng)作的。通常一個(gè)文本檢測(cè)器對(duì)于一個(gè)給定的文本片段會(huì)給出一個(gè)評(píng)分,當(dāng)這個(gè)評(píng)分超過(guò)閾值時(shí),這個(gè)片段被認(rèn)為是AI生成的,反之則是人類創(chuàng)作的。



文本檢測(cè)框架

(圖片來(lái)源:根據(jù)參考文獻(xiàn)1翻譯)

現(xiàn)有的主流檢測(cè)方法可以分為兩大類:事前檢測(cè)和事后檢測(cè)。事前檢測(cè)可以進(jìn)一步分為基于水印的檢測(cè)和基于檢索的檢測(cè)。事后檢測(cè)可以分為基于零樣本學(xué)習(xí)的檢測(cè)和基于訓(xùn)練的檢測(cè)。



主流檢測(cè)方法分類

(圖片來(lái)源:根據(jù)參考文獻(xiàn)1翻譯)

1. 事前檢測(cè)

基于水印的檢測(cè)是指在AI生成的文本中隱藏某些信息以便后續(xù)檢測(cè)。但由于文本的離散性,在文本中添加水印比在圖像和音樂(lè)中添加水印困難很多。常用的方法是讓AI生成的文本使用特定的語(yǔ)言風(fēng)格或者偏向性地使用某些特定的詞匯,但這樣可能會(huì)降低AI生成文本的質(zhì)量。

基于檢索的方法是指AI服務(wù)的提供者將用戶通過(guò)AI生成的文本保存在數(shù)據(jù)庫(kù)中。當(dāng)需要檢測(cè)目標(biāo)文本是否由AI生成時(shí),將目標(biāo)文本與數(shù)據(jù)庫(kù)中的文本進(jìn)行匹配,如果相似度較高,則很可能是AI生成的。但這種方法需要保存用戶數(shù)據(jù),可能帶來(lái)隱私泄露的問(wèn)題。

2. 事后檢測(cè)

基于零樣本學(xué)習(xí)的檢測(cè)是指不需要進(jìn)行任何的訓(xùn)練,僅根據(jù)AI生成文本的特點(diǎn)來(lái)檢測(cè)一段文本是否是AI生成的。通常AI生成的文本傾向于使用常見(jiàn)的詞匯,句子的長(zhǎng)度和結(jié)構(gòu)也更加統(tǒng)一。而人類創(chuàng)作的文本則顯得更加隨心所欲,每一句的水平也參差不齊。與人類相比,AI在記憶細(xì)節(jié)上能力較強(qiáng)而在邏輯推理上能力較弱。利用這些特點(diǎn)可以在一定程度上區(qū)分AI生成的文本和人類創(chuàng)作的文本。

基于訓(xùn)練的檢測(cè)是指使用人類創(chuàng)作的文本和AI生成的文本構(gòu)建一個(gè)數(shù)據(jù)集,用這個(gè)數(shù)據(jù)集訓(xùn)練一個(gè)分類器來(lái)識(shí)別AI生成的文本。但這需要收集足夠的數(shù)據(jù)用于訓(xùn)練,并且隨著AI能力的進(jìn)步,這樣的區(qū)分也變得越來(lái)越困難。

可以看到,事后檢測(cè)比事前檢測(cè)要困難許多。為了高精度地篩選出AI生成的文本,在事前AI生成文本時(shí)就添加水印是一個(gè)很好的解決方案

Google DeepMind的突破:SynthID-Text水印技術(shù)

Google DeepMind 研究團(tuán)隊(duì)提出了一種新的水印生成方案,稱為SynthID-Text。它基于之前的水印生成組件,但使用了一種新的“錦標(biāo)賽采樣”方法。SynthID-Text可以非扭曲(保留文本質(zhì)量)或者扭曲(以犧牲文本質(zhì)量為代價(jià)提升水印的可檢測(cè)性)地添加水印。在扭曲和非扭曲設(shè)置下,與現(xiàn)有的最佳方法相比,SynthID-Text都提升了水印的檢出率。



水印生成框架

(圖片來(lái)源:根據(jù)參考文獻(xiàn)2翻譯)

上圖中展示了大語(yǔ)言模型生成文本的原理以及之前水印生成的框架。大語(yǔ)言模型的文本生成是基于上下文的,它會(huì)根據(jù)輸入的文本序列計(jì)算下一個(gè)詞匯的分布,然后從這個(gè)分布中抽樣出下一個(gè)詞匯。

一個(gè)生成式的水印方案通常包含三個(gè)部分:一個(gè)隨機(jī)數(shù)生成器、一個(gè)采樣算法以及一個(gè)評(píng)分函數(shù)。水印生成的過(guò)程是:首先使用隨機(jī)數(shù)生成器根據(jù)前面的文本以及水印鍵生成一個(gè)隨機(jī)數(shù),然后采樣算法利用這個(gè)隨機(jī)數(shù)從詞匯的分布中抽樣出下一個(gè)詞匯。給出一段文本以及一個(gè)水印鍵,評(píng)分函數(shù)提供一個(gè)分?jǐn)?shù)來(lái)量化當(dāng)前文本中含有水印的可能性,當(dāng)分?jǐn)?shù)超過(guò)一個(gè)閾值時(shí)就認(rèn)為這段文本中含有水印。



錦標(biāo)賽采樣

(圖片來(lái)源:根據(jù)參考文獻(xiàn)2翻譯)

SynthID-Text提出了一種新的“錦標(biāo)賽采樣”方法,上圖是錦標(biāo)賽采樣方法的一個(gè)例子。當(dāng)向模型輸入“...我最喜歡的熱帶水果是”時(shí),模型計(jì)算出下一個(gè)詞匯的分布,其中“芒果”的概率是0.5,“荔枝”的概率是0.3,“木瓜”的概率是0.15,“榴蓮”的概率是0.05。在不加水印的正常生成中,模型會(huì)按這個(gè)概率直接采樣出下一個(gè)詞匯。在錦標(biāo)賽采樣中,模型先根據(jù)隨機(jī)數(shù)種子生成三個(gè)隨機(jī)的水印函數(shù),然后再?gòu)脑~匯的分布中采樣出八個(gè)詞匯,將這八個(gè)詞匯兩兩組合后進(jìn)行競(jìng)賽,在每一輪競(jìng)賽中,由一個(gè)水印函數(shù)決定每一對(duì)組合中的勝出者。經(jīng)過(guò)三輪競(jìng)賽后,最終的勝出者就是模型的輸出結(jié)果:“芒果”。

在錦標(biāo)賽采樣中,詞匯是根據(jù)水印函數(shù)的偏好采樣得出的。因此添加水印的文本會(huì)在水印函數(shù)上有更高的評(píng)分。在檢測(cè)時(shí)只需要評(píng)估每個(gè)詞匯在對(duì)應(yīng)的水印函數(shù)下的評(píng)分,再將評(píng)分加和就可以得到這段文本包含水印的可能性。

水印的添加是通過(guò)改變采樣方法實(shí)現(xiàn)的,它會(huì)改變模型輸出下一個(gè)詞匯的分布,這看起來(lái)不可避免地會(huì)影響生成文本的質(zhì)量。然而,由于采樣方法中使用了隨機(jī)數(shù)種子,盡管在某一隨機(jī)數(shù)種子下詞匯的分布會(huì)被改變,但在對(duì)所有隨機(jī)數(shù)種子進(jìn)行平均后可以得到和原始分布相同的結(jié)果。SynthID-Text可以在適當(dāng)?shù)呐渲孟卤苊庥绊懺~匯的分布從而保證文本的質(zhì)量,也可以以損失一部分質(zhì)量為代價(jià)提高水印的檢出概率。

SynthID-Text方法在Google DeepMind推出的Gemini 人工智能模型上經(jīng)過(guò)了兩千萬(wàn)次用戶測(cè)試。測(cè)試結(jié)果表明SynthID-Text在添加水印的同時(shí)并不會(huì)降低文本的質(zhì)量。同時(shí),SynthID-Text不會(huì)產(chǎn)生太多的時(shí)間和計(jì)算開(kāi)銷,可以被大規(guī)模地應(yīng)用于生產(chǎn)實(shí)踐之中。

結(jié)語(yǔ)

事后檢測(cè)文本是否由AI生成是非常困難的。隨著AI能力的增強(qiáng),事后檢測(cè)會(huì)變得越來(lái)越困難,檢測(cè)和反檢測(cè)將會(huì)是無(wú)止境的技術(shù)競(jìng)賽。水印方法提供了一種可能的解決方案,但這需要大語(yǔ)言模型的提供者在生成時(shí)就預(yù)先加入水印。如果用戶使用的模型沒(méi)有主動(dòng)加入水印,就難以在事后進(jìn)行檢測(cè)。此外,用戶還可以使用開(kāi)源模型,或者對(duì)添加了水印的文本進(jìn)行二次編輯來(lái)逃脫檢測(cè)。這些問(wèn)題都有待進(jìn)一步解決。

未來(lái),隨著生成式人工智能的普及,如何檢測(cè)AI生成的內(nèi)容會(huì)變得越來(lái)越重要。SynthID-Text證明了水印技術(shù)在文本生成中大規(guī)模應(yīng)用的可能性,但水印技術(shù)面臨的困難也說(shuō)明檢測(cè)并不只是一個(gè)技術(shù)問(wèn)題。解決這個(gè)問(wèn)題還需要各方共同努力,形成相關(guān)的行業(yè)標(biāo)準(zhǔn)以及法律法規(guī),從而推動(dòng)AI走在為人類服務(wù)的正軌之上。

參考文獻(xiàn):

  1. Ghosal S S, Chakraborty S, Geiping J, et al. Towards possibilities & impossibilities of ai-generated text detection: A survey[J]. arXiv preprint arXiv:2310.15264, 2023.
  2. Dathathri, S., See, A., Ghaisas, S., Huang, P. S., McAdam, R., Welbl, J., ... & Kohli, P. (2024). Scalable watermarking for identifying large language model outputs. Nature, 634(8035), 818-823.

出品:科普中國(guó)

作者:王?。ㄖ袊?guó)科學(xué)院計(jì)算技術(shù)研究所在讀博士)

監(jiān)制:中國(guó)科普博覽



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不用卷了!今年廣東高考15萬(wàn)人已被提前錄取

不用卷了!今年廣東高考15萬(wàn)人已被提前錄取

戶外釣魚(yú)哥阿勇
2025-06-03 10:05:10
烏軍突襲海參崴俄軍基地!或刷新最遠(yuǎn)距離攻擊紀(jì)錄

烏軍突襲海參崴俄軍基地!或刷新最遠(yuǎn)距離攻擊紀(jì)錄

項(xiàng)鵬飛
2025-05-31 21:05:34
深圳樓市起風(fēng)了,深圳樓市深圳灣房?jī)r(jià)從172000元變成170000元

深圳樓市起風(fēng)了,深圳樓市深圳灣房?jī)r(jià)從172000元變成170000元

有事問(wèn)彭叔
2025-06-01 21:57:02
那個(gè)將日本當(dāng)靠山,停飛我國(guó)航班拒絕我國(guó)游客的國(guó)家,后來(lái)怎樣了

那個(gè)將日本當(dāng)靠山,停飛我國(guó)航班拒絕我國(guó)游客的國(guó)家,后來(lái)怎樣了

訪史
2025-06-02 22:14:11
南海局勢(shì)突變,美、日、菲、韓聯(lián)手,中方強(qiáng)援登場(chǎng),先拿日本下手

南海局勢(shì)突變,美、日、菲、韓聯(lián)手,中方強(qiáng)援登場(chǎng),先拿日本下手

一個(gè)有靈魂的作者
2025-06-03 08:16:09
廣州地鐵10號(hào)線最新進(jìn)展,預(yù)計(jì)開(kāi)通時(shí)間在即!

廣州地鐵10號(hào)線最新進(jìn)展,預(yù)計(jì)開(kāi)通時(shí)間在即!

西莫的藝術(shù)宮殿
2025-06-03 12:28:26
河南近1億人口,出了一個(gè)鄭大一附院,它到底有多大?

河南近1億人口,出了一個(gè)鄭大一附院,它到底有多大?

驊駿老師張
2025-06-03 06:23:51
路虎越野車有沖撞行為,太原警方:已接到報(bào)警正在調(diào)查

路虎越野車有沖撞行為,太原警方:已接到報(bào)警正在調(diào)查

極目新聞
2025-06-02 12:34:49
三千公里海疆直接“腰斬”?琉球獨(dú)立或?qū)⒊蔀槿毡静豢沙惺苤兀?>
    </a>
        <h3>
      <a href=明月聊史
2025-06-02 16:55:20
李斌回應(yīng)蔚來(lái)車主高速睡著:輔助駕駛不是自動(dòng)駕駛,返工路上注意安全!觸發(fā)自動(dòng)緊急靠邊停車,SOS電話喚醒車主

李斌回應(yīng)蔚來(lái)車主高速睡著:輔助駕駛不是自動(dòng)駕駛,返工路上注意安全!觸發(fā)自動(dòng)緊急靠邊停車,SOS電話喚醒車主

和訊網(wǎng)
2025-06-03 09:29:08
見(jiàn)證歷史!新一輪貨幣戰(zhàn)爭(zhēng)在路上了

見(jiàn)證歷史!新一輪貨幣戰(zhàn)爭(zhēng)在路上了

米筐投資
2025-06-03 07:06:59
玩不起了?新疆1000元燒烤當(dāng)自助,吃太多老板翻臉,付2000才走人

玩不起了?新疆1000元燒烤當(dāng)自助,吃太多老板翻臉,付2000才走人

娛樂(lè)看阿敞
2025-06-03 10:05:07
澤連斯基參加基輔書(shū)展,站在3層防彈保鏢中,激勵(lì)民眾去刺殺暴君

澤連斯基參加基輔書(shū)展,站在3層防彈保鏢中,激勵(lì)民眾去刺殺暴君

碳基生物關(guān)懷組織
2025-05-31 19:15:08
拉什福德一身打扮34萬(wàn)英鎊,與金發(fā)比基尼女郎海邊浪漫約會(huì)

拉什福德一身打扮34萬(wàn)英鎊,與金發(fā)比基尼女郎海邊浪漫約會(huì)

懂球帝
2025-06-03 01:46:11
27歲女游客三亞被蛇咬傷身亡,家屬質(zhì)疑兩家醫(yī)院救治延誤

27歲女游客三亞被蛇咬傷身亡,家屬質(zhì)疑兩家醫(yī)院救治延誤

極目新聞
2025-06-03 15:46:40
曾轟動(dòng)一時(shí)的爺孫戀10年后結(jié)局大反轉(zhuǎn),男主死了,女主瘋了

曾轟動(dòng)一時(shí)的爺孫戀10年后結(jié)局大反轉(zhuǎn),男主死了,女主瘋了

史行途
2025-04-24 15:27:30
最傷胰島的4種行為,糖尿病人能不做就不做,第3個(gè)很多人不知道

最傷胰島的4種行為,糖尿病人能不做就不做,第3個(gè)很多人不知道

白宸侃片
2025-06-03 12:51:58
俄軍轟炸機(jī)被炸,外國(guó)網(wǎng)友發(fā)布中國(guó)空軍基地機(jī)庫(kù):又讓俄軍羨慕了

俄軍轟炸機(jī)被炸,外國(guó)網(wǎng)友發(fā)布中國(guó)空軍基地機(jī)庫(kù):又讓俄軍羨慕了

嘆知
2025-06-02 15:07:29
掘金大換血,威少逆襲成唯一贏家,杜蘭特哈登高薪未必爭(zhēng)氣

掘金大換血,威少逆襲成唯一贏家,杜蘭特哈登高薪未必爭(zhēng)氣

倩影漂漂
2025-06-03 14:47:09
周總理葬禮上喬冠華上前抱住棺槨,哭喊道:我當(dāng)您兒子為您送終

周總理葬禮上喬冠華上前抱住棺槨,哭喊道:我當(dāng)您兒子為您送終

領(lǐng)悟看世界
2025-06-03 02:55:33
2025-06-03 16:32:49
中國(guó)科普博覽 incentive-icons
中國(guó)科普博覽
中國(guó)科學(xué)院科普云平臺(tái)
4362文章數(shù) 201215關(guān)注度
往期回顧 全部

科技要聞

賈躍亭股東日哽咽談FF:我“特別愧疚”

頭條要聞

哈佛女生蔣雨融未回應(yīng)父親任職一事 綠發(fā)會(huì)火速刪推文

頭條要聞

哈佛女生蔣雨融未回應(yīng)父親任職一事 綠發(fā)會(huì)火速刪推文

體育要聞

從家鄉(xiāng)的水泥球場(chǎng),他一路走上歐洲之巔

娛樂(lè)要聞

李小璐賈乃亮首合體!陪甜馨過(guò)六一

財(cái)經(jīng)要聞

見(jiàn)證歷史!新一輪貨幣戰(zhàn)爭(zhēng)在路上了

汽車要聞

4.0T V8動(dòng)力升級(jí)/3.4秒破百 賓利添越Speed官圖發(fā)布

態(tài)度原創(chuàng)

數(shù)碼
健康
藝術(shù)
時(shí)尚
本地

數(shù)碼要聞

華為WATCH 5官宣發(fā)布!首款鴻蒙AI手表,華為穿戴率先邁入AI時(shí)代

唇皰疹和口腔潰瘍是"同伙"嗎?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

6條適合夏天的裙子、褲子!溫柔顯瘦美到爆炸!

本地新聞

《中國(guó)匠人——錦繡中國(guó)》即日上線:解讀千年絲線的東方美學(xué)密碼

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 华蓥市| 铜山县| 调兵山市| 天等县| 夹江县| 环江| 西华县| 思茅市| 鄯善县| 华宁县| 宣汉县| 海南省| 佛坪县| 岚皋县| 昌吉市| 时尚| 香河县| 翼城县| 阿拉善右旗| 手机| 江华| 平果县| 双峰县| 绍兴县| 太谷县| 石柱| 自治县| 光山县| 芦溪县| 张家港市| 通河县| 承德县| 涿州市| 台东市| 宜宾县| 上高县| 苏尼特左旗| 阿拉善右旗| 类乌齐县| 防城港市| 石楼县|