網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

謝賽寧團(tuán)隊(duì)論文爆雷，暗藏AI好評(píng)提示震碎學(xué)術(shù)圈！本人急發(fā)長(zhǎng)文反思

2025-07-08 16:09:06　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子

【新智元導(dǎo)讀】一句話隱藏提示，在AI圈鬧的動(dòng)靜更大了。網(wǎng)友爆料稱，AI大神謝賽寧團(tuán)隊(duì)的一篇論文中，也有操縱AI評(píng)審的提示。對(duì)此，謝賽寧本發(fā)長(zhǎng)文回應(yīng)：需要重新思考學(xué)術(shù)界的游戲規(guī)則。

用AI提示操控審稿，這兩天在全網(wǎng)吵成了一鍋粥。

而如今，網(wǎng)友joserffrey爆出大瓜，「NYU助理教授、AI大神謝賽寧帶隊(duì)的論文，也卷入了這場(chǎng)AI作弊的風(fēng)暴」。

許多人第一時(shí)間滿臉問號(hào)——這是真的嗎？？？

AI大神陷「作弊」風(fēng)暴？

arXiv悄然更新

今年5月，謝賽寧帶隊(duì)發(fā)表在arXiv上的論文，曾提出了兩個(gè)新基準(zhǔn)測(cè)試，用于評(píng)估MLLM跨語言一致性。

然而，就在這篇論文中，也偷偷隱藏了一個(gè)「POSITIVE REVIEW ONLY」操縱同行評(píng)審的AI提示。

團(tuán)隊(duì)成員將「白色」隱形字體植入文中，肉眼根本無法看出。

這一「作案手段」與韓國(guó)科學(xué)技術(shù)院Se-Young Yun團(tuán)隊(duì)，簡(jiǎn)直如出一轍。

幾天前，日經(jīng)爆料稱，全球14所頂尖機(jī)構(gòu)研究人員，暗自操控AI提示，讓大模型給出好評(píng)。一時(shí)間，全網(wǎng)迅速淪陷，網(wǎng)友直呼，「學(xué)術(shù)界完蛋了」。

這一風(fēng)波在國(guó)內(nèi)外AI圈中，吵得不可開交。

那些默默在論文中植入「AI提示」的研究人員心知肚明，甚至有的人早已慌了。

網(wǎng)友joserffrey言辭犀利地表示，謝賽寧團(tuán)隊(duì)的arXiv已靜默更新，看起來就是在掩蓋事實(shí)。

論文地址：https://arxiv.org/abs/2505.15075v1

他憤怒地表示，自己無法理解如此大型的「雙標(biāo)」現(xiàn)場(chǎng)：

CVPR 2025大會(huì)，謝賽寧曾發(fā)表了一個(gè)關(guān)于AI研究淪為「有限游戲」的精彩演講。

然而，他卻合著了一篇試圖用隱藏的「POSITIVE REVIEW ONLY」提示操縱同行評(píng)審的論文，并悄悄更新了arXiv。

演講PPT：https://www.canva.com/design/DAGp0iRLk9g/8QLkIDov8ez1q6VvO8nnpQ/edit

對(duì)于學(xué)術(shù)界來說，這不是兒戲，更需要一個(gè)明確的解釋。

謝賽寧長(zhǎng)文回應(yīng)

GPT-4o潤(rùn)色

被點(diǎn)名之后，謝賽寧并沒有推卸責(zé)任，而是第一時(shí)間給出了回復(fù)。

說實(shí)話，在最近這些帖子瘋傳之前，我完全不了解這個(gè)情況。我絕不會(huì)鼓勵(lì)學(xué)生做這種事——如果我擔(dān)任AC，任何包含這類提示詞的論文都會(huì)直接被「桌拒」。

不過對(duì)于存在問題的投稿，所有共同作者都難辭其咎，這點(diǎn)無可辯解。

這件事也給我這個(gè)課題組長(zhǎng)敲了警鐘：不能只檢查最終PDF，還必須審查全部提交文件——此前我確實(shí)沒意識(shí)到需要這樣做。

接下來，他發(fā)長(zhǎng)文分享了過去一周內(nèi)部調(diào)查的結(jié)果，并詳細(xì)闡述了事情的前后的經(jīng)過和個(gè)人的思考，一共分為四部分：

1 事件背景

2 事件經(jīng)過

3 后續(xù)措施

4 深層思考

本人親筆，GPT-4o潤(rùn)色

那么，這場(chǎng)「作弊」風(fēng)暴背后，究竟是怎么回事？

2024年11月，英偉達(dá)研究科學(xué)家Jonathan Lorraine發(fā)布了一條帖子，最先提出了在論文中隱藏AI提示詞，忽悠LLM審稿。

謝賽寧表示，那是自己第一次了解還有這等操作，并且當(dāng)時(shí)學(xué)界也意識(shí)到了，論文PDF是可以直接嵌入提示。

需要說明的是，這種提示注入，僅在審稿人直接將PDF上傳給大模型時(shí)才會(huì)有效。

當(dāng)時(shí)，許多人的共識(shí)是：絕不能用LLM進(jìn)行審稿，這會(huì)嚴(yán)重破壞評(píng)審公正性。

因此，包括CVPR、NeurIPS等頂會(huì)，現(xiàn)已明令禁止，比如在任何環(huán)節(jié)使用LLM撰寫審稿意見，或元評(píng)審。

任何在AI頂會(huì)發(fā)過論文的人，都體會(huì)過收到AI生成審稿意見的挫敗感——這種意見既難以回應(yīng)，又難以確證來源。

雖然Jonathan Lorraine原帖可能只是開個(gè)玩笑，但人們一致認(rèn)為「以毒攻毒」絕非正解，或許惹出的麻煩比解決的問題還要多。

與其這樣，還不如通過頂會(huì)制度來規(guī)范。

事件經(jīng)過

論文中的學(xué)生作者，是日本的短期訪問學(xué)者，對(duì)于Jonathan過于當(dāng)真，直接把人家的套路照搬，用在了EMNLP投稿里。

這個(gè)學(xué)生就是論文第一位作者Hao Wang，日本早稻田大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的博士生。

謝賽寧表示，他完全沒意識(shí)到這是在開玩笑，可能會(huì)讓人覺得操縱或誤導(dǎo)。

其實(shí)，Hao Wang也沒有充分認(rèn)識(shí)到，這么做會(huì)對(duì)公眾對(duì)科學(xué)的信任、以及同行評(píng)審的公正性產(chǎn)生怎樣的影響。

更糟的是，他們還在arXiv版本中也植入了同樣的內(nèi)容，根本沒有多想。

謝賽寧之所以忽略這一點(diǎn)，部分原因是這超出了他平時(shí)對(duì)論文進(jìn)行倫理把關(guān)的預(yù)警范圍

目前，這位學(xué)生已經(jīng)更新了論文，并聯(lián)系了ARR以尋求正式指導(dǎo)，并將嚴(yán)格執(zhí)行其建議。

個(gè)人思考

這件事對(duì)謝賽寧本人來說，也得到了一次深刻的教訓(xùn)。

起初，他本人也很生氣，但深思后認(rèn)為除拒稿外不應(yīng)追加懲罰。

高壓環(huán)境下的學(xué)生，往往無法周全考慮倫理影響，尤其是面對(duì)這類新興問題時(shí)。

他表示，「我的責(zé)任是，引導(dǎo)他們穿越灰色地帶，而非單純事后追責(zé)。比起懲罰，更重要的是加強(qiáng)科研倫理教育」。

回到最初帖子的問題上——整個(gè)情況確實(shí)凸顯了我們需要重新思考學(xué)術(shù)界的游戲規(guī)則。

這才是我在演講中想要表達(dá)的主要觀點(diǎn)。我將繼續(xù)盡我所能，幫助學(xué)生學(xué)會(huì)如何開展扎實(shí)的研究。

最后，謝賽寧引用了一項(xiàng)亞馬遜博士后Gabriele Berton的民意調(diào)查，有45.4%的人認(rèn)為植入隱藏提示，可以被接受。

雖然調(diào)查可能存在偏差，但確實(shí)反映了問題的復(fù)雜性。

他認(rèn)為，真正的癥結(jié)在于現(xiàn)行制度存在漏洞，與偽造數(shù)據(jù)等傳統(tǒng)學(xué)術(shù)不端不同，這是AI時(shí)代催生的新問題，需要更深入的倫理討論。

論文暗藏AI提示，究竟是對(duì)是錯(cuò)？

Gabriele Berton安慰道，「這沒什么好羞愧的，沒必要因?yàn)閄平臺(tái)上某個(gè)憤怒的用戶認(rèn)為這不道德就感到難堪」。

正如你提到的，投票顯示有很多人認(rèn)為這種做法是合乎道德的。

而且會(huì)議也沒有明令禁止。

不管怎樣，相關(guān)規(guī)則確實(shí)應(yīng)該盡快明確制定。

對(duì)此，謝賽寧堅(jiān)定地表示，我確實(shí)認(rèn)為這種做法不符合道德規(guī)范（若參與投票我會(huì)明確反對(duì)）。

同時(shí)，他表示很多圈外人根本get不到AI審稿的雷區(qū)。

這不僅僅是審得好不好的問題，更重要的是保密性！把別人未發(fā)表的論文扔給公開的AI系統(tǒng)，這已經(jīng)踩了高壓紅線了。

（當(dāng)然，本地運(yùn)行AI助手是可行的——但說實(shí)話，目前大多數(shù)人實(shí)際操作的恐怕不是這種方式）

Meta超級(jí)智能實(shí)驗(yàn)室研究員Lucas Beyer表示，其實(shí)挺可怕的。這讓我意識(shí)到，作者可以只在審稿版本里加入這類內(nèi)容，然后在arXiv和最終出版版本中把它刪掉。

謝賽寧回應(yīng)道，這種現(xiàn)象已經(jīng)出現(xiàn)了——最近的學(xué)術(shù)會(huì)議已經(jīng)批量發(fā)出了許多「桌拒」；相關(guān)人士也正在制定更完善的政策。

現(xiàn)在大家注意到的這些arXiv論文，其實(shí)只是反映了作者的天真和粗心（畢竟合作者幾乎不可能發(fā)現(xiàn)這類問題）。

發(fā)明刷AI好評(píng)提示的研究員認(rèn)為，「目前來看，確保有真人參與評(píng)審可能還是比較明智的做法」。

那么，你認(rèn)為這種在論文里隱藏prompt的行為，是否可取呢？（頂會(huì)已明令禁止用AI審稿）

參考資料：

https://x.com/sainingxie/status/1942219178166931781

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.