99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

14%論文都有AI代寫?Nature:每7篇就有1篇藏有ChatGPT特征詞

0
分享至

鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

“unparalleled”、“invaluable”、“heighten”……

小心!這些詞可能會偷偷暴露你的論文是AI幫忙寫的,一年之內(nèi)14%使用LLM的生物醫(yī)學(xué)論文就是這樣被發(fā)現(xiàn)滴……



據(jù)Nature最新報道,研究發(fā)現(xiàn)在2024年PubMed上發(fā)表的150萬篇生物醫(yī)學(xué)研究摘要中,其中超過20萬篇都頻繁出現(xiàn)LLM特征詞。

這些詞匯大多都是多余的風(fēng)格性動詞形容詞,只改變了文體,并不影響內(nèi)容。

在部分國家和學(xué)科中,AI輔助寫作的比例也已經(jīng)超過五分之一,而這一趨勢還在不斷上升。



與此同時,部分作者也注意到這點,開始引導(dǎo)LLM規(guī)避明顯的AI痕跡,這也讓我們現(xiàn)在難以得知LLM對學(xué)術(shù)產(chǎn)出的影響究竟有多深……

日益深化的LLM學(xué)術(shù)影響力

自從ChatGPT首次實現(xiàn)在學(xué)術(shù)領(lǐng)域生成接近人類水平的文本,許多作者開始將LLM融入日常寫作,甚至與LLM一起合作撰寫論文。

但雇傭LLM代筆,未必如想象中隱秘。

和人類作者一樣,LLM也喜歡在論文中留下自己獨特的寫作印記,雁過留痕,恰好這些也成為了發(fā)現(xiàn)LLM的途徑。



研究團隊從PubMed上下載了1400萬篇摘要(2010年-2024年),構(gòu)建詞匯出現(xiàn)的二元矩陣,計算每年詞匯頻率,并將實際頻率與預(yù)期頻率的差值δ和比值r作為衡量超額使用的指標。



實驗發(fā)現(xiàn),在2024年以前,類似“coronavirus” 的名詞被超額使用;2024年之后,則以“intricate”、“notably” 等與研究內(nèi)容無關(guān)的風(fēng)格詞為主,其中66%都是動詞(如 “delving”、“emphasizing”),16%為形容詞(如 “crucial”、“pivotal”)



好家伙,原來LLM你小汁喜歡華麗風(fēng)哇,喜歡怎么夸張怎么來。

Σ( ° △ °|||)︴

例如,LLM喜歡醬紫:

  • 通過仔細研究連接[…]和[…]的錯綜復(fù)雜的網(wǎng)絡(luò),本章深入探討了他們的參與作為[…]的重要風(fēng)險因素。
  • 全面掌握[…]和[…]之間錯綜復(fù)雜的相互作用對于有效的治療策略至關(guān)重要。
  • 最初,我們深入研究了[…]的復(fù)雜性,強調(diào)了它在細胞生理學(xué)中不可或缺的地位,控制其通量的酶迷宮,以及關(guān)鍵的[…]機制。

嘶,聽起來是不是相當(dāng)熟悉,現(xiàn)在人類寫作風(fēng)格也逐漸被LLM影響,打開一篇論文鋪天蓋地都是“深入研究了”、“極具潛力的”、“至關(guān)重要的”、“無與倫比的”……

部分詞匯的頻繁出現(xiàn),讓使用LLM的論文極易被察覺,通過將222個低頻風(fēng)格詞和10個高頻風(fēng)格詞組合計算,研究人員發(fā)現(xiàn)在2024年的論文中至少10%-11%的摘要中使用了LLM,部分子語料庫中這一比例甚至高達30%



另外,研究還發(fā)現(xiàn),在不同學(xué)科、地域和期刊中LLM的使用也存在顯著差異

在計算領(lǐng)域、生物信息學(xué)等學(xué)科中,由于行業(yè)技術(shù)日新月異,而研究者需要迅速掌握新技術(shù),依賴LLM協(xié)助,約占20%

在中國、韓國等非英語國家中,由于需要LLM輔助英語寫作,LLM使用率可達15%,相比之下,像英國、澳大利亞等英語國家的LLM使用率相對較低。

一些低門檻的開放獲取期刊,如MDPI旗下的《Sensors》,LLM可達24%,而像《Nature》、《Science》等頂刊只有6%到8%,研究人員推測,可能是由于前者審稿流程相對簡化,而作者需要依賴LLM快速成文。



所以原來不知不覺,LLM已經(jīng)影響我們?nèi)绱酥睿?/p>

不夠透明的LLM使用

然而在2024年底,研究人員對arXiv已發(fā)表和已撤回的論文摘要再次進行統(tǒng)計分析,以月為單位計算詞匯頻率,并對每1萬篇摘要進行標準化處理。



研究發(fā)現(xiàn),一些像“delve”、“intricate” 這類已經(jīng)被明確指出是ChatGPT的常用詞匯,自2024年4月起使用頻率顯著下降。

而ChatGPT喜歡的另一些較為常見的詞匯,如“significant”、“additionally” ,使用率反而持續(xù)上升。



該現(xiàn)象表明,在使用LLM時,論文作者現(xiàn)在會主動調(diào)整輸出,避免使用典型的LLM特征詞,而一些常用詞因為本身普遍使用,且相關(guān)研究討論度較低,單獨出現(xiàn)也并不容易被發(fā)現(xiàn)。

這一點研究人員在實驗中也得以證明,他們分別通過以下兩種提示詞,讓GPT-4o-mini處理文本:

  1. 直接修改句子。
  2. 禁止使用LLM特征詞并修改句子。

對比原始文本和修改后的摘要,發(fā)現(xiàn)使用提示詞1后,LLM特征詞頻率上升,而使用提示詞2后,相關(guān)詞頻出現(xiàn)下降,不過并未完全消除,說明人為干預(yù)可以調(diào)整部分輸出,但無法完全規(guī)避



再將原始摘要、LLM生成摘要、經(jīng)過提示詞修改后的摘要依次投入Binoculars這一MGT(機器生成文本)檢測器中。

與詞頻分析得出的結(jié)果不同,檢測器并未顯示出明顯的真實摘要和LLM生成摘要的得分差異,但提示詞處理確實會在一定程度上影響MGT檢測器的結(jié)果。



所以MGT檢測器也并非完全準確,準確度受不同LLM模型和文本類型影響,且作者們現(xiàn)在使用特定提示詞修改文本,都讓檢測器難以準確判斷論文與LLM關(guān)系。

但研究人員也表示,未來他們將通過統(tǒng)計大量文本中常見詞匯的頻率來進一步估計AI對學(xué)術(shù)文獻的影響,而不僅僅只針對單個短文本進行檢測。

總而言之,LLM在科研工作中的影響力日益增長的同時,也亟需逐步完善其在學(xué)術(shù)論文中占比的量化分析,如何更好地讓AI參與學(xué)術(shù)寫作、AI使用的邊界在哪里等等,這些問題也許都值得我們重新思考。

參考鏈接:
[1]https://www.nature.com/articles/d41586-025-02097-6
[2]https://www.science.org/doi/10.1126/sciadv.adt3813
[3]https://arxiv.org/abs/2502.09606

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
收到中國邀請后,李在明第二天親自答復(fù),訪華的決心不好下

收到中國邀請后,李在明第二天親自答復(fù),訪華的決心不好下

科技處長
2025-07-04 23:08:36
三星三折疊,蘋果拼輕薄:2025 下半年旗艦機前瞻

三星三折疊,蘋果拼輕薄:2025 下半年旗艦機前瞻

愛范兒
2025-07-04 11:16:17
啥原因?qū)е缕牌诺匚辉絹碓降停烤W(wǎng)友:根本原因是養(yǎng)了個不孝順兒子

啥原因?qū)е缕牌诺匚辉絹碓降停烤W(wǎng)友:根本原因是養(yǎng)了個不孝順兒子

娛樂圈人物大賞
2025-06-15 00:15:07
買車為啥別買白色?交警:教你一句選色口訣,跟著買,不會錯

買車為啥別買白色?交警:教你一句選色口訣,跟著買,不會錯

全金貓眼
2025-07-02 20:26:02
俄烏戰(zhàn)爭:盧宇光列傳

俄烏戰(zhàn)爭:盧宇光列傳

憑闌聽史
2025-07-02 17:28:51
官方:韓國國腳、原天津權(quán)健外援權(quán)敬原加盟K聯(lián)賽安養(yǎng)隊

官方:韓國國腳、原天津權(quán)健外援權(quán)敬原加盟K聯(lián)賽安養(yǎng)隊

懂球帝
2025-07-04 10:07:07
76歲何慶魁梅開三度,被親兒子捅刀:他玩不動了,每月1萬夠花!

76歲何慶魁梅開三度,被親兒子捅刀:他玩不動了,每月1萬夠花!

火之文
2025-07-04 18:06:19
大連人注意,還有雨!今天起,出門多穿紅色衣服…

大連人注意,還有雨!今天起,出門多穿紅色衣服…

魯中晨報
2025-07-04 15:47:09
短劇男主出道前后對比,誰是天然帥哥誰是濾鏡美男,差距一目了然

短劇男主出道前后對比,誰是天然帥哥誰是濾鏡美男,差距一目了然

不似少年游
2025-07-02 08:20:37
前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對轟!

前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對轟!

阿龍聊軍事
2025-06-07 20:04:46
日本最著名的便利店,拍過的片子100T硬盤都裝不下

日本最著名的便利店,拍過的片子100T硬盤都裝不下

beebee
2025-07-02 11:11:35
中國U16男足1:1戰(zhàn)平日本,浮嶋敏證明自己帥惟浩上限郜林

中國U16男足1:1戰(zhàn)平日本,浮嶋敏證明自己帥惟浩上限郜林

李廣專業(yè)體育評論
2025-07-04 21:32:20
國務(wù)院任免國家工作人員:免去費東斌的國家鐵路局局長職務(wù)

國務(wù)院任免國家工作人員:免去費東斌的國家鐵路局局長職務(wù)

界面新聞
2025-07-03 16:47:53
探花視頻是怎么拍出來的?

探花視頻是怎么拍出來的?

吃瓜黨二號頭目
2025-06-18 10:54:04
森林是不是越多越好?3.06億年前的地球,早就交了一次昂貴的學(xué)費

森林是不是越多越好?3.06億年前的地球,早就交了一次昂貴的學(xué)費

半解智士
2025-06-20 19:12:01
發(fā)現(xiàn)一個奇怪的現(xiàn)象:辭職或失業(yè)后不上班的人,工資沒了,但時間久了卻再也不想回去上班了。為什么呢?

發(fā)現(xiàn)一個奇怪的現(xiàn)象:辭職或失業(yè)后不上班的人,工資沒了,但時間久了卻再也不想回去上班了。為什么呢?

互聯(lián)網(wǎng)思維
2025-06-21 23:33:51
寧可臺灣不長草,也要解放臺灣島!

寧可臺灣不長草,也要解放臺灣島!

華山穹劍
2025-07-04 21:26:36
“只有將亮度調(diào)亮,才能看懂的梗!”哈哈哈哈哈,細節(jié)決定成敗

“只有將亮度調(diào)亮,才能看懂的梗!”哈哈哈哈哈,細節(jié)決定成敗

滄海一書客
2025-02-15 10:40:42
伊朗國葬現(xiàn)場,黑衣人突現(xiàn),美歐大驚失色:這不可能!

伊朗國葬現(xiàn)場,黑衣人突現(xiàn),美歐大驚失色:這不可能!

林子說事
2025-07-04 04:57:05
中國女籃迎戰(zhàn)澳大利亞:家門口的熱身之戰(zhàn)

中國女籃迎戰(zhàn)澳大利亞:家門口的熱身之戰(zhàn)

環(huán)球體壇啄木鳥
2025-07-04 11:37:11
2025-07-05 03:16:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
10796文章數(shù) 176178關(guān)注度
往期回顧 全部

科技要聞

被雷軍"震驚"后,何小鵬"藏起"G7的戰(zhàn)報

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

頭條要聞

美媒:特朗普的"大而美"法案讓14億中國人在笑話我們

體育要聞

體壇最爽打工人:37歲被裁,工資領(lǐng)到72歲

娛樂要聞

李宇春身上的標簽?zāi)膫€才是真的?

財經(jīng)要聞

茅臺從3300跌到1700 泡沫破了酒才真香

汽車要聞

重生之拿回銷量 領(lǐng)克10 EM-P搶鮮實拍

態(tài)度原創(chuàng)

時尚
數(shù)碼
本地
房產(chǎn)
公開課

再見多巴胺,今年流行的“淡彩色”穿搭太美了!

數(shù)碼要聞

TCL實業(yè)盧春水:彩電是一個朝陽行業(yè),我們正在蓬勃發(fā)展

本地新聞

建筑地標如何成為城市人才匯聚的 “強磁場”?

房產(chǎn)要聞

重磅發(fā)布!海南樓市2025上半年Top10榜單出爐!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 仪征市| 方城县| 九江县| 襄垣县| 屏东市| 滁州市| 玛纳斯县| 浦城县| 益阳市| 千阳县| 昌平区| 垦利县| 沾化县| 武冈市| 始兴县| 潢川县| 双流县| 福贡县| 延川县| 水城县| 黄平县| 三门峡市| 崇义县| 乐安县| 隆化县| 金塔县| 思南县| 商河县| 高邑县| 安顺市| 大安市| 阿图什市| 旺苍县| 广丰县| 张家口市| 阿瓦提县| 城固县| 凌源市| 凤冈县| 望都县| 喜德县|