99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

中國論文工廠,已經用AI批量生產垃圾論文了?

0
分享至

7.9

知識分子

The Intellectual

圖源:Pixabay



撰文 | 張天祁

Scientific Reports的副主編、英國薩里大學數據科學家馬特·斯皮克(Matt Spick)注意到,一批垃圾論文正以每天一篇甚至兩篇的速度,在迅速涌入他工作的期刊。

它們選題各異,套路卻驚人地一致。有的研究血清維生素D與抑郁癥的關系,有的分析碘攝入與糖尿病,有的考察炎癥指數與睡眠質量,總之就是考察一個變量對一種疾病的影響。只需一份標準化的數據集、一段回歸模型腳本,再得出一個統計顯著的結果,這類論文就能迅速成文。換個變量,又是新的一篇。

這種沒有信息含量的垃圾論文數量在迅速膨脹。2024年,僅1月至10月,全球就發表了190篇這類基于美國 NHANES 健康數據庫的“單因子關聯研究”,幾乎是2014至2021年間年均發表數量的五十倍。

01

國產垃圾論文攻陷國外期刊


更引人注意的是,垃圾論文數量的激增幾乎完全集中在中國。2021至2024年間,全球共發表了316篇此類論文,其中有292篇的第一作者來自中國單位,占比超過92%。而在2014至2020年的25篇中,這一數字僅為2篇[1]。

這組數據來自于斯皮克和他合作者今年發布的一項研究。為了系統性地研究這一現象,斯派克和他的合作者在PubMed和Scopus等學術數據庫中,使用精確的關鍵詞組合進行檢索,篩選出過去十年間所有使用NHANES數據、且研究設計為單因素關聯的論文。經過篩選,他們最終確定了341篇符合條件的論文作為分析對象。

這些論文大多采用相同的方法框架:使用 logistic 回歸模型,研究一個健康變量與一種疾病或生理狀態之間的統計關聯,最多控制三五個協變量,結論集中在“顯著相關”這一層面。研究的問題不同,結構幾乎不變。

在對這三百多篇論文進行分析后,研究團隊發現,它們普遍遵循一套高度重復的寫作腳本。研究者從數據庫中選取一個預測變量,比如某種維生素水平,再選擇一個健康結果,比如抑郁癥,通過標準化的統計流程將兩者建立關聯,最終得出一個簡單的結論,A 與 B 相關。在最極端的情況下,研究者甚至只需顛倒自變量和因變量的位置,就能生成另一篇論文,無需任何生理學依據或理論假設,便可無限擴展變量與結局的組合方式。

為了進一步說明這類研究存在的問題,研究團隊使用了網絡分析方法,把所有論文中提到的預測變量和疾病之間的配對關系畫成圖表。結果顯示,像抑郁癥這樣的復雜疾病,被幾十個毫無關聯的變量分別單獨研究過一次。圖中呈現出一種“一個變量對應一個疾病”的稀疏結構,揭示出這類研究往往忽視疾病背后的多重因素,只是簡單地找出某種單一因素與某個結果之間的聯系。

團隊以抑郁癥為例,檢驗這些論文是否可靠。他們統計了所有聲稱與抑郁癥顯著相關的研究,一共28篇,并使用一種叫“錯誤發現率”(FDR)的統計方法,對這些結果重新進行了校正。FDR 用來處理多個變量同時檢驗時容易出現的假陽性問題。結果發現,這28項中有15項在校正后不再顯著,說明很多看起來有效的結果,其實可能只是偶然波動造成的。

研究人員進一步發現,不少論文在數據使用上存在操縱的嫌疑。NHANES 是一項跨年滾動調查,覆蓋數十年的連續數據,供研究者完整調用。但在大部分論文中,作者卻在沒有提供任何解釋的情況下,僅選取了其中一小段年份區間進行分析。這種精心挑選數據的做法,很難不令人懷疑其動機是為了篩選出p值最低、結果最漂亮的組合來發表。

將所有線索串聯起來,一條AI論文流水線已經顯示地非常清晰了。一個對AI開放的數據庫作為原料,輔以自動化的分析腳本,再套用高度公式化的研究設計,最終得以在短期內以指數級速度產出大量雷同的論文。這套流程完美地契合了AI輔助的工作模式,正如報告作者所言,這種生產力的提升,對“旨在通過提供低質量或偽造稿件來牟利的論文工廠尤其具有吸引力” 。

02

論文工廠用上AI了


這一切的起點,是龐大的公共健康數據庫NHANES。這是由美國官方主導的一項長期項目,旨在評估美國成人和兒童的健康與營養狀況。該調查每兩年進行一次,招募約1萬名參與者,通過結合訪談、體格檢查和實驗室檢測,收集了涵蓋疾病、風險因素、營養指標等超過700個變量的綜合數據。

造成這一局面的部分原因,在于NHANES 本身高度結構化的數據形式。它的數據可以通過API直接導入Python或R語言環境,一系列標準庫(如 nhanesA、pynhanes、NHANES pyTOOL 等)支持自動搜索、清洗、建模與輸出。過去需要團隊手動完成的數據整理和圖表繪制,如今可在更短時間內借助腳本工具實現。

更關鍵的是,NHANES是一個AI就緒(AI-ready)的數據集。 這意味著,研究者可以通過應用程序編程接口(API)輕松地、自動化地提取和分析數據。 這種設計本意是為提高科研效率,但它也為“數據挖掘”和批量生產論文打開了方便之門。

斯皮克團隊認為,他們的研究結果很可能嚴重低估了問題的規模。他們的檢索范圍局限于符合利用NHANES的單因子研究。但更寬泛的搜索顯示,僅在一年之間,使用 NHANES 數據發表的論文數量就從2023年的4926篇增長到了2024年的7876篇。

來自美國西北大學的研究者瑞茲·理查森(Reese Richardson)一直關注論文工廠的動向。他在一次快速檢索中,就發現了5篇未被斯皮克團隊納入的 NHANES 論文,這些文章與某個可疑論文工廠有關聯。它們的寫作結構與斯皮克所識別出的論文非常相似,同樣是圍繞 NHANES 數據中的單一變量與某種疾病的簡單相關性展開,例如電子煙使用與肺部疾病之間的關聯[2]。

以“臨床公共數據庫挖掘”為關鍵詞,在中國社交媒體平臺上不難搜到大量提供服務的公眾號。其中除了本文提到的 NHANES 數據庫,GBD(Global Burden of Disease,全球疾病負擔研究)等數據庫也頻繁出現在這些平臺的推文和案例中,成為熱門的數據來源。

這類公眾號大多提供多種模式的服務,例如:根據研究主題協助下載公開數據,完成統計分析,撰寫數據分析報告,或在已有數據和主題的基礎上提供論文思路和寫作指導。一些平臺還進一步打出“全流程陪跑”的口號,從選題、分析到英文潤色,覆蓋論文寫作的各個階段。

在一些平臺的廣告中,造假的暗示已非常露骨。例如有平臺寫道:“因公共數據庫的開放性,我們提供的統計服務可不斷更換研究主題,挖掘數據,直至分析出發表級的統計分析結果,并可提供中英文的方法和結果。”換句話說,就是以發表為目標,圍繞數據庫中的變量反復組合、拆解、篩選,直到跑出一組足夠顯著的結果。



參考文獻:

[1]Suchak, T., Aliu, A. E., Harrison, C., Zwiggelaar, R., Geifman, N., & Spick, M. (2025). Explosion of formulaic research articles, including inappropriate study designs and false discoveries, based on the NHANES US national health database. PLoS Biology, 23(5), e3003152.

[2]O’Grady, C. (2025, May 14). Low-quality papers are surging by exploiting public data sets and AI. Science.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
小四月從瑞士回國,15歲的她有點凸嘴,素顏像媽媽,一身行頭超5w

小四月從瑞士回國,15歲的她有點凸嘴,素顏像媽媽,一身行頭超5w

史書無明
2025-07-23 21:59:58
戶口博弈:男子拿到北京戶口就跳槽,戶口被公司直接遷到湖北宜昌

戶口博弈:男子拿到北京戶口就跳槽,戶口被公司直接遷到湖北宜昌

阿傖說事
2025-07-18 09:09:24
鬧大了!奧委會點名讓中國辦奧運?網友吵翻:先看看菜市場的價簽

鬧大了!奧委會點名讓中國辦奧運?網友吵翻:先看看菜市場的價簽

史書無明
2025-07-22 20:43:33
教育部辦公廳主任朱小杰,職務調整

教育部辦公廳主任朱小杰,職務調整

新京報
2025-07-23 22:09:25
韋德:比爾想和哈登合作有些日子了 這都因為后者的組織能力

韋德:比爾想和哈登合作有些日子了 這都因為后者的組織能力

直播吧
2025-07-23 21:24:43
A股:指數精準收在3582.30,不出意外,明天再次上演同樣的劇本?

A股:指數精準收在3582.30,不出意外,明天再次上演同樣的劇本?

說說史事
2025-07-23 17:24:08
A股:公安部、發改委重磅發聲!穩定幣突發利空,明天市場如何走?

A股:公安部、發改委重磅發聲!穩定幣突發利空,明天市場如何走?

八斗小先生
2025-07-23 16:48:14
傳奇搖滾巨星去世,兩周前剛舉辦告別演唱會

傳奇搖滾巨星去世,兩周前剛舉辦告別演唱會

紅星新聞
2025-07-23 14:33:47
陳佩斯《戲臺》票房井噴,讓多少資方臉紅,黃渤這次又賭對了?

陳佩斯《戲臺》票房井噴,讓多少資方臉紅,黃渤這次又賭對了?

東方不敗然多多
2025-07-22 17:27:31
官方出手!親美辱華、為安倍哭喪的呂麗萍,今自食惡果再次變笑話

官方出手!親美辱華、為安倍哭喪的呂麗萍,今自食惡果再次變笑話

啟娛說
2025-07-22 16:42:28
24省份半年報陸續出爐:廣東穩居首位,四川守住第五

24省份半年報陸續出爐:廣東穩居首位,四川守住第五

時代周報
2025-07-23 15:24:30
娃哈哈風波后,鐘睒睒昔日言論被挖出:人要有道德水平,我們的錢是干凈的

娃哈哈風波后,鐘睒睒昔日言論被挖出:人要有道德水平,我們的錢是干凈的

可達鴨面面觀
2025-07-20 09:49:18
馬斯克可能重返美國政壇:他為啥敢硬剛總統?這正是美國厲害之處

馬斯克可能重返美國政壇:他為啥敢硬剛總統?這正是美國厲害之處

老方
2025-07-23 14:47:35
堅持埼玉的訓練方法1000天之后,堂主lee成為了真正的一拳超人

堅持埼玉的訓練方法1000天之后,堂主lee成為了真正的一拳超人

手談姬
2025-07-22 20:56:03
煥然一新的紅魔?阿莫林的夢想11人,在姆貝烏莫之后還有三筆轉會

煥然一新的紅魔?阿莫林的夢想11人,在姆貝烏莫之后還有三筆轉會

夜白侃球
2025-07-23 20:11:29
指南針股價創新高

指南針股價創新高

每日經濟新聞
2025-07-23 13:13:17
賴清德、曹興誠掉槍大扣分,藍營估罷免從“亮紅燈”轉趨穩

賴清德、曹興誠掉槍大扣分,藍營估罷免從“亮紅燈”轉趨穩

郭茂辰海峽傳真
2025-07-23 22:22:52
人在極度勞累下,一次最多能睡多久?網友:列車員說把他嚇壞了

人在極度勞累下,一次最多能睡多久?網友:列車員說把他嚇壞了

特約前排觀眾
2025-07-23 00:15:03
偶遇王思聰坐飛機!蜷腿看著好疲憊,戴名表坐經濟艙該省省該花花

偶遇王思聰坐飛機!蜷腿看著好疲憊,戴名表坐經濟艙該省省該花花

娛樂圈圈圓
2025-07-23 11:38:02
蔡依林回應與彭于晏復合6年

蔡依林回應與彭于晏復合6年

大象新聞
2025-07-23 19:08:27
2025-07-24 00:23:00
知識分子 incentive-icons
知識分子
關注科學、人文、思想
425文章數 839關注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

家居
游戲
親子
公開課
軍事航空

家居要聞

晨曦生活 明媚而放松

LPL第三階段:有驚無險,WBG三局戰勝WE

親子要聞

醫學科普中醫脾胃育兒

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國核彈頭重回英國牽動全球神經

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 麻阳| 黑水县| 乌拉特中旗| 丹巴县| 顺昌县| 兴城市| 昌平区| 北票市| 鞍山市| 镇沅| 三明市| 三门峡市| 交城县| 和龙市| 长兴县| 枝江市| 罗甸县| 贞丰县| 同仁县| 城固县| 沈阳市| 上高县| 含山县| 上饶市| 阳高县| 平顺县| 梁河县| 朔州市| 桂林市| 周口市| 沭阳县| 抚宁县| 湟中县| 罗田县| 五大连池市| 通辽市| 平昌县| 原阳县| 木兰县| 商丘市| 资中县|