2025年5月,Science 雜志發表題為Low-quality papers are surging by exploiting public data sets and AI的評論文章,指出公共數據挖掘和AI導致低質量論文泛濫,反對應用NHANES、GBD等公共數據庫進行的套路性研究。
(Science 網站截圖)
數據開源和AI技術本身是推動科研進步的利器,而不是低質量論文泛濫的原罪!NHANES數據濫用案例,本質上暴露了三個深層問題。
首先,方法論創新貧乏。許多研究團隊將公共數據庫視為數據礦場,用窮舉變量組合的粗暴方式替代科學假設驅動的研究范式,嚴重違背了科研探索的本質。我們可能經常遇到這樣的論文,作者對生物機制的理解停留在相關性強弱上,而沒有進一步的因果關系探究。
其次,技術倫理缺位。AI輔助寫作本可以提升科研效率,但是有的團隊將其用作學術洗稿工具,通過文本重組生成表面合規但科學內涵空洞的文章。而更危險的是,這種模式正被論文工廠產業化,形成從數據挖掘到論文生成的完整灰色鏈條。
最后,評價機制失靈。現行科研考核體系對短平快成果的偏愛,客觀上鼓勵了這種低風險、低創新的研究模式。學術期刊可以設立更好標準的論文發表要求和準則,比如生信類論文必須包含實驗驗證,或對公共數據的分析必須提供新的方法學貢獻。
解決問題的關鍵不在限制數據共享,而在重建學術共同體的自律機制。期刊應當要求作者披露AI使用情況,并建立方法學創新性的清單;資助機構也要調整評價導向,對數據挖掘類的研究給予更嚴格的審查。只有讓投機者無利可圖,才能引導科研回歸發現真知的軌道。
雪崩時,沒有一片雪花是無辜的。公共數據挖掘的研究,只要能夠濕實驗驗證,就可以發表;如果還能闡明機制,那就向高質量論文又邁進了一步!
不要忘了,二八定律具有普適性!沒有公共數據和AI的科研時代,高質量研究也是少數,低質量論文雖然沒有泛濫,但也不少!
以上僅為個人觀點,拋磚引玉,供大家參考!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.