新智元報道
編輯:桃子
【新智元導讀】21世紀最具影響力的25篇論文中,AI論文竟然獨占鰲頭!從席卷全球的ResNet到奠定ChatGPT基礎的Transformer架構,Nature獨家揭秘全球高被引論文。
21世紀第一個25年,AI領域被引最高25篇論文都有哪些?
近日,Nature頭版獨家文章,揭秘了不同科學領域最具影響力的論文。
然而,令人意外的是,那些廣為人知的科學發(fā)現(xiàn):從mRNA疫苗和CRISPR基因編輯技術,到希格斯玻色子的發(fā)現(xiàn)和引力波的首次測量,并沒有出現(xiàn)在這些入選的論文中。
他們得出結論,被引最高的論文,正是描述科學方法、軟件工具或系統(tǒng)性綜述的「幕后英雄」。
那么,都有哪些論文上榜了呢?
引用:科學影響力的衡量標準
引用是學術界衡量論文影響力的重要指標,作者通過引用來致敬前人的工作。
Nature的分析基于五個學術數(shù)據(jù)庫(涵蓋了21世紀數(shù)千萬篇論文),通過取中位數(shù)排名,篩選出本世紀最受引用的25篇論文。
結果顯示,人工智能、提升研究質量提升、癌癥統(tǒng)計、研究軟件相關的論文占據(jù)了榜單前列。
唯一例外是一篇2004年關于石墨烯實驗的開創(chuàng)性論文,這項工作為作者贏得了2010年的諾貝爾物理學獎。
AI崛起,ResNet登頂
人工智能論文,在本世紀引用榜單中獨領風騷。
位居榜首的是,微軟團隊2016年發(fā)表的一篇論文——Deep Residual Learning for Image Recognition。
這恰恰是所有人熟知的「深度殘差學習」神經網絡——ResNets的開山之作,由AI大牛孫劍帶隊何愷明等人完成。
論文地址:https://arxiv.org/abs/1512.03385
ResNets解決了信號在多層網絡中傳播時衰減的問題,讓研究人員能夠訓練約150層神經網絡。
這大約是當時常規(guī)神經網絡層數(shù)的5倍。
該論文首次作為預印本發(fā)布于2015年末,微軟團隊憑借其在圖像識別競賽中奪冠。
ResNets的突破為AI飛速發(fā)展鋪平了道路,催生了AlphaGo、AlphaFold、ChatGPT等模型誕生。
現(xiàn)就職于麻省理工學院的何愷明表示,「在ResNets之前,深度學習并不那么『深』」。
據(jù)統(tǒng)計,這篇論文的引用量在10萬-25.4萬次之間。在五個數(shù)據(jù)庫中有兩個將其列為第一,兩個列為第二,一個列為第三,綜合中位數(shù)排名第一。
Google Scholar這篇論文被引數(shù)已超25萬
此外,2017年谷歌發(fā)表的Attention is all you need排位列七,論文中提出了著名的Transformer架構,成為ChatGPT等大模型的核心。
論文地址:https://arxiv.org/pdf/1706.03762
AI論文的高引用量,主要是因為其廣泛的應用領域和快速的研究進展。
同樣,AI教父Geoff Hinton指出,「AI論文天然具有引用優(yōu)勢」。
2012年,Hinton帶領學生Ilya、Alex Krizhevsky發(fā)表的AlexNet論文排名第八。
這篇巨作展示了神經網絡在圖像識別競賽中的壓倒性優(yōu)勢,掀起了后來的深度學習革命。
論文地址:https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf
此外,開源也助推了AI論文的引用。
比如排名第六的Random Forests論文介紹了一種開源、易用的機器學習算法,廣泛應用于多個領域。
論文地址:https://link.springer.com/article/10.1023/A:1010933404324
需要說明的是,許多AI論文以預印本形式發(fā)布,增加了引用統(tǒng)計的復雜性。
OpenAlex數(shù)據(jù)庫嘗試合并預印本與最終出版物的引用,而Google Scholar則努力將同一作品的所有版本歸類并匯總引用。
研究軟件:科學家的「工具箱」
除了AI領域,研究軟件相關論文在本世紀引用榜單中表現(xiàn)亮眼。
排名第二的論文由Thomas Schmittgen等人于2000年發(fā)表,介紹了一種用于定量PCR(聚合酶鏈式反應)數(shù)據(jù)分析的方法。
這篇論文應審稿人要求而生,因其提供了計算基因活性變化的簡單公式,被引量超過16.2萬次,躋身歷史前十。
論文地址:https://www.sciencedirect.com/science/article/abs/pii/S1046202301912629
排名第五的論文,是由英國化學家George Sheldrick撰寫,介紹SHELX程序套件,用于分析X射線散射模式以揭示分子結構。
這篇2008年的綜述論文建議使用SHELX時引用,引用量在7萬至9萬次之間。
論文地址:https://journals.iucr.org/a/issues/2008/01/00/sc5010/index.html
其他軟件論文,如排名第十五的scikit-learn(Python機器學習庫)和排名第十八的DESeq2(RNA測序分析),因其開源和易用性,成為科學家不可或缺的工具。
統(tǒng)計軟件:數(shù)據(jù)分析的利器
統(tǒng)計軟件相關論文,也在榜單中名列前茅。
例如,排名第15的scikit-learn論文和排名第22的lme4論文分別為Python和R語言用戶提供了強大的數(shù)據(jù)分析工具。
排名第23的G*Power軟件論文則幫助生物學家計算實驗所需的樣本量,以確保統(tǒng)計顯著性。
值得注意的是,R編程語言本身未出現(xiàn)在榜單中,盡管OpenAlex記錄其引用量超過30萬次。
這是因為R的開發(fā)者建議用戶引用其網站而非學術論文,導致數(shù)據(jù)庫記錄不一致。
這也提醒研究者:若開發(fā)了有影響力的程序,發(fā)表一篇相關論文至關重要。
癌癥與健康:數(shù)據(jù)驅動的洞見
癌癥研究領域的三篇論文在榜單中占據(jù)重要位置。
排名第四的Diagnostic and Statistical Manual of Mental Disorders(DSM-5)是精神病學領域的權威指南,2013年出版后廣泛用于研究和臨床,定義了精神障礙的診斷標準。
排名第九和第十的是世界衛(wèi)生組織GLOBOCAN項目于2018年和2020年發(fā)布的全球癌癥統(tǒng)計報告,為研究者和政策制定者提供了關鍵數(shù)據(jù)。
排名第十九的綜述論文總結了癌癥的「標志性特征」,激勵了無數(shù)學生投身癌癥研究。
提升研究質量
提升研究質量的論文在本世紀引用榜單中熠熠生輝。排名第三的論文Using thematic analysis in psychology,由心理學家Virginia Braun和Victoria Hannah Clarke于2006年發(fā)表,介紹了「主題分析」——一種分析定性數(shù)據(jù)的系統(tǒng)方法。
這篇為學生設計的指南意外成為本世紀第三高引用論文,徹底改變了兩位作者的職業(yè)軌跡。
排名第11的PRISMA聲明(2009年)為系統(tǒng)綜述和薈萃分析提供了27項報告規(guī)范,引用量在5.3萬至13.8萬次之間。
2020年更新的PRISMA(排名第23)同樣上榜。排名第17的論文(2003年)討論了行為研究中的方法偏差,幫助研究者提高研究嚴謹性。
參考資料:
https://www.nature.com/articles/d41586-025-01125-9
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.