最近,《自然》雜志發布專題報告,回顧了科學文獻數據庫中被引用最多的科研論文。根據Web of Science、Dimensions和Scopus等多個數據庫提供的數據,他們發現人工智能、提升研究質量的科研軟件和方法、癌癥統計數據等主題的論文占據21世紀熱門論文榜單[1]。而1951年發表于《生物化學雜志》的一篇描述蛋白質測定方法的論文[2],繼續穩坐迄今為止被引次數最多論文榜首。
早在2014年,《自然》雜志就已統計過史上被引次數最多的100篇論文[3],他們發現最知名的一些研究并未入選,例如發現高溫超導體和DNA雙螺旋結構解析等獲得諾獎的研究。相反,上榜論文多是生物醫學和統計學領域中實用性極強的技術方法,例如Lowry蛋白質測定法、Sanger測序法和PCR等。此外,像BLAST和Clustal這樣的生物信息學工具、用于繪制進化樹的鄰接法、以及Kaplan–Meier和Cox模型等統計方法也位列其中。榜單還顯示,計算機的發展推動了這些方法的普及,而工具類軟件、數據庫和統計模型往往能獲得遠超基礎科學突破的引用量。
而在當前《自然》雜志更新的榜單中,排名有一半已經發生了變化,21世紀已有16篇論文躋身歷史前50名。值得一提的是,微軟研究人員在2015年人工智能會議上提交的一篇論文《用于圖像識別的深度殘差學習》[4],迅速攀升至歷史百大榜單第5名(WoS、Dimensions和Scopus數據庫排名中位數分析)。
進一步的分析發現,這篇論文已經成為21世紀以來被引用次數最多的論文。該論文的作者提出了深度殘差學習(ResNet)架構,突破性地解決了深層神經網絡訓練中的信號衰減問題,使網絡層數達到前所未有的深度,并在2015年贏得圖像識別競賽。ResNet不僅成為深度學習發展的重要里程碑,也為后續的AI突破——如AlphaGo、AlphaFold和ChatGPT等技術的出現奠定了基礎。
不過,不同數據庫對這篇論文的引用統計存在差異。谷歌學術將其列為第二高被引論文,引用次數達25.4萬,而Web of Science則將其排在第三,引用略超10萬。盡管排名不一,在五個主流數據庫中,它的中位排名居首。然而,引用次數本身存在諸多不公平因素,例如發表時間較早、所處領域熱門等都會帶來積累優勢。盡管《自然》曾嘗試通過計量學方法調整這些影響,但由于入選文章本就引用極高,整體榜單變化不大,僅有部分疫情相關新論文有所上升。
除此之外,人工智能、研究軟件與方法、癌癥與健康相關研究也進入21世紀被引次數最高論文榜單[5]。AI領域憑借跨學科適用性和迅猛發展勢頭,多篇關鍵論文高居榜單,包括2012年開啟深度學習熱潮的AlexNet、推動大語言模型發展的Transformer架構“Attention is all you need”,以及廣泛應用于圖像處理的U-Net網絡等。開源特性和預印本文化也促進了這些論文的廣泛傳播。
研究軟件方面,定量PCR、RNA測序分析工具DESeq2、結晶分析程序SHELX等被廣泛引用。健康類論文中,GLOBOCAN癌癥統計報告、癌癥標志物綜述以及DSM-5精神障礙分類指南影響深遠。此外,主題分析方法、PRISMA系統綜述報告指南、I2統計量等研究質量提升工具也躋身前列,scikit-learn、lme4、G*Power等統計與編程軟件的引用量也極高。
總的來看,許多論文因其快速發展趨勢在引用上展現出天然優勢,還有一些論文更是借助工具性、方法指南或綜述性獲得超高引用。然而,一個值得深思的問題也浮上水面:為什么原創性的基礎研究逐漸淹沒在高被引論文中?顯而易見的是,引用次數已經不再能夠完全評估科研質量及其影響力,或許我們是時候引入新的評價體系了。
21世紀十大高被引論文
01
Deep residual learning for image recognition
用于圖像識別的深度殘差學習
He, K., Zhang, X., Ren, S., & Sun, J.
發表日期:2016
引用次數:103,756–254,074
這篇論文提出了殘差學習框架(ResNet),成功解決了深層神經網絡訓練困難的問題。通過引入“殘差連接”,網絡可以更高效地學習相對于輸入的變化,使得深度高達152層的模型依然易于優化,并顯著提升了圖像識別準確率。這一突破奠定了深度學習在計算機視覺領域的關鍵基礎。
02
Analysis of relative gene expression data using real-time quantitative PCR and the 2-ΔΔCT Method
使用實時定量PCR及2-ΔΔCT方法分析相對基因表達數據
Livak, K. J., & Schmittgen, T. D.
發表日期:2001
引用次數:149,953–185,480
實時定量PCR數據常用的兩種分析方法是絕對定量和相對定量,其中2-ΔΔCT方法是一種簡便實用的相對定量工具。這篇論文介紹了該方法的原理、假設與應用,并補充了兩種有助于分析的衍生變體。
03
Using thematic analysis in psychology
在心理學中使用主題分析法
Braun, V., & Clarke, V.
發表日期:2006
引用次數:100,327–230,391
這篇論文系統闡述了主題分析在心理學中的應用,強調其作為一種靈活且易于上手的定性研究方法的重要性。文章呼吁研究者更多關注和規范使用主題分析,認為它在心理學及其他領域的定性研究中具有廣泛價值。
04
Diagnostic and Statistical Manual of Mental Disorders,
DSM-5
《精神障礙診斷與統計手冊》第五版(DSM-5)
American Psychiatric Association
發表日期:2013
引用次數:98,312–367,800
《精神障礙診斷與統計手冊》第五版(DSM-5)是當前全球最廣泛使用的精神疾病診斷標準之一。它是對第四版(DSM-IV)及其修訂版的全面更新,旨在反映過去十余年中精神病學、心理學、神經科學等領域的最新研究成果。
05
A short history of SHELX
SHELX簡史
Sheldrick, G. M.
發表日期:2007
引用次數:76,523–99,470
這篇論文總結了SHELX晶體結構解析軟件的發展歷程,回顧了其從1976年版本到現代的演進。SHELX系列盡管起源于舊式計算環境,但憑借穩定性、實用性和不斷改進,至今仍被廣泛應用。
06
Random forests
隨機森林
Breiman, L.
發表日期:2001
引用次數:31,809–146,508
這篇論文介紹了隨機森林算法的原理與優勢。隨機森林通過構建多個相互獨立、基于隨機特征選擇的決策樹組成分類器,其泛化誤差會隨著樹數量的增加而趨于穩定。該方法在誤差率上優于Adaboost,具有更強的抗噪性,并能利用內部估計評估模型性能與變量重要性,廣泛適用于分類與回歸任務。
07
Attention is all you need
注意力機制即一切
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I.
發表日期:2017
引用次數:56,201–150,832
這篇論文提出了一種全新的神經網絡架構——Transformer,完全基于注意力機制,摒棄了以往依賴循環(RNN)或卷積(CNN)結構的復雜模型。Transformer結構簡單、并行性強,訓練效率顯著提高。這一成果標志著注意力機制在序列建模中的巨大潛力。
08
ImageNet classification with deep convolutional neural networks
使用深度卷積神經網絡進行ImageNet圖像分類
Krizhevsky, A., Sutskever, I., & Hinton, G. E.
發表日期:2012/2017
引用次數:46,860–137,997
這篇論文介紹了深度卷積神經架構AlexNet網絡在ImageNet圖像分類任務中的應用。為了提高訓練效率,作者采用了非飽和激活函數和GPU加速的卷積操作,并通過“dropout”技術有效減少過擬合。在ILSVRC 2012競賽中,該模型變體以15.3%的Top-5錯誤率奪得第一名。這項工作開創了深度學習在圖像識別領域的新時代。
09
Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries
全球癌癥統計2020:GLOBOCAN對185個國家36種癌癥發病率和死亡率的估算
Sung, H., Ferlay, J., Siegel, R. L., Laversanne, M., Soerjomataram, I., Jemal, A., & Bray, F.
發表日期:2020
引用次數:75,634–99,390
這篇文章基于國際癌癥研究機構(IARC)發布的 “GLOBOCAN 2020”數據,更新了全球癌癥負擔的最新情況。2020年,全球預計新增癌癥病例達1930萬例,死亡病例近1000萬例。女性乳腺癌首次超過肺癌,成為全球最常見癌癥,其次為肺癌、結直腸癌、前列腺癌和胃癌;而肺癌仍是癌癥死亡的首要原因。預計到2040年,全球癌癥新發病例將增至2,840萬例,較2020年增長47%。
10
Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries
2018年全球癌癥統計:GLOBOCAN對185個國家36種癌癥發病率與死亡率的估算
Bray, F., Ferlay, J., Soerjomataram, I., Siegel, R. L., Torre, L. A., & Jemal, A.
發表日期:2018
引用次數:66,844–93,433
這篇文章基于“GLOBOCAN 2018”數據,評估了全球癌癥負擔,并重點分析了全球20個地區的地理差異。2018年全球預計將有1810萬新發癌癥病例和960萬癌癥死亡,肺癌在發病率和死亡率中均居首位,但不同國家和地區最常見及致死率最高的癌癥類型差異顯著,受經濟發展水平和生活方式影響明顯。
其他高被引論文
11
Preferred Reporting Items for Systematic Reviews and Meta-Analyses: The PRISMA Statement
系統綜述與薈萃分析的首選報告項目:PRISMA聲明
12
U-Net: Convolutional Networks for Biomedical Image Segmentation
U-Net:用于生物醫學圖像分割的卷積神經網絡
13
Electric Field Effect in Atomically Thin Carbon Films
原子級薄碳膜中的電場效應
14
Fitting Linear Mixed-Effects Models Using lme4
使用lme4擬合線性混合效應模型
15
Scikit-learn: Machine learning in Python
Scikit-learn:Python中的機器學習工具
16
Deep learning
深度學習
17
Common Method Biases in Behavioral Research: A Critical Review of the Literature and Recommended Remedies
行為研究中的常見方法偏差:文獻批判性回顧與推薦補救措施
18
Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2
使用DESeq2對RNA測序數據的倍數變化和離散度進行調和估計
19
Hallmarks of Cancer: The Next Generation
癌癥標志物:下一代
20
Measuring inconsistency in meta-analyses
薈萃分析中不一致性的測量
21
NIH Image to ImageJ: 25 years of image analysis
從NIH Image到ImageJ:25年的圖像分析之路
22
Fiji: an open-source platform for biological-image analysis
Fiji:用于生物圖像分析的開源平臺
23
The PRISMA 2020 statement: an updated guideline for reporting systematic reviews
PRISMA 2020聲明:系統綜述報告最新指南
24
ImageNet: A Large-Scale Hierarchical Image Database
ImageNet:一個大規模分層圖像數據庫
25
G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences
G*Power 3:面向社會科學、行為科學與生物醫學科學的靈活統計功效分析程序
參考文獻
[1] https://www.nature.com/articles/d41586-025-01124-w
[2] https://www.jbc.org/article/S0021-9258(19)52451-6/pdf
[3] https://www.nature.com/news/the-top-100-papers-1.16224
[4] https://arxiv.org/abs/1512.03385
[5] https://www.nature.com/articles/d41586-025-01125-9
編譯&整理:神經現實
封面:GPT 4o
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.