圖片系AI生成
如何量化中美AI產(chǎn)學研領域的差距?從人才和論文數(shù)量等維度觀測,是一個較為客觀的衡量標準。
7月3日消息,在2025全球數(shù)字經(jīng)濟大會上,全球首份基于高質量論文數(shù)據(jù)系統(tǒng)分析人工智能十年科研演進的報告——《全球人工智能科研態(tài)勢報告(2015-2024)》,現(xiàn)場還揭曉了五份聚焦全球人工智能科研人才的榜單。
該報告由聯(lián)合國工業(yè)發(fā)展組織投資和技術促進辦公室與東壁科技數(shù)據(jù)有限責任公司(東壁科技數(shù)據(jù))聯(lián)合發(fā)布,基于東壁指數(shù)(Dongbi Index)評價體系,對2015-2024年間發(fā)表的96961篇人工智能領域文獻進行深度分析。
報告中多位AI產(chǎn)學研大佬位列其中,《中國人工智能人才榜TOP100》中的張祥雨,其身份是曠視科技研究院基礎模型組負責人,他的團隊曾獲CVPR2016最佳論文獎,并多次問鼎ImageNet、COCO等頂級視覺競賽。代表作包括Res Net、Shuffle Net系列,已成為工業(yè)界廣泛應用的基石技術,Google Scholar引用數(shù)高達40000多次。
同時躋身全球及中國百人榜、并任職于企業(yè)的研究者還有華為的田奇、王云鶴以及謝凌曦,商湯科技的王曉剛、石建萍,蔚來汽車的任少卿,以及MiniMax閆俊杰、Sand.AI曹越等AI新銳企業(yè)的領軍人。
與此同時,美國頂尖機構中活躍著大量杰出的華人學者身影。全球100人榜單里,在美任職的20位學者中,華人學者占10位,除何愷明、楊明玄外,還有在卡內基梅隆大學任職的朱俊彥等人。以及女性榜單中,11位在美國任職的學者里有3位華人女性,包括斯坦福大學的李飛飛。
另一方面,中國也成為吸引全球AI人才的重要磁極。《報告》顯示,從國家分布來看,盡管美國在全球AI人才聚集方面仍占據(jù)主導地位,谷歌、微軟、IBM、Meta和亞馬遜超過60%至90%的人才均分布在美國。但中國展現(xiàn)出強勁的崛起態(tài)勢,成為第二大人才聚集地,騰訊(94.6%)、阿里巴巴(90.2%)的人才高度集中于本土,微軟也在中國部署了714名人才,占其全球AI人才的29.0%。
人工智能產(chǎn)業(yè)十年,三大階段演進
東壁科技數(shù)據(jù)創(chuàng)始人、深圳大學特聘教授吳登生提到:“從早期的多元探索,到深度學習的爆發(fā)式增長,再到如今的工程化落地與新興方向涌現(xiàn),這份報告勾勒出全球人工智能研究鮮明的階段性特征,發(fā)文量總體呈上升趨勢,粗略可分為初始起步期(2015-2016年)、快速發(fā)展期(2017-2019年)、成熟高峰期(2020-2023年)、波動調整期(2024年)。
2015-2016年是初始起步期,全球AI年度論文數(shù)量出現(xiàn)了小幅下滑,從2015年的4421篇滑落至2016年的3628篇。“這個階段就像是在技術森林中摸索,”吳登生形容道,“傳統(tǒng)研究中,機器學習是主流,沒有‘超級明星’,大家都在多元化嘗試。”
快速發(fā)展的黃金期出現(xiàn)在2017-2019年,此時論文數(shù)量迎來“三連跳”,至2019年一舉突破萬篇大關。2017-2018年是關鍵轉折點,關鍵詞“深度學習”熱度陡增,標志著AI研究開始從實驗室的理論探索大規(guī)模走向實際應用的廣闊天地。
隨后的2020-2023年是成熟高峰期,雖有2022年的短暫回調,但AI科研整體呈現(xiàn)強勁勢頭。其中,2020-2021年堪稱“深度學習”的全面爆發(fā)季,2023年論文量飆升至17,074篇,較2015年實現(xiàn)了近4倍的跨越式增長。在這個階段,AI工程化落地全面推進。
進入最近的2024年,數(shù)據(jù)則揭示出一個重要的調整信號——2024年發(fā)文量回落至14786篇。“這并非退步,而是學術研究的戰(zhàn)略聚焦,”吳登生表示,“AI研究正告別‘廣撒網(wǎng)’,開始進入深度專業(yè)化與精準應用導向的新階段。”
另一方面,從技術演進路徑看,2015年到2017年主要集中在傳統(tǒng)機器學習算法和神經(jīng)網(wǎng)絡基礎研究方面,2018年到2020年深度學習、計算機視覺、自然語言處理等應用領域興起,2021年至2023年,大型語言模型、生成式AI、多模態(tài)模型成為研究前沿,再到2024年至2025年,可解釋性AI、自適應學習、多智能體系統(tǒng)等新興方向涌現(xiàn)。
中美AI差距在哪
榜單數(shù)據(jù)印證了中美在全球AI研究中的核心地位。《全球人工智能機構榜TOP100》顯示,中國機構占據(jù)38席,美國機構占35席。根據(jù)《人工智能領域科研態(tài)勢分析報告(2015-2024)》,中國科學院以2386名頂尖人才、4639篇頂刊論文的體量展現(xiàn)出絕對的優(yōu)勢,清華大學與北京大學分別以1753人和1377人的人才數(shù)和4583篇和3609篇的發(fā)文量緊隨其后,共同構筑了中國頂尖研究機構的“三駕馬車”。
《人工智能領域科研態(tài)勢報告(2015-2024)》則印證了美國的深厚底蘊,美國以35117篇論文(2534篇核心論文)和超過228萬次總被引位居全球學術影響力之首,遠超其他國家。中國以31694篇論文(1557篇核心論文)和約94.9萬次總被引位居第二。
數(shù)據(jù)顯示,全球AI研究人才分布具有顯著的不均衡性和地域集中特征。美國和中國的研究人員數(shù)量合計占全球57.7%,凸顯了兩國在該領域的主導地位。
中國的研究人員數(shù)量從2015年不足萬人到2024年的5.2萬人規(guī)模,以28.7%的年復合增長率展現(xiàn)出驚人的張力。其中,中國科學院3453人、清華大學2667人、北京大學2123人,這些高校人才構成了中國AI人才第一梯隊。另一方面,騰訊、阿里巴巴等科技企業(yè)的研發(fā)團隊分別以992人、633人的規(guī)模超越部分實力高校。
美國以6.3萬余人的人才數(shù)量居全球領先地位,其中,斯坦福大學2385人、麻省理工學院2191人,與谷歌2569人、微軟2461人形成高校企業(yè)雙引擎。
“中國人才規(guī)模的增長速度很快,以5.3萬人緊追美國的6.3萬人”,吳登生對比數(shù)據(jù)指出,“這不僅是數(shù)量上的追趕,也是多維度的靠近。”
谷歌公司和微軟公司各有約2500名人工智能人才,穩(wěn)居第一梯隊,占據(jù)了全球AI人才的主導地位。第二梯隊則由擁有1640名相關人才的美國IBM公司,以及擁有1249名人工智能人才的美國Meta公司占據(jù)。
來自中國的騰訊和阿里巴巴公司也表現(xiàn)突出,兩家公司分別擁有992名和633名人工智能人才,在全球競爭中占據(jù)重要位置。
從論文數(shù)量來看,在機構競爭力層面,中國呈現(xiàn)“國家隊引領”的特征。中國科學院以585篇高影響力論文位居全球科研機構榜首,清華大學、北京大學也進入全球發(fā)文量前十。然而,企業(yè)端的差距較為明顯。美國頭部企業(yè)人均科研產(chǎn)出效率顯著領先,谷歌、微軟、Meta三大科技巨頭的總發(fā)文量為5896篇,是中國TOP3企業(yè)騰訊、阿里、華為的1.8倍,這背后是美國基礎研究數(shù)十年的沉淀,尤其在機器學習、自然語言處理等基礎領域,美國企業(yè)論文的平均被引頻次為63.3次,較中國企業(yè)的55次高出15%。
《報告》還揭示了一個有趣的現(xiàn)象,即中美兩國企業(yè)在人工智能領域的研究上呈現(xiàn)出明顯的路徑分化特征。
2015-2024年,美國企業(yè)AI學術發(fā)文總量為10,330篇,而中國企業(yè)為5,748篇,美國企業(yè)發(fā)文量是中國企業(yè)的1.8倍,領先優(yōu)勢達4,582篇(79.7%)。這反映出美國企業(yè)在AI基礎研究投入和學術產(chǎn)出能力方面具有顯著的優(yōu)勢。
而平均發(fā)文量方面,美國企業(yè)平均發(fā)文543篇,中國企業(yè)平均發(fā)文302篇,美國企業(yè)在平均學術產(chǎn)出上同樣是中國企業(yè)的1.8倍。這表明美國企業(yè)單體研發(fā)實力也較中國企業(yè)具有明顯優(yōu)勢。
AI作為技術密集型產(chǎn)業(yè),其學術研究也高度集中于頭部企業(yè),中美兩國TOP15企業(yè)的發(fā)文集中度均超過99%。
中國發(fā)文最多的前三名企業(yè)分別為騰訊(1,354篇)、阿里巴巴(1,034篇)和華為(885篇),而美國前三名企業(yè)為谷歌(2,895篇)、微軟(1,582篇)、Meta( 1,419篇)。
其中,美國谷歌公司發(fā)文量超過中國前兩名企業(yè)的總和,這體現(xiàn)了美國科技巨頭在AI基礎研究方面的深厚積累。
吳登生還提到關鍵發(fā)現(xiàn):“美國形成了典型的‘人才旋轉門’機制,如卡內基梅隆大學與當?shù)仄髽I(yè)人才流動率達37%。而中國高校與企業(yè)間互通率不足15%,這堵‘隱形墻’亟待打破。”
報告顯示,美國AI研究展現(xiàn)出基礎理論扎實、技術創(chuàng)新驅動和均衡發(fā)展的特點,在機器學習、智能機器人、專家系統(tǒng)等基礎理論和技術創(chuàng)新領域擁有絕對優(yōu)勢,研究注重底層突破和技術倫理,如AI安全與隱私保護。中國AI研究呈現(xiàn)出鮮明的應用導向和產(chǎn)業(yè)結合緊密的特點,在計算機視覺、知識圖譜和自然語言處理方面具有相對優(yōu)勢。
“中國在計算機視覺領域的論文數(shù)量比美國高40.8%,知識圖譜領域高50.1%,在自然語言處理領域也略有優(yōu)勢,”吳登生援引報告數(shù)據(jù)指出,“這與中國在自動駕駛、互聯(lián)網(wǎng)應用、知識管理方面具有龐大市場需求和豐富應用場景密不可分。”
中國企業(yè)也在推薦系統(tǒng)、智能金融(如移動支付)、自動駕駛等強應用、強落地的領域表現(xiàn)突出。此外,在智能算法、邊緣計算等新興探索領域,中國雖起步相對較晚,但也展現(xiàn)出良好的發(fā)展態(tài)勢。
中國AI女性人才占比較低
報告揭示的人才性別失衡問題引發(fā)關注。數(shù)據(jù)顯示,總樣本量為13萬余人,男性科學家占比79.9%,女性科學家占比20.1%。其中,中美AI領域女性人才占比差異明顯。
“最令人驚訝的差距在這里。”吳登生直言,“中國AI女性人才占比僅9.3%,美國20.1%,這個比例,中國在全球Top20中排名倒數(shù)第二,不及美國的一半。”
在中國頭部機構中,清華大學女性人才占比7.88%,北京大學9.18%,而美國斯坦福大學、麻省理工學院的女性人才占比達25%-30%。
性別差距在企業(yè)端更為突出。中國科技企業(yè)AI團隊女性僅占6.1%,谷歌、微軟則女性占比達18.7%。從全球范圍來看,新加坡以36.6%的女性占比位居首位,澳大利亞28.7%、韓國28.1%緊隨其后。報告分析認為,傳統(tǒng)文化觀念、科研評價體系對女性的隱性偏見,以及高強度研發(fā)工作的性別適配性問題,是導致AI人才性別結構失衡的三大主因。
“不過,我們也發(fā)現(xiàn)了一處亮點。”吳登生特意提到:“在中國AI領域,信息技術類院校如西安電子科技大學和綜合性大學如四川大學的性別包容性優(yōu)于傳統(tǒng)工程院校,香港大學的國際化特征亦顯示制度環(huán)境對性別平等的促進作用。說明制度變革能打破傳統(tǒng)桎梏。”
活動現(xiàn)場展示了全球AI人才熱力圖,可以清晰看到“核心-邊緣”的結構,在前20大區(qū)域中,亞洲地區(qū)占據(jù)重要比例,包括北京、香港、上海、深圳、新加坡、首爾等,表明亞太地區(qū)正在成為全球科技創(chuàng)新的重要增長極。美國的紐約、硅谷地區(qū)、波士頓地區(qū)等傳統(tǒng)創(chuàng)新中心仍保持強大的人才吸引力。歐洲地區(qū)以倫敦、蘇黎世等為代表,展現(xiàn)了多元化的創(chuàng)新格局。
數(shù)據(jù)顯示,國家層面來看,美國在全球AI人才聚集方面占據(jù)絕對主導地位。谷歌、微軟、IBM、Meta和亞馬遜超過60%至90%的人才均分布在美國。“但中國正成為新磁極。”吳登生表示,中國成為第二大人才聚集地,不僅吸引了本土騰訊和阿里巴巴的絕大部分人才,美國微軟也在中國部署了714名人才,占其總量的29.0%。
深度學習主導 融合與工程化成未來可能趨勢
通過關鍵詞分析,報告清晰地描繪出人工智能核心技術路線的變化。
“‘深度學習’無疑是過去十年的絕對主角,”吳登生介紹道。“深度學習”關鍵詞頻率累計增長84倍,尤其在2018-2023年,年均增速高達217%,展現(xiàn)出驚人的爆發(fā)力。但他也指出,“2024年其增速首次降至30%,進入平臺期,預示著單靠模型規(guī)模擴張的發(fā)展模式面臨瓶頸。”
在計算機視覺領域,“目標檢測”(object detection)以高達78%的出現(xiàn)率成為該領域“最熱”關鍵詞。“語義分割”(semantic segmentation)在2022-2023年熱度登頂,標志著計算機視覺技術形成了“目標檢測-語義分割-視覺應用”的完整閉環(huán)。
機器學習基礎理論持續(xù)夯實,“reinforcement learning”等子領域在10個年度保持活躍,年均增長12%。語義理解相關關鍵詞如“semantics”在2022年后年均增長45%,預示著“認知智能”可能是下一輪突破的焦點。
報告還揭示了基礎理論類關鍵詞如“machine learning”、“classification”、“clustering”保持相對穩(wěn)定的熱度,體現(xiàn)了這些基礎概念的重要性。
新興技術崛起方面,“Transformers”關鍵詞在2022年后異軍突起,深刻改變自然語言處理和多模態(tài)AI領域。“Feature extraction”和“optimization”等工程化關鍵詞在2020年后呈現(xiàn)持續(xù)升溫趨勢,表明研究重心正從算法創(chuàng)新轉向工程優(yōu)化和實際部署,是技術成熟和產(chǎn)業(yè)需求雙重驅動的結果。
此外,報告還揭示了不同技術領域之間的融合趨勢。報告發(fā)現(xiàn),傳統(tǒng)的計算機視覺關鍵詞(如“object detection”、“segmentation”)與深度學習關鍵詞(如“neural networks”、“deep learning”)在熱度變化上高度同步。“這生動體現(xiàn)了AI發(fā)展的‘融合’大趨勢,孤島式研究已成過去時。”吳登生總結道。(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.