參考文獻:
7.7
知識分子
The Intellectual
圖源:Freepik
撰文 | 張?zhí)炱?/strong>
在很長一段時間里,外界對DeepSeek的主流看法是,一支年輕、經(jīng)驗不多的團隊成為AI界的黑馬,在資源并不占優(yōu)勢的條件下做出了比肩世界頂尖公司的大模型。DeepSeek創(chuàng)始人梁文鋒也曾在訪談中表示,他們不設(shè)KPI,招人看能力而不是看經(jīng)驗,核心技術(shù)崗位基本以應(yīng)屆和畢業(yè)一兩年的人為主。
但斯坦福大學與胡佛研究所近日聯(lián)合發(fā)布的一項報告,展示了DeepSeek團隊的另一面。團隊確實年輕,但并不缺乏系統(tǒng)性的訓練和科研積累[1]。
這項研究梳理了DeepSeek自2024年以來公開發(fā)表的五篇核心論文,統(tǒng)計了其中223位作者的信息,最終獲得211人的教育背景與學術(shù)指標。平均而言,每位DeepSeek研究者發(fā)表了61篇論文,獲得1059次引用,h指數(shù)(評估學者科研影響力的重要指標,越高影響力越廣)為10.8。而最核心的31名作者中,這一數(shù)字進一步躍升。平均發(fā)表70篇文章、被引用1554次,h指數(shù)達13.5。
換句話說,DeepSeek的科研主力雖然平均來說比較年輕,但學術(shù)上已經(jīng)積累了不錯的成果。
在五篇核心論文中均有署名的31位核心作者學術(shù)水平更高,他們?nèi)司么螖?shù)為1554次,中位數(shù)為501次,平均h指數(shù)為13.5,i10指數(shù)(學者發(fā)表的論文中,有多少篇被引用超過了10次)為25.5。特別值得注意的是,這不是一個靠少數(shù)人拉高平均表現(xiàn)的群體。
在這31名核心成員中,至少有一半人的h指數(shù)都達到了10或更高。這說明,團隊的學術(shù)實力并非集中在少數(shù)人身上,而是多數(shù)成員都有穩(wěn)定產(chǎn)出,整體分布更為均衡。報告作者認為,DeepSeek的研究能力不僅強大,而且分布均衡。在基礎(chǔ)模型競爭不斷加速的背景下,這種組織特征可能會發(fā)揮尤為重要的作用。
如果和同樣號稱以年輕團隊為主的OpenAI做個對比,這種差異會更清楚。OpenAI在2023年發(fā)布的o1模型匯聚了265位作者,平均引用次數(shù)4403次,但中位數(shù)卻不高,只有338。這背后的含義不難想象,團隊中確實有少數(shù)明星研究員貢獻突出,拉高了整體指標,但大多數(shù)成員的學術(shù)產(chǎn)出相對有限,內(nèi)部差距較大。
這份報告還指出,中國也已經(jīng)具備了獨立培養(yǎng)AI人才的能力。在對201位有明確隸屬信息的作者進行分析后發(fā)現(xiàn),超過一半(111人)始終在中國機構(gòu)接受培訓并任職,沒有學習和留學的經(jīng)驗。
DeepSeek的作者群體中,隸屬本土機構(gòu)占據(jù)了多數(shù)。對201位具有明確隸屬關(guān)系的作者統(tǒng)計顯示,2025年時,其中171人隸屬于中國機構(gòu)。作者們一共與全球499家機構(gòu)建立過學術(shù)或職業(yè)聯(lián)系,中國機構(gòu)占到368家,占比達74%。
這個分布廣泛的機構(gòu)網(wǎng)絡(luò)以大學和研究機構(gòu)為主,也包括少量來自企業(yè)(17家)、政府部門(12家)和非營利組織(9家)的背景。這張網(wǎng)絡(luò)以中國科學院(CAS)為核心節(jié)點。中國科學院直接關(guān)聯(lián)18名DeepSeek作者,若將其下轄的153個附屬單位(包括研究所、實驗室和專業(yè)中心等)納入計算,覆蓋的作者總數(shù)達到53人,幾乎構(gòu)成了DeepSeek作者網(wǎng)絡(luò)的主干。
北京大學擁有20名作者,清華大學緊隨其后,有16名作者。中山大學和南京大學分別貢獻了10名作者。這種機構(gòu)分布展現(xiàn)了中國培養(yǎng)本土AI人才的能力,一個以中科院為核心、輻射多所頂尖高校的知識網(wǎng)絡(luò),正在成為中國AI創(chuàng)新的重要土壤,也在一定程度上挑戰(zhàn)了長期由美國主導的AI人才格局。
美國成為中國AI人才跳板
美國保爾森基金會(Paulson Institute)下屬的麥克羅波洛智庫(MacroPolo)曾經(jīng)做過一項名為“全球人工智能人才追蹤”的調(diào)查。這項報告根據(jù)2022年NeurIPS會議的作者數(shù)據(jù),描繪了頂尖AI人才的教育和職業(yè)軌跡,它的一個關(guān)鍵發(fā)現(xiàn)是,中國是最大的AI人才輸出國,而真正承接并發(fā)揮他們才能的,卻主要是美國的AI產(chǎn)業(yè)。
報告顯示,在中國接受本科教育的頂級(前20%)AI人才占全球47%。不少活躍于國際AI領(lǐng)域的人才,最初都在中國接受了基礎(chǔ)培養(yǎng)。
但到了研究生階段,流向開始發(fā)生變化。將近四成的中國AI人才選擇赴美深造,逆轉(zhuǎn)了中美的AI人才比例。在美國獲得博士學位之后,77%的非美國學生選擇了留在美國工作。美國的公司和研究機構(gòu)成了他們職業(yè)發(fā)展的下一站,甚至是最終去向。在這個過程中,中國出身的大量AI人才被留在了美國。
按照調(diào)查的數(shù)據(jù),美國頂級AI機構(gòu)中有接近四成的人才來自中國,甚至略微超過了美國本土人才的比例。反過來,幾乎沒有美國出身的人才最終在中國AI領(lǐng)域工作[2]。
OpenAI的GPT-4的貢獻者名單為這一趨勢提供了更具體的樣本。團隊中的32位中國背景研究人員中,有11人在中國完成本科,其余21人在美國就讀。在研究生階段,這些人才中接近八成都在美國讀書,并且后續(xù)留在美國AI領(lǐng)域工作[3]。
但兩年多的時間過去,同樣是做出了世界知名的大模型,DeepSeek團隊中的人才流動軌跡又是另一番景象。在DeepSeek的團隊中,美國似乎成了中國的AI人才的孵化器。
DeepSeek相關(guān)作者中49人曾有美國高校或科研機構(gòu)的經(jīng)歷,包括本科、碩士、博士或博士后等階段。這部分人學習或工作的機構(gòu)橫跨26個州、65個機構(gòu),涵蓋了公立大學、私立學院、醫(yī)療中心、非營利機構(gòu)和科技公司。南加州大學、斯坦福大學、紐約大學等學校有多位研究者產(chǎn)生關(guān)聯(lián),但沒有任何一個機構(gòu)擁有超過三位DeepSeek作者。報告指出,這種分布覆蓋了美國AI生態(tài)的多個層面。
比地點更關(guān)鍵的,是人才流動的方向。對這49位曾與美國科研機構(gòu)發(fā)生關(guān)聯(lián)的研究者進行梳理可以發(fā)現(xiàn),其中將近四成(19人)最初在中國接受教育,隨后赴美深造,最終回到中國加入本土機構(gòu);另有11人雖然早期在美國或其他國家學習、工作,但最終也選擇在中國落腳。相比之下,僅有7個人是在中國讀本科,赴美讀研并留美工作,在DeepSeek團隊中并不占主流。相反,大量曾赴美讀研的人才,最終選擇來中國AI領(lǐng)域工作,這和幾年前報告給出的趨勢完全不同。
在曾有美國經(jīng)歷的49位DeepSeek作者中,大多數(shù)人其實只是短暫停留,31人在美國只逗留了一年,足以接觸高水平的研究環(huán)境,但不足以建立持久聯(lián)系。有9人在美時間超過5年,已經(jīng)深度融入了美國的學術(shù)體制,學術(shù)成就最為突出,但值得注意的是,這9人中目前僅有3人仍與美國機構(gòu)保持隸屬關(guān)系。無論屬于哪一類,對DeepSeek論文作者來說,美國更像是他們學術(shù)生涯中的一段過渡,而非終點。他們在美國教育深造,但取經(jīng)歸來還是選擇在中國AI領(lǐng)域工作。
這批擁有美國經(jīng)歷的49位研究人員,在DeepSeek團隊中數(shù)量不多,但并非邊緣角色。他們的平均被引次數(shù)達到2168次(中位數(shù)為565次),平均h指數(shù)為17,i10指數(shù)為34,顯著高于團隊整體水平,稱得上是核心貢獻者。其中長期停留美國、深度融入當?shù)乜蒲畜w系的9人,更是其中的佼佼者。
DeepSeek作為一家中國公司,當然無法代表全球AI人才流動的全貌。但與幾年前中美AI人才流動的趨勢相比,變化也的確存在。美國不再是AI人才默認的首選目的地。
報告作者反思,美國政策制定者始終相信,世界上最優(yōu)秀的技術(shù)人才會自然而然地選擇留在美國發(fā)展,但現(xiàn)實開始偏離這一判斷。美國的高校和研究機構(gòu)現(xiàn)在更像一個人才跳板,對很多研究人員來說,美國提供了高水平的資源、經(jīng)驗和人脈,但最終這些積累被帶回中國,成為支撐本土AI領(lǐng)域發(fā)展的一部分。
1.A deep peek into DeepSeek AI’s talent and implications for US innovation. (n.d.). Hoover Institution.
2.Methodology for Global AI Talent Tracker (2023) - MacroPolo. (2024, March 6). MacroPolo.
3.The Global AI Talent Tracker 2.0 - MacroPolo. (2024, March 6). MacroPolo.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.