作者|冬梅
字節 Top Seed 啟動
2026 屆招聘,瞄準頂尖博士
4 月 27 日,字節跳動 Seed 在其官微上發布了一則招聘啟示,宣布正式啟動 2026 屆 Top Seed 大模型頂尖人才校招計劃,研究課題包括大語言模型、機器學習算法和系統、多模態生成、多模態理解、語音等方向,基本覆蓋大模型研究各個領域,計劃招募約 30 位頂尖應屆博士。
值得一提的是,本屆 Top Seed 強調不限專業背景,更關注研究潛力,希望尋找具有極強技術信仰與熱情、具備出色研究能力、富有好奇心和驅動力的年輕研究者。
除了匹配研究價值的回報外,Top Seed 計劃還將給予人才一流的科研環境和充分的自由度進行研究探索,鼓勵不拘泥既有技術、探索智能上限,同時依托字節跳動豐富的應用場景,研究成果也將有廣闊的落地空間。
InfoQ 了解到,Top Seed 人才計劃是字節跳動去年 5 月發起的面向應屆博士畢業生的招聘,同年 7 月,字節推出針對在校博士生的 Top Seed 研究實習生專項,共同為旗下豆包大模型團隊篩選人才。
在字節跳動去年發布的該項目宣傳視頻中,該計劃公布了希望招聘到的人才“一定是最頂尖的 5% 的人”,并希望他們去做 95% 的人做不到的事情。
在該段視頻中,Top Seed 團隊成員表示:“Top Seed 希望人才能夠具備的最關鍵的能力是創造力,要敢于打破我們現在的認知,有堅定的目標和信念,對技術有極大熱情,有想象力,有扎實的功底,動手能力強,有較強的好奇心,有探索欲,能夠承受挫折。”
應屆生已在重要項目中嶄露頭角
無留學背景的人才很能打
值得注意的是,字節跳動在此次招聘啟事中還透露了幾位剛畢業的同學已經做出了一些有影響力的研究。
比如,Z 同學構建并開源了首個多語言代碼修復基準 Multi-SWE-bench,在 SWE-bench 基礎上,首次覆蓋 Python 之外的 Java、TypeScript、C、C++、Go、Rust 和 JavaScript 七種編程語言,1632 個真實修復任務,是真正面向“全棧工程”的評測基準,其數據均來自 GitHub issue,歷時近一年構建,以盡可能準確測評和提高大模型高階編程智能水平。
具體而言,這個 Multi-SWE-bench 到底能干什么用?答案是可用于評估和提升大模型“自動修 Bug”能力。
作為該篇論文的一作,昝道廣就是上述提到的 Z 同學。
據領英信息,昝道廣是中科院計算機科學與技術博士生,研究方向為大數據分析技術和人工智能技術應用研究、網絡安全分析、威脅情報分析、系統安全、知識圖譜、云計算技術,參與發表了 34 篇與大模型相關的學術論文,曾在中國科學院軟件研究所擔任高級工程師。
濟南校區電氣信息系計算機科學與技術專業 1 班的昝道廣是師生眼里典型的“學霸”。在大學學期,昝道廣學習成績穩居專業第一, 8 次獲獎學金;獲發明專利 1 項、軟件著作權 2 項,發表學術論文 5 篇;多次擔任隊長參加大學生數學建模、軟件設計、算法設計、程序設計等各級競賽,獲省級以上獎項 9 項,獲得 Java 高級工程師、IBM 軟件工程師等證書……
去年,昝道廣加入字節跳動并在短時間內構建并開源了首個多語言代碼修復基準 Multi-SWE-bench。
另一位 Q 同學主導并開源了可以在虛擬世界中高效執行各類任務的多模態智能體項目深受開發者群體歡迎,Desktop 版本 GitHub Star 數破萬。
UI-TARS 能夠在虛擬世界中高效執行各類任務。目前,UI-TARS-1.5 已在 7 個典型的 GUI 圖形用戶界面評測基準中取得 SOTA 表現,并首次展現了其在游戲中的長時推理能力和在開放空間中的交互能力。
綜合上述信息,InfoQ 推測,Q 同學是該論文的一作者秦禹嘉。
秦禹嘉專注于 LLM/VLM 類代理。于 2024 年從清華大學獲得計算機科學博士學位,師從劉知遠,2020 年于清華大學獲得電子工程學士學位,導師為吳冀。
研究生期間,他曾在騰訊微信模式識別組擔任實習生,導師為李鵬博士和林彥凱博士。他也曾創辦了一家 AI 公司 SeqAI Inc. ,后又于去年 7 月份通過 Top Seed 計劃入職字節跳動。
最后是 H 同學。他作為一作發表超稀疏模型架構 UltraMem 研究,有效解決 MoE 推理時高額的訪存問題,推理速度較 MoE 架構提升 2-6 倍,推理成本最高可降低 83%。
在 Transformer 架構下,模型的性能與其參數數量和計算復雜度呈對數關系。隨著 LLM 規模不斷增大,推理成本會急劇增加,速度變慢。
字節跳動提出的這款全新的稀疏模型架構 UltraMem 有效解決了 MoE 推理時高額的訪存問題,還揭示了新架構的 Scaling Law,證明其不僅具備優異的 Scaling 特性,更在性能上超越了 MoE。
實驗結果表明,訓練規模達 2000 萬 value 的 UltraMem 模型,在同等計算資源下,可同時實現業界領先的推理速度和模型性能,為構建數十億規模 value 或 expert 開辟了新路徑。
InfoQ 查閱論文發現,該技術論文的一作為 Zihao Huang。
根據 OpenReview 信息,Zihao Huang 于 2021 年碩士畢業于南開大學人工智能學院,同年加入字節跳動。
一流高校碩士、博士生、頂級學霸,這些都是已經進入 Top Seed 的人才身上的標簽,也側面反映了該項目的選拔人才標準——只要 5% 頂尖人才。
說完了對人才的要求,Top Seed 又能給予候選人提供什么呢?
技術大佬導師成“招聘法寶”
首先是錢。能提供行業 Top 級薪資待遇。據進入計劃的一位北大的學生透露,實習工資被提到了 2000 元一天,要是按照一個月出勤 20 天來算,實習工資將達到月薪 4 萬元,這在全行業來講也屬高薪范疇。
其次是資源(算力和數據)。據宣傳視頻中介紹,Top Seed 能夠提供為人才充足的算力和數據支持。當同學們加入后,可以直接參與到問題定義和解決的過程中。Top Seed 會給予人才充分的自由度——雖然團隊有統一的愿景,但實現這個愿景的具體路徑可以由同學們自主選擇。
在這里,最大的優勢在于,許多產品都涉及視覺數據處理。這意味著一旦學生加入后開發出了新的視覺技術,可以快速實現應用落地。
第三,是頂級技術大牛帶隊和充分的自由度。Top Seed 另一最重要的資源和支持來自于優秀的團隊。因為對于很多人才來講,他們選擇工作機會時看中的可能并非以上兩點,而是能夠與杰出的人才共同應對挑戰性工作,這本身就極具吸引力。
此外,Top Seed 團隊也表示,將會給予學生們更多的自由度,基本上不用做 PPT,也不怎么開會,將把更多的時間放在做正確的事情上。
那 Top Seed 背后的團隊,到底藏著哪些優秀導師?根據宣傳視頻,我們來淺扒一下。
王明軒:Top Seed LLM 研究團隊研究員,豆包大語言模型研究團隊負責人,北航校友,博士畢業于中科院計算所;
項亮:豆包大模型基礎設施團隊負責人,2006 年畢業于中國科學技術大學自動化系,并榮獲該校本科生最高榮譽獎——郭沫若獎學金。隨后保送至中國科學院自動化所,并在楊青研究員的指導下攻讀工學博士學位。畢業后,項亮任職于 Hulu 和宜信公司,從事視頻推薦系統的研究和開發工作。他還曾任瓜子二手車首席科學家。
馮佳時:字節跳動研究科學家、豆包大模型視覺基礎研究團隊負責人,曾任新加坡國立大學電子與計算機工程系助理教授,機器學習與視覺實驗室負責人。
王雨軒:豆包大模型語音部門負責人,本科畢業于北航,后攻讀北京大學研究生,博士畢業于俄亥俄州立大學;
其他未出現在視頻中的豆包大模型背后的技術專家還包括:
田值:豆包大模型視覺生成模型技術專家,在川大本科期間就以一作發布頂會論文,阿德萊德大學獲博士學位;
嚴林:豆包大語言模型對齊團隊負責人,研究生畢業于中科院計算所;
陳卓:豆包大模型音頻生成研究團隊負責人,西安交大校友,碩博畢業于哥倫比亞大學;
李成剛:豆包大語言模型預訓練方向負責人,清華機械工程本碩學位;
同時,2 月份加入字節的谷歌 DeepMind 研究副總裁、現 Seed 基礎研究負責人吳永輝,也出現在了可供實習生選擇的導師行列。
大廠 AI 人才爭奪戰,
為什么瞄準年輕人?
據智聯招聘日前發布的《2025 年春招市場行業周報(第一期)》,春招首周,人工智能行業求職人數同比增速達 33.4%,位居行業第一;人工智能工程師的求職增速達 69.6%,位居職業榜首,平均招聘月薪超過 2 萬元。
據脈脈高聘人才智庫去年 9 月的數據,云計算、搜索算法、大模型算法、DSP 開發、反欺詐 - 風控算法 5 個崗位連續 2 年位列人才緊缺度前十。
AI 方向技術人才如此短缺,大廠難免紛紛下場搶奪 AI 人才。
2 月份,一則有關 DeepSeek 百萬年薪招聘人才的消息引發了熱議。據消息,DeepSeek 開出最高 98 萬元年薪招聘 UI 設計師。網友們進一步挖掘之后發現,這家公司正在以極具競爭力的薪資招聘各種工程師,即便是非算法崗,也提供令人矚目的待遇,最高月薪 9 萬(合年薪 126 萬)。特別是核心系統研發工程師,甚至包括了“校招應屆生”這一范疇。
4 月初,阿里國際接連放大招。據阿里國際招聘官網消息,2026 屆校招中 80% 為 AI 崗位,包括 AI 算法、研發、AI 產品經理等。同時,啟動了面向全球的頭部 AI 科技人才培養計劃 Bravo102。
4 月中旬,騰訊宣布啟動史上最大就業計劃,三年內將新增 28000 個實習崗位并加大轉化錄用,其中僅 2025 年,就將迎來 10000 名校招實習生,有六成面向技術人才開放。
騰訊方面表示,今年開放的校招實習崗位涵蓋技術、產品、設計、市場、職能等五大類 70 余種崗位,包括大模型、研發、算法、市場、策劃、運營、銷售、美術等多個崗位職能。同時,在大模型加速落地的背景下,騰訊加大了人工智能、大數據、云計算、游戲引擎、數字內容等技術類崗位的招聘力度,技術類崗位“擴招”力度空前,占比超 60%。
但有個值得深思的信息是,無論是阿里、字節還是騰訊這類大廠還是 DeepSeek,他們砸下重金招聘的往往都是應屆生,甚至是一些本科生、碩士生以及實習生,為什么會這樣?
在 InfoQ 近期的一次訪談中,中國人民大學信息學院院長、計算機系教授柴云鵬表示,之所以出現這種情況,是因為“在計算機領域,尤其是工科,很多人的創造力最活躍的時期是在 20 多歲到 30 出頭。這個年齡段的人學習能力強,也有一定的經驗。但到了 40 歲左右,學習能力可能會變慢,整體節奏也會放慢。特別是在 AI 時代,適應新事物的能力會變弱,而 AI 團隊需要快速響應,一旦有新的思路,就要爭分奪秒地去實施。加班能力也很重要,而年輕人在這方面更有優勢”。
他還表示:“從這個角度看,吸引剛畢業或工作沒幾年的年輕人是比較劃算的。比如,人大信息學院的進人策略也是這樣,主要精力放在引進年輕人。只需要少量有經驗的人來帶領團隊。比如,一個有經驗的人帶領十幾個年輕人,這樣的戰斗力可能是最強的,性價比也很高。從頭培養年輕人有很多好處,比如增強歸屬感和協同溝通能力。”
理想的創新團隊年齡結構不能太大。從這個角度看,DeepSeek 的策略是合理的。此外,AI 領域與其他領域不同,它本身就很新,資深人士的經驗作用并不大,甚至可能因為固定的思維方式而產生阻力。
https://arxiv.org/abs/2504.02605
https://seed.bytedance.com/zh/topseed?view_from=homepage_tab
https://36kr.com/p/3214485615234177
https://www.researchgate.net/profile/Daoguang-Zan
https://www.sdust.edu.cn/info/1039/1527.htm
https://arxiv.org/pdf/2501.12326
https://arxiv.org/abs/2411.12364
https://yujia-qin.github.io/
AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯動,全覽 AI 技術前沿和行業落地。大會聚焦技術與應用深度融合,匯聚 AI Agent、多模態、場景應用、大模型架構創新、智能數據基建、AI 產品設計和出海策略等話題。即刻掃碼購票,一同探索 AI 應用邊界!
今日薦文
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.