鄧思邈 發自 凹非寺
量子位 | 公眾號 QbitAI
余家輝。
一個在中文互聯網幾乎隱形的名字,卻讓硅谷兩大AI巨頭撕破臉皮。
浙江慈溪人,高二就被招去中科大少年班,博士師從“計算機視覺之父”黃煦濤,現字節Seed掌舵人吳永輝的嫡系弟子,還與豆包核心技術大牛楊建朝的上升軌跡有著驚人的重合……
扎克伯格親自下場挖他,傳出“1億美元年薪”,刷新AI人才市場紀錄。
奧特曼在一旁急得跳腳,公開指控Meta的作派“令人反感”,殺人誅心說“總有人唯利是圖”。OpenAI內部員工更是哀嚎:這是巨大損失。
網友甚至調侃:
AI頂級研究員收入堪比C羅轉會費,但知名度連十八線網紅都不如。
一時間,AI圈比娛樂圈還精彩。
更魔幻的是,當全世界都在討論這個天價薪酬包時,當事人卻像人間蒸發一樣,沒有回應,沒有聲明,甚至連個動態都沒發。
所以,余家輝到底是何許人也?他憑什么?
無法復制的履歷組合
余家輝,剛好30歲,出生于1995年,打小天資聰穎,2012年從浙江慈溪中學考到了中科大少年班學院。
本科就在大大小小的比賽中初露頭角,拿下了全國并行應用挑戰賽(PAC2015)冠軍、智能化技術訓練營一等獎、大學生超算競賽(SCC)季軍……
右為19歲的余家輝,圖源自中科大官網
2016年從中科大畢業后,只身前往UIUC(美國伊利諾伊大學厄巴納-香檳分校)讀博,師從AI視覺一代華人教父黃煦濤,讓他打下了扎實的學術基礎。
黃煦濤(Thomas S.Huang)是美國工程院院士,也是中國工程院外籍院士、中國科學院外籍院士,他是計算機視覺、模式識別、多媒體等領域最資深的華人科學家之一。
從教57年,黃煦濤培養了眾多AI領域的核心人才,包括云從科技創始人兼CEO周曦、文遠知行創始人兼CEO韓旭、AI大牛顏水成等等。
但僅有名師指導還不夠,真正讓余家輝脫穎而出的是其豐富的跨平臺經驗。
在加入谷歌前,他曾在微軟亞洲研究院、曠視研究院、Adobe、Jump Trading(頂級量化交易機構)、Snap(社交媒體公司)、百度美國研發中心、英偉達都實習過,從底層框架到高效算法,再到視覺應用,4年7段實習讓他積累了難得的實戰經驗。
2019年5月進入谷歌,一待就是4年多時光。
余家輝博士畢業那一年不幸遇上導師黃煦濤離世,但他在谷歌遇到了人生中另一個重要的技術領路人——吳永輝。
兩人頻頻聯手,搭檔默契,發表了多篇具有行業影響力的研究成果。
左為吳永輝,右為余家輝
吳永輝是谷歌Fellow級大佬,南京大學校友,博士畢業于加州大學河濱分校,在谷歌深耕AI近17年
值得一提的是,今年2月吳永輝離開谷歌加盟了字節Seed,專注大模型基礎研究。
有貴人指點,余家輝迅速成長為谷歌DeepMind團隊的核心力量。離開谷歌之前,余家輝已經是Gemini多模態項目的聯合負責人,同時是PaLM-2模型的核心貢獻者。
能在谷歌參與這種級別的項目,說明他不僅有研究能力,還具備大規模工程實施的經驗。
2023年10月,余家輝加盟OpenAI,擔任感知團隊負責人。短短不到2年時間里,他帶隊領導了4o、4.1、o3、o4-mini等一眾明星模型的多模態部分研發。
今年4月,余家輝還在平臺上介紹他們所實現的技術新突破——o3和o4-mini模型,是截至當時OpenAI“最智能、最能干的模型”。
正因以上種種經歷,余家輝也成為了極少數同時了解谷歌和OpenAI技術路線的研究者,他深諳兩家公司的工程文化、技術優勢、戰略思路。
對于急需在AI競爭中翻身的Meta來說,這樣的背景就是戰略資源。
一定程度上,扎克伯格也不僅僅是買他這個人本身,余家輝就像是一棵蒼天大樹中的重要節點,憑借每一個不同身份都可以鏈接和吸引到無數優秀人才奔赴Meta、追隨于他。
技術影響力的硬指標
履歷固然亮眼,但真正讓余家輝在AI圈站穩腳跟的,還是他在技術創新上的硬實力。
數字不會撒謊:34780次引用。
這是余家輝在谷歌學術上的論文引用數,雖說遠遠不敵Geoffrey Hinton、LeCun、李飛飛等大神,但在AI領域也意味著不小的影響力。
其多篇論文發表在CVPR、ICCV、ECCV、ICML等AI頂會上。
而真正讓硅谷巨頭們在意的,是這些研究背后的實用價值。
DeepFill技術解決了圖像修復的核心難題。在黃煦濤的指導下,余家輝于2018年發表的DeepFill v1和2019年的DeepFill v2,讓AI能真正理解圖像內容,不再是簡單的像素填補。
這項技術成為圖像修復領域的重要突破,GitHub上獲得了3409次星標,在學術界和工業界都產生了廣泛影響。
舉個,有了DeepFill v2,你能用AI隨心所欲P圖了。
右邊那個騎車的人,被擦掉了
同樣備受業界認可的還有Conformer模型,該模型基于Transformer架構改進而來,成為語音識別技術的重要進展。這是余家輝與吳永輝共同開發的成果。
想象一下,當你對著手機語音助手說話時,背景一嘈雜它就聽不清你在說什么,或者你說快一點、帶點方言口音它就壓根聽不懂了;看視頻時自動生成的字幕錯誤百出;語音輸入法總是打錯字,你得不斷修改……
Conformer模型的出現,就是為了有效解決以上這些問題。
此外,余家輝和吳永輝共同開發的CoCa圖文基礎模型(2022年,引用1752次),讓計算機能更智能地理解圖像和文本之間的關系,推動了多模態AI技術的發展,尤其在圖像識別、檢索和生成描述等方面具有廣泛應用前景。
計算機視覺、多模態理解、語音識別、神經網絡架構……橫跨AI多個細分研究領域、并且已經得到實際落地驗證的成果和經驗,讓余家輝成為了不可多得的“全棧AI科學家”。
然而,比起過往的技術成就,更讓業界刮目相看的,或許是余家輝對AI發展趨勢的精準把握。
比市場早一步的技術判斷
早在ChatGPT徹底引爆全球之前,他就已經展現出了超越同齡人的技術洞察力。
2022年12月,余家輝在「硅谷101」播客中發表的觀點現在看來幾乎句句應驗。
面對引發滿世界震驚的ChatGPT,他卻保持異常冷靜:“一開始沒有特別驚訝,因為OpenAI在語言生成模型上已經耕耘了很多年”。
這種判斷來自對技術發展脈絡的深度理解,以及他一貫的謹慎理性。普通人看到突然爆發,他看到的是漸進式的積累。
而當被問到ChatGPT會不會替代谷歌搜索時,他給出“降維打擊”的判斷。聊天機器人不是產品替代,而是交互范式的重新定義。事實證明,ChatGPT的確創造了全新的人機交互方式。
關于業界十分流行的“大力出奇跡”觀點,他當時直接反駁:
“可能一開始你想著只要有數據、有算力就可以,但其實真的做起來的時候發現全部都是問題。”
這個判斷現在已經成為行業共識。錢和GPU只是基礎,工程能力、人才組織、技術積累才是關鍵。
“時間積累、人才積累、組織積累、自信積累”則是余家輝當時總結的關于OpenAI成功的四個要素。
這套理論現在被廣泛認可為AI公司成功的必要條件,特別是“組織積累”這一點,預言了后來各大公司在AI團隊架構上的調整。
在商業化路徑上,他同樣展現了超前的戰略眼光:“真正更長遠的機會是在基建上,真正有商業化價值的是在應用層面”。
中美科技巨頭們正投入大量資源夯實基礎建設,基于此,我們看到各類AI應用正在加速涌現并展現價值。
而這,還只是他極少數公開發聲中的吉光片羽……
在AI進入下半場的關鍵時刻,擁有正確判斷力的人才變得比黃金還珍貴。誰能看清技術演進的真正路徑,誰就能在這場沒有硝煙的戰爭中搶占先機。
小扎求賢心切,余家輝此刻被Meta選中不是偶然,而是必然。
在AI軍備競賽中,Meta確實落后了。OpenAI和Google都在全力沖刺AGI,可Llama 4的表現不及預期,Meta現在連一款有競爭力的大模型都拿不出手。
新組建的超級智能實驗室50人規模,由Alexandr Wang(Scale AI前CEO)帶隊領導,研發下一代模型,實現“為每個人提供個人超級智能” 的承諾——這是Meta最后的卡位機會。
對Meta來說,他們買的不是一個員工,而是通往AGI的入場券。
而對于余家輝來說,在Meta開啟新的旅程或許是“激動人心且意義重大的”,就像他曾經對離開OpenAI的同事送上的祝福一樣。
硅谷的搶人大戰還在繼續,很顯然,中國人正在成為這場游戲的主角。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.