7月初,Meta開出2億美金“天價”年薪,挖角蘋果AI基礎模型團隊負責人龐若鳴。關于龐若鳴和蘋果AI團隊的討論甚囂塵上:為何Meta愿開高薪挖角一個“并沒有出成果”的團隊負責人?
蘋果AI做了兩年,成果到底如何?
《職場Bonus》獨家獲悉,龐若鳴負責的蘋果AI AFM團隊一直在做大模型的研發工作,同時也取得了不錯的成果,但因蘋果內部較為封閉的生態:研發團隊的成果必須要等產品上線后才能發布,成果始終無法公開。
沒有人比龐若鳴更惋惜現在的蘋果AI。
2021年,龐若鳴加入蘋果AI,負責自研模型團隊。從2023年Apple Intelligence在內部誕生,到2025年,大模型飛速發展了2年,蘋果卻沒跟上時代的節奏,AI成果頻被外界詬病。
7月12日,社交媒體爆出龐若鳴在離職前,向蘋果負責軟件的SWE部門爭取,公開自己AFM團隊研發成果的機會,卻遭到拒絕。
在迅速變化的AI時代,蘋果的AI戰略顯得保守:2023年以來,WWDC大會上承諾的AI功能頻頻食言,AI功能雖已融入系統,但卻缺乏創新。關于AI的決策上,蘋果已然失去了大眾期待的創新和活力。
但遺憾的是,這些問題根源并非在于人員能力,而是來自蘋果內部的重重阻力。
龐若鳴失望離去。
谷歌大牛帶隊,團隊80%華人陣容,自研模型能力接近DeepSeek╱ 01
在AI上不斷搖擺的蘋果╱ 02
蘋果患上了蘋果病╱ 03
谷歌大牛帶隊,團隊80%華人陣容,自研模型能力接近DeepSeek
蘋果自研模型(AFM)團隊一號位是龐若鳴,是在Meta挖角風波中,硅谷“最貴”的華人大牛。
公開資料顯示,龐若鳴博士畢業后,在谷歌擔任了15年的首席軟件工程師。在谷歌期間,龐若鳴與吳永輝(沒錯,就是年初加入字節Seed團隊的吳永輝)、陳智峰(龐若鳴走后,陳智峰將接替龐若鳴的位置,任蘋果AFM團隊負責人)共同主導了Babelfish/Lingvo框架開發。這一框架成為谷歌TPU使用量最高的深度學習平臺,成果最終被谷歌內部1000+項目采用,使用率超越AdBrain與DeepMind。
此外,龐若鳴還是端到端神經網絡語音合成(TTS)系統的的核心貢獻者。
“若鳴是位很有人格魅力的大牛。”曾有與其共事者告訴《職場Bonus》。
龐若鳴于2021年加入蘋果,領導AFM團隊,負責蘋果AI基礎模型研發。《職場Bonus》獲悉,龐若鳴在蘋果AFM團隊管理80人左右,其他成員都比較低調,包括陳智峰、Zirui Wang(王子瑞)、Chung-Cheng Chiu、Guoli Yin(尹國立)、Yinfei Yang、Nan Du(杜楠)、Chong Wang(王崇)等多位大牛。其中,王子瑞、尹國立、王崇、Mark Lee、張博文、TomGunter為AFM團隊最早期成員。其各自分工如下:
據記者馬克·古爾曼爆料,龐若鳴離開后,蘋果自研模型團隊將由陳智峰(Zhifeng Chen)管理。該團隊將形成新的、更為分散的管理架構:從大多數工程師直接向負責人報告的結構,轉變為多個經理向負責人報告。
陳智峰2000年本科畢業于復旦大學,分別于美國普林斯頓大學、伊利諾伊大學香檳分校獲得碩士、博士學位。2005年博士畢業后,陳智峰加入Google,在谷歌任職19年。陳智峰、吳永輝[1]、龐若鳴三人均是Google Brain早期成員,也是Google Brain三個華人團隊的主要Leaders。除了Babelfish/Lingvo框架之外,陳智峰在機器學習和分布式系統領域有著顯著的學術影響力,Google scholar顯示其學術成果被引用11萬余次。特別是在TensorFlow這一廣泛應用的開源機器學習框架的開發中,陳智輝發揮了關鍵作用。
《職場Bonus》從知情人士處獨家獲悉,關于彭博社近期“蘋果正考慮引入Anthropic或OpenAI的大語言模型”的消息,蘋果現在會堅定做自研模型,這件事本是今年年初時發生的,“那時內部高管意見動搖,蘋果自研模型情況緊急,龐若鳴邀請來了此前谷歌時期的‘好兄弟’陳智峰來幫忙。”
值得一提的是,蘋果AI團隊早期成員王子瑞,在谷歌時期曾與龐若鳴共事。王子瑞本碩博畢業于卡內基梅隆大學,2020年博士畢業后加入Google Brain。在谷歌時期,王子瑞匯報吳永輝,曾和扎特伯格1億美金年薪挖角的OpenAI感知團隊負責人余家輝[2]共事。
在吳永輝博士的帶領下,王子瑞和余家輝共同開發的「CoCa圖文基礎模型」被引用1752次。該模型讓計算機更智能地理解圖像和文本之間的關系,推動了多模態AI技術的發展,尤其在圖像識別、檢索和生成描述等方面具有廣泛應用前景。
離開谷歌后,王子瑞加入蘋果,是蘋果AFM團隊的早期成員。來到蘋果后,王子瑞獨立研發了最初的AFM模型,并使其發展成為Apple Intelligence,和龐若鳴共同推動了Apple歷史上最大的AI發布。2024年,王子瑞加入馬斯克xAI團隊,致力于Grok3的Post-training(后訓練)。目前,是蘋果AI團隊后訓練負責人。
尹國立本科畢業于浙江大學,2018年斯坦福大學碩士畢業后加入蘋果,在蘋果任職7年。尹國立是最早做蘋果推理引擎的一批人。他和團隊開發的蘋果搜索引擎輸入建議系統,已于蘋果大部分產品中應用。2022年,尹國立作為早期成員加入AFM團隊,當時團隊只有5個人,現主要負責Agent、Post-Training、API。
尹國立和已于近期離職的Tom Gunter是蘋果超7年的老員工。蘋果AFM團隊另外幾位Leader:王崇、Yinfei Yang、杜楠、Chung-Cheng Chiu,也都是各自領域內大牛,曾在Google任職研究員。
多模態負責人Yinfei Yang在自然語言處理和計算機視覺領域具有顯著貢獻。他在2021年發表的《Scaling up visual and vision-language representation learning with noisy text supervision》,被引用次數4148次,該工作在視覺和視覺-語言表示學習中利用噪聲文本監督,推動了大規模多模態模型的發展。
近日,Zhe Gan這位多模態領域大牛,也加入與蘋果AFM團隊合作。Zhe Gan的學術研究主要圍繞視覺與語言的聯合表示學習(《Uniter: Universal image-text representation learning》,被引用3059次)、文本到圖像生成、視頻與語言理解以及生成模型等方向,具有較高的國際影響力,Google scholar引用數據超2.6w。
被稱為“混合專家模型(MoE)領域專家”的杜楠是Apple的首席研究員,也在龐若鳴的AFM團隊架構下,之前曾在Google擔任高級研究科學家。
杜楠參與了谷歌萬億權重語言模型GLaM(General Language Model)的開發。GLaM采用稀疏專家混合模型(MoE)架構,通過高效訓練和服務,在多個小樣本學習任務上都能有競爭力的性能。此外,杜楠還參與了PaLM 2和Google AI搜索項目Magi的工作。
[1] 吳永輝是人工智能領域的資深專家,現任字節跳動大模型團隊Seed基礎研究負責人,直接向CEO梁汝波匯報。他于2008年加入谷歌,深耕AI領域17年,主導了谷歌神經機器翻譯(GNMT)、RankBrain等標志性項目,因在深度學習領域的持續貢獻于2023年晉升為 “Google Fellow” 并擔任谷歌 DeepMind 研究副總裁。2025年初加盟字節。
[2] 余家輝是現任Meta“超級智能實驗室”(MSL)核心成員,主導多模態大模型與 AGI 前沿研究。2019年,余家輝加入谷歌DeepMind后,他作為Gemini多模態團隊聯合負責人,推動該模型實現語言、圖像、音頻的無縫融合。2023 年,余家輝加盟OpenAI,擔任感知團隊負責人,主導GPT-4o、GPT-4.1等模型的多模態感知模塊研發。2025年6月,Meta以四年3億美元的薪酬方案(含股權激勵)將其招致麾下,首年總包傳聞達 1 億美元,被稱為“比C羅還貴”的那個男人,是當前全球 AI 領域最受關注的華人科學家之一。
在AI上不斷搖擺的蘋果
7月初,Meta愿開出2億美金“天價”年薪,挖角龐若鳴。扎克伯格顯然不是“最慘接盤俠”。
一位關注AI人才的獵頭評價,“以上名單透露出蘋果AI的人才密度還是很高的,研發能力不至于是現在給大眾展現出來的水平。”
《職場Bonus》從知情人士處獲悉:“從2023年初開發出AFM第一代模型開始,團隊內部其實一直在做大模型的訓練。”
據了解,蘋果目前已經訓練出數千億參數的基礎模型,模型能力接近DeepSeek。
研發成果豐碩,但蘋果AI掉隊最核心的問題,在于高管們對AI的認知不同,導致蘋果在AI研發上推動的每一個決策都異常艱難。
本該匯報給JG副手Daphne的龐若鳴,離職之際,卻向“隔壁”負責軟件工程的SWE團隊老大Craig爭取研發團隊成果公布的自由。并且,在郵件往來之間以及郵件公布過后,都并未見龐若鳴的上級Daphne,亦或是JG發聲。這并非空穴來風。
Craig Federighi是蘋果SWE團隊SVP,匯報CEO Tim Cook。Craig最初于1994年加入NeXT,1997年隨喬布斯回歸蘋果公司。但在1999年離開蘋果。2009年,Craig再回蘋果。2012年8月,Craig升任蘋果軟件工程高級副總裁,主管iOS和macOS的開發。
2018年,庫克從谷歌挖來約翰·詹南德雷亞(John Giannandrea,后文簡稱JG)擔任人工智能部門負責人,補足蘋果AI的短板。當時,JG在谷歌被視為影響力僅次于CEO的高管。
但來到蘋果之后,JG處處受挫。
作為“空降”高管,JG的決策壓力,主要來源于主管iOS開發的Craig。
在外媒記者Mark Gurman發布的《Why Apple Still Hasn't Cracked AI》(為何蘋果仍未攻克人工智能)一文中,援引多位蘋果內部同事的爆料:“軟件負責人Craig Federighi不愿在AI上投入巨資,他不認為AI是移動設備的核心能力。”
蘋果AI上的決策,幾乎是要看Craig的“心情”:2018年,JG剛加入蘋果不久,想“大展身手”,改革蘋果AI,卻因需要大量資金投入受阻。那時Craig認為AI并不重要。以至于ChatGPT發布之際,蘋果連Apple Intelligence的概念都沒有。
2023年,ChatGPT吸引了Craig的注意。Craig當即聯合JG組建開發大語言模型的AI團隊,但這時的投入也只有千萬美元級別。而當時OpenAI在大模型相關的研發、訓練及運營成本,總計已能達到數十億美元以上(粗略估算),并已完成超100億美元的融資。
盡管蘋果對AI的投入在逐年遞增,但卻總是會晚于市場一步。
因此,相比于其他研發團隊,蘋果AFM團隊的研發條件沒那么優渥。蘋果及其他公司高管表示,蘋果的AI員工數量遠少于其他競爭對手,且用于訓練和運行大語言模型訓練的GPU也較少,“很多一部分是租的谷歌的TPU”。
蘋果AI“難產”,JG的日子也不好過。據Mark Gurman援引其他蘋果高管透露,庫克對JG打造新產品的執行力失去了信心。今年3月,本屬于JG負責的Siri團隊,移交給了SWE團隊,并由Mike Rockwell負責。
蘋果患上了蘋果病
馬云曾說過,企業留不住人才,只有兩個原因:“不是錢沒到位,就是受委屈了。”
有人說,龐若明的離開,也是對SWE團隊的失望。
一位接近蘋果的人士告訴《職場Bonus》,蘋果更重視產品,Craig堅持“蘋果標準”,因此研發團隊發布成果,需要等相應的產品上線。沒有產品上線,研發團隊的成果便不能發布。
一方面,研發團隊的成果得出后,進行工程化落地,以及與產品進行開發和適配,還有很長一段距離。蘋果又以做產品著稱,作為負責人的Craig對產品成熟度的要求很高。接近Craig人士告訴《職場Bonus》:“Craig是一個寧愿讓外界說蘋果做AI不行,也不想聽到外界說蘋果做AI應用、做service不行的人。”
因此,消費者現在能看到、體驗到的蘋果的AI功能,很可能是研發團隊去年、前年的成果,甚至是模型的閹割版。
另一方面,蘋果堅持較為封閉的生態,想在自己的硬件上運行大模型。但蘋果自研的PCC芯片[3]性能有限,倒逼研發團隊只能根據硬件可行性,在一個比較小的模型上做調試。相關人士分析稱:從蘋果自研芯片的性能來看,蘋果的芯片是沒辦法絲滑運行目前市面上所有的前沿模型的。
關于這一點,Craig在給龐若鳴回復的郵件中也有回復:“Apple is forcing huge compromises to run models on their hardware”(蘋果為了在其硬件上運行模型,做出了巨大的妥協)
2010年,蘋果推出首款自研芯片A系列,應用于iPhone和iPad;2020年,蘋果發布M系列芯片,應用于個人電腦。蘋果自研芯片通過其垂直整合能力和自主創新設計,構建了統一內存架構,用戶能在iPhone、iPad、Apple Watch、Mac等不同產品間擴展應用。自研芯片也利用蘋果自身優勢,打造了更加節能緊湊的硬件方案。
但在AI芯片方面,蘋果沒有技術積累,跟進研發仍需要時間。5月25日,據媒體消息,蘋果有內部人士稱其他正在研發的芯片,將用于未來Mac機型以及能為Apple Intelligence平臺提供支持的AI服務器。
《職場Bonus》援引知情人士分析預測:“下一代芯片性能大概也只有英偉達H100的水平。”
從公司層面來看,Craig的決策在一定程度上也反映了蘋果的態度:蘋果想守住從前的蘋果。但對消費者、對蘋果內部的AI人才來說,沒有先進的AI體驗、不能公開發布成果——消費體驗和時間是更大的成本。
重產品、守自研成了一把雙刃劍:賦予蘋果想象空間的同時,既是對一些AI人才的桎梏,更成了困住蘋果AI的“蘋果病”。
[3] PCC(Private Cloud Compute)芯片是蘋果公司為私有云計算(Private Cloud Compute, PCC)架構設計的專用芯片,主要用于處理Apple Intelligence的復雜請求。
撰文|陳佳惠
編輯|陳桐
排版|段春燕
封面圖|Philipp Düsel(Unsplash)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.