大數據文摘出品
2025年,Llama 的締造者正在離開 Meta。
他們大多去向了Mistral,這家總部位于巴黎的 AI 初創公司,正在用“開源速度”反攻 Meta 自己開啟的戰場。
Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占據主流話語權的 2023 年,Meta 用一篇重量級論文和一組開放權重的大語言模型,意外地把開源陣營推上主舞臺。而那時,Meta 的 AI 科研團隊 FAIR(Fundamental AI Research)也正處于高光時刻。
那篇震驚行業的論文:https://arxiv.org/pdf/2302.13971
但兩年后,這條路線似乎走到了一個岔口。
Meta 官方尚未對“人才流失”作出正面回應,社交平臺 X 上已經有一些討論。目前,14 位在 Llama 論文中署名的研究者,目前只剩 3 位仍在 Meta。有人形評論:Meta 打開了一條通往開源未來的路,卻眼睜睜看著建路的人轉身離開,另起爐灶。
01 一條持續的人才遷徙線
從 LinkedIn 記錄看,Llama 團隊的出走并非一朝一夕,它悄然展開于 2023 年初,至 2025 年初幾近完成。
最早一批離開的,是 Meta 內部資深研究員 Guillaume Lample 和 Timothée Lacroix。他們幾乎是 Llama 架構的奠基者,離職時間分別是 2023 年年初和 6 月。隨后,他們在巴黎創立了 Mistral AI。
圖注:Timothée Lacroix、Arthur Mensch和Guillaume Lample 是Mistral AI公司的聯合創始人。其中Lacroix與 Lample 曾參與撰寫Meta公司原始Llama論文。圖片來源于businessinsider,由Khanh Renaud/ABACAPRESS.COM提供。侵刪
接下來的一年半內,包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陸續加入這家初創公司。如今,Mistral 的研究骨干中,有一整支前 Meta 團隊。
而其他人也未偏離 AI 一線戰場。有人去了 Anthropic、DeepMind、微軟 AI,也有人加入了 Kyutai、Cohere 等二線研究機構。
他們平均在 Meta 任職超過五年,絕非“打工人式的流動”。這更像一次認知的重構——那些曾深度參與 Meta AI 體系設計的人,正在以離職的方式,表達自己的方向選擇。
02 Meta 的開源理想,走得比公司戰略更快
Meta 推出 Llama 時,用了一個不小的策略跳躍:它不再將模型封閉運行,而是開放權重、共享參數,允許開發者在單張 GPU 上復現最前沿模型。這在彼時是對 OpenAI 和 Google 的商業閉環思路的一次反向挑戰。
從技術上說,Llama 的設計確實更輕、更高效。它在資源消耗上做了權衡,不依賴大量私有數據,跑得也更快。這些“實用主義”的工程美學,正契合了開源社區的理想主義愿景。
但問題是:當理想走得太快,公司戰略未必跟得上。
Llama 模型在開發者間收獲大量好評,Llama 2 更是成為 HuggingFace 上最受歡迎的模型之一。但從 Llama 3 到 Llama 4,業界的情緒開始轉變。“不夠新”“進展慢”成為越來越多人的反饋。尤其在 DeepSeek、Qwen 等新勢力爆發式迭代之后,Meta 逐漸掉隊。
而更嚴重的警訊是,Meta 遲遲沒有推出類似 GPT-4 Turbo、Gemini Pro 這樣具備“推理能力”的模型版本。這意味著,在多步推理、鏈式調用、外部工具整合等下一代語言模型方向上,它已經落于人后。
《華爾街日報》甚至報道說,Meta 正在推遲其內部最大規模模型 Behemoth 的發布,因團隊對其性能與領導方向存在分歧。
一邊是慢下來的產品節奏,一邊是熟悉 Meta 技術路線的核心研究員大量出走,Meta 顯得前后受敵。
03 FAIR 的隱退與“新 FAIR”的建立
過去一年,Meta 內部還有一個關鍵變化:領導 FAIR 八年的 Joelle Pineau 宣布辭去職務,其位置由 Robert Fergus 接替。這位新領導者曾在 DeepMind 任職五年,也是 FAIR 的早期聯合創始人。
FAIR 曾是 Meta 研究自信的核心:2014 年創立,曾在圖神經網絡、機器翻譯、多模態學習等多個前沿領域發表影響深遠的成果。Llama 正是 FAIR 的巔峰之作。
但如今,這支隊伍核心團隊已散,方向也在變。
過去,FAIR 的基調是“開放 + 共享”;如今,Meta 對“應用”和“效率”的關注似乎壓倒了科研的探索熱情。在這樣一組矛盾中,很多研究員選擇離開,也就并不難理解。
如果只看人事層面,Meta 的這波人才外流可以被視作“正常的團隊更替”,但事實顯然不止如此。
Mistral 并不只是吸收前 Meta 員工的公司,它已經是 Meta 的直接競爭對手。在多項模型評測中,Mistral 的 Mixtral 和 Tiny Mistral 憑借參數規模與效果平衡,擊中了市場的“可部署模型”需求。而這些成果,大多由前 Meta 團隊主導。
這使 Meta 處于一個尷尬位置:它定義了開源大型模型的第一章,但第二章正在被別人書寫。
04 Mistral:一支從 Meta 出走的隊伍
圖注:Mistral AI 官網截圖
Mistral AI爆發式增長始于 2023 年,創立僅一個月便完成超 1 億美元的種子輪融資,并在之后的一年內迅速拉起多個大模型家族。
Pixtral 面向多模態,Medium 3 瞄準 STEM 和編程任務,“Les Ministraux”則優化邊緣部署。
新近上線的 OCR API 和阿拉伯語模型 Saba,表明其產品策略已不再局限于英語語境或科研模型,而是在更廣泛場景中主動擴張。
但這場擴張背后,挑戰也顯而易見。
圖注:techcrunch 關于Mistral 60億估值的報道
首先是“影響力與變現能力不對稱”的困境。雖然聊天助手 Le Chat 在法國一度超越 ChatGPT 登頂 App Store 下載榜,但根據多方消息,Mistral 的營收仍停留在千萬美元級別。這對于一家估值 60 億美元的公司而言,仍遠不足以支撐 IPO 或擺脫被收購的猜疑。
模型“開放性”立場的自我張力也受限。Mistral 在早期以 Apache 2.0 協議開源模型著稱,但進入商業化階段后,其主力模型的權重并未公開,只保留部分“研究版本”可自由使用。這種“兩軌制”的策略雖可兼顧營收與聲譽,卻也招致部分開源社區的質疑:它是否正在變得越來越“閉源化”?
第三個隱憂則是國際擴展能力。雖然 Mistral 與法國軍方、AFP、Stellantis、IBM、Helsing 等達成戰略合作,并與 NVIDIA、Bpifrance 在巴黎籌建 AI 校區,但其用戶群體和生態建設仍以歐洲市場為主。相比之下,OpenAI 和 Google 已在全球構建起完整的 API 平臺、開發者工具鏈及消費級產品矩陣,具備更強的粘性和護城河。
總結下來, Mistral 的團隊規模、融資額和模型能力已經達到一級梯隊水準,但在全球化運營、基礎設施建設、以及長期生態搭建上,它還需要更多時間證明自己。
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.