網易首頁 > 網易號 > 正文申請入駐

Meta為他豪擲2億美元，上交校友龐若鳴，曬出在蘋果的最新論文

2025-07-10 20:20:04　來源: 機器之心Pro

北京舉報

分享至

機器之心報道

編輯：笑寒、陳陳

這或許是龐若鳴（Ruoming Pang）在蘋果參與的最后一篇論文。

龐若鳴，蘋果基礎模型團隊負責人、杰出工程師，即將成為 Meta 新成立的超級智能團隊的最新成員。他本科畢業于上海交通大學，在谷歌工作了 15 年，此后加入蘋果。另據彭博社最新消息，Meta 更是開出了 2 億美金的天價來邀請龐若鳴加入。

雖然即將跨入另一段人生旅程，但龐若鳴還在為蘋果站好最后一班崗。

7 月 9 日，龐若鳴在 X 上宣傳了自己參與的一項研究《 AXLearn: Modular Large Model Training on Heterogeneous Infrastructure 》，據了解，這項研究是構建 Apple Foundation 模型的基礎代碼庫。

具體而言，本文設計并實現了AXLearn，一個用于大規模深度學習模型訓練的生產級系統，其具備良好的可擴展性和高性能。與其他先進的深度學習系統相比，AXLearn 具有獨特的優勢：高度模塊化和對異構硬件基礎設施的全面支持。

AXLearn 內部的軟件組件接口遵循嚴格的封裝原則，使得不同組件能夠靈活組合，從而在異構計算環境中快速進行模型開發和實驗。

此外，本文還提出了一種用于衡量模塊化程度的新方法：基于代碼行數的復雜度（LoC-complexity）指標。實驗表明，AXLearn 在系統擴展時可以保持恒定的復雜度，而其他系統則呈現出線性甚至二次增長的復雜度。

例如，將 Rotary Position Embeddings（RoPE）這類功能集成到 AXLearn 的上百個模塊中僅需約 10 行代碼，而在其他系統中可能需要數百行代碼才能實現相同效果。同時，AXLearn 也保持了與主流高性能訓練系統相當的訓練性能。

論文地址：https://arxiv.org/pdf/2507.05411
開源地址：https://github.com/apple/axlearn
論文標題： AXLearn: Modular Large Model Training on Heterogeneous Infrastructure

AXLearn 介紹

現階段，像 ChatGPT、Gemini 這樣的聊天機器人都是由大模型驅動的。這種深度學習系統會優先考慮性能和可擴展性。

作為全球最大的消費電子和在線服務公司之一，蘋果已經將許多 AI 模型集成到自家產品中，服務于全球數十億用戶。

除了訓練性能和可擴展性外，蘋果對深度學習系統還有兩個額外的要求。首先是賦能模型工程師，只需編寫最少的代碼，就能配置復雜的模型定義和訓練方法。其次，作為一家大型科技公司，他們不能依賴單一的硬件供應商，因而他們的設計目標是兼容異構后端，如 GPU、TPU 和 AWS Trainium。

為了達到上述目的，AXLearn 被開發出來。

為了促進模塊化，AXLearn 的核心設計決策是強制執行嚴格的封裝。此外，本文還通過將旋轉位置嵌入（RoPE）和專家混合模型（MoE）集成到 AXLearn 中的案例研究，展示了該框架與傳統代碼行數計數方法的一致性。

圖 2 顯示了 AXLearn 的系統架構和工作流程。AXLearn 有兩個關鍵組件：

（1）AXLearn 組合器（AXLearn composer）和（2）AXLearn 執行框架（AXLearn runtime）。

用戶通常使用 AXLearn 內置的層庫和第三方層組件來定義訓練配置。基于該配置腳本，AXLearn 組合器會首先生成完整的 JAX 程序。

這一過程包含以下關鍵步驟：包括為目標加速器實例選擇合適的網格形狀、為特定層應用分片注釋、為目標硬件自動調優 XLA 編譯選項、為后端選擇合適的注意力內核，并根據模塊層次中的標記點應用適當的重計算策略。這些注釋對于訓練的高效運行至關重要。

然后，JAX 程序和編譯選項被傳遞給 XLA 編譯器，以生成加速器程序（例如，CUDA 內核），該程序隨后通過 AXLearn 運行時在分布式硬件（例如 Kubernetes）上進行調度，并使用特定于加速器的運行時（例如 CUDA 運行時）。

AXLearn 執行框架監控加速器程序的執行，并提供額外的功能，如高效的檢查點、監控和容錯能力。

實驗評估

下表展示了不同系統的代碼量復雜度（LoC-Complexities）匯總。

在 AXLearn 中，RoPE 和 MoE 被嚴格封裝。本文提供了一個 10 行的代碼片段，可以將這兩個功能集成到任何實驗配置中。

在本文的內部實踐中，正是通過類似的代碼片段，成功配置了超過 1000 個實驗，用于啟用 RoPE、MoE，或兩者同時使用。隨著模塊數量或 RoPE 或 MoE 變體的增加，無需對任何現有接口進行更改，實現了恒定的代碼復雜性。

在異構硬件上的性能

本文將 AXLearn 的訓練性能與以下系統進行了對比：PyTorch FSDP、Megatron-LM 以及 MaxText，這些系統在 GPU 與 TPU 上均實現了先進的訓練性能。

本文在三種硬件平臺上評估了兩個模型：Llama2 7B 與 Llama2 70B：

1. 256/512 H100 GPU（分別對應 32/64 個 AWS P5d 實例，每個實例含 8 張 H100）；

2. TPU-v5p-512/1024（分別對應 64/128 個 GCP Cloud TPU 主機，每個主機含 4 顆芯片）；

3. 1024 顆 Trainium2 芯片（64 個 AWS trn2 實例，每個實例含 16 顆 Trainium2 芯片）。

下表總結了性能結果。

為驗證 AXLearn 的可擴展性，本文對兩個實際部署的模型進行了弱擴展性（weak-scaling）實驗。

這些結果表明，AXLearn 接近線性擴展性，如圖 4 所示。

AXLearn 在 TPU 上同樣展現出業界領先的推理性能。本文對比了 AXLearn 與 vLLM 在 Llama2 7B 與 70B 參數模型上的推理表現。

如表 4 和圖 5 所示，AXLearn 在延遲和吞吐量方面均顯著優于 vLLM：

在延遲方面，AXLearn 在 TTFT 和 TPOT 上分別實現了 500 倍和 6 倍加速；
在吞吐量方面，AXLearn 在 7B 模型推理上快 2.8 倍，在 70B 模型上快 1.6 倍。

在生產中的使用體驗

如今，AXLearn 已從最初僅有數位開發者、訓練百萬級參數模型的工具，發展為支持數百位開發者訓練十億至萬億參數規模模型的大型平臺。

它在任意時刻可并行支持超過 10,000 個實驗的開發與運行，并部署在數十種異構硬件集群上。

借助 AXLearn 訓練的部分模型，現已被廣泛應用于十億級用戶規模的產品功能中，包括：智能助手、多模態理解與生成、代碼智能等關鍵能力。

了解更多內容，請參考原論文。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Manus清空微博、小紅書

每日經濟新聞 2025-07-11 15:03:11
28 跟貼 28
全國吃貨瘋狂點單！美團深夜曬戰報：訂單1.5億

每日經濟新聞 2025-07-13 15:06:43
0 跟貼 0

小米要做中國家電前三，和美的相互學習

每日經濟新聞 2025-05-19 23:45:08
588 跟貼 588

成為汽車界的蘋果，國內最有可能的，還是小米汽車

互聯網.亂侃秀 2025-07-13 09:50:03
25 跟貼 25
蘋果造車十年卒！小米汽車為了iPhone用戶太拼座艙產品經理：蘋果對我們車很認可

快科技 2025-07-11 08:21:08
2 跟貼 2

蘋果公司據悉計劃2026年初發布新款MacBook Pro、iPhone 17e和iPad

界面新聞 2025-07-11 14:41:58
0 跟貼 0

LeCun要向Alexandr Wang匯報!這是Meta新AI團隊一些獨家內部消息

機器之心Pro 2025-07-11 11:10:02
5 跟貼 5
何小鵬和雷軍真正的塑料兄弟

雷科技 2025-06-06 21:23:05
51 跟貼 51

科技巨頭“挖人戰”白熱化！谷歌、Meta同日出手擴張AI版圖

財聯社 2025-07-13 03:30:09
6 跟貼 6
找對象，陌陌靠譜：棋場對決象棋大戰顯功夫

傻瓜象棋 2025-07-10 10:21:32
0 跟貼 0
比亞迪李云飛：要忙在正道上，拒絕陰陽

每日經濟新聞 2025-06-06 17:55:12
243 跟貼 243
靜悄悄的餓了么，戰斗力到底有多強？

華商韜略 2025-04-30 14:18:35
0 跟貼 0
蘋果手機人臉識別：此寬非彼寬

蜻蜓世音 2025-07-13 07:44:42
26 跟貼 26
Llama慘遭拋棄！Meta內部改用Claude寫代碼

量子位 2025-07-11 09:21:45
19 跟貼 19
北大、北郵、華為開源純卷積DiC：3x3卷積實現SOTA性能比DiT快5倍

機器之心Pro 2025-07-11 16:47:30
1 跟貼 1
7B模型對標GPT-4o，全球首個醫療代碼生成大模型訓練平臺來了

量子位 2025-07-13 12:32:34
3 跟貼 3
竹籃裝蘋果一場空啊

大案搞笑配音 2025-07-11 17:24:56
1 跟貼 1
天水幼兒園后續：網友嘗試彩繪顏料做面食，看看結果怎么樣？

牛劍鋒 2025-07-11 01:00:43
2962 跟貼 2962
國外媽媽就是細心，給寶寶小腳丫做模型，既有紀念意義也可愛！

老沾看生活 2025-07-10 14:45:25
3 跟貼 3
阿里發布信息檢索Agent，可自主上網查資料，GAIA基準超越GPT-4o

量子位 2025-06-27 14:00:19
48 跟貼 48
吉利控股副總裁楊學良：長城汽車魏建軍是行業吹哨人

每日經濟新聞 2025-06-07 16:30:19
161 跟貼 161
字節藏了一手“牌”

虎嗅APP 2025-07-13 00:25:24
0 跟貼 0
中國團隊提出SRDA，一種專為AI大模型訓推設計的下一代計算架構

量子位 2025-06-09 17:50:16
0 跟貼 0
iPhone17 Pro再縮水，鈦金屬邊框沒了？

極果酷玩 2025-07-11 18:20:44
0 跟貼 0
蘋果亮瞎眼，安卓一團灰，HDR照片差別大

量子位 2025-06-19 20:52:05
0 跟貼 0
長城汽車董事長魏建軍對「35歲」重新定義：35歲開場而已。生命的壯闊，從不在于起跑的年齡，而在于你是否敢在風暴中校準方向

新周刊 2025-07-10 20:04:42
15 跟貼 15
網友分享天津數碼店一幕：阿姨用平板寫代碼

小莉幫忙 2025-07-12 18:22:03
10 跟貼 10
能順走電腦上蘋果的奇人

春秋笑談 2025-07-11 15:18:44
1 跟貼 1
牛彈琴：白宮貼出一張圖全世界都哭笑不得

上游新聞 2025-07-13 08:58:33
7501 跟貼 7501
蘋果真不行了？黑科技加持，國產機殺紅眼，Other名單或添巨頭

數科先驅 2025-07-11 16:41:48
0 跟貼 0
點了20單外賣，其中17單“0元購”......周末外賣大戰，你薅到羊毛了嗎？

極目新聞 2025-07-12 21:15:10
2 跟貼 2
雷軍偷家蘋果庫克氣哭

雷科技 2025-07-04 14:14:12
0 跟貼 0
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
2 跟貼 2
谷歌I/O大會放狠招，終極AI助手已來

機器之心Pro 2025-05-21 13:09:12
0 跟貼 0
上海一超市6顆荔枝298元，工作人員：個頭和正常荔枝差不多，這是一款有故事的荔枝，限量供應

大象新聞 2025-07-09 00:24:09
7384 跟貼 7384
特朗普為何豁免中國產品？西媒傳來消息，蘋果總裁庫克說了實話

二大爺觀世界 2025-07-12 01:04:29
0 跟貼 0
理想汽車李想：我們比傳統汽車廠商更懂大型軟件

每日經濟新聞 2025-03-29 12:03:06
50 跟貼 50
首發M5芯片！蘋果新品iPad?Pro將于10月發布？

雷科技 2025-07-11 16:29:03
3 跟貼 3
蔚來李斌：讓每一個蔚來車主都覺得購買蔚來的車是正確選擇

每日經濟新聞 2025-07-07 17:30:53
0 跟貼 0
科大訊飛：AI孫悟空用日語回答日本老爺爺的提問

智東西 2025-04-18 23:31:04
0 跟貼 0

機器之心Pro

專業的人工智能媒體

10845文章數 142375關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

家居

時尚

親子

房產

PS第一方上Steam竟要裝Epic服務？原來是為了聯機！

家居要聞

手機 / 數碼

房產 / 家居

Meta為他豪擲2億美元，上交校友龐若鳴，曬出在蘋果的最新論文

Grok正式登陸特斯拉 "脫韁模式"讓車主上頭

浙江604分畢業生賀顯貽放棄本科 被武漢高職院校錄取

浙江604分畢業生賀顯貽放棄本科 被武漢高職院校錄取

楊瀚森兩戰20+9+8 隔扣成最大亮點

38歲何潔近照曝光，與老公用餐甜蜜

宗馥莉被"弟妹"起訴 要求凍結18億美元

小米YU7深度試駕：優點很多缺點也很多

態度原創

PS第一方上Steam竟要裝Epic服務？原來是為了聯機！

生活憧憬 自由浪漫之境

今年最流行的4件T恤，減齡又好看！

天水幼兒血鉛風波后續：家長爆料孩子治療情況，給西安醫院送錦旗

8大新盤曝光！2025下半場，廣州主城開卷廝殺！

浙江604分畢業生賀顯貽放棄本科被武漢高職院校錄取

浙江604分畢業生賀顯貽放棄本科被武漢高職院校錄取

宗馥莉被"弟妹"起訴要求凍結18億美元

生活憧憬自由浪漫之境