99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<sub id="0hune"><p id="0hune"></p></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

字節開源MoE關鍵優化技術，主流大模型均能接入，訓練成本省40%！

2025-03-10 17:56:29　來源: 產業家

北京舉報

0

分享至

3月10日，字節豆包大模型團隊官宣開源一項針對MoE架構的關鍵優化技術，可將大模型訓練效率提升1.7倍，成本節省40%。據悉，該技術已實際應用于字節的萬卡集群訓練，累計幫助節省了數百萬GPU小時訓練算力。

MoE是當前大模型的主流架構，但其在分布式訓練中存在大量跨設備通信開銷，嚴重制約了大模型訓練效率和成本。以海外主流模型Mixtral-8x7B為例，其訓練過程中通信時間占比可高達40%。針對這一難題，字節在內部研發了COMET計算-通信重疊技術，通過多項創新，大幅壓縮了MoE專家通信空轉時間。

相較DeepSeek近期開源的DualPipe等MoE優化方案，COMET可以像插件一樣直接接入已有的MoE訓練框架，支持業界絕大部分主流大模型，無需對訓練框架進行侵入式改動。因簡潔、通用的設計理念，該工作以5/5/5/4的高分入選全球機器學習系統頂級會議MLSys2025，被認為“在大規模生產環境中極具應用潛力”。

具體而言，COMET從系統層面建立了面向MoE的細粒度流水線編程方式，通過引入共享張量依賴解析、自適應負載分配兩項關鍵機制，來解決通信與計算之間的粒度錯配問題，并精準平衡通信與計算負載，最終大幅提升MoE流水線整體效率。引入COMET后，單個MoE層上可實現1.96倍加速、端到端平均1.71倍效率提升，且在不同并行策略、輸入規模及硬件環境下均表現穩定。

COMET的設計結構

值得一提的是，COMET與Deepseek研發的DualPipe方案還可以聯合使用。在降低MoE通信開銷上，COMET采用了計算-通信融合算子的優化方式，DualPipe則通過排布算子來掩蓋通信，兩種方案并不沖突，結合使用或將更大幅度壓縮模型訓練成本。

目前，COMET支持多種MoE并行模式，部署靈活、方便。同時，COMET核心代碼已開源，并向開發者提供了一套友好的PythonAPI，計劃兼容Triton等編譯生態。

COMET論文鏈接：https://arxiv.org/pdf/2502.19811；

開源地址：https://github.com/bytedance/flux

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

開啟 AI 自主進化時代，普林斯頓Alita顛覆傳統通用智能體

機器之心Pro 2025-06-04 17:32:28
5 跟貼 5
ACL 2025 | 基于Token預算感知的大模型高效推理技術

機器之心Pro 2025-06-05 10:33:22
0 跟貼 0

DeepSeek接入智慧小浪，「評論羅伯特」爆梗進化！背后大模型全揭秘

新智元 2025-06-04 14:51:39
2 跟貼 2

爆改大模型訓練，華為打出昇騰+鯤鵬組合拳

虎嗅APP 2025-06-04 19:00:08
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

DeepSeek用的GRPO占用大量內存？有人給出了些破解方法

機器之心Pro 2025-02-07 14:49:06
1 跟貼 1

烏“蛛網”行動，造成俄8架圖-95損毀，真正的技術含量在哪？

陳虎點兵 2025-06-03 20:39:51
1 跟貼 1
“專為我開了一個新課題”，頂尖博士為什么偏愛去字節實習？

機器之心Pro 2025-03-10 18:59:01
0 跟貼 0

數字智能淬礪青春劍時代考場激揚奮斗歌——于2025年高考之際寫給高考生

中國日報網 2025-06-04 15:03:02
0 跟貼 0
中國版 “Palantir” 未陌 AI 獲 A 輪千萬級融資，打造企業智能體策略引擎新高地

鈦媒體APP 2025-06-05 10:32:04
1 跟貼 1
格芯宣布計劃投資160億美元增強半導體制造和先進封裝能力

財聯社 2025-06-05 08:38:24
0 跟貼 0
女子發現豬肉攤疑似添加硼砂，已上報市場監管局

大象新聞 2025-06-05 08:07:17
82 跟貼 82
淄博：開展夏季通訊防汛應急演練，夯實安全生產基礎

齊魯壹點 2025-06-04 19:08:08
0 跟貼 0
全球AI景氣延續或支撐光模塊需求，通信ETF（515880）漲超1.2%

每日經濟新聞 2025-06-05 10:35:07
0 跟貼 0
壓了2顆西瓜苗，村民張口就要1200賠償成本0.3元到0.85元之間！

主持人佳偉 2025-05-31 23:06:01
18 跟貼 18
烏無人機突襲俄戰機"內應"被通緝：曾在基輔當DJ

紅星新聞 2025-06-04 16:49:17
11585 跟貼 11585
熱搜第一！白象就“多半”商標發聲明致歉：注冊初心是做份量區分，將盡快調整

揚子晚報 2025-06-04 20:46:00
13253 跟貼 13253
還剩34天，各國還沒動靜，特朗普急催方案，關稅面臨爛尾危機

王晉博士 2025-06-05 11:55:32
0 跟貼 0
樊振東遠赴德國打球，俱樂部：我們并非豪門，但給樊振東的待遇絕非象征性的

瀟湘晨報 2025-06-04 18:37:20
2171 跟貼 2171
驚人的子彈、彈藥和彈頭制造過程，現代機器與技術

全球見聞筆記 2025-06-02 11:36:53
1 跟貼 1
和平協議31條：俄方拋出終戰方案，烏克蘭還能拒絕嗎？

北山戰史 2025-06-05 07:23:27
4 跟貼 4
最大的橋梁施工過程，現代重型橋梁設備，探索巨型橋梁技術

全球見聞筆記 2025-06-03 11:16:38
1 跟貼 1
USB-C太混亂！微軟終于看不下去了，WHCP能解？

雷科技 2025-06-05 12:08:58
1 跟貼 1
重點防范境外惡意網址和惡意IP（續八）

極目新聞 2025-06-05 14:14:33
0 跟貼 0
告別物業費：輕松管理您的居住成本

精彩一網打盡 2025-06-02 18:53:08
0 跟貼 0
中國預警機技術徹底改寫空戰規則，F-22隱身神話被撕得粉碎！

溫柔度 2025-06-05 03:12:41
0 跟貼 0
AI視頻天花板！阿里字節強強聯手，免費開源，打破AI影視創作壁壘

不懂技術就用AI呀 2025-06-04 12:07:58
0 跟貼 0
女孩等男朋友來接，等她坐上車后座，直接開始展示技術！

小星星沒煩惱 2025-06-05 10:45:32
0 跟貼 0
李在明提名的新總理曾獲清華法學碩士學位

參考消息 2025-06-04 17:40:51
1365 跟貼 1365
李在明：龍山總統府像墳地

極目新聞 2025-06-04 18:59:00
1190 跟貼 1190
尼泊爾山里人是怎么建房子的，看完你就知道他們建房成本有多低了

探尋尼泊爾 2025-06-04 06:07:16
1 跟貼 1
北京一公園門票僅0.2元售票員反復強調:別輸成2元了

上游新聞 2025-06-03 12:56:11
868 跟貼 868
黃仁勛：Switch 2芯片圖形性能遙遙領先于所有移動芯片

熱點科技 2025-06-05 11:42:23
3 跟貼 3
開始了！曝火箭愿意交易10號簽，探討3個方案，杜蘭特或成備選

星落山間 2025-06-03 05:00:50
1 跟貼 1
小米超強鋼，真自研還是玩“字研”？

創作者_1470992743975 2025-06-05 13:00:18
0 跟貼 0
江蘇省紀委書記張忠：對不擔當、不作為的干部嚴肅追責問責，對敢闖新路、勇開先河的干部大膽容錯糾錯

政知新媒體 2025-06-05 10:39:07
7 跟貼 7
遼寧葫蘆島一老人自制電梯上五樓，居委會：曾申請專利，目前已拆除

極目新聞 2025-06-04 16:51:06
35 跟貼 35
轉氨酶高，下腹疼痛，尿無力，耳鳴眼花，看老中醫這一套調理方案

那年初戀 2025-06-04 00:54:21
1 跟貼 1
上海新地標“榮耀之環”沖刺收尾

上觀新聞 2025-06-04 22:32:15
221 跟貼 221
魔獸世界暴雪開始禁用大量插件，未來wa插件可能不能用了

分身有術 2025-06-05 12:16:42
10 跟貼 10

胡喬木撰寫回憶錄，為何他提出，延安文藝講話個別觀點有局限性？

胡喬木撰寫回憶錄，為何他提出，延安文藝講話個別觀點有局限性？

小葛說史

2025-06-03 13:58:21

銀行問你取錢干嘛？記住3句“萬能話術”，讓柜員閉嘴乖乖辦業務

銀行問你取錢干嘛？記住3句“萬能話術”，讓柜員閉嘴乖乖辦業務

詩詞中國

2025-05-28 12:59:14

相貌平平，卻總演央視大劇，還能搭檔李幼斌，馬藜到底什么來頭？

相貌平平，卻總演央視大劇，還能搭檔李幼斌，馬藜到底什么來頭？

塞外書語

2025-06-05 11:31:30

烏克蘭安全局官方數據41架！這些俄羅斯轟炸機發射了近3000枚導彈

烏克蘭安全局官方數據41架！這些俄羅斯轟炸機發射了近3000枚導彈

鷹眼Defence

2025-06-04 16:10:31

美國展出唐伯虎10米真跡，估值超過100億，不愧是“頂級才子”！

美國展出唐伯虎10米真跡，估值超過100億，不愧是“頂級才子”！

書法網

2025-05-29 18:14:37

57歲的江珊做夢也想不到，她那平平無奇的老公，55歲還能火一把

57歲的江珊做夢也想不到，她那平平無奇的老公，55歲還能火一把

春序娛樂

2025-06-05 08:31:58

平民夫妻潛伏6年俄國空軍！117架“玩具飛機”炸碎30億美金裝備

平民夫妻潛伏6年俄國空軍！117架“玩具飛機”炸碎30億美金裝備

甘甘來了

2025-06-05 10:17:23

涉嫌嚴重違紀違法，四川一縣財政局局長主動投案！

涉嫌嚴重違紀違法，四川一縣財政局局長主動投案！

瀟湘晨報

2025-06-04 09:12:19

韓國民主黨表示：沒有職員交接，連辦公工具都沒有！必須追究責任

韓國民主黨表示：沒有職員交接，連辦公工具都沒有！必須追究責任

AI商業論

2025-06-05 10:18:07

從小被允許吃冷飲和不允許吃的孩子，長大后真的不一樣，要注意！

從小被允許吃冷飲和不允許吃的孩子，長大后真的不一樣，要注意！

特約前排觀眾

2025-06-02 00:10:05

你以后就會知道，上一輪下崗的，和未來下崗的，會是同一類人

你以后就會知道，上一輪下崗的，和未來下崗的，會是同一類人

記憶承載

2025-06-05 11:30:36

王鶴棣曬與哈利伯頓同框照：總決賽G1就在明天，來給哈利加個油

王鶴棣曬與哈利伯頓同框照：總決賽G1就在明天，來給哈利加個油

雷速體育

2025-06-05 13:29:35

業內最著名的雙馨女演員之一——Alexa Grace

業內最著名的雙馨女演員之一——Alexa Grace

吃瓜黨二號頭目

2025-06-05 09:56:36

以色列定居者在約旦河西岸發動大規模襲擊

以色列定居者在約旦河西岸發動大規模襲擊

財聯社

2025-06-05 03:43:16

我國將迎來前所未有的人口死亡高峰！復旦專家：三個因素導致

我國將迎來前所未有的人口死亡高峰！復旦專家：三個因素導致

第一心理

2025-06-04 17:10:12

美國不要的，中國也不要！蔣雨融事件越鬧越大，網友：賣國求榮

美國不要的，中國也不要！蔣雨融事件越鬧越大，網友：賣國求榮

聞識

2025-06-03 14:15:46

變本加厲，特朗普亮出B計劃，催促中方上談判桌，日內瓦協議生變

變本加厲，特朗普亮出B計劃，催促中方上談判桌，日內瓦協議生變

要塞陣地官方

2025-06-05 09:45:44

李在明剛宣誓就職，白宮的電話就打來了，有4件事特朗普憋了很久

李在明剛宣誓就職，白宮的電話就打來了，有4件事特朗普憋了很久

掌青說歷史

2025-06-04 12:56:22

探店網紅翻車，在外當“母狗”出軌不同男人，丈夫曝光圖片、視頻

探店網紅翻車，在外當“母狗”出軌不同男人，丈夫曝光圖片、視頻

社會醬

2025-06-04 17:02:39

老謀深算！小因扎吉簽約沙超原因曝光：國米3億窟窿+2600萬歐年薪

老謀深算！小因扎吉簽約沙超原因曝光：國米3億窟窿+2600萬歐年薪

萬花筒體育球球

2025-06-04 21:21:46

產業互聯網第一媒體

882文章數 1326關注度

往期回顧全部

科技要聞

人形機器人千億投入年產量不如勞力士一周

頭條要聞

男子將叛逆兒子送"訓練營" 第53天他拿著一張名單報警

頭條要聞

男子將叛逆兒子送"訓練營" 第53天他拿著一張名單報警

體育要聞

從次輪末到樂透邊緣楊瀚森的試訓有什么玄機？

娛樂要聞

陳學冬消失2年首曬照車禍后遺癥嚴重？

財經要聞

多半袋方便面"多半"是商標白象致歉

汽車要聞

長安汽車升級為獨立央企東風長安重組按下暫停鍵

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

旅游

數碼

公開課

軍事航空

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

數碼要聞

紅魔電競平板3 Pro真機上手：行業最窄四等邊、純平后蓋

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
指紋識別有可能認錯人嗎？
李彥宏：百度離破產30天

軍事要聞

普京明確：沒有人會與“恐怖分子”談判

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：福安市| 新疆| 金堂县| 措美县| 邵阳市| 和龙市| 若尔盖县| 镇平县| 丹棱县| 宁波市| 肥城市| 祁连县| 景泰县| 桐庐县| 岑巩县| 于都县| 娱乐| 敦煌市| 固阳县| 太和县| 修武县| 西华县| 桂阳县| 安化县| 商水县| 定安县| 沅陵县| 蒙自县| 英超| 唐海县| 疏附县| 房产| 思南县| 南开区| 策勒县| 广平县| 灌云县| 南城县| 庆云县| 扎赉特旗| 海城市|

<cite id="xnmcv"></cite>