2025年3月24日,彭博社援引知情人士消息稱,螞蟻集團正通過阿里巴巴、華為等國產芯片,結合混合專家(MoE)機器學習技術,降低AI大模型訓練成本約20%,且訓練效果與英偉達H800芯片相當。
盡管螞蟻集團未直接官宣,但其技術論文及行業動態已引發廣泛討論。
據披露,螞蟻集團自研的MoE架構將任務拆解為細分領域,類似“專家團隊協作”,通過算法優化提升低性能芯片的利用率。其開源模型“Ling-Plus”(參數規模2900億)在國產芯片上訓練1萬億Token的成本為508萬元,較傳統高性能設備(635萬元)降低20%。
論文顯示,該模型性能對標阿里通義Qwen2.5-72B、DeepSeek-V2.5等國際主流模型,并在部分基準測試中超過Meta同類產品。
這一技術方向與英偉達“依賴高端硬件堆砌”的策略形成鮮明對比。英偉達CEO黃仁勛曾強調“算力需求持續增長”,而螞蟻的研究則試圖證明,通過算法創新可在資源受限環境下實現高效訓練,為中小企業降低技術門檻。
螞蟻集團的嘗試并非孤例。此前,科大訊飛與華為合作,在昇騰國產算力集群上實現MoE模型跨節點推理,效率提升200%;阿里、華為等企業亦在加碼國產芯片研發。
值得關注的是,螞蟻開源“Ling-Lite”與“Ling-Plus”兩大模型,或推動技術普惠——中小企業可借此以更低成本參與AI創新。
資本市場對此反應積極。2024年9月以來,港股科技板塊AI相關指數漲幅超77%,中芯國際、小米等國產芯片鏈企業股價持續攀升。分析認為,國產替代的可行性正被逐步驗證,而成本優勢或成全球AI競賽的“新變量”。
針對外媒報道,螞蟻集團回應稱“針對不同芯片持續調優以降低成本,目前取得一定進展,將逐步開源分享”,未直接證實成本降幅。
知情人士透露,螞蟻集團仍保留部分英偉達芯片用于開發,但主要依賴AMD及國產芯片進行模型訓練。
這一技術路線面臨雙重挑戰:一是國產芯片性能的穩定性仍需驗證;二是國際供應鏈波動可能影響長期規劃。不過,螞蟻集團論文中“每一個FLOP都至關重要”的核心理念,凸顯出中國科技企業對資源效率的極致追求。
盡管螞蟻集團的技術突破尚未完全脫離國際供應鏈,但其探索為中國AI產業提供了新思路——通過算法創新彌補硬件差距,或將成為應對地緣政治風險的關鍵。正如中國發展高層論壇嘉賓所言,中國創新正不斷給世界帶來驚喜。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.