摩爾線程創始人、CEO張建中
繼英偉達之后,國產通用GPU公司摩爾線程也要發力“AI工廠”理念。
7月26日消息,2025世界人工智能大會(WAIC)期間,摩爾線程創始人兼CEO張建中宣布,為應對生成式AI爆發式增長下的大模型訓練效率瓶頸,公司將通過系統級工程創新,構建新一代AI訓練基礎設施,致力于為AGI時代打造生產先進模型的“超級工廠”。
張建中表示,除了語言模型之外,所有人都在把模型能力拓展到多模態和世界模型,甚至于具身智能和三維空間里的模擬仿真,它需要大型AI計算基礎設施,但要想建立大型基礎設施的難度就好比建一個Foundry(晶圓廠)一樣,所以他稱之為“AI工廠”(AI Foundry)。Foundry是生產芯片的,而AI Foundry是生產智能的,而摩爾線程提出的“AI工廠”,如同芯片晶圓廠的制程升級,是一個系統性、全方位的變革,需要實現從底層芯片架構創新、到集群整體架構的優化,再到軟件算法調優和資源調度系統的全面升級。其中,基于Triton-MUSA編譯器 + MUSA Graph,基于“平湖”架構的MTT S5000 GPU可實現DeepSeek R1推理加速1.5倍(150%)。
張建中強調,我們正迎來前所未有的生成式AI技術變革,而大模型的發展非常“卷”,從DeepSeek V3發布以來,短短半年,全球前沿模型DeepSeek的“智力”水平提升50%,遠超人類智力水平的增長速度。
“這是一件很可怕的事情,首先我們不要跟模型斗,要把它用好,它是你的Agent,你不能變成它的Agent。短短幾個月,Grok 4直接飆到世界第一,馬斯克只有一個秘訣,就是買了20萬張GPU卡,所以它可以‘卷’成世界第一,用很少的人力,但用強大的財力、強大的算力,所以就是靠算力推動智力的革命。”張建中稱。
據悉,摩爾線程成立于2020年6月,以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案。摩爾線程創始人兼CEO張建中曾任英偉達全球副總裁、中國區總經理,在GPU這一行業已經深耕近二十年。
成立以來,摩爾線程以自主研發的全功能GPU為核心,致力于為AI、數字孿生、科學計算等高性能計算領域提供計算加速平臺,公司已推出四代GPU架構,其芯片采用先進MUSA技術,并拓展出覆蓋AI智算、云計算和個人智算等應用領域的計算加速產品矩陣,滿足政務、企業及個人消費者等多層次、多樣化需求。
啟動IPO之前,摩爾線程已經完成了多輪融資,整個融資規模超過40億元。投資方包括中國移動、深創投、上海國盛、中銀國際、建銀國際、招商局創投、中關村科學城、紅杉資本等基金和機構。最近一輪投前估值246.20億元。
業務方面,基于自主研發的MUSA架構,公司成功開發出支持 AI 計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼等多場景的全功能GPU芯片。公司四年推出四代GPU芯片架構、四顆GPU芯片系列——蘇堤、春曉、曲院和平湖,流片成功/發布時間分別是2021年、2022年、2023年和2024年,覆蓋 AI 智算、專業圖形加速及桌面級圖形加速等領域,主要生產方式包括板卡/模組、一體機、集群設備等,客戶包括百度(北京百度網訊科技有限公司)、京東平臺、中國郵電器材集團等多家頭部公司。
2022年,摩爾線程推出國產游戲顯卡MTT S80,被譽為“國產游戲第一卡”,也是國內極少數可以支持DirectX 12的消費級顯卡。此外,在數據中心GPU部分,摩爾線程還發布了MTT S4000、S5000等多款計算卡,并擁有千卡智算集群、自有的萬卡集群方案。
招股書中顯示,MTT S80顯卡性能規格與英偉達RTX 3060相當,公司在兩年時間內先后完成24版驅動更新,顯卡性能表現提升數倍,成功兼容近千款游戲和應用。
目前,摩爾線程已成功自主研發并量產第四代高性能 GPU 架構“平湖”,并基于此推出了十余款高性能GPU加速卡與模組,以及D800計算服務器和KUAE智能計算集群等產品,構建了包含芯片設計、硬件產品及軟硬件一體化解決方案的全方位自主可控產品體系。
據悉,最新采用“平湖”架構的摩爾線程MTT S5000加速計算卡對標英偉達H100產品,其FP8計算能力適合對DeepSeek-V3/R1 MoE大模型進行訓練。
如今,基于通用GPU的全方位的自主可控產品體系,張建中提出了摩爾線程更大的“野心”:AI工廠(AI Foundry)。
事實上,英偉達最先提出了“AI工廠”(AI Factory)這一概念,原因在于,英偉達認為與傳統數據中心不同,AI工廠不僅存儲和處理數據,還能大規模生產智能,將原始數據轉化為實時洞察,對于世界各地的企業和國家而言,這意味著顯著縮短價值實現時間,將AI從一項長期投資轉化為提升競爭優勢的直接驅動力,從而讓企業未來將在創新、效率和市場差異化方面引領行業。
那么,在“AI工廠”設計中,英偉達提供強大的計算性能、高級網絡、基礎設施管理和工作負載編排、最大的AI推理生態系統、存儲和數據平臺、設計和優化藍圖、參考架構、為每個企業提供靈活部署等完整、集成的 AI 工廠堆棧,其中從芯片到軟件的每一層都針對大規模訓練、微調和推理進行了優化。這種全棧式方法確保企業能夠部署經濟高效、性能卓越且面向未來的 AI 工廠,以應對 AI 的指數級增長。
黃仁勛曾提到,借助基于英偉達Blackwell Ultra 的GB300 NVL72機架級解決方案,AI 工廠可實現高達 50 倍的 AI 推理輸出。
相比英偉達的“AI工廠”理念,摩爾線程“AI工廠”(AI Foundry)的核心在于基于全功能GPU通用算力,以系統化創新和工程化的能力提升先進模型生產效率。
在張建中看來,打造AI工廠,摩爾線程主要擁有五個技術競爭力:1、擁有全功能GPU,功能完備精度完整,實現加速計算通用性;2、自研MUSA架構,提升芯片有效算力;3、MUSA全棧系統軟件,提升單節點計算效率;4、自研KUAE大規模集群,優化集群效率;5、零中斷容錯技術,提升集群的穩定性和可靠性。
數據顯示,基于第四代“平湖”架構,摩爾線程的AI加速系統(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多種混合精度計算,在保證計算精度的同時,將Transformer計算性能提升約30%;內存系統方面,實現了50%的帶寬節省和60%的延遲降低;獨創的ACE異步通信引擎減少了15%的計算資源損耗,MTLink2.0互聯技術提供了高出國內行業平均水平60%的帶寬;核函數啟動時間縮短50%;GEMM算子算力利用率達98%,Flash Attention 算子算力利用率突破95%;MCCL通信庫實現RDMA網絡97%帶寬利用率;將百GB級備份恢復時間從數分鐘壓縮至1秒,提升GPU有效算力利用率。
張建中表示,依托AI工廠,摩爾線程成功構建起覆蓋“訓練-推理-部署”全流程高效體系,從圖形渲染基石到AI算力引擎,摩爾線程以“KUAE+MUSA”為智算業務核心,加速賦能千行百業,推動全功能GPU驅動的AI技術在物理仿真、AIGC、科學計算、具身智能、智能體、醫療影像分析、工業大模型等關鍵領域的應用與部署。
這意味著,國產計算基礎設施已具備支撐AGI(通用人工智能)時代規模化、高效率、高可靠模型生產的關鍵能力。
當前摩爾定律收入、研發費用不斷增加。招股書顯示,2022年、2023年、2024年,摩爾線程營業收入分別為0.46億元、1.24億元、4.38億元,三年營業收入復合增長率208.44%,累計營收6.09億元;三年研發費用分別為11.16億元、13.34億元、13.59億元,累計研發費用超過38億元。
(本文首發于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.