前言:
2025年,AI撕裂數據與實體的邊界,量子計算探索物理規則的邊緣,綠色科技重塑增長的倫理,低空經濟、機器人、大模型打開科技躍遷的大門。
在這個大背景下,中國企業需要以智慧為坐標,穿透技術、組織與商業模式的“三重結界”,在數字與實體的糾纏中鍛造新物種。在這背后,是一群技術興國的信奉者,產業躍遷的掌舵人、商業社會的洞察者、認知邊界的拓荒者,這些企業家永遠走在創新的前沿。
與智者同行者,必將率先觸摸未來;與AI共振,終將定義下一個紀元。
我們邀請了多位國內外頂尖創新與商業領袖,人工智能鏈主和龍頭創新企業,共同展望2025產業發展、技術創新以及戰略性新興產業發展的前景。
此文為融中特別策劃·《2025向新·AI未來》系列報道第四篇。
摩爾線程作為國內領先的全功能GPU創新企業,憑借其強大的技術實力和完善的生態系統,在AI產業鏈中迅速崛起。公司以全功能GPU為核心,致力于為全球提供加速計算的基礎設施和一站式解決方案,助力各行各業的數智化轉型。摩爾線程不僅在技術研發上取得了顯著成就,還在產品迭代、知識產權、應用場景等方面展現出強大的競爭力。面對大模型時代的機遇與挑戰,摩爾線程積極布局,通過與開源模型的合作和自主生態的構建,加速國產AI生態發展進程,為我國數字經濟的騰飛注入強勁動力。
本次,融中財經與摩爾線程市場生態高級總監呂其恒圍繞企業優勢、行業發展展開討論,以下為融中財經整理內容。
融中財經:貴司所處AI產業鏈條哪些關鍵環節、市場格局如何,具備哪些技術/產品優勢等?
呂其恒:摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI計算支持。我們的目標是成為具備國際競爭力的GPU領軍企業,為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。
摩爾線程有以下幾點核心的團隊優勢——
1. 技術領先:摩爾線程是國內極少數可從功能對標英偉達的GPU。摩爾線程全功能GPU芯片采用自研先進MUSA架構,集成AI計算加速、圖形渲染、視頻編解碼、物理仿真和科學計算等四大引擎,且原生支持包括FP8計算在內的多種精度。
2. 產品迭代:摩爾線程保持每年迭代一顆全功能GPU芯片的節奏,建立了從芯片、板卡、集群到軟件的全棧AI智算產品線。也是國內僅有的在B端、C端均有產品布局的全功能GPU企業。
3. 生態系統:我們擁有千余家生態伙伴,形成了強大的生態網絡,這為我們的產品提供了廣闊的市場和應用場景。
4. 人才優勢:摩爾線程創始團隊來自全球GPU巨頭英偉達,構建了一支涵蓋GPU芯片IP研發、系統軟硬件設計、生態建設、市場營銷等多領域的高端人才隊伍,公司員工絕大部分為研發人員,這為我們的技術創新和產品開發提供了堅實的人才基礎。
5. 知識產權:經過四年投入,摩爾線程在專利數量和價值上取得重要突破進展。根據國家知識產權局的數據,截至2025年2月,摩爾線程獲得470項授權專利,穩居國內GPU企業中專利授權數量首位。這些專利主要覆蓋了處理器架構設計、AI應用、驅動軟件設計、GPU算力集群等關鍵技術領域,充分展示了摩爾線程在技術創新上的深厚積累和前瞻布局。2024年11月,摩爾線程憑借夸娥(KUAE)智算集群項目斬獲“2024中國·海淀高價值專利培育大賽”一等獎。此外,摩爾線程還取得了知識產權貫標認證,這一認證屬于貫徹國家標準(GB/T29490-2023)的國家級資質認證,是對公司知識產權管理體系科學性、系統性、規范性和專業性的有力證明。
6. 應用場景:摩爾線程全功能GPU應用場景廣泛,覆蓋AI訓練與推理、AIGC、數字孿生、物理仿真、科學計算等,可以充分為金融、教育、電力、交通、能源、農業等重點行業的數智化轉型提供算力加速,持續助力我國數字經濟發展。
7. 投資陣容:摩爾線程成立不到五年時間內完成了數輪融資,投資方包括中國移動、深創投、上海國盛、中銀國際、建銀國際、招商局創投、中關村科學城、紅杉資本等知名國資和風投機構。
摩爾線程是一家擁有自主知識產權的全功能GPU創新企業,是國內極少數既覆蓋了圖形渲染,又支持AI高性能計算的國產GPU公司,產品覆蓋從云到端,致力為各行各業的數智化轉型提供全棧計算支持。夸娥(KUAE)智算中心全棧解決方案:以全功能GPU為底座,軟硬一體化、完整的系統級算力解決方案,包括以夸娥計算集群為核心的基礎設施、集群管理平臺(KUAE Platform)以及大模型服務平臺(KUAE ModelStudio),旨在以一體化交付的方式解決大規模GPU算力的建設和運營管理問題。
2023年,摩爾線程推出了以夸娥智算集群為核心的智算中心產品組合,可實現從千卡至萬卡集群的無縫擴展,支持所有主流開源大模型,并與智源研究院、智譜AI、無問芯穹等多家大模型合作伙伴完成適配與測試,能夠為千億和萬億參數的大模型訓練提供堅實的算力支撐,滿足大模型時代對于算力“規模夠大+計算通用+生態兼容”的核心需求。桌面級圖形顯卡MTT S80:國內首款公開發售的國產高性能游戲顯卡,也是國內首個支持DirectX12游戲的國產GPU。MTT S80自2022年11月發布至今,其Windows 驅動版本已經迭代26次,平均每30天發布一個新版本。目前已實現China Top 50熱門游戲100%兼容,已追蹤超過450款游戲的運行情況,累計正式發布的適配和優化游戲192款,并且還有更多游戲正在適配和調優。截至2024年10月,在圖形測試軟件3DMark 11中,MTT S80的成績提升至4.5倍。
摩爾線程AI大模型訓推一體機:摩爾線程AI大模型訓推一體機MCCX D800是專為千卡乃至萬卡級別GPU集群、萬億參數大語言模型預訓練優化的服務器硬件系統,同時針對大模型推理效率以及性價比優化,支持兼容主流軟硬件生態。目前,MCCX D800原生支持包括FP8計算在內的多種精度,現已支持包括DeepSeek、Qwen、GLM、Aquila、GPT、LLaMA在內的多個主流大模型的訓練與微調,承托于MUSA底層軟件棧,配備完善的推理軟件工具包,可實現快速上手、開箱即用。
融中財經:隨著這兩年大模型的快速發展,特別是Deep seek爆火,您對公司發展有了哪些新的想法?近三年戰略路徑是?
呂其恒:DeepSeek的核心突破在于算法優化和計算效率的提升,這種低算力需求模型對國產芯片的發展是一個重要機遇。首先,DeepSeek的成功表明,通過模型壓縮、稀疏計算、混合精度訓練等技術手段降低算力需求,可以在一定程度上彌補硬件性能的不足,為國內芯片提供了軟硬件協同設計的新思路,證明了在硬件性能短期內難以趕超的情況下,通過軟件層面的創新仍可提升整體計算效能;
其次,DeepSeek在混合精度訓練方面的成功,展示了低精度計算在AI訓練中的潛力。國內芯片廠商可以借鑒這種模式,優化芯片的計算單元,支持更靈活的精度配置。摩爾線程是目前國內唯一能支持包括FP8在內的全精度AI訓練的GPU企業。摩爾線程全功能GPU配備了最新一代的Tensor Core,原生支持E5M2和E4M3兩種表示方式的FP8數據精度,可以為DeepSeek的模型訓練提供國產算力支持。
與此同時,DeepSeek的開源模式為國產芯片廠商提供了與軟件開發者合作的機會。通過與DeepSeek等開源模型的合作,國內芯片廠商可以更好地理解AI應用的需求,進行針對性優化,國產模型+國產芯片可以形成完整的AI閉環,加速國產AI生態發展進程。另外,DeepSeek大幅降低AI成本,讓AI更加普及,反過來又會提升對算力規模的需求。
行業正處于模型應用落地的關鍵階段,摩爾線程已經構建起"軟硬一體"的行業解決方案。作為國內率先原生支持FP8計算精度的國產GPU企業,摩爾線程快速適配DeepSeek的各個開源倉庫,旨在為更多GPU開發者賦能。憑借先進的MUSA 架構和全功能GPU的強大技術實力,我們不僅光速適配了DeepSeek-R1和V3滿血版,更有DeepSeek大模型一體機提供開箱即用的體驗。近日,摩爾線程MTT S4000訓推一體計算卡還通過了中國信通院AI芯片和大模型適配驗證,對DeepSeek-R1 671B 大模型可實現正常、穩定運行,在推理場景下的適配結果符合“AI芯片和大模型通過性適配要求”并獲頒檢測證書。
同時,基于全功能GPU,我們與合作伙伴聯合打造的智算一體機已完成與DeepSeek等主流大模型的深度適配。例如,摩爾線程與雪浪云聯合打造的“軟硬件緊耦合”大模型訓推一體機——雪浪MindCenter X100,憑借其卓越的性能和靈活的架構,已成功部署DeepSeek-R1-Distill-Qwen(適配1.5B、7B、14B、32B)推理服務,并在多種中文任務中展現了優異的性能。通過深度集成,這款一體機能夠充分發揮DeepSeek模型的強大性能,同時借助自身高效的計算架構和資源管理能力,實現更快的訓練速度、更低的推理延遲和更高的資源利用率。
整體來看,國產模型+國產芯片可以形成完整的AI閉環,加速國產AI生態發展進程。國產芯片通過聚焦能效比、本地化服務和政策紅利,有望在邊緣和端側市場、行業AI等場景實現突圍。例如:中國有廣泛的工業場景,摩爾線程的大模型一體機產品在工業領域受到青睞。但與此同時,國產芯片仍需在生態構建、軟硬協同和技術創新上持續投入,才能真正將機遇轉化為市場份額。
融中財經:對比中美AI底層生態,您認為目前國內處于何種狀態?隨著AI產業的快速發展,中國創新企業,實現國產替代彎道超車的突破口在哪里?
呂其恒:我想從英偉達構建的CUDA生態的角度來談談這個問題——CUDA生態壁壘的核心在于硬件與軟件的深度耦合,以及由此形成的強大生態綁定效應。英偉達的GPU架構通過CUDA進行了深度優化,能夠充分發揮硬件的并行計算能力。同時,CUDA生態涵蓋了從編程語言、API到優化庫的完整工具鏈,并與主流深度學習框架深度集成,形成了強大的開發者社區和應用生態。
如果希望在全球市場上挑戰英偉達的CUDA生態,國產GPU廠商需要從多個方面尋找突破口。一是構建自主可控的軟件生態是關鍵,其次,兼容與創新并行的策略也至關重要。像摩爾線程MUSA既可以兼容主流開放生態,又可以自主發展,能夠降低開發者的遷移成本,同時逐步構建自主生態。此外,抓住新技術的機遇也是一個重要方向。例如,DeepSeek的爆火,它的核心突破在于算法優化和計算效率的提升,這種低算力需求模型對國產芯片的發展是一個重要機遇。再次,通過開源和合作,吸引開發者參與,加速技術迭代,以及硬件層面的優化也非常重要。總之,挑戰CUDA生態需要國產GPU廠商在硬件性能、軟件生態和算法優化等多方面協同發力,逐步構建自主的軟硬件生態鏈。
融中財經:大模型落地需要工程和算法的協同創新,如何建立開放協作的AI產業生態?產學研合作能起到哪些關鍵作用?
呂其恒:摩爾線程深刻理解開發者在技術生態中的重要性,通過線上線下課程培訓、與高校合作交流等多種方式,為開發者提供技術成長和創新的平臺。摩爾學院作為摩爾線程創立的專業GPU技術培訓與交流平臺,專為GPU開發者、科研人員以及產業實踐者設計,提供從入門到精通的全方位培訓。學院匯聚行業頂尖專家和生態合作伙伴資源,旨在打造一個全面而深入的課程體系,課程內容廣泛覆蓋人工智能、數字孿生、加速計算等多個前沿技術領域,幫助學員掌握尖端技術知識,拓展創新視野。
除了賦能開發者,圍繞自主研發的MUSA統一系統架構和軟件平臺,摩爾線程正致力于構建一個完善且好用、易用的國產GPU應用生態,既可以自主發展,又兼容主流開放生態。
MUSA架構:MUSA(Meta-computing Unified System Architecture)是摩爾線程自主研發的GPU統一系統架構,包括統一的GPU編程模型、軟件運行庫、驅動程序框架、指令集架構和芯片架構。開發者基于MUSA開發的應用將具備廣泛的可移植性,可以同時運行在云端和邊緣的眾多計算平臺上,包括面向圖形、計算、多媒體和人工智能的各類應用。
MUSA軟件棧:軟件生態是推動GPU計算普及的關鍵,以MUSA架構為核心,摩爾線程發布了完備的MUSA軟件棧,以服務廣大的開發者和終端用戶。MUSA軟件棧包括圖形渲染、多媒體、人工智能、物理仿真、通用計算等功能模塊,將涵蓋從底層驅動到GPU加速庫,再到為不同行業定制的應用領域開發套件,致力于滿足各種行業場景下的應用開發需求。
CUDA兼容:摩爾線程自研先進MUSA架構及軟件棧對CUDA具備優良的兼容性,通過MUSIFY代碼自動轉換工具,用戶可以快捷地將原有的CUDA代碼無縫遷移到MUSA平臺,大幅提升應用移植的效率,縮短開發周期。
MUSA開源軟件:借助MUSA對CUDA的完整兼容,摩爾線程上線了一系列基于國產全功能GPU進行開源項目MUSA移植的軟件,包括深度學習框架Torch-MUSA、大語言模型高速推理框架vLLM-MUSA、計算機視覺庫OpenCV-MUSA、高性能模板庫MUTLASS,以及DeepSeek開源周“全家桶”相關成果,以支持開發者基于國產GPU的技術創新和項目實踐。
目前,摩爾線程已經在制造業、工程機械、新能源、教育、金融等多個行業中落地應用,展示了國產GPU在復雜AI任務中的強大支持能力。未來,摩爾線程將持續深化與開源社區合作,通過技術開放與生態共建,推動國產全功能GPU在AI計算領域的規模化應用,并協同千余家生態伙伴形成的強大的生態網絡,為更多用戶提供更智能、高效的解決方案,為各行各業的數智化轉型提供強大的AI計算支持。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.