通信世界網消息(CWW)人工智能時代,智算產業不僅是技術競賽,更是一場關乎未來的生態共建。5月17日,2025世界電信和信息社會日智算產業創新發展論壇在南昌舉辦。中國移動研究院院長黃宇紅出席并作主題演講,探討如何通過超萬卡智算集群技術創新突破,賦能人工智能縱深發展。
智算已成為人工智能時代發展的關鍵驅動力。黃宇紅指出,當前通往通用人工智能(AGI)的道路上存在兩條路徑:一條是通過“大模型+大算力+大數據”探索模型能力上限;一條是“模型算法+智算設施”深度融合優化,探索成本下限。“這兩條路徑不僅推高算力需求,也對智算集群的設計提出新要求。”
隨著算力需求的增長,智算集群發展呈現三大趨勢:一是預訓練和后訓練技術推高算力需求,智算集群規模向超萬卡演進,推動算力形態和互聯架構創新發展,實現極致算效提升;二是DeepSeek引領AI普惠發展,推理算力需求和流量持續激增,加速智算設施的算力形態從單一向多元轉變,智算布局從集中式向“集中+分布”轉變;三是模型算法、訓推框架等基礎軟件深層次優化和創新,深度挖掘硬件潛能,提升計算效率,開辟大模型全新發展路徑。
“近年來,中國移動基于“N+X”智算布局積極推進智算中心建設,已建成兩大技術領先的萬卡集群,并實現了AI基礎設施的一體化供給和服務。”黃宇紅表示,面向人工智能時代發展新要求,中國移動將前瞻布局超萬卡集群的原創技術體系,攻關構建超萬卡集群的系統工程難題和科學技術難題。
在算效提升方面,通過互聯技術解決集群有效算力無法隨規模線性提升的問題,突破超萬卡集群的“算效瓶頸”。當前,開放互聯技術缺失導致GPU無法向超節點演進,為此,中國移動原創提出全向智感互聯OISA、全調度以太網GSE,助力國產智算集群效能躍升。其中,OISA通過定義協議棧、報文、流控及重傳等機制,使互聯規模提升16倍、點對點帶寬提升約14倍、時延縮短約10倍,在國內形成了廣泛的互聯生態。全調度以太網GSE實現分發粒度、發流模式、轉發和可靠機制等四大機制轉變,構建無損的高性能、高可靠機間網絡,并立足兩大場景,圍繞兩顆芯片,攜手產業伙伴持續攻關GSE關鍵技術,加速構建GSE產業生態,滿足超萬卡甚至未來超十萬卡智算集群的建設需求。
在生態融通方面,打造基礎軟件系統將成為驅動算法和基礎設施深層次協同的關鍵。針對國內各廠商智算軟件生態多而不強、相互割裂,應用難以跨架構遷移,制約整體訓練和推理效能的問題,中國移動提出算力原生原創技術體系(CAMA)并自研“芯合”算力原生基礎軟件系統,實現多樣算力一體適配,應用一次開發,跨芯一鍵部署遷移,目前已支持7家GPU跨架構高效推理。同時,中國移動聯合業界提出異構混訓技術,開辟了以軟補硬引領生態發展的全“芯”發展路徑,目前已構建原創技術體系和原型系統1.0,實現百億級參數大模型在5家智算芯片上交叉混訓能力,加速比超94.5%。
最后,黃宇紅表示,新型智算原創技術突破道阻且長,中國移動愿與產學研一起努力,共同助力我國智算產業蓬勃發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.