出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
頭圖 | 虎嗅拍攝
7月26日,世界人工智能大會(WAIC)在上海正式拉開帷幕。
在展會現場,具身智能無疑是最備受矚目的行業。從靈活完成格斗動作的人形機器人,到能精準執行家務、康復輔助的服務型機器人,這些具備物理交互能力的智能體憑借流暢的動作、自然的交互賺足了觀眾眼球。
然而,在這場科技盛宴中,當人們沉浸在具身智能帶來的震撼體驗時,人工智能產業的核心底座——以芯片、板卡、服務器、計算集群等為核心構成的算力基礎設施,依然是整個行業繞不開的關鍵話題。
與往屆大會相比,今年算力基礎設施展區呈現出截然不同的風貌。
往年展臺上隨處可見的“參數競賽”已悄然淡去,各廠商送展的芯片和服務器展品中,很少再有將某項極致性能參數用醒目字體刻意標記出來的情況。
曾經被重點標注的技術指標,如今更多地融入到具體的產業解決方案中,或是隱藏在真實的應用場景演示里。
現場的討論也多是基于“碎片化算力資源統籌”、“低功耗與低成本”與“垂類產品軟硬件整合”這些非常務實的話題。
全鏈路國產化進行時
在算力基礎設施的務實轉型浪潮中,“全鏈路國產化”的推進節奏尤為引人關注。
過去幾年,全球供應鏈波動引發的芯片斷供風險,以及核心技術“卡脖子”的現實挑戰,反復挑動著國內人工智能產業的神經。在全行業已默契達成“居安思危”共識的背景下,即便部分產品應用尚未受到外部限制,國內算力基礎設施廠商也主動將國產化的邊界從單一芯片突破,拓展至從架構設計、軟硬件生態到產業落地的全鏈路自主可控。
這種主動出擊的國產化實踐,在本屆 WAIC 的展臺間隨處可見。
從芯片底層架構的自主研發,到操作系統、編譯器等軟件工具鏈的國產化適配,再到與本土服務器廠商、行業應用企業的深度協同,一條貫穿“芯片—軟件—整機—場景” 的國產化鏈條正在加速成型。
剛剛提交上市輔導備案的沐曦,算是其中較為典型的代表。
本屆展會上,沐曦首次公開展示了其最新研發的訓推一體GPU曦云C600。據悉,其采用自研的XCORE 1.5架構及指令集,面向云端人工智能訓練與推理、通用計算、AI for Science等計算任務,且擁有豐富的標量、矢量和張量計算單元,支持多種混合精度計算。
雖然現場并沒有關于曦云C600的性能參數介紹,但據展臺工作人員透露,這枚芯片搭載了當前業界前沿的HBM3e顯存。這一關鍵配置勢必會大幅提高顯存帶寬,為大模型訓練及推理時的海量數據吞吐提供強力支撐。
鑒于曦云C600在本月剛剛回片,展會上并未出現基于這枚芯片打造的板卡及服務器。
而基于上代產品曦云C500系列芯片,沐曦在現場展示了PCIe服務器、OAM服務器和光互連服務器解決方案,這些服務器基本都實現了“全鏈路國產化”,即從編譯器、驅動程序,再到卡間互聯協議完全自研,或是第三方國內合作伙伴打造。
還有廠商則展示了不同于GPU的另一條高性能計算路線,比如國內唯一實現TPU量產的中昊芯英。
該公司打造的“剎那”系列TPU,采用完全可控的IP核與自研指令集、計算平臺,其可重構多級存儲、存算一體的設計,配合Chiplet技術實現2.5D封裝,在相同AI計算任務下能耗可降低三成。
另外,該枚芯片還有較強的集群擴展能力,最高支持1024片芯片高速互聯,基于“剎那”打造的“泰則”計算集群系統,單集群最大浮點運算能力在稀疏算力下達400P(TF32)以上,可支撐超千億參數的AI大模型計算。
據現場工作人員介紹,目前“泰則”計算集群系統,已完成對AIGC大模型計算、高級無人駕駛模型訓練、蛋白質結構精密預測在內的各類高強度運算場景的適配。
下沉到場景中
在兩個月前的鯤鵬昇騰開發者大會上,作為華為今年來在算力基礎設施上的集大成者,“384超節點”被首次公開,基于昇騰超節點技術,實現了業界規模最大的384卡高速總線互聯。
本次展會上,“384超節點”真機完成了在公眾面前的首次亮相,而該系統在大模型適配上的進度也令人矚目。據悉,目前業界已基于昇騰適配和開發超過80個大模型,在基礎大模型方面多個技術方向均有積累,如訊飛星火認知、DeepSeek、Qwen、鵬城、LLaMA等。
在場景適配上,基于昇騰軟硬件能力、訓練與推理解決方案及開源開放的軟硬件生態,華為聯合伙伴展示互聯網、運營商、金融、政務、醫療、油氣、交通等行業解決方案實踐。
另一家國產GPU企業摩爾線程,在現場展示的場景適配上則要更加細致。
在摩爾線程展位,該公司共帶來了包括生命科學、物理仿真、空間智能、視頻超分在內的12項面對不同行業打造的Demo。
令筆者印象較為深刻的是視頻超分技術MTVSR。該技術可在端側提供2-4倍的視頻實時超分,并提供多檔質量設定,能夠顯著提升低分辨率視頻在高分辨率屏幕下的播放清晰度,且以SDK形式支持播放器、瀏覽器等APP集成調用,可為終端用戶提供無縫的視頻超分體驗。
不同于一般的行業垂直解決方案,視頻場景中的端則軟件技術,由于其廣泛的應用性,一方面能夠有效調動行業應用,比如降低內容創作者獲取高質量素材的成本,提高內容生產效率;另一方面還能夠有效刺激產業生態構建,主動吸引視頻播放軟件、游戲開發商、監控設備制造商等多方協同。
華為以超節點技術夯實大模型訓練的算力底座,通過廣泛的行業適配構建生態護城河;摩爾線程則聚焦細分場景,用輕量化技術方案打通算力應用的“最后一公里”。兩者雖聚焦不同層面,但卻很好地反映出了眼下國產算力基礎設施所呈現出“高低搭配、全域覆蓋”的發展態勢。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4625468.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.