經濟觀察報記者 鄭晨燁
7月15日,英偉達(NVIDIA)創始人兼CEO黃仁勛現身第三屆中國國際供應鏈促進博覽會。這已是黃仁勛在2025年內第三次到訪中國大陸,就在幾天前的7月9日,他執掌的英偉達,市值盤中突破4萬億美元大關。
同日,根據英偉達官方微信公眾號發布的信息,英偉達正在提交重新銷售NVIDIA H20 GPU 的申請,“美國政府已向英偉達保證將授予許可證”,并且英偉達希望盡快啟動交付。H20是英偉達此前“特供”中國市場的一款AI芯片,今年4月被美國政府列入出口管制。
英偉達在文中同時強調了其在美國“加強AI基礎設施”的努力,以及在中國“探討AI如何提高生產力”的意愿。
為“合規”而生的H20
H20芯片的誕生背景,可直接追溯至2023年10月17日。
彼時,美國商務部工業與安全局(BIS)發布了更新的出口管制最終規則,該規則對銷往中國的先進計算芯片,設置了兩道核心的、量化的技術紅線。第一道紅線是“總體處理性能”,用以衡量芯片的綜合原始算力;第二道紅線則是“性能密度”,即總體處理性能與芯片面積的比值,旨在限制通過芯粒(Chiplet)組合方式繞開管制的能力。
這兩項指標的設定,將英偉達當時最暢銷的H100、A100以及H800、A800等數據中心GPU產品,擋在了中國市場門外。
作為應對,英偉達迅速調整其產品策略。2023年11月,根據公開報道,英偉達已開發出三款專為中國市場設計的新芯片——H20、L20和L2,其核心設計目標,就是嚴格遵照BIS設定的技術參數框架,確保產品合規。其中,作為面向AI訓練任務的旗艦型號,H20的公開規格參數,清晰地反映了這種“合規”的內在邏輯,它與被禁售的H100同樣基于Hopper架構(英偉達推出的一種GPU架構),但在關鍵性能上進行了精確的調整。
在算力性能方面,H20的FP16/BF16(半精度浮點)算力為148 TFLOPS(每秒萬億次浮點運算)。作為對比,被限制的H100芯片在同等精度(FP16)下的算力高達1979 TFLOPS。盡管性能差距顯著,H20的總體處理性能(TPP)經計算后低于美國商務部工業與安全局(BIS)設定的4800 TPP管制紅線,從而達到了“合規”標準。
顯存配置是H20少數未被削減的環節,其HBM3顯存容量從H100的80GB增至96GB,顯存帶寬也由3.35 TB/s提升到4.0 TB/s。芯片間的互聯性能,則是H20最受關注的環節之一,其單卡NVLink(英偉達開發的一種高速互連技術)互聯總帶寬為900 GB/s,與H100的規格持平,這保證了服務器節點內部的GPU間通信效率。
然而,真正的瓶頸在于跨節點的集群互聯能力,由于美國對高速網絡設備同樣存在出口管制,中國客戶將難以獲得用于構建DGX SuperPOD級別集群的NVIDIA Quantum-2 InfiniBand網絡方案——該方案能為每個服務器節點提供高達400 GB/s(即3.2 Tb/s)的外部互聯帶寬。
對于需要數千顆GPU互聯以訓練大模型的中國云廠商而言,外部互聯能力的缺失,意味著組建超大規模集群的通信效率將大打折扣,難度與成本也隨之顯著增加。
從產品立項到正式獲得銷售許可,H20的問世之路并不平坦,該芯片原定于2024年初上市,但其面市時間一再推遲,市場普遍認為,延遲的原因在于該系列芯片需通過美國政府的額外審核程序。這漫長的等待,直至2025年7月15日英偉達官方宣布獲得“保證”,才算告一段落。
“保證”之下的市場挑戰
英偉達官方信息中“保證將授予許可證”的表述,在商業層面意義重大,它為英偉達在中國市場啟動一系列商業活動提供了必要的基礎,這意味著,英偉達可以正式與中國客戶就H20的銷售進行談判、簽署意向訂單、進行產能規劃和供應鏈準備。
與此同時,英偉達也亮出了其多產品策略的另一環。英偉達在官方公眾號的文章中同時宣布,將推出一款“全新且完全兼容”的NVIDIA RTX PRO GPU,該產品“是為智能工廠和物流打造數字孿生AI的理想選擇”。
在高性能計算芯片受限的背景下,轉向工業AI應用領域,不僅符合中國推動制造業升級和“新質生產力”發展的宏觀政策方向,也因其應用場景的特殊性,面臨相對較低的出口管制風險。數字孿生、工業自動化等市場,或將成為英偉達在中國尋求更穩固業務的突破口。
然而,無論是H20的“有條件回歸”,還是RTX PRO的“新路開拓”,都無法回避一個已然改變的市場現實——激烈的本土競爭。
在美國出口管制政策的窗口期內,中國本土AI芯片產業獲得了加速發展的空間。
最直接的體現是市場份額的變化。根據TrendForce集邦咨詢2025年5月發布的一份研究報告,中國AI服務器市場預計外購英偉達、AMD等芯片比例會從2024年約63%下降至2025年約42%,而中國本土芯片供應商在國有AI芯片政策支持下,預期2025年占比將提升至40%,幾乎與外購芯片比例平分秋色。
另根據國際數據公司(IDC)發布的《中國半年度加速計算市場(2024上半年)跟蹤》報告,2024年上半年,中國加速服務器市場規模達到50億美元,同比2023上半年增長63%。在這一高速增長的市場中,一個關鍵的變化是,由NPU、ASIC等非GPU芯片驅動的加速服務器市場規模增速高達182%,達到近7億美元。
從更底層的加速芯片角度看,這一趨勢同樣顯著。IDC數據顯示,2024上半年,中國加速芯片的市場總規模超過90萬張,其中,中國本土人工智能芯片品牌的出貨量已接近20萬張,約占整個市場份額的20%。
值得注意的是,在服務器廠商層面,2024上半年按銷售額計算,浪潮、新華三、寧暢等本土廠商占據了市場超過70%的份額,中國本土的服務器供應鏈正在與國產AI芯片加速深度綁定,構建起相對獨立的生態系統。
IDC中國AI基礎架構分析師杜昀龍在報告中認為,由于前期的大量采購,目前中國的AI服務器市場仍處于“存量市場”狀態,這為本土技術的升級提供了一定的“緩沖期”。他亦指出,在當前環境下,隨著行業大模型需求的不斷加深,“適配中國算力設施的生態建設將成為主要的著力點”。
一個標志性的商業案例,則更直觀地反映了本土AI芯片產業加速發展的趨勢。2024年5月,中國移動公示了其《2024年至2025年新型智算中心采購》項目的中標結果,該項目共計采購人工智能服務器7994臺,總金額高達191億元人民幣(不含稅)。根據公開的中標信息,分享這一大單的服務器廠商包括昆侖、中科可控、寶德、長江計算、超聚變、百信、華鯤振宇等。一個關鍵的細節是,這七家中標廠商,均為華為昇騰生態體系內的硬件合作伙伴,此次招標的技術路線幾乎被昇騰體系“全包”。
在市場需求最旺盛的互聯網行業,頭部云廠商也均用實際行動完成了對國產化AI基礎設施的布局。根據華為昇騰官方公布的信息,其AI硬件平臺已對阿里巴巴的全系列“通義千問”大模型——從70億參數的Qwen-7B到千億參數的Qwen-72B——實現了全面適配與深度優化;百度智能云通過其“千帆”大模型平臺,為用戶提供了將文心大模型一鍵部署至昇騰硬件的選項;騰訊云也已將其“混元”大模型與昇騰服務器相結合,面向政企客戶推出解決方案;科大訊飛的“星火”大模型更是最早完成與昇騰平臺適配的企業之一。
也就是說,英偉達“H20”此次重返市場,面對的已不再是一個對其高度依賴的空白地帶,它不僅需要向客戶解釋其“合規”后性能參數的削減,更需要面對在價格、服務以及生態協同上都極具優勢的本土競爭者。
此外,對于已經投入大量資源進行國產化AI基礎設施適配與軟件生態建設的中國客戶而言,是否愿意以及在多大程度上“重返”英偉達的技術體系,也將是一個復雜且艱難的商業決策。
(作者 鄭晨燁)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
鄭晨燁
深圳采訪部記者 關注新能源、半導體、智能汽車等新產業領域,有線索歡迎聯系:zhengchenye@eeo.com.cn,微信:zcy096x。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.