今天整個科技圈和資本圈都在熱議一件事:黃仁勛親口確認,為中國市場“特供”的H20芯片,在被禁三個月后,恢復銷售了!
A股AI概念聞聲起舞,英偉達股價應聲上漲。一片“利好”聲中,硅兔君撥通了自己硅谷專家網(wǎng)絡中的專家A(代號無任何意義)的視頻電話。A是NVIDIA前資深系統(tǒng)軟件工程師,深度參與過Hopper架構(gòu)的性能優(yōu)化項目。
視頻那頭,A正在硅谷的家中,他呷了一口咖啡,開門見山:“Jenson(黃仁勛)的這步棋,走得極其精妙,也極其‘毒辣’。它不是一次破冰,而是一場‘手術刀’式的再平衡。 理解了這把刀的落點,你才能看清未來幾年中國AI的真實棋局。”
這篇長文,將為您完整轉(zhuǎn)述并解讀硅兔君與A長達兩小時的深度對話。準備好了嗎?讓我們一起,撥開迷霧。
H20究竟是“何方神圣”?
在討論影響之前,我們必須先搞清楚,H20到底是一款什么樣的芯片。很多人簡單地將其理解為H100的“閹割版”,但A強調(diào),這種“閹割”并非大刀闊斧地亂砍,而是“外科手術”般的精準。
“想象一下,”A打了個比方,“英偉達給了你一臺法拉利的V12發(fā)動機,但把油管口徑、變速箱的換擋速度和輪胎的抓地力都做了嚴格限制。這臺車依然能跑,甚至在某些直道上感覺還不錯,可一旦進入需要連續(xù)加速、高速過彎的專業(yè)賽道,它的性能瓶頸就會暴露無遺。”
H20的限制,就體現(xiàn)在三個核心維度:
算力密度(Compute Density):這是最直觀的一刀。H20的FP16(半精度)算力約為296 TFLOPS,僅為H100(1979 TFLOPS)的15% 左右。這意味著在單位時間內(nèi),單張H20能完成的計算量遠低于H100。
互聯(lián)帶寬(Interconnect Bandwidth):這是最致命的一刀。H20的NVLink互聯(lián)帶寬從H100的900 GB/s被腰斬至400 GB/s。
A解釋說:“大模型訓練就像成千上萬個大腦協(xié)同思考一個極其復雜的問題,它們之間需要不斷高速交流信息。帶寬就是這些大腦之間的‘溝通語速’。語速慢了,整個思考過程就會被拖慢,即便每個大腦本身再聰明,整體效率也上不去。”這直接決定了H20無法高效地進行萬億參數(shù)級別的超大規(guī)模集群訓練。
內(nèi)存帶寬(Memory Bandwidth) :H20配備了96GB的HBM3內(nèi)存,這點很慷慨,甚至超過了H100的80GB HBM3e。但它的內(nèi)存帶寬為4.0 TB/s,略低于H100的4.8 TB/s。A指出:“這很有迷惑性。大內(nèi)存對于推理任務、或者加載更大的模型是友好的,能降低一些部署門檻。但這就像給了你一個巨大的書桌,但你從書架取書的速度(內(nèi)存帶寬)并沒有提升,甚至還慢了一點。對于計算密集型的訓練任務,這依然是瓶頸。”
A總結(jié)道,“H20在單卡理論算力上與國產(chǎn)的昇騰910B非常接近,但在互聯(lián)和內(nèi)存性能上依然保有優(yōu)勢。它的設計目標極其清晰:在遵守美國‘性能密度’管制紅線的同時,精準卡位,性能要略高于國產(chǎn)旗艦,以維持商業(yè)競爭力。
一紙解禁令背后的中美博弈
看清了H20的產(chǎn)品定位,我們才能理解它背后那場無聲的較量。
A為我復盤了整個事件的時間線:
2022年10月:美國商務部首次出重拳,禁售A100/H100等高端芯片。英偉達迅速反應,推出“特供版”A800/H800。
2023年10月:禁令升級,A800/H800也被禁。英偉達再次針對新規(guī),設計了H20系列。
2024年4月:風云突變,H20被曝出對華銷售亦受阻,英偉達在華業(yè)務遭受重創(chuàng),季度損失預估超百億美元。
2025年7月:黃仁勛官宣解禁。
“這期間發(fā)生了什么?”A分析道,“是美國政府、英偉達和中國市場三方博弈的結(jié)果。”
對于美國政府: 他們的策略是“小院高墻”(Small Yard, High Fence),即在最關鍵的核心技術領域(高墻)進行封鎖,而其他領域(院子)則可以保留一定的流動性。
全面禁售導致了兩個意外:一是重創(chuàng)了以英偉達為首的美國芯片巨頭的營收,動搖了產(chǎn)業(yè)鏈根基;二是極大地刺激了中國的國產(chǎn)化決心,華為昇騰的訂單量暴增,生態(tài)建設一日千里。繼續(xù)強壓,可能會把一個巨大的市場拱手讓給未來的戰(zhàn)略對手。
對于英偉達: 黃仁勛是頂級的商人,他比誰都清楚中國市場的重要性。完全失去中國,不僅是財務上的巨大損失,更意味著其賴以生存的CUDA生態(tài)系統(tǒng)將出現(xiàn)一個巨大的缺口。
H20就是他遞給美國政府和中國市場的一個“最大公約數(shù)”: 它遵守了規(guī)定,讓華盛頓滿意;它性能尚可且CUDA兼容,能留住絕大部分中國客戶;它的官方渠道和價格,還能有效打擊水貨市場,并對國產(chǎn)芯片形成降維打擊。
對于中國市場: 面對“無米下鍋”的窘境,H20的到來至少是一個“有總比沒有好”的選擇。特別是對于大量的中小AI企業(yè)和應用層公司,他們沒有能力也沒有必要去自建一套非CUDA生態(tài),H20是他們能快速開展業(yè)務的救命稻草。
“所以,”A總結(jié)道,“H20的解禁,是美國政府從‘硬封鎖’轉(zhuǎn)向‘軟絞殺’的策略調(diào)整。他們不再追求一刀切死,而是想通過精準控制你獲取先進生產(chǎn)工具的效率,來控制你整個產(chǎn)業(yè)的發(fā)展速度。 ”
H20將如何“攪動”中國AI江湖?
A更是從企業(yè)、產(chǎn)業(yè)和兩個層面,拆解了H20解開對華禁售后的影響。我們一起來聽聽他的“一線洞見”。
1. 對AI企業(yè)的直接沖擊:解渴,但別指望“飛天”
“好消息:H20的穩(wěn)定供應,能讓很多公司松口氣。”A說,“過去幾個月,禁令下企業(yè)要么高價囤水貨(風險大),要么轉(zhuǎn)用國產(chǎn)芯片(生態(tài)適配麻煩)。現(xiàn)在,有了官方渠道,AI推理、垂類模型訓練等業(yè)務能快速‘上車’。想象一家做智能推薦的創(chuàng)業(yè)公司,用H20集群迭代產(chǎn)品,成本和效率都優(yōu)化了。
但他話鋒一轉(zhuǎn):“壞消息:性能天花板擺在那兒。H20的低帶寬意味著大規(guī)模集群訓練效率低下,對于想造‘中國版GPT’的頭部玩家(如阿里、騰訊),這等于被‘限速’。許多企業(yè)會轉(zhuǎn)向更務實的路徑:聚焦應用落地,而不是基礎模型軍備賽。”
2. 對產(chǎn)業(yè)格局的深遠重塑:分化加速,自強提速
A分析道:“H20解禁會讓國內(nèi)AI生態(tài)‘兩極分化’:應用層爆發(fā)——中小模型和場景化AI(如醫(yī)療、教育、電商)將迎來春天。企業(yè)不用再為算力發(fā)愁,能更快把技術變現(xiàn)。”
“基建層挑戰(zhàn):基礎大模型領域,國產(chǎn)算力(如昇騰910B)將成為主力。禁令的‘倒逼效應’已經(jīng)顯現(xiàn)——華為生態(tài)伙伴超4000家,應用覆蓋金融、制造等。H20的到來,反而會刺激大家加速國產(chǎn)化,避免‘卡脖子’。”
他笑稱:“這可能推動中國AI從‘追趕’轉(zhuǎn)向‘彎道超車’:在受限硬件下,優(yōu)化軟件棧和算法創(chuàng)新,或許能誕生獨特優(yōu)勢。但風險也大:如果國產(chǎn)生態(tài)跟不上,差距可能會進一步拉大。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.