【導語:在中美貿易戰的博弈中,英偉達的H20芯片再度成為雙方交鋒的焦點之一。不過,隨著美國政府短期內解禁H20對中國的出口,讓中國的大算力AI芯片獲得了喘息之機。不過,從長遠來看,國產高端芯片要奮起直追,徹底解決“卡脖子”的技術。】
撰文|張大川、編輯|禾 子
近日,英偉達掌門人黃仁勛在接受采訪時公開表示,美國政府已經批準了英偉達的出口許可,英偉達將開始向中國市場銷售H20芯片。這是自今年4月美國決定禁止H20芯片銷往中國之后,美國政府的一個較大的態度轉變,也是中美為解決關稅沖突的一攬子協議中的關鍵一項。
H20的前世今生
相比于已經被列入嚴格出口管制的英偉達的A100以及H100/H200芯片,H20是英偉達公司專門為滿足美國的出口管制要求而專門打造的適用中國市場的AI加速器,其整體參數和要求都是完全按照美國政府的預期來打造,所以最初美國政府也沒有任何理由來限制其出口。
具體來看,H20擁有CoWoS先進封裝技術,沿用了和H100/H200同系列的Hopper架構,值得一提的是,其顯存容量增大至96GB HBM3,GPU顯存帶寬為4.0TB/s。但是,在最關鍵的算力這個考核指標上,H20的FP8算力為296 TFLOPS,FP16算力為148 TFLOPS,比H100縮水80%,僅為“最強”AI芯片H200的1/13。但即便如此,H20的整體性能依然勝過華為昇騰910B一籌。在這種情況下,國內不少企業調整策略,將多塊H20芯片并行計算,以此來彌補單塊芯片性能不足的缺陷,這也是國內目前能夠找到的相對最優解。
隨著使用H20的DeepSeek的橫空出世,美國發現國內的AI大模型只需要用非常少的芯片算力,就能夠達到OpenAI的最領先的Chat GPT的功能。因此,美國政府在今年對H20這款芯片下了手,終止了英偉達對中國出口這款芯片的許可,而如今經過多方博弈,又重新放開。
英偉達的霸主地位
英偉達自誕生之日起,始終致力于圖形處理器GPU的研發,并持續進行技術迭代。而這種對于圖形的辨識能力,不僅幫助英偉達在游戲顯卡領域一枝獨秀,更是在像自動駕駛這些需要對圖形辨識和學習的場景下,領先其他芯片企業一大截。
除了芯片本身的性能領先之外,英偉達的CUDA生態是其稱霸的另一個支柱。目前,全球90%的AI模型都是基于CUDA開發,這就使得企業在從英偉達的生態切換到其他生態時都會顧慮重重:在不同的生態之間進行轉換,需要對部門代碼重新編寫,耗費較長的時間,而且由于工具鏈大概率無法兼容,因此需要開發額外的適配層,系統性能會出現下降;模型效果可能出現偏移,對于自動駕駛算法來說,一旦效果出現偏移,哪怕只有1%,就需要對模型參數進行重新調試,而這意味著需海量的工作量和項目的延期。
在這種情況下,企業往往不愿意輕易切換芯片生態,并導致了如今英偉達在AI芯片領域獨步天下,霸主地位沒有人可以撼動。
中國自動駕駛企業要兩手準備
對于中國汽車企業來說,H20芯片的解禁,意味著本土車企在自動駕駛超算中心的芯片方案可以重新回歸英偉達的技術路線,但是,使用英偉達H20的自動駕駛云平臺技術方案,本身是有一定的技術局限性。
和A100這樣的芯片相比,H20的性能明顯受限。為此,國內車企就通過將H20顯卡集成在一起使用,通過增加集群規模效應來彌補單卡算力的下滑。而這種方式,不僅會導致整體訓練時間變長,而且更為關鍵的是,H20在設計之初就已經限制了用戶對于集群擴展的規模。H20的理論極限僅僅可以使用5萬張卡合成在一起,遠低于H100的20萬張。而傳統的rule-based的自動駕駛算法代碼動輒幾十萬行,且呈現出越來越復雜的態勢;哪怕是代碼只有幾千行的端到端,也是需要前期對于海量的真實道路數據的反復訓練所得,這些都注定了未來繼續使用H20會存在一定的制約。
此外,由于美國政策存在較大的變數,各家車企是否還愿意將所有資源投入到H20芯片,這要打一個比較大的問號的。而國產的平替方案,也在不斷的演進。相比于昇騰 910B,采用 Chiplet 雙芯片封裝華為昇騰 910C在性能上已經可以達到H100的60%,且支持CUDA 生態遷移。對于有實力的國內頭部企業來說,使用華為的昇騰平臺,即選擇英偉達和華為昇騰兩條腿走路,斷供的風險可以被大大緩解。
除了H20這樣的被用于智能駕駛云和數據中心的AI大算力芯片之外,國內車企更需要關注的是搭載在幾乎每一臺車上的智駕芯片。一旦這類芯片出現斷供,帶來的業務中斷風險更大。像Orin-X和Thor兩類智駕芯片,已經成為國內絕大多數車企高階智駕方案的主要選擇之一。當然,在這個領域國內還有包括地平線在內的芯片設計企業擁有“平替方案“。雖然這個就如同昇騰一樣,性能上還暫時落后國外的尖端技術,但在一定程度也已能滿足當下的場景。不過,包括上游的芯片設計需要使用的EDA工具,和生產高制成芯片的光刻機,依然還牢牢掌握在國外同行手中。
點評
英偉達H20回歸中國市場,讓國內車企以及一些大模型公司都可以喘一口氣。不過,從長遠來看,國產AI芯片要加快技術迭代和升級,讓相關企業使用國產芯片來建設自己的無人駕駛云以及實現無人駕駛技術;另一方面,國內整車企業和自動駕駛技術公司也需要學習DeepSeek,利用軟件算法上的優勢來對沖硬件性能上的不足。國內車企以及相關企業只有自己解決卡脖子技術,走通高端芯片這條“華山”之路,才真正可以在世界舞臺上與全球汽車霸主們一較高下。
(本文系《禾顏閱車》原創,未經授權,不得轉載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.