7月26日,2025世界人工智能大會(WAIC)將正式啟幕。據悉,華為將首次線下展出昇騰384超節點真機。這無疑將成為今年WAIC上一件意味深長的“高光時刻”。
然而,根據近日多方消息報道(如媒體“The Information”),華為正內部討論逐步淡化ASIC芯片的主導地位,轉向開發GPGPU產品,以適應大模型訓練需求。若傳聞屬實,不僅意味著華為AI戰略對ASIC路線的否定,也將對國內AI市場和昇騰用戶造成巨大沖擊。
昇騰能力遭遇瓶頸
盡管尚無官方公告,但華為調整AI芯片戰略,放棄投入多年且巨大的ASIC顯然并非空穴來風。昇騰的發展正遭遇嚴重瓶頸,除了宣稱因制裁導致產品停止迭代數年,其技術和市場也遭遇諸多問題。
首先是軟件生態受限,開發門檻長期居高不下。MindSpore、CANN等自研工具鏈尚未在主流開發者中形成足夠滲透力。即便是在國內信創市場,基于PyTorch和TensorFlow的訓練仍為絕對主流,昇騰平臺在開發側被頻繁詬病“上手難”、“生態封閉”等。而由于開發者使用門檻高,通用性不足,導致很多項目“部署了但用不起來”。
其次是ASIC更適用于推理,卻不適于訓練。目前,大模型訓練正從低精度向更高精度遷移,以昇騰910為代表的華為芯片主要面向AI推理部署場景,但其在大模型訓練側由于缺乏TF32、BF16等訓練關鍵算力支持,在高性能通用訓練場景中存在“天然劣勢”,與主流GPGPU在性能和靈活性上差距明顯。不少用戶甚至選擇NVDIA消費級的4090系列GPU,也不愿意使用ASIC芯片。
再次昇騰產品供貨不穩定,難以保證規模化應用。昇騰芯片由于流片工藝與良率控制方面面臨極限,可能存在供貨不穩定的問題,產能無法滿足大規模部署,特別在AI訓練高并發場景中存在物理算力瓶頸。
此外,隨著英偉達H20、AMD Instinct MI300X重新解禁,在中國以定制方案形式回歸,行業企業更傾向選用生態完備、支持廣泛的GPGPU平臺。同時,國產GPGPU近年發展迅速,已在信創市場行程強大競爭力。在多方市場競爭壓力下,華為昇騰等ASIC芯片競爭力正遭遇結構性挑戰,純粹依賴政策紅利和區域性保護的競爭策略效力大不如前。
技術切換難度巨大
從ASIC轉向GPGPU,不僅是技術路線上的簡單調整,更意味著研發體系、生態構建和產品周期的全面重構,而由于技術邏輯上的巨大差異,也會導致此前巨大投入打水漂,技術和商業體系基本要從零開始。
ASIC是一種為特定任務設計的高度定制芯片,比如AI推理,其優勢在于功耗控制、單位計算效率與價格控制。華為的昇騰芯片便屬此類,自2019年以來已在多個國產AI算力平臺部署落地,采用頗為廣泛,是國產AI芯片的主要選擇之一。
相較之下,GPGPU以其高并行計算能力成為AI訓練主力,具備更強的通用性和靈活性,尤其在大模型,如Transformer架構中具備壓倒性優勢。NVIDIA就是這一類型的最典型代表廠商,并因其CUDA生態深耕20年,早已成為開發者和框架的事實標準。
表面上,兩者皆為AI芯片,但底層架構、生態適配與開發者門檻差異極大。ASIC芯片適合特定場景加速,但無法做到全場景全精度適用,而GPGPU則憑借強大生態覆蓋和全精度計算能力,承擔通用算力平臺角色,是當前全球AI基礎設施的首要選擇。
倉促轉向前途未卜
雖然GPGPU是一條高度成熟的產業路徑,但對于華為而言,其進入門檻與轉換難度不容低估。如果華為真如傳聞的啟動GPGPU研發,勢必要直面三大拷問:多久流片?多久商用?多久形成生態?
從硬件架構上看,華為技術重構難度巨大。GPGPU核心在于高度可并行調度的SIMD架構,以及適用于圖形+通用場景的資源分配邏輯,完全不同于昇騰系列面向固定神經網絡任務的定制邏輯。兩者幾乎不存在架構兼容或軟遷移的可能。若從頭設計SM模塊、控制單元、內存架構,保守預計設計周期在18-24個月以上。
其次在軟件生態構建上,眾所周知,NVDIA主導的GPGPU成功的核心不在芯片,而在軟件棧和開發工具鏈。不夸張的說,當前市場體系下,CUDA生態不可替代。NVDIA在長達15年的時間里構建了的CUDA生態壁壘,華為目前僅靠MindSpore和CANN,顯然不足以承載GPGPU通用生態的復雜性。
據2024年斯坦福“AI Index”報告,全球90%以上的AI訓練仍運行于CUDA GPU上。即使華為打造兼容CUDA的芯片平臺,仍需克服長期構建的編譯器、底層算子、性能優化庫的全棧差距,這顯然需要巨大的人力財力和時間投入,想在短期內替代很難實現。
更為關鍵的是,若從零開始設計GPGPU芯片,完成從架構設計、IP整合、EDA驗證、初代流片到驅動開發與軟件適配,行業慣例至少需要2-3年技術周期,這意味著在2027年前華為的GPGPU難以真正對市場形成產品輸出。
用戶市場難以交待
即便通過非常規手段能夠加快流片量產,初代華為GPGPU在定價上也可能難以形成競爭力。根據IDC數據,華為昇騰?910B的市場價格約為120,000?元/片(約合16,672?美元)。H20重返中國市場后,售價預計在86,000–110,000?元/片(12,000–15,000?美元)之間,但考慮特朗普政府的不確定性,其渠道價格可能會略有上漲。另一參照項是壁仞早前發布的國產通用GPU BR100,單片預售價格大概在230,000元。
若考慮流片成本、工藝良率與初期產量,華為首代GPGPU產品試圖進入市場,其價格大概率高于當前昇騰系列,綜合來看定價不會低于200,000元/片,不僅明顯高于H20,也高于A100和H100,可能面臨性價比不足與缺乏規模優勢的雙重壓力。
但價格的影響仍是其次,如果華為真的弱化甚至逐步退出昇騰ASIC路線,首當其沖受到影響的將是大量政企與信創項目客戶。目前昇騰芯片已部署在數十個部委級平臺與信創項目,包括多個科研機構、高校、政務大數據中心,甚至在一些東數西算核心節點上也有規模應用。
轉向GPGPU后,原部署在昇騰平臺上的推理引擎與API需大規模重構,舊有系統無法直接遷移至GPGPU架構,推理模型、算法代碼、系統適配都需重寫。而一旦華為停止對昇騰生態工具鏈的支持,客戶已購買的ASIC硬件、配套板卡、開發框架可能被棄用,面臨二次投入和算力平臺重構成本。
同時,此前不少政府采購與信創標案明確要求“昇騰適配”或“華為芯片認證”,若架構轉變,勢必將影響原始標的交付與審計,而政府、高校、醫院、銀行和央國企等政策驅動型項目恰恰容不得折騰。一旦華為在這種關鍵技術路線頻繁搖擺,“自主可控”的承諾和形象都將失信于客戶。
截至目前,華為并未官方回應“放棄ASIC轉向GPGPU”的傳聞,也未有正式產品路線公開。但放棄ASIC、轉向GPGPU,對于華為來說無疑是一次技術路線的豪賭。如真,則必須面對產品重構、生態重建、客戶信任重塑的全面挑戰。如假,僅僅是又一次陣仗拉滿的營銷噱頭,必然進一步拉低公眾和客戶的信任度。
畢竟,技術路線可以更迭,但信任無法多次透支。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.