(圖片來源:NVIDIA官網)
就在全球AI龍頭英偉達(NVIDIA)財報發布數小時前,華為再度隔空“硬碰硬”。
5月29日凌晨,華為技術團隊在Gitcode平臺上發布Pangu Ultra MoE萬億規模大模型技術報告,其擁有約7180億參數規模的結構,首次全流程在昇騰Ascend 910上進行訓練,顯著提升推理吞吐并降低延遲,并且融合大算子和通信優化有效提升了NPU利用率,從而有效提高訓練過程的穩健性。
而昨天,華為盤古還發布基于分組混合專家模型(MoGE)架構構建的盤古Pro MoE大模型,參數規模720億,基于昇騰300I Duo和800I A2實現了更優專家負載分布與計算效率(321 tokens/s 和 1528 tokens/s)。
更早之前,華為技術團隊稱昇騰在MoE模型的推理部署性能已全面超越了基于英偉達Hopper架構的推理部署性能,而DeepSeek基于國產芯片的部署方案,性能也已超越英偉達H100系列芯片。另外,華為“CloudMatrix 384超節點”技術在算力規模和推理性能上也全面超越英偉達NVL72。
因此,面對華為的“兇猛”進擊AI算力賽道,身價1173億美元的黃仁勛似乎也感受到全球AI市場的快速變化,并開始放緩新產品迭代速度,而轉向網絡架構。
5月29日凌晨,英偉達發布2026財年第一季度(2025自然年第二季度)業績報告,收入利潤仍在上漲。
財報顯示,英偉達當季營收441億美元,環比增長12%,同比增長69%;凈利潤187.75億美元,市場預期207.67億美元;調整后每股收益為0.96美元,市場預期0.93美元。其中,關鍵的數據中心業務營收同比增長73%,達到391億美元,略低于市場預期的393億美元。
值得注意的是,財報中披露,4月美國政府宣布H20對中國禁售,英偉達在2026財年第一季度因H20產品過剩庫存和采購義務產生了45億美元的費用,因為對H20產品的需求下降。在新的出口許可要求之前,2026財年第一季度英偉達H20產品的銷售額為46億美元。英偉達在第一季度無法發貨導致額外的25億美元H20收入。此外,預計英偉達Q2受此損失80億美元。
近期有消息稱,英偉達即將在6月開始對華出貨B20“特供版”芯片,以取代H20。
談到B20的進入對中國AI算力格局看法,Gartner研究副總裁盛陵海(Roger Sheng)近期對筆者表示,AI芯片到底是否適用、到底能不能受到歡迎,在于它能否支持最新AI大模型,且效率要高,從而要得到市場的認同,如果競爭力不高,可能沒人去使用。然而,即便英偉達AI卡有更好的性能表現,同時也不放棄中國市場,但中國需要發展國產AI算力,一旦美國斷供很難讓企業信任。“不能把所有的東西放在一個籃子里,我們要多元化(發展)。”
受財報影響,英偉達(NASDAQ:NVDA)股價盤后大漲4.89%,最新市值3.29萬億美元。
數據中心收入持續暴漲,資本市場已不再“震驚”
事實上,自2025年初DeepSeek熱潮下,最受矚目的就是英偉達。
華爾街質疑,DeepSeek“現象級”的崛起,對美國科技巨頭3000多億美元的算力支出是否有用,動搖了推動美國 AI 行業發展預期。就在美股今年1月27日,英偉達股價暴跌17%,收于118.58美元,市值蒸發近6000億美元(約合4.3萬億元)。
CNBC稱,這是“美國公司有史以來的最大跌幅”。
到了5月,華為又“助力”了。5月中旬,華為發布CloudMatrix 384超節點技術,利用多寬帶高速網絡連接AI加速卡,用網絡的“量”彌補顯卡性能上的“質”,以此算力訓練更大規模的AI模型。
如今,英偉達已感受到了壓力。
黃仁勛近期多次表示,中國AI競爭確實非常激烈,初創企業眾多,大概有五十多家相關GPU算力公司迅速崛起,其中華為無疑是全球最具實力的科技公司之一。他提到華為昇騰CloudMatrix 384超節點和910C,部分性能上甚至超過英偉達的產品。
“這是一個我們必須高度重視、充分尊重的對手,我們也必須全力以赴,持續創新,才能在這樣的競爭中保持領先地位。”黃仁勛指出,華為目標就是將5G與AI深度融合,這一戰略方向非常有前瞻性,也完全正確,而英偉達也在推進同樣的工作。
財報顯示,英偉達收入來源于數據中心、游戲、專業可視化、汽車等業務方向。
具體來看,數據中心業務上,英偉達當季營收為391億美元,同比增長73%,環比增長10%。微軟、谷歌等大型云服務平臺仍然是英偉達最大的客戶群體,占數據中心收入的近50%。Blackwell在該季度貢獻了近70%的數據中心計算收入,Hopper的遷移工作已接近完成。
其中,計算業務收入為342億美元,同比增長76%;網絡收入為50億美元,同比增長56%。
英偉達CFO克雷斯(Colette Kress)表示,AI工作負載已強勢轉向推理,AI工廠的建設正在帶來可觀的收入,其對客戶的承諾堅定不移。GB200 NVL的引入是一項根本性的架構變革,旨在支持數據中心規模的工作負載,并實現最低的單位推理令牌成本。雖然這些系統的構建過程很復雜,但英偉達已經看到制造良率的顯著提升,機架出貨量也正在向最終客戶穩步增長。
本季度,游戲方面營收38億美元,同比增長42%,環比增長48%,增長主要得益于Blackwell架構GPU的銷售;專業可視化業務營收5.1億美元,同比增長19%,環比持平;汽車業務營收為5.8億美元,同比增長72%,環比下降1%。
黃仁勛表示:“我們突破性的 Blackwell NVL72 AI 超級計算機——一款專為推理而設計的‘思考機器’——現已在系統制造商和云服務提供商中全面投入生產。全球對 NVIDIA AI 基礎設施的需求異常強勁。AI 推理代幣的產量在短短一年內就激增了十倍,隨著 AI 代理成為主流,對 AI 計算的需求也將加速增長。世界各國都已將 AI 視為與電力和互聯網一樣重要的基礎設施,而英偉達正處于這一深刻變革的中心。”
展望2026財年第二季度(2025自然年三季度),英偉達指出,預計公司收入為450億美元,上下浮動2%。這一預期反映了近期出口管制限制導致的H20收入約80億美元的損失;預計 GAAP 和非 GAAP 毛利率分別為 71.8% 和 72.0%,上下浮動 50 個基點,并力爭在今年下半年將毛利率提高到 70% 左右;預計GAAP和非GAAP運營費用分別約為57億美元和40億美元。預計2026財年全年運營費用增長率將在30%左右。
對于英偉達來說,中國市場無疑是本季市場最為關注的事件。
黃仁勛近期表示,美國對華AI芯片出口管制是失敗的。他說道,“事實證明,最初制定AI擴散規則的那些基本假設存在根本性缺陷。”黃仁勛表示,英偉達在中國的市場份額已從美國前總統拜登執政初期的95%降至目前的50%。
研究機構Emarketer分析師雅各布·伯恩(Jacob Bourne)在一份報告中表示,更廣泛的擔憂是,貿易緊張局勢以及關稅對數據中心擴張的潛在影響,可能會在未來幾個季度對AI芯片的需求造成阻力。“這并不意味著英偉達的主導地位將終結,但這凸顯出,英偉達要維持這種主導地位,需要應對日益復雜的地緣政治、競爭和經濟挑戰。”伯恩寫道。
5月29日財報會議上,黃仁勛表示,中國是全球最大的AI市場之一,也是通往全球成功的跳板。全球有一半的AI研究人員在中國,贏得中國市場的平臺有望在全球領先。然而,如今價值500億美元的中國市場實際上對美國企業關閉了大門。
“H20出口禁令終止了我們在中國的Hopper數據中心業務。我們無法進一步削減Hopper的產能以遵守出口管制規定。因此,我們將對無法出售或重新利用的庫存進行數十億美元的減記。我們正在探索有限的競爭方式,但Hopper已不再是我們的選擇。 無論有沒有美國芯片,中國的AI都會不斷發展。它必須進行計算才能訓練和部署先進的模型。問題不在于中國是否會擁有AI,它已經擁有了。問題在于,作為全球最大的 AI 市場之一,中國是否會在美國平臺上運行。保護中國芯片制造商免受美國競爭的影響,只會增強它們在海外的競爭力,削弱美國的地位。出口限制刺激了中國的創新和規模化發展。 AI競賽不僅僅關乎芯片,而關乎世界將基于哪種技術棧運行。隨著該技術棧擴展到6G和量子技術,美國的全球基礎設施領導地位岌岌可危。 美國的政策建立在‘中國無法制造AI芯片’的假設之上。這一假設一直以來都備受質疑,現在顯然是錯誤的。中國擁有巨大的制造能力。最終,贏得AI開發者的平臺才能最終贏得AI。出口管制應該強化美國的平臺,而不是迫使全球一半的AI人才流向競爭對手。”黃仁勛表示
克雷斯表示,雖然新加坡占英偉達第一季度賬單收入的近20%,因為許多大客戶都使用新加坡進行集中開票,但英偉達的產品幾乎總是運往其他地方。需要注意的是,H100、H200和Blackwell數據中心計算收入中,超過99%的賬單收入來自美國客戶的訂單。
談到DeepSeek,黃仁勛毫不吝嗇地對DeepSeek和通義千問表達了贊賞,稱其是“最佳開源AI模型之一”。“就像ChatGPT一樣,引入了推理AI,它思考的時間越長,給出的答案就越好。”
“來自中國的DeepSeek和Qwen是最優秀的開源AI模型之一。它們免費發布,在美國、歐洲及其他地區都獲得了廣泛關注。DeepSeek-R1與ChatGPT類似,引入了推理AI,其思考時間越長,給出的答案就越好。推理AI能夠逐步解決問題、規劃和使用工具,將模型轉化為智能代理。推理是計算密集型的,每個任務需要的令牌數量是以前一次性推理的數千倍——每個任務需要的令牌數量是以前的一次性推理的數千倍。推理模型正在推動推理需求的階躍式增長。AI Scaling Law保持不變,不僅在訓練方面,現在推理也需要大規模計算。”黃仁勛稱。
克雷斯表示,英偉達在制造良率方面得到顯著改善,機架出貨量正以強勁速度交付。GB300也預計本季度末量產發貨。
“我們的目標是在一年內在美國制造從芯片到超級計算機的整個過程。每個GB200 NVLink72機架包含 120 萬個組件,重近2噸。迄今為止,還沒有人生產過如此規模的超級計算機,我們的合作伙伴正在作出非凡的貢獻。”黃仁勛稱。
黃仁勛強調,“美國將永遠是英偉達最大的市場,也是我們基礎設施最大安裝基數的所在地。如今,每個國家都將AI視為下一次工業革命的核心,這是一個為每個經濟體提供智能和必要基礎設施的新興產業。各國正在競相構建國家級AI平臺,以提升其數字化能力。上周,我前往瑞典,出席了該國首個國家級AI基礎設施的啟動儀式。日本、韓國、印度、加拿大、法國、英國、德國、意大利、西班牙等國家正在建設AI工廠,以賦能初創企業、各行各業和社會。自主AI是英偉達新的增長引擎。”
華為完成中國AI大模型推理適配部署,H20作用大大減少
黃仁勛對華為中國AI市場的渴求,已經擺在了臺面上。
“DeepSeek凸顯了開源AI的戰略價值。當熱門模型在美國平臺上進行訓練和優化時,它將推動其應用、反饋和持續改進,從而鞏固美國在整個AI領域的領導地位。美國平臺必須繼續成為開源AI的首選平臺。這意味著要支持與包括中國在內的全球頂尖開發者的合作,當像DeepSeek和阿里Qwen這樣的模型在美國基礎設施上達到最佳運行狀態時,美國就將獲得勝利。”黃仁勛認為中國AI大模型應該要用英偉達這樣的美國AI系統進行訓練,而不應該是華為。
實際上,2017年美國開始發動對華貿易戰,2018年已經開始在半導體和芯片等領域圍堵中國,2019年切斷了對華為5G芯片的供應。
過去六年,華為“低調”處理,接連完成消費級、云服務器層面的芯片部署。當前,基于高達100%國產化率的昇騰芯片,華為昇騰鯤鵬AI系統已經解決了大模型訓練、推理問題。所以這對于黃仁勛來說,無疑是一個巨大打擊。
就在5月29日一場學術活動上披露,DeepSeek模型已經在華為昇騰上進行了高效推理。通過對模型算子權重進行Int4量化優化,顯著降低現存占用,首次實現單臺華為8卡服務器上的DeepDeek-R1的推理,同時在DeepSeek V2推理性能比vLLM昇騰版本在不同請求下平均提升88%以上。
上述是一套自主可控的推理優化方案。
據Gartner最新報告顯示,截至目前,消費者業務全球份額高達21%,國產芯片自給率高達42%,模擬芯片、無線通訊相關產業芯片達到27%的自給率。
盛陵海對筆者指出,隨著自研芯片趨勢,自給率份額會逐漸提升。比如,預期今年由于AI市場的投資持續增加,國產AI芯片自給率會有進一步提升。中國芯片企業把眼光不應該僅局限于國產替代,而且要建立相關標準、要去國際市場做新的競爭。
不過,目前國產AI芯片依然存在很多不足。
中國科學院院士、清華大學計算機系教授胡事民表示,國產芯片格局已基本明朗,高端芯片與美國仍有較大差距。算法和模型優化能夠實現卓越的性能提升,彌補國產算力不足,原始創新仍然需要加強。
近期華為發布的CloudMatrix 384超節點,通過全面架構創新,在算力、互聯帶寬、內存帶寬等方面實現全面領先。而目前,華為開發者規模超1200萬,伙伴數量超4.5萬,云商店應用數量超1.2萬。
目前,黃仁勛也在追趕華為384超節點,部署多個網絡平臺。他在財報會上表示,目前英偉達有四個網絡擴展平臺:NVLink、InfiniBand、Spectrum-X和BlueField。
黃仁勛也透露了公司對全球AI基礎設施建設的宏偉愿景:“我們可以預見到在不遠的將來,需要數十吉瓦的英偉達AI基礎設施的項目。”
他指出,AI是一種基礎設施。就像電力和互聯網成為基礎設施一樣,AI將成為每個國家、每個行業必不可少的基礎設施。我們正處于這種基礎設施建設的初期階段。
展望未來,英偉達仍保持樂觀。黃仁勛強調,“這是強勁新一波增長的開始。Grace Blackwell已全面投產,我們已全力以赴。我們現在有多個重要的增長引擎。”
“AI時代已經到來,從AI基礎設施、大規模推理、自主AI、企業AI和工業AI,NVIDIA 已經做好準備。”黃仁勛稱。(本文首發于鈦媒體App,作者|林志佳)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.