文源:源Byte
作者:柯基的柯
穿著皮衣頂著北京的大太陽,英偉達CEO黃仁勛可不想自己今年第三次的中國之行,就僅僅收獲一張跟小米創始人雷軍的合影。
次日,也就是7月15日,黃仁勛宣布H20芯片恢復對華銷售,聲稱將緩解中國市場的算力瓶頸,算是幫DeepSeek創始人梁文鋒解了圍。
據知情人士爆料,DeepSeek的R2模型因H20芯片禁售而延遲發布,官網流量暴跌70%,用戶流失至第三方平臺,梁文鋒急需R2模型來穩住局面。
作為壟斷全球算力的硬核狠人,黃仁勛出手“搭救”梁文鋒可能更多是從商業層面考慮,畢竟放眼全球,只有眼前這位廣東靚仔依靠“閹割版”的基建,就能對OpenAI、谷歌等一系列國際巨頭持續施壓。
01
相愛相殺
黃仁勛與梁文鋒的關系,可以用“亦敵亦友”來概括。
黃仁勛掌舵的英偉達,是全球AI算力基礎設施的“軍火商”,是支撐頂級大模型發展的核心引擎。而梁文鋒創立的DeepSeek,則以“低成本、高性價比”為標簽,通過算法創新將大模型訓練成本壓縮至行業平均水平的1/20。
在DeepSeek年初爆火出圈的那段時間,它不止顛覆了技術路徑,更動搖了“算力霸權=商業成功”的舊秩序,一度讓英偉達的市值蒸發千億美元。
但如果追根溯源的話,兩人的關系起點應該是合作,2021年,梁文鋒著手提前卡位,意圖購買1萬張A100顯卡,為DeepSeek后續研發奠定基礎。彼時的美國還尚未將該型號列入禁售清單。
在后來的臺北國際電腦展大會上,黃仁勛還公開稱贊DeepSeek,他認為,DeepSeek-R1對人們理解AI和推理有巨大的影響,對行業和世界作出了巨大貢獻。
對于老辣的黃仁勛來說,DeepSeek的崛起讓他看到了新的市場機遇。2025年春節后的第一周,搭載8塊H20的服務器價格從年前的100萬元飆升至110萬元,甚至有客戶愿意加價5萬元鎖定現貨,隨后,這款顯卡一路飆升,截止黃仁勛本年度第三次來華之前,市場價格已經來到了180萬元。
英偉達芯片概念圖 | 源Byte制
這款專為中國市場設計的芯片,雖在浮點運算能力上僅有旗艦產品H100的1/10,但其96GB顯存和900GB/s的NVLink帶寬,恰好擊中了推理場景的命門。
當DeepSeek以560萬美元的訓練成本叫板行業巨頭時,其開源策略點燃了企業部署AI的熱情,但也帶來了副作用:推理服務的穩定性成為致命短板,而H20的“錯位競爭”策略恰好填補了這一需求空白,其4.0TB/s的顯存帶寬足以支撐數十個推理任務并行,而價格僅為H100的1/3。
也就是說,DeepSeek的崛起反而讓H20完美地適配了中國大模型市場,黃仁勛這一次的中國行雖沒有帶來頂級“尖兒”貨,但帶來了最具性價比的選擇。
還是黃仁勛的算盤打得精,在DeepSeek徹底將中國大模型市場定位在彎道超車的性價比路線后,英偉達極有可能將類似H100這類頂級顯卡賣給海外頂級大模型公司,待其升級迭代數月后,再將“閹割版”、“特供版”大批量地出售給中國大模型公司,讓其繼續對海外公司保持競爭力。
畢竟,有競爭才有壓力,有壓力才會讓這些大模型公司不斷提升對算力的需求。
02
梁文鋒又要殺回來了
在R2接連跳票的這段日子里,梁文鋒的日子并不好過。
一度在大模型內卷中“掉隊”的百度率先發難,百度創始人李彥宏早在4月就公開吐槽DeepSeek“慢且貴”,稱其API調用價格遠高于市場平均水平。
在外界都以為,梁文鋒掏出R2模型將文心一言按在地上摩擦之時,僅僅在5月底推出了DeepSeekR1的改款,但是后續市場反響平平,并未幫助DeepSeek止住頹勢。
截圖來源于DeepSeek官網
根據國際半導體研究機構Semianalysis最新報告,DeepSeek的全球用戶使用率已從2025年1月的50%驟降至7月的3%,官網訪問量在2月至5月期間下滑63%。另一家AI模型集成平臺Poe的統計顯示,其核心模型R1的使用率在2月至4月間腰斬,從7%跌至3%,而同期ChatGPT和谷歌Gemini的使用率分別增長40.6%和85.8%。
眼見R2模型一拖再拖,一度讓DeepSeek徹底擠下牌桌的“X小龍”們又活躍起來,6月中旬更新的MiniMax-M1模型,號稱世界上第一個開源的大規模混合架構推理模型,其號稱整個強化學習階段只用到512塊H800三周的時間,租賃成本只有53.47萬美金。
來到7月,月之暗面上線的KimiK2模型,同樣選擇了開源,并成為國內開源領域首個總參數量達到1萬億的MoE架構基礎模型。
截圖來源于KimiK2官網
一個有趣的現象似乎可以印證“X小龍”們在R2缺位這段時間內的心情起伏,在BOSS直聘等招聘渠道上,5月份的主流崗位還是各類應用的產品經理,進入到6月就紛紛將其撤下,換成各類工程師與研究員。
畢竟,在為效率買單的AI付費體系尚未成熟的階段,各類應用前途不明,倒不如在R2缺位的階段,在大模型領域再搏一把。即便是Mauns這種一度火出半邊天的爆款,并未在國內市場淘出幾個金塊,在近期甚至傳出“跑路”去新加坡的消息。
甚至,部分國內大廠似乎看到了對DeepSeek取而代之的希望,趕工加點地推出產品,一度讓行業從從“卷技術”轉向“卷參數”,技術標準逐漸模糊化,甚至鬧出了一連串的套殼抄襲事件。
就在7月初,華為盤古大模型被曝與阿里通義千問的代碼相似度高達92.7%,華為的回應堪稱教科書級別的公關話術——“嚴格遵循開源許可”,但開源社區的開發者們并不買賬。這場風波并非孤例。月之暗面與阿里通義的糾紛也被舊事重提,盡管細節模糊,卻足以讓行業陷入信任危機。
“即便R2無法完全超越這些頂級大模型,但至少會給整個行業的發展路徑定調,就是給大家一個如何接近和趕超頂級大模型的路徑,省得只能在這里無效卷參數。”有開發者對源Byte坦言。
“雖然是一邊唱衰DeepSeek,但行業還是離不開(DeepSeek),畢竟只有幻方知道如何趕超頂級大模型。”上述開發者表示,相比其他國產大模型,DeepSeek至少不會盲目卷參數,且清楚地知道這條追趕之路是什么狀況。
就當友商們似乎見到光明之時,黃仁勛直接掐滅了火種,他為梁文鋒帶來了期盼已久的H20。據知情人士透露,DeepSeek團隊近幾個月一直在密集推進R2模型開發,但梁文鋒目前對模型的能力仍不滿意,內部仍在繼續提升性能,相應模型尚未準備好正式投用。
黃仁勛帶來的H20,雖然在性能僅為H100的15%-20%,談不上雪中送炭,倒也間接地幫助國產大模型結束抄襲、套殼、參數注水的亂象。
03
芯片解禁,誰的救命稻草?
雖然梁文鋒的R2模型在某種程度上,未來極有可能成為黃仁勛向OpenAI等公司逼單的籌碼,但天下終究苦英偉達久矣,這位鐘愛皮衣的男人同樣需要盟友。
翻開“反英偉達聯盟”的名單,既有OpenAI、Meta、微軟、谷歌、亞馬遜等深度依賴英偉達芯片的科技巨頭,也包括英特爾、AMD、高通等英偉達的直接競爭對手。
來到今年6月,在AdvancingAI 2025大會現場,OpenAI的CEO薩姆·奧特曼明確表示,OpenAI未來將使用AMD的AI芯片。正在構建“芯片-模型-生態”三位一體的全新生態。
這種頂級AI模型廠商與芯片廠商深度合作的模式,可能會引發其他AI領軍企業效仿,加速它們在芯片領域的布局。
AMD作為英偉達的老對手,在蘇姿豐的帶領下,憑借在CPU和GPU方面的建樹,提供在性能上能與市場領導者匹敵甚至在某些單點上有所超越、但在成本上更具優勢的產品,以此吸引那些對價格敏感或者尋求替代供應商的客戶。
因此,H20這種性能被打了折扣的產品,恰好與AMD的芯片來到了同一賽道。據財報數據,2025年第一季度,英偉達營收達440億美元,在獨立顯卡市場占據超90%的份額;AMD同期營收74.4億美元,同比增長35.9%(年增36%),超出市場預期的71億美元,增長勢頭強勁。
英偉達已被OpenAI、谷歌、Meta等頭部機構的大模型訓練(如GPT-4、PaLM)驗證,形成“成功案例→行業信任→更多采用”的正向循環;而AMD在超大規模大模型(千億參數以上)的公開成功案例較少,企業在選擇時需承擔“試錯成本”。
就在黃仁勛宣布H20的第二天,AMD當即表示,在美國宣布將批準銷售后,公司計劃重啟向中國出口其MI308芯片。AMD的MI308芯片是專為中國市場設計的AI加速器,基于其MI300系列架構,性能足以滿足垂類模型訓練和推理需求。
因此,OpenAI與AMD的合作,在某種程度上為AMD的產品和服務打樣,倘若繼續“禁售”下去,勢必助長AMD在爭取DeepSeek等一眾國產大模型的優勢。
對于黃仁勛來說,這塊最適配H20的市場,又是增速最為迅猛的市場,錯過這一波行情,不知下一次是何年。
根據IDC發布的《中國模型即服務(MaaS)及AI大模型解決方案市場追蹤,2024H2》報告顯示,2024年中國MaaS市場呈現爆發式增長,全年規模達7.1億元人民幣,較2023年實現215.7%的同比激增,其中2024下半年市場規模達4.6億元人民幣。展望2024-2029年,該市場將以66.1%的年均復合增長率高速擴容,預計2029年市場規模將達到90億元人民幣。
黃仁勛必須要在友商即將要起勢的關鍵階段,果斷出手來打亂節奏,積極游說美國政府調整政策。
肉眼可見,英偉達將在中國市場狂賺一筆了。
部分圖片來源于網絡,如有侵權請告知刪除
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.