出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
頭圖 | 視覺中國
7月16日,黃仁勛在北京出席了“鏈博會”,罕見地以一身唐裝示人,并首次嘗試使用中文演講。
“中國的開發者、創業者正在推動AI的快速創新,現在有100萬名開發者投身這一領域,像DeepSeek、阿里巴巴、MiniMax、百度,他們開發的產品都是世界級的,推動了全球人工智能的發展。”
自黃仁勛抵達北京以來,對于中國AI產業及廠商的贊美,貫穿于每一次公開露面中。
這并不難理解,就在兩天前,這位英偉達掌舵人表示,美國政府已批準此前被禁止出口的H20芯片,可以再度銷往中國。
鑒于國內AI廠商的“算力焦慮”,那些已經被英偉達在財報中列入“計減損失”的價值45億美元的庫存積壓,恐怕此刻正被緊急清點、打包,不日即可送到中國客戶手中。
不過,幾乎在黃仁勛高調示好中國市場的同一時間,美國商務部部長霍華德·盧特尼克卻站出來擺了一道。
“中國企業無法得到最好的芯片,也不是第二好(second best),甚至不是第三好(even third best)”,在接受美媒采訪時,盧特尼克直言不諱地表示,該策略是為了向中國企業出售足夠多的AI芯片,以形成對美國的技術依賴。
這番言論直白地闡述了一個立場:在當前對華半導體限制的基調下,無論政策是否松動,位于中國的下游產業鏈都無法取得符合預期的產品。
而此次到訪中國的黃仁勛,也并沒有用太多篇幅去渲染英偉達GPU的重要性,至少在中國市場,英偉達的敘事,正在發生些微妙的轉變。
英偉達,等不起
綜合多方信息來看,盧特尼克的表態很大程度上也是一種挽尊之舉。
一方面,中國通過稀土出口等反制手段開始取得效果;另一方面,自今年4月以來,美國半導體產業鏈對于特朗普政府反復進行游說及施壓。
其中,英偉達的反應尤為激烈,由于“特供版”H20芯片無法銷往他處,如果不解除禁售,將不得不面對真金白銀的損失。
在昨天下午的媒體溝通會上,黃仁勛也談到了關于H20的問題:“英偉達可能無法全部恢復先前的庫存計減損失,但大部分資產并未永久報廢,回收率可能達不到100%,但也不會是0。”
而相比于財報上的數字,真正讓黃仁勛擔心的應該是英偉達GPU芯片留出的真空期。
可以橫向對比下,過去三個月中國AI芯片行業發生了哪些變化。
以英偉達直接競爭對手華為為例,今年5月華為在鯤鵬昇騰開發者大會上正式推出“CloudMatrix385超節點”算力平臺,它基于384張昇騰芯片實現了業界最大規模的高速總線互聯。
誠然,昇騰芯片在硬件參數上要遜于英偉達芯片,但作為通信起家的公司,華為通過全互聯對等架構的研發,實現了對英偉達NVL 72在稠密BF16算力、網絡互聯總帶寬的反超。
媒體溝通會上,當被問到如何看待華為等競爭對手時,黃仁勛坦言,“我們已經做了30年,他們(華為)才做幾年,現在沒有哪家公司比英偉達付出更多精力來建造AI生態,而華為已經能和我們相提并論,這說明了一些問題。”
同樣在近期抓住機會的還有寒武紀。根據此前發布的一季度財報,這家公司的營收從去年同期的0.26億暴增至11.11億,并首次在單季度實現盈利。盡管這段時期與英偉達H20的對華禁售并不完全重疊,但考慮到下游廠商的備貨周期,已經足夠說明問題。
面對國產AI算力芯片的洶涌來襲,黃仁勛和他的英偉達,恐怕等不起。
更重要的是,正如虎嗅本月15日文章《黃仁勛釋懷了》所指出的,大模型向國產算力平臺遷移是個“單向”的過程,隨著這個過程的推進,無論從經營成本來看,還是從風險管控來看,在遷移部署完成后都不大可能再回歸英偉達生態當中。
因此,當下的黃仁勛才會迫不及待地表態,并高調宣布英偉達高算力芯片重新回歸國內市場。
押寶中國具身智能
如無意外,在H20芯片積壓的庫存消耗殆盡后,這款產品將不會再繼續生產,黃仁勛昨天也側面證實了這一點。
對于未來中國市場,英偉達預計將主推基于Blackwell架構打造的“B30芯片”,需要說明的是,這同樣是一枚中國特供版芯片,而且極有可能是一次“反向升級”。
根據Wccftech的爆料,圍繞B30構建的機架級解決方案相比于H20部分性能有所削弱,但預計能效會比后者高出30%,采購成本降低40%,而價格降低是建立在HBM芯片改用GDDR7的基礎上。
鑒于大模型預訓練階段已基本結束,除非B30芯片在推理場景中的能效比有著大幅提高,不然B30芯片對于國內廠商的需求可能并沒有那么高。
而此次黃仁勛在北京期間,也并沒有透露這枚芯片的進展。與之形成鮮明對比的是,圍繞“人形機器人”領域的表態卻異常密集,成為此次行程的另一大焦點。
在被問到如何看待中國人形機器人產業時,黃仁勛表示有三個關鍵點:
第一,全球都面臨嚴重的勞動力短期,制造業缺口甚至達到千萬級,提高自動化水平將顯著推動全球GDP增長。
第二,人形機器人與AI的技術結合正合時宜,兩個領域同步推進。
第三,中國已擁有非常優秀的AI技術,在機電一體化上做的非常出色,而且還有龐大的制造業基礎來部署這些機器人。
“因此,我對中國人形機器人的發展非常樂觀。”
不過,可能黃仁勛沒有提到的一個原因是,在中國市場推廣英偉達的人形機器人服務,其實是一項非常“因地制宜”的策略。
一方面,人形機器人供應鏈暫時沒有被明確列入到對華出口限制中;另一方面,英偉達在人形機器人領域有著龐大且完整的技術棧,即便在充滿不確定的地緣政治中,也完全可以做到“狡兔三窟”。
比如要部署在端側的計算機,英偉達有Jeston Thor;如果需要做仿真訓練,英偉達有Omniverse平臺;如果需要讓機器人通過模仿學習或通過試錯與強化學習的反饋來學習新技能,英偉達還有Isaac Lab。
哪怕連基礎模型都搞不定的話,沒關系,英偉達還有GROOT N1。
如果說在生成式AI時代,英偉達是行業背后的“賣鏟人”,那么到了具身智能時期,英偉達可能想的是將所有生產工具全部包辦。
在具身智能創業如火如荼的中國,英偉達未來的市場潛力不言自明。
值得一提的是,過去兩年的GTC大會上,黃仁勛曾展示了多款來自國內廠商的人形機器人,而在這次的“鏈博會”展臺上,英偉達則帶來了諸如“加速進化”、“智平方”等人形機器人新秀企業,主打一個“一碗水端平”。
CUDA,被動兼容?
在昨天的媒體溝通會上,黃仁勛還有一番表態讓人頗感意外。
當被問到英偉達是否會考慮開源CUDA時,黃仁勛表示,“如果一個平臺與CUDA兼容,我覺得是沒問題的。實際上,CUDA本身就比較開發,你可以查閱CUDA的詳細版本,然后基于此開發兼容版本。因此,從某種程度上來說,CUDA已經是開源的。”
“這和X86架構不同,如果你開發兼容X86的產品,他們可能會不滿,但如果你開發兼容CUDA的產品,我完全不會介意。”話畢,黃仁勛還不忘隔空cue下英特爾。
不過,過去英偉達在CUDA的兼容問題上是較為敏感的。
比如在去年3月,英偉達就在CUDA 11.6更新版本的最終用戶許可協議(EULA)中加入了一個條款:不得對使用 SDK 組件生成的軟件產品的任何部分進行逆向工程、反編譯或反匯編,以便轉換此類軟件產品、從而在非英偉達平臺上運行。
那么在實際產品開發中,是否有企業這么做呢?應該說,不止一家公司實踐過。
比如AMD ROCm的就是在API接口協議和編譯器層面與CUDA保持一致的基礎上,開發具有自主知識產權的工具庫、技術棧。
還有一些國內廠商則更加直接,通過調用CUDA函數來讓未經修改的二級制文件運行在第三方卡上,這的確切實傷害了英偉達的利益。
但從黃仁勛昨日的公開表態中,不難察覺英偉達在 “被動兼容 CUDA” 這一關鍵問題上的心態已悄然發生轉變。
這種轉變背后存在雙重現實考量:一方面,正如前文所提及的,英偉達當前最憂心的是,在美國政府政策持續搖擺的背景下,其在潛力巨大的中國市場可能被迫讓渡出“市場真空”,進而給競品創造可乘之機。
另一方面,正如黃仁勛強調的,英偉達是全球少數幾家能夠實現從算法架構、系統軟件、硬件系統、網絡技術直至芯片設計的全棧創新的企業,即便硬件銷售上有所損失,只要能牢牢掌控 CUDA 生態的核心影響力,依然可以通過軟件授權、技術服務等路徑實現商業價值回流。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4586475.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.