英偉達創始人兼CEO黃仁勛近日的訪華之旅,因為種種新變化又增加了不少關注度。這些變化背后既有中美AI博弈的新進展,又有英偉達自身所到達的新高度。
在他出席鏈博會開幕式的前一天,今年4月被禁的H20宣布解禁;而就在前一周,英偉達成為全球首個市值突破4萬億美元的公司。這些大開大合的變化背后,其實有一個關聯因素——就是AI史無前例的重要性和開拓性,它重要到成為大國博弈的核心籌碼,成為眾多新老產業背后的支柱力量。
<與非網>及國內一些媒體受邀參加了昨日的媒體見面會。這位新晉全球市值第一的CEO被問到感受時表示深感榮幸,他強調,英偉達之所以經歷了從零到巔峰的歷程,核心成就就是“重塑計算”和“開創了AI產業”。在這一過程中,英偉達已經成為全球絕大部分地區AI計算基礎設施的提供者,“我們正處在一個非常、非常激動人心的AI時代的開端”,他指出,“AI將成為一個國際性的全球科學領域,來自世界各地的科學審查將極大地幫助我們以安全的方式推進這項技術。”
算力焦慮真相:越智能,越渴求
在這個AI通過推理和思考來學習的時代,算力成為緊缺資源。我們都知道AI三要素是“算力”、“算法”和“數據”。那么在這個三角中,算力是被高估了,還是仍然不足?
黃仁勛說,英偉達內部有很多AI超級計算機供工程師們使用,但他們每天仍然飽受算力焦慮之苦,他們每天都渴望能擁有多10倍的算力。這恰恰說明,這個新的計算時代不再是關于手工編碼,而是關于AI機器學習。如果AI機器承擔了大量的學習任務,那么你就會希望擁有更快、更大的機器,因為這樣就能更快地解決更大的問題。
“我認為在未來十年里,我們都會經歷算力焦慮。是的,這不會消失,任何在工程領域的人都會有“,他補充。
黃仁勛提出這一論斷背后的核心是“后訓練(post training)“,他指出,這一階段需要海量的計算機和非常少的數據。
為何“少量數據+大量算力”可行?黃仁勛今年首次公開回應DeepSeek R1模型對算力的沖擊時,對"后訓練"概念進行了闡述。在他看來,預訓練是基礎,后訓練才是智能的核心,真正的智能是在后訓練階段形成的。市場對DeepSeek R1的反應存在誤解,認為AI已經發展到了頂峰不再需要大量算力,但實際上,后訓練階段仍然需要大量的計算資源。
他解釋說,預訓練賦予模型基礎知識,而后訓練教會模型如何解決問題,涉及復雜推理、策略調整和實際應用能力,這才是真正體現智能的環節。而推理越多,思考越多,AI表現就越好,這離不開強大的計算能力支持。
黃仁勛提出的“后訓練”概念,核心指向大模型落地階段的稀疏化微調與推理優化,其本質是通過算法架構創新+大量算力替代數據規模。這一策略當然反映了一定的技術趨勢,但也不排除包括英偉達的商業意圖,還需要進行辯證分析。
在今年的GTC大會上,英偉達所發布的人形機器人基礎模型 Isaac GR00T N1,就從一定程度上證明了后訓練理念的可行性。
當時黃仁勛展示了1X技術公司的NEO Gamma人形機器人,正是使用了基于GR00T N1模型構建的后訓練策略。
該人形機器人基礎模型 Isaac GR00T N1,包括了預訓練+后訓練的雙階段架構。其中系統1被描述為一種快速思維行動模型,其行為類似于人類的反射和直覺,相當于進行預訓練,能夠基于人類演示與合成數據訓練,實現快速反射動作(如抓取、避障);系統2則相當于后訓練,由視覺語言模型驅動,是一種慢思維模型,它對環境和接收到的指令進行推理以規劃行動。這些計劃被傳遞給系統1,將其轉化為精確、連續的機器人動作,包括抓取、用單臂或雙臂移動物體,以及涉及基本技能組合的更復雜的多步驟任務。
在AI發展的落地的過程中,我們一直都認為海量的數據必不可少。不過隨著MoE的突破,這一趨勢有所改變。1X公司的NEO Gamma機器人僅用少量后訓練數據即可學會自主整理任務,驗證了“小數據+大算力”的可行性。
工業數字孿生首款GPU,為何面向中國推出?
黃仁勛還專門針對中國市場推出了一款全新且完全兼容的RTX PRO GPU,宣稱該產品“是為智能工廠和物流打造數字孿生 AI 的理想選擇”。可以看出,英偉達避開了敏感的高算力訓練場景,同時切入中國工業數字化轉型的藍海市場,可謂定位精準。
他指出,數字孿生需要強大的實時渲染和AI計算能力,而RTX PRO的技術特點正好契合這些需求。首先,RTX PRO 是為了運行NVIDIA Omniverse而設計的,是世界上首款此類產品,這對于智能工廠、機器人等應用非常重要。
該GPU基于Blackwell架構,同時擁有圖形處理和光線追蹤功能。而光線追蹤技術對于傳感器模擬非常重要,通過這一技術可以模擬數字工廠、自動駕駛汽車或者機器人的傳感器。
“數字機器人之所以必要,是因為要教會一個物理機器人如何變得優秀,并能很好地執行任務,而這需要先在數字世界里進行訓練”,黃仁勛強調,“RTX PRO是世界上首款此類產品,而中國擁有龐大的制造業基礎,如此多的實體創新正在進行,如此多的智能工廠工作在這里完成。”
其次,他談到,未來的AI工廠將更具敏捷性、更可配置、吞吐量更高——這是供應鏈工廠應該具備的特點。隨著機器人技術和AI能力的提升,單位生產成本降低而生產力提升,產品的成本很可能會下降。
在這個商業邏輯的推演下,黃仁勛對RTX PRO的應用前景充滿信心。“如果我們有更多的自動化,全世界都會更加繁榮”,他表示。
針對中國的人形機器人發展,黃仁勛談到,人形機器人和AI的時機正在交匯,這令人非常興奮。而中國發展人形機器人具備三個獨特的條件:第一,擁有出色的AI技術;第二,擅長機械、電氣工程;第三,擁有龐大的制造業基礎。他毫不懷疑中國的老牌公司和初創公司在這方面的發展,小米、比亞迪都有望造出令人驚艷的機器人。
H20解禁,幾家歡樂幾家愁?
根據公開信息,H20配備96GB HBM3顯存,顯存帶寬可達4TB/s,部分升級型號還提升至141GB顯存、900GB/s的卡間互聯帶寬。其FP8和FP16算力分別為296 TFLOPS與148 TFLOPS,在AI訓練、推理中仍具一定競爭力,尤其適合大模型推理階段對帶寬、內存容量要求較高的場景。
H20恢復對華銷售的消息公布兩天,就在中國市場掀起了復雜的漣漪效應。從最新行業動向看,這一事件可能正在深刻改寫中國AI算力市場的競爭格局。
首先從英偉達的角度來看,對于H20回歸后的市場預期有多大的確定性?
黃仁勛指出,H20的核心優勢就是內存、帶寬,非常適合DeepSeek、阿里千問等大模型,他確信H20會非常成功,且一定會非常有用。
不過,H20未來的訂單還存在幾個不確定因素:首先是客戶的新訂單時間點,畢竟之前的訂單被取消了,他們的需求可能已經發生了變化;其次,重啟供應鏈需要時間,英偉達目前的供應鏈周期長達9個月,雖然他們正在全力加速Hopper架構產品的產能恢復,但這確實需要持續努力。短期內,可能既無法預測訂單量,也難以準確評估供應能力。但英偉達會竭盡全力滿足客戶需求,畢竟當前行業普遍存在的"算力焦慮"確實亟待緩解。
未來,他希望將更先進的芯片帶入中國市場,因為技術總是在進步。H20雖然具備良好的推理能力和帶寬表現,但隨著更多、更好的新技術問世,只要在中國能被允許銷售,相關產品也會持續不斷地進步。
針對中國市場的特供芯片是英偉達在政治夾縫中的商業防守,但性能降規和供應鏈的反復波動,正在深刻地影響著我國的算力格局。
對于數據中心來說,算力得到緩解、AI需求得到釋放,無疑是利好消息。不過近些年,國內新建的算力集群很多都開始采用異構系統架構,同步搭載了英偉達GPU和國產芯片。除了芯片上的突破,軟件生態也在快速發展,AI Infra對于搭載不同芯片的混合算力也起到了關鍵作用。
對于H20的回歸,大模型廠商短期可以緩解一定的算力焦慮,畢竟從訓練+推理的算力缺口、集群的擴展性提升方面,H20都能帶給市場積極影響,特別是在千卡規模集群中,其效率顯著優于國產方案;另外在垂類模型領域,比如金融風控、醫療影像等場景,都需要大顯存的支持,H20的“弱算力+高帶寬”配置仍具有獨到優勢。
不過,更深層的挑戰是“雙刃”的——如果在禁令頒布后,一些廠商已經完成了向國產平臺的遷移,他們是否愿意隨著H20的解禁再次“回遷”?這其中的成本和代價有多大?H20卷土重來,究竟是給中國AI發展爭取了更多的時間窗口,還是在一定程度上擠壓了國產芯片的空間?這些還需要繼續觀察。
黃仁勛此行帶來兩個大消息:H20解禁和面向中國工業領域的RTX PRO GPU。
一方面,通過合規芯片“收復失地”;另一方面,面向更大的藍海市場推出全新產品規劃,針對具體的落地場景帶來新的算力支撐。而這套組合拳,很可能成為英偉達中國戰略的關鍵轉折。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.