出品|搜狐科技
作者|梁昌均
編輯|楊錦
一年一度的英偉達GTC大會最受關注的黃仁勛主題演講環節,3月19日凌晨落下帷幕。在推遲了10分鐘后,黃仁勛以標志性的黑色皮衣登上舞臺。
今年的GTC大會可能是黃仁勛近年來壓力最大的一次。此前數年,深度學習和大模型浪潮的接踵而至,讓英偉達成為這一波AI革命最大的贏家。
然而,AI技術發展范式的轉變,尤其以DeepSeek為代表的技術創新,一度讓市場對英偉達的算力信仰產生了懷疑。這次大會,無疑是黃仁勛向外界證明英偉達依然很能打的絕佳機會。
在兩個多小時的演講中,黃仁勛講述了AI發展趨勢及對算力帶來的挑戰與機會,再現經典名言:the more you buy,the more you save(買的越多、省的越多)。
更重要的是,他公布了英偉達的GPU芯片技術路線圖,包括即將登場的Blackwell Ultra,以及后續兩代的Rubin和Feynman。他還公布了多項企業級AI和物理AI等方面的進展。
“作為研究者,我們很開心見證歷史,參與基礎貢獻。但作為初創企業,要時刻警惕,超前兩年思考,什么是大廠做不好或做不了的方向,避免在大廠延長線上創新?!彼押萍继丶s作者、Meta人工智能科學家許家駿在現場聽完演講后表示。
從資本市場反應來看,投資者似乎對英偉達的最新發布不太“感冒”。最近交易日,英偉達開盤走低,一度跌超4%,隨著黃仁勛演講開始有所走高,但收盤仍跌超3%。
代理AI和推理將推動算力增長
數據中心支出將達到1萬億美元
在演講開始,黃仁勛對比了基于Blackwell架構的GeForce 5090芯片和RTX4090的進步?!八w積縮小了30%,能效散熱提升30%,性能更是飛躍式提升,幾乎無法相提并論。”
這一切的驅動力在于人工智能。黃仁勛表示,過去十年間,AI的進步堪稱驚人,最初是感知式AI(如計算機視覺和語音識別),隨后是生成式AI、代理AI和物理AI。
“這徹底改變了計算模式,從傳統的檢索式計算轉向生成式計算,計算領域的每一層都在過去幾年經歷了根本性變革。”黃仁勛表示。
黃仁勛認為,未來AI的發展需要解決三個基本問題。一是如何解決數據問題,因為AI是數據驅動。二是如何訓練模型,讓AI能夠以超越人類的速度去學習擴展。三是如何實現算法等資源投入與智能提升的正向循環。
“去年,幾乎整個世界都對此做出了錯誤的判斷。AI計算的擴展更具彈性,實際上,由于代理AI和推理的原因,我們對計算的需求比去年這個時候我們以為需要的多100倍?!?/p>
黃仁勛解釋稱,代理AI的基礎是推理,而推理使用的是思維鏈技術,因此產生的Token數量會顯著增加。為了保持模型的響應性和交互性,計算需要更快。
此外,在訓練過程中,數據有限,人類的參與也有限,但現在有了強化學習,有能力生成大量的Token,從而使用合成數據,這基本上是一種機器人式的方法。
“AI這兩種方法的結合給整個行業帶來了巨大的計算挑戰?!?/strong>黃仁勛表示,每次訪問ChatGPT時需要等待越來越長的時間,這是一件好事,說明很多人在有效地使用它,而且訓練和推理這些模型所需的計算量已經大幅增加。
換句話說,英偉達的芯片還有需求。一個有力的例證是,2024年全球前四云服務提供商共采購130萬片Hopper架構芯片,而2025年它們又購買了360萬Blackwell芯片。
黃仁勛提到,Blackwell剛開始出貨,基礎設施在驚人增長。“我預計到2028年數據中心的建設支出將達到1萬億美元,我相當確定會達到?!?/p>
這得益于兩個判斷。一是計算方式的轉變,通用計算已經走到了盡頭,世界正從由運行在通用計算機上的手工編寫軟件到運行在加速器和GPU上的機器學習軟件的平臺轉變。二是行業都意識到軟件的未來需要資本投資。
黃仁勛提到,這需要構建新的基礎設施?!拔曳Q它們為AI工廠。世界正在經歷的轉變,不僅僅是將要建造的數據中心數量,還有它們的建造方式,數據中心的一切都將被加速?!?/p>
英偉達的CUDA生態則是這一切的基石?!拔覀兗铀倭薃I框架,我們稱它們為CUDA-X庫?!秉S仁勛還宣布開源更多庫(如稀疏求解器cuDSS),并介紹了面向光刻、量子、物理仿真等領域的庫。
目前,全球600萬開發者通過CUDA加速了900多個庫,覆蓋科學計算、醫療、通信、量子計算等領域?!叭绻麤]有CUDA,以及龐大的安裝基礎,這些庫對于開發者來說將毫無用處?,F在,我們已經達到了加速計算的臨界點,CUDA使之成為可能?!秉S仁勛說。
他還認為,AI正從云端走向邊緣端,這將推動AI更廣泛的應用。他宣布,英偉達與德國電信運營商T-Mobile、思科合作5G邊緣AI棧,將AI注入通信網絡,通過自適應信號優化和強化學習提升頻譜效率,這可以徹底改變通信。
在自動駕駛領域,黃仁勛宣布,通用汽車(GM)選擇英偉達為其打造全棧自動駕駛系統,涵蓋訓練、仿真和車載計算,同時幫助通用改變制造方式,“自動駕駛的時代已經到來”。
芯片路線圖曝光
新架構Rubin和Feynman將在三年內發布
談完AI,時間已過去大半,黃仁勛終于聊起市場最為關心的芯片進展。去年發布的Blackwell已經全面投產,黃仁勛稱這實現了計算機架構的根本轉變。
他花了不少篇幅介紹計算規模擴展的所要解決的挑戰,比如如何將多個PGU進行連接從而擴展規模,以及如何解決寬帶和通信問題,電力能源消耗和散熱問題。
去年GTC大會推出的基于Blackwell架構的GB200系統,通過NVLink 72互聯技術,實現單機架1 Exaflop(百億億次)算力,內存帶寬達570 TB/s,較前代Hopper提升25倍能效。
這款超級計算機使用5000根電纜,長度累計接近2英里?!拔覀兊哪繕耸沁M行規模擴展。通過NVLink,我們已經完成了這種極端規模的擴展,前所未有。”黃仁勛說。
這種對規模的追求是由于巨大的需求。黃仁勛認為,AI推理系統中,存在兩個關鍵指標(如下圖所示):X軸代表吞吐量,是整個工廠每秒生成的Token總量;Y軸代表響應速度,是每個用戶體驗的Token生成速度。
黃仁勛認為,AI的智能程度與生成的Token數量直接相關,更多的Token意味著更深入的推理能力,但用戶無法忍受過長的等待時間,這要求AI工廠在吞吐量與響應速度間找到最優平衡。“生成的Token越多,AI就越聰明。但回答問題的時間過長,用戶就不會再回來?!?/strong>
如何解決這兩個挑戰?“完美的答案在右上角。理想情況下,這條曲線應該是正方形,即每人每秒的Token生成速度盡可能快,直到達到工廠的極限。但沒有工廠能做到這一點,因此這是一條曲線,目標是最大化曲線下的面積,即X和Y的乘積。”
黃仁勛表示,這兩個維度分別意味著需要大量的計算能力(flops),以及大量的帶寬和內存,并且要盡可能高,以及有最好的架構和盡可能高的能效,還必須擁有一個能夠運行所有這些軟件的編程模型。
黃仁勛宣布推出開源的英偉達Dynamo軟件系統,號稱是“AI工廠的操作系統”,可以解決計算系統當中并行處理、預批處理、負載管理、KV緩存等方面的問題?!癉ynamo可以在模型進行規?;渴穑瑥亩鵀锳I工廠實現降本增效?!?/p>
許家駿也認為,推理的重要程度毋庸置疑,Dynamo像OpenAI的Agent 一樣,吃下了MLSys 開源科研很多成果,包括KV緩存以及各種并行、張量、數據等技術。
“能源工業革命是水進來,變成蒸汽,最后產生出了電,Dynamo將是新的AI革命一切的起點。”黃仁勛說。目前,英偉達已和Meta、微軟、Perplexity等公司達成合作。
黃仁勛還展示了Dynamo能帶來的對計算系統的提升,Blackwell相較Hopper能提升25倍,而在推理模型中的性能提升則高達40倍。他還打趣到,銷售人員不要擔心Hopper不好賣,并再次放話稱“你買得越多,省得越多”。
“全世界的計算機公司都在大規模地加速購買這些了不起的機器,我非常高興和感激,所有人都在向這個新架構轉型?!?strong>黃仁勛宣布,今年下半年,英偉達將過渡到Blackwell Ultra NVL72,算力和內存再提升1.5倍,支持更大規模注意力機制。
他還展示了未來三年的技術路線圖。下一代芯片命名為Vera Rubin,其主要是向暗物質研究先驅天文學家Vera Rubin致敬。2026年下半年,這款芯片將接替Blackwell Ultra,同時2027年下半年將推出Rubin Ultra版本,實現從NVLink 144互聯到高達576的極端擴展。
Vera Rubin和Grace Blackwell類似,集成了CPU和GPU,其中Vera是CPU,Rubin是GPU。黃仁勛宣稱,Rubin系統的性能可達Hopper的900倍,而Blackwell是Hopper的68倍。
Rubin之后的下一代芯片命名為Feynman,取自著名物理學家理查德?費曼(Richard Feynman)。根據英偉達路線圖,Feynman架構芯片將于2028年登場,并會采用新一代互聯技術。
當AI工廠不斷拓展,傳統網絡架構將面臨嚴峻挑戰。黃仁勛還宣布,新的以太網芯片將在2025年下半年推出,2026年下半年推出集成硅子光學芯片,推出Photonics交換機系統和Spectrum-X網絡架構,并在GPU存儲加速方面和戴爾、惠普、IBM等達成合作。
未來將面臨1500萬工人的短缺
機器人有了牛頓物理引擎
最后,黃仁勛照例公布了企業級AI和物理AI方面的進展。
英偉達推出一系列開放推理人工智能模型,供開發者和企業構建代理式AI平臺,Blackwell RTX專業版登陸工作站與服務器,賦能設計師、開發者、數據科學家及創意工作者構建并協同智能代理式AI。
黃仁勛還發布了DGX Spark和DGX Station兩款個人AI計算機,其由Grace Blackwell支持,支持本地化運行萬億參數模型,面向科研與工業設計,將與惠普、聯想、戴爾合作,并在今年量產。
“下一波浪潮也已經到來,機器人技術,它由物理AI驅動,用AI去理解物理世界?!?strong>黃仁勛說,機器人時代已經到來,能夠與物理世界互動,這是機器人的優勢。
他表示,世界正面臨嚴重的人力短缺,到2023年世界將至少面臨1500萬工人的短缺,可能每年要付機器人5萬美元讓它們來上班,這將是一個非常大的產業,英偉達現在則在研發通用的機器人。
不過,這一次并沒有聲勢浩大的機器人團隊前來給黃仁勛“站臺”。黃仁勛宣布,英偉達、谷歌、Disney Research將合作開發Newton Physics Engine(牛頓物理引擎),預計將于2025年稍晚完成開發。
他認為,這一物理引擎可以訓練觸覺反饋、精細動作技能和執行器控制,且是GPU加速驅動,以便可以以超線性、超實時的方式訓練人工智能模型。這在Omniverse和Cosmos可以更好解決物理AI模型訓練的問題。
采取這一引擎的機器人還走上舞臺與黃仁勛互動,不過它現在還不會說話,但能聽懂黃仁勛的指令。當黃仁勛對它說往旁邊站站的時候,它乖乖執行了指令,搖頭晃腦看起來很呆萌。
英偉達還宣布推出Isaac GR00T N1,這是一個通用型人形機器人的基礎模型,建立在合成數據生成、學習和模擬的基礎上,具有雙系統架構,可以快速和慢速思考,該模型將會開源。
運營編輯 |曹倩審核|孟莎莎
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.