99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛年度演講來了,Scaling Law失效只是假象,推理需求暴漲100倍,AI模型優(yōu)化迎來新挑戰(zhàn)|GTC 2025

0
分享至


作者 | 王啟隆

出品 | CSDN(ID:CSDNnews)

北京時間 3 月 19 日凌晨,NVIDIA GTC 2025 的主會開場演講來了!

在黃仁勛的這場演講前,英偉達(dá)股票還是119.53 美元。刷推的時候又發(fā)現(xiàn),馬斯克的 Grok AI 都在和網(wǎng)友們吐槽英偉達(dá)今年開年不濟,相當(dāng)艱難,需要一場演講拯救股市,振奮投資者。還有些直播,直接開了個股市頁面實時盯著 NVDA 漲漲停停,畫面相當(dāng)喜感。


兩小時的演講結(jié)束后,股價居然還跌了將近 3%……


今年的演講主題是「AI 工廠」。英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛身穿標(biāo)志性的皮衣,瀟灑上臺。


順帶一提,看外媒的現(xiàn)場返圖,英偉達(dá)這次在 GTC 大會會館前擺了個攤賣煎餅,黃仁勛親自上陣邊吃邊賣,里面穿著圍裙,外邊兒穿著皮衣,真的是堅持皮衣到底。


下面先簡單總結(jié)演講的內(nèi)容有哪些(正好黃仁勛自己在最后強調(diào)了一遍本次主會的五大亮點),后文我們再來個“事無巨細(xì)”的全面回顧,帶大家云體驗一遍全程。

Blackwell 全面投入生產(chǎn)

第一代 Blackwell 芯片還沒熱乎,英偉達(dá)就推出了下一代 Blackwell Ultra,旨在提升訓(xùn)練和擴展推理能力。主會上展示了兩個版本:

  • GB300 NVL72:機架級解決方案,集成 72 顆 Blackwell Ultra GPU 和 36 顆 Grace CPU,可視為單一巨型 AI GPU,提升復(fù)雜任務(wù)分解與 AI 推理能力。

  • HGX B300 NVL16:高性能服務(wù)器單元,相比前代 Hopper GPU,大語言模型推理速度提升 11 倍,算力增加 7 倍,內(nèi)存容量擴大 4 倍。

目前的落地計劃是:

  • 云服務(wù)廠商:AWS、谷歌云、微軟 Azure、甲骨文云等將率先提供 Blackwell Ultra 實例。

  • 服務(wù)器廠商:戴爾、惠普、聯(lián)想、Supermicro 等計劃 2025 年底推出基于 Blackwell Ultra 的 AI 基礎(chǔ)設(shè)施。

Blackwell Ultra 專為 AI 推理設(shè)計,支持預(yù)訓(xùn)練、后訓(xùn)練及推理全流程,黃仁勛稱其為“AI 推理領(lǐng)域最大飛躍”。


一路規(guī)劃到 2028 年:Rubin、Rubin Ultra、Feynman

英偉達(dá)將延續(xù)“一年一旗艦”策略以及“用杰出科學(xué)家命名”的傳統(tǒng),2026 年推出以“證實暗物質(zhì)存在”的女性科學(xué)先驅(qū)薇拉?魯賓(Vera Rubin)命名的「Rubin架構(gòu),2027 年更新 Ultra 版本。2028 年推出以知名科學(xué)家、美國國家科學(xué)院院士,諾貝爾物理學(xué)獎獲得者理查德·費曼命名的「Feynman」架構(gòu)。

2026 年下半年將推出 Vera Rubin NVL144;


2027 年下半年再推出 Rubin Ultra NVL576;


老黃表示,Rubin 的性能可以達(dá)到 Hopper 的 900 倍,而 Blackwell 又是 Hopper 的 68 倍。


至于費曼,還在新建文件夾階段。

個人 AI 超級計算機

英偉達(dá)推出DGX Spark,將搭載 GB10 Superchip(精簡版 Blackwell),算力達(dá)每秒千萬億次,適合模型微調(diào)與推理。起售價約 3000 美元。

而這其實就是今年 CES 2025 亮相的那個“迷你超算” Project DIGITS,其設(shè)計理念是一個能夠運行高端 AI 模型的單元,占用的空間與標(biāo)準(zhǔn)臺式機相當(dāng)。


另一個產(chǎn)品DGX Station則是上面這個迷你計算機的加強版,黃仁勛稱之為“桌面級數(shù)據(jù)中心”。它搭配 B300 Grace Blackwell Ultra 芯片,784GB 統(tǒng)一內(nèi)存,支持大規(guī)模訓(xùn)練與推理,預(yù)計年內(nèi)由華碩、戴爾等廠商推出。


備戰(zhàn)量子計算

今年英偉達(dá)很看重量子計算這個風(fēng)口,今年在波士頓設(shè)立加速量子研究中心(NVAQC),基于 GB200 NVL72 硬件,目標(biāo)是解決量子比特噪聲、實驗芯片設(shè)計等問題,推動量子計算與 AI 融合。彼時,MIT(麻省理工)量子工程團(tuán)隊將利用該中心開發(fā)量子糾錯技術(shù),預(yù)計年內(nèi)啟動。


還有就是,本次 GTC 2025 有一場“量子計算論壇”作為收尾,黃仁勛將對話 14 家企業(yè)領(lǐng)袖,侃一侃量子計算相關(guān)的話題。這個對標(biāo)的應(yīng)該是去年那場“”的論壇,可見黃仁勛本人的重視程度。

到時候 CSDNAI 科技大本營賬號也會跟進(jìn)這場論壇。


此外,黃仁勛還在主會上宣布了英偉達(dá)推出基于硅光子技術(shù)的 Spectrum-X 和 Quantum-X 交換機:

  • Spectrum-X支持 128 端口 800Gb/s 或 512 端口 200Gb/s,能效提升 3.5 倍,信號穩(wěn)定性提高 63 倍,適合超大規(guī)模 GPU 互聯(lián)。

  • Quantum-X是液冷設(shè)計,支持 144 端口 800Gb/s InfiniBand,AI 計算網(wǎng)絡(luò)速度翻倍、擴展性提升 5 倍。

黃仁勛稱其將“打破傳統(tǒng)網(wǎng)絡(luò)限制,助力百萬 GPU 級 AI 工廠”。


“通用機器人時代已經(jīng)到來”

演講尾聲,黃仁勛宣布了一堆可以加速人形機器人開發(fā)的技術(shù)。

首先就是鋪墊已久的NVIDIA Isaac GR00T N1,這是全球首個開放且完全可定制的基礎(chǔ)模型,用于通用的人形推理和技能。它還配套了 NVIDIA Isaac GR00T 藍(lán)圖技術(shù),用于生成合成數(shù)據(jù)。


這次正式命名加了個“艾薩克·牛頓”(Isaac Newton)的半個名字進(jìn)去,致敬了這位廣為人知的科學(xué)家。

而另外半截名字則用于一個開源物理引擎 Newton——它由 Google DeepMind 和迪士尼研究共同開發(fā),專為開發(fā)機器人而設(shè)計。

黃仁勛最后強調(diào):“通用機器人時代已經(jīng)到來,借助 NVIDIA Isaac GR00T N1 和新的數(shù)據(jù)生成及機器人學(xué)習(xí)框架,全世界的機器人開發(fā)者將開啟人工智能時代的下一個前沿。

緊接著就是最后一個驚喜:英偉達(dá)的小機器人Blue亮相。


從迪士尼制作的動畫,再到 DeepMind 提供的 AI 技術(shù),以及英偉達(dá)的硬件能力,讓這個由 Newton 物理引擎驅(qū)動的機器人走進(jìn)現(xiàn)實。

美國網(wǎng)友覺得它很像《星球大戰(zhàn)》里的機器人,個人覺得比較像那個經(jīng)典電影《瓦力》(WALL·E)。Blue 不是消費產(chǎn)品,所以黃仁勛真的就是叫它出來亮相收個尾的。


接下來,帶大家詳細(xì)回顧這場主會演講的完整內(nèi)容:

今年的 GTC 大會在美國加州圣何塞的體育場館SAP Center 舉行,據(jù)說原計劃是要在圣何塞的另一個會議中心辦主會,但由于本次參會人數(shù)眾多(約 19,000 人),會議中心沒法容納所有觀眾,所以英偉達(dá)只能在 SAP Center 這個體育館舉行——而 GTC 大會的其他部分依舊在會議中心舉行。

主會開始前的一小時,英偉達(dá)舉辦了預(yù)熱直播節(jié)目,請了眾多企業(yè)家輪流到一張桌子前講講自己對行業(yè)動態(tài)的看法,其中也有稍后即將登臺演講的黃仁勛。

老黃哪怕穿著一身圍裙,也要外套個皮衣出鏡,簡直是堅持人設(shè)到底。他還端出了一鍋煎餅,并聊了聊故事,將自己年輕時與現(xiàn)在的自己進(jìn)行比較。


老黃和煎餅的故事相當(dāng)悠久,比如九歲那年他移民到美國的時候,就是在 Denny’s 餐廳里當(dāng)洗碗工,整天給客人端招牌煎餅和咖啡;后來黃仁勛自己也喜歡上了煎餅,他在 2023 年評價 AI 安全問題還有 的時候都提到了自己吃煎餅的愛好。還有一次對話惠普 CEO,他直接在節(jié)目上吃起了餅,并展示了自己吃餅的方式。


時間來到凌晨 1 點 10 分,遲到的主會正式開始。


兩大關(guān)鍵詞:「token」「AI 工廠」

“去年全世界都搞錯了 Scaling Law。大家都以為是法則失效了,但其實是因為推理所需的計算量比去年人們認(rèn)為的要多 100 倍。” “計算領(lǐng)域迎來了拐點,AI 的增長正在加速,到 2028 年,數(shù)據(jù)中心資本支出預(yù)計超過 1 萬億美元。” “何謂 AI 工廠:計算機已經(jīng)成為了生成 token 的工具,而不是文件檢索工具。”

首先是今年 GTC 2025 的官方開幕宣傳片:“在 NVIDIA 的世界里,token 是 AI 計算的基本單位。token 不僅能教會機器人如何移動,還能教會它們?nèi)绾螏砜鞓贰?/strong>”


這個宣傳片想表達(dá)的思想其實就是,一個 token 生兩個 token,兩個token 生三個 token,然后三生萬物。“token 連接著所有的點,讓生命觸手可及,帶我們一起邁出下一個偉大的飛躍,前往之前沒有人抵達(dá)過的地方。”

短片結(jié)束,黃仁勛上臺,感嘆“(2025 是)多么令人驚嘆的一年”。

他想要通過人工智能的魔法,請大家來到英偉達(dá)總部,然后特意強調(diào)了一下他這場演講“沒有任何腳本和提詞器”:


這里的彩蛋是背景動畫里有個人形機器人想刷工牌進(jìn)入英偉達(dá)總部。暗示了這場演講最后的爆點。

開講之前,老黃慣例感謝了一波金主們:從醫(yī)療保健、交通到零售……幾乎每個行業(yè)都有代表。尤其是計算機行業(yè),幾乎每一家 IT 大廠都在贊助商列表中。


緊接著又是一個短片,強調(diào)「GTC 起源于 GeForce」,紀(jì)念這個最初為了玩游戲而生的顯卡系列:


接著短片的內(nèi)容,黃仁勛回憶了當(dāng)年 G 系列顯卡在市場上叱咤風(fēng)云的時候,然后雙手各舉一塊 GTX 5090 顯卡和 GTX 4090 顯卡:“你會發(fā)現(xiàn)它的體積小了百分之三十。”


這里有句話很精彩:英偉達(dá)的 GeForce 系列顯卡最大的歷史意義是將 CUDA 技術(shù)引入世界,然后 CUDA 推動了人工智能的發(fā)展,而如今人工智能又反過來徹底革新了計算機圖形學(xué),生成式 AI 從根本上改變了計算的方式

下面這個背景,正是完全基于路徑追蹤的實時渲染畫面:


聊到了 AI,就引入了今天的第一張增長圖。


從 2012 年 Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton 三位大神開發(fā)的 AlexNet 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),開始一路發(fā)展,才有了最初的感知 AI(Perception AI);再就是 ChatGPT 出來之后,大家熟悉的生成式 AI(Generative AI)誕生;近幾年隨著對智能體(Agent)的想法成熟,還有推理模型的誕生,又出現(xiàn)了自主式 AI(Agentic AI);最后再往上,就是具身智能和自動駕駛興起后,開始需求使用運動技能理解現(xiàn)實世界并與之進(jìn)行交互的模型,即物理 AI(Physical AI)。

黃仁勛說,理解物理世界的能力,將使 AI 進(jìn)入一個新的時代,使機器人成為可能。和此前的每一個階段一樣,都帶來了新的市場機會——然后為 GTC 大會帶來更多合作伙伴。

這里他將去年的 GTC 2024 大會比喻為“AI 的第一次現(xiàn)場表演”,也就是AI 的伍德斯托克音樂節(jié)(換成中國比喻就是迷笛音樂節(jié)),今年這場大會,則被他描述為AI 的超級碗(換成中國比喻就是春晚)。

所以,是什么因素讓 AI 的每一個階段得以實現(xiàn)呢?看下面這張圖:


黃仁勛提到了「三大基礎(chǔ)問題」:

  • 1. 數(shù)據(jù)。

人工智能是一種數(shù)據(jù)驅(qū)動的計算機科學(xué)方法,需要數(shù)據(jù)來學(xué)習(xí)知識。

  • 2. 訓(xùn)練。

為了訓(xùn)練 AI,我們的最終目標(biāo)是“希望沒有人類參與到訓(xùn)練的循環(huán)中”,因為人類在循環(huán)中之所以具有根本性的挑戰(zhàn)性,也就是壽命時間。我們希望人工智能能夠以超人的速度、超實時的速度和無人能及的規(guī)模學(xué)習(xí)。

  • 3. 擴展。

這個問題涉及到我們要怎么找到各種算法,讓人工智能隨著數(shù)據(jù)的增多可以變得越來越聰明,而不是數(shù)據(jù)用完了就停止。

圖上就展示了三種擴展:從感知 AI 到生成式 AI 最重要的就是預(yù)訓(xùn)練擴展,比如 GPT-3.5;而通過后訓(xùn)練擴展,我們獲得了更強的生成式 AI,比如 GPT-4;再之后就是測試時訓(xùn)練擴展,正是這一步讓我們有了 OpenAI o1 和 DeepSeek-R1 這樣的長思考模型,讓 AI 學(xué)會了推理。

所以,擴展法則其實從一條,變?yōu)榱巳龡l。

黃仁勛接下來這句話很經(jīng)典:“去年,幾乎全世界都搞錯了擴展法則(Scaling Law)。大家都以為是擴展法則失效了,但其實是因為自主式 AI 的推理所需的計算量比去年人們認(rèn)為的要多 100 倍。


現(xiàn)在我們有了能夠通過思維鏈思考和其他技術(shù)逐步推理的 AI,但是生成 token 的基本過程并沒有改變。這種推理需要更多的 token,且為了保持模型的響應(yīng)性,每秒所需的計算量同樣很高。


所以老黃就給出了解法:合成數(shù)據(jù)。“強化學(xué)習(xí)是過去幾年的重大突破。給 AI 提供成千上萬種不同的例子,讓 AI 一步步解決問題,并在它做得更好的時候?qū)ζ溥M(jìn)行獎勵(強化)。這意味著要訓(xùn)練該模型需要萬億甚至更多的 token。換句話說:生成合成數(shù)據(jù)來訓(xùn)練 AI。”

為了證明自己的話,老黃也是直接搬出了數(shù)據(jù),表示“計算正在面臨巨大的挑戰(zhàn),而行業(yè)正在回應(yīng)這點”。去年 Hopper 芯片(就是我們常說的 H100 那個系列,DeepSeek 用的是 H800)出貨量位居云服務(wù)提供商之首,屬于是 Hopper 系列的一大高峰。然而,與新系列 Blackwell 第一年的對比,則產(chǎn)生了三倍差距:


要知道 Blackwell 其實才剛剛開始發(fā)貨沒多久。

黃仁勛說:“我們早就知道通用計算已經(jīng)過時了,當(dāng)然,順其自然吧,我們需要一種新的計算方法,世界正在經(jīng)歷平臺轉(zhuǎn)變。”

然后是今晚第一個爆點:“數(shù)據(jù)中心建設(shè)正朝著加速計算(即使用 GPU 和其他加速器而非僅僅 CPU)的方向出現(xiàn)轉(zhuǎn)折點,計算領(lǐng)域正在出現(xiàn)拐點。到 2028 年,數(shù)據(jù)中心資本支出預(yù)計超過 1 萬億美元。


最后是這段內(nèi)容的總結(jié),解釋了到底什么是 AI 工廠:“計算機已成為生成令牌的工具,而不是文件檢索工具。從基于檢索的計算轉(zhuǎn)變?yōu)榛谏傻挠嬎悖瑥呐f的數(shù)據(jù)中心操作方式轉(zhuǎn)變?yōu)闃?gòu)建這些基礎(chǔ)設(shè)施的新方式。我稱它們?yōu)?AI 工廠(AI Factory)。


從 CUDA 到邊緣計算和自動駕駛

“我熱愛我們所做的工作,更熱愛著你們(開發(fā)者)用它所開發(fā)的一切。” “自動駕駛的時代已經(jīng)來臨!”

介紹完 AI 工廠的概念后,黃仁勛一轉(zhuǎn)話鋒:“雖然數(shù)據(jù)中心中的一切都將加速,但并非都是人工智能驅(qū)動——還需要物理、生物和其他科學(xué)領(lǐng)域的框架。”


而這些框架,已經(jīng)被英偉達(dá)作為其CUDA-X 庫的一部分提供。cuLitho 用于計算光刻,cuPynumeric 用于數(shù)值計算,Aerial 用于信號處理等。這也是英偉達(dá)在更大行業(yè)中的“護(hù)城河”。

這里黃仁勛還提到,美東時間 20 日(我們的 21 日)將會是英偉達(dá)的第一個“量子日”(Quantum Day),其實就是本文前面提到的那個量子計算論壇,黃仁勛會對話許多量子企業(yè)的 CEO。

再次進(jìn)入一段短片:自 CUDA 誕生以來,超過 200 個國家的 600 萬開發(fā)者使用它并改變了計算方式……開發(fā)者們用 CUDA 加速科學(xué)發(fā)現(xiàn)、重塑行業(yè)、賦予機器視覺、學(xué)習(xí)和推理的能力,而如今,英偉達(dá) Blackwell 比第一代 Cuda GPU 快了五萬倍。


短片結(jié)束,黃仁勛感謝了各位開發(fā)者:“我熱愛我們所做的工作,更熱愛著你們用它所開發(fā)的一切。”

然后就到了大家最喜歡的 AI 話題。


“眾所周知人工智能起源于云端,它之所以起源于云端是有充分理由的,因為事實證明人工智能需要基礎(chǔ)設(shè)施,所謂的「機器學(xué)習(xí)」顧名思義,需要一臺機器來進(jìn)行科學(xué)研究。”

“而云數(shù)據(jù)中心有基礎(chǔ)設(shè)施,他們也擁有非凡的計算機科學(xué)、非凡的研究、人工智能在云端起飛的完美環(huán)境以及 NVIDIA 合作伙伴網(wǎng)絡(luò)云服務(wù)提供商 (CSP),但這并不是人工智能所局限的領(lǐng)域。人工智能將無處不在,我們將以許多不同的方式談?wù)撊斯ぶ悄堋!?/p>

“當(dāng)然,云服務(wù)提供商喜歡我們的領(lǐng)先技術(shù),他們喜歡我們擁有完整的堆棧。但現(xiàn)在他們要把 AI 帶到整個世界,情況就有些變化了。GPU 云、邊緣計算等,都有各自的要求。”

鋪墊了那么多,全在講云,都是為了引出這段:“我們今天宣布,思科、T-Mobile 和英偉達(dá)將會在美國構(gòu)建完整的無線網(wǎng)絡(luò)堆棧,目標(biāo)是人工智能的邊緣計算。


但這只是一個行業(yè),人工智能會賦能千行百業(yè)。“還有自動駕駛車輛。當(dāng)年正是 AlexNet 讓 NVIDIA 全力投入自動駕駛汽車技術(shù)。而現(xiàn)在,他們的技術(shù)正在全世界范圍內(nèi)被使用。NVIDIA 為訓(xùn)練、模擬和自動駕駛汽車本身構(gòu)建計算機,而今天我們還要隆重宣布,英偉達(dá)將和通用汽車(GM)合作,共同構(gòu)建其未來的自動駕駛車隊。


“自動駕駛的時代已經(jīng)來臨!”這話不知道老黃以前有沒有講過,可能上一個這么說的是馬斯克。

大家討論自動駕駛的時候,最關(guān)心的還是安全問題,這也是 NVIDIA 今年在汽車領(lǐng)域工作的關(guān)鍵。如今 NVIDIA 已由第三方對全部 700 萬行代碼進(jìn)行了安全性評估,并宣布了芯片到部署的自動駕駛安全系統(tǒng) NVIDIA Halos


緊接著再次來到短片環(huán)節(jié),這次是關(guān)于 NVIDIA 用于創(chuàng)建自動駕駛車輛的技術(shù)和方法。數(shù)字孿生、強化學(xué)習(xí)、生成多樣化場景等,將全部基于 NVIDIA Cosmos 構(gòu)建,形成一個訓(xùn)練循環(huán):利用 AI 來創(chuàng)造更多的 AI



數(shù)據(jù)中心和下 N 代芯片

“看到這個,你應(yīng)該倒吸一口涼氣。” “未來當(dāng)英偉達(dá)討論 NVLink 互聯(lián)域時,將不再以“GPU 芯片數(shù)量”為單位,而是以“GPU 核心裸片(die)數(shù)量”為統(tǒng)計標(biāo)準(zhǔn)。” “每個未來的數(shù)據(jù)中心都將受到功率限制。我們現(xiàn)在是一個功率受限的行業(yè)。”

短片結(jié)束,就直接轉(zhuǎn)到了數(shù)據(jù)中心的話題。

黃仁勛重磅宣布:Blackwell 系列已全面投入生產(chǎn)


然后舞臺上就直接亮真家伙了。老黃首先展示了其合作伙伴提供的各種機架系統(tǒng)。英偉達(dá)長期以來一直在研究分布式計算——如何縱向擴展和橫向擴展。

由于橫向擴展很難,因此英偉達(dá)首先通過 HGX 和 8 塊 GPU 配置實現(xiàn)了縱向擴展。


然后他舉起了 HGX 上的一塊 H 系列芯片,并表示它是過去式了:


未來則是需要構(gòu)建這樣的一個 NVL8 系統(tǒng):


為了超越過去的設(shè)計,實現(xiàn)人工智能革命,英偉達(dá)必須重新設(shè)計 NVLink 系統(tǒng)的工作方式,以進(jìn)一步擴展。這里老黃很忙,先是展示了 NVLink Switch,展示它應(yīng)該如何移出機箱,并移到其他機架單元設(shè)備上。這個過程應(yīng)該叫“解耦 NVLink”(Disaggregated NVLInk):


最終得到的結(jié)果是可以在一個機架內(nèi),提供一個 ExaFLOP。“這是世界上有史以來最極端的擴展。”

總之,這套方法是有極限的。由于 Blackwell GPU 的芯片尺寸已接近光刻工藝的物理極限(reticle limits),英偉達(dá)無法再通過單純“做大單個芯片”來提升性能,因此轉(zhuǎn)向“將整個機架(rack)作為一個巨型計算單元”來擴展算力,而不是依賴傳統(tǒng)的單臺服務(wù)器設(shè)計。


(這張圖好像 CES 2025 才用過)

這種轉(zhuǎn)向還有助于提供用于 AI 的計算性能。不僅僅是用于訓(xùn)練,還包括推理——黃仁勛展示了一個大規(guī)模計算的推理性能曲線。簡而言之,這是總吞吐量和響應(yīng)性之間的平衡。保持系統(tǒng)飽和將最大化 token 的吞吐量,但單個 token生成的時間會很長(如果時間過長,用戶可能會轉(zhuǎn)向其他地方):


因此,對于使用 NVIDIA 硬件進(jìn)行推理的 NVIDIA CSP 合作伙伴和其他客戶來說,為了最大化他們的收入,他們需要仔細(xì)選擇曲線上的一個點。通常,理想的情況將是向右上方移動——在不顯著犧牲一方的情況下,實現(xiàn)最大的吞吐量和響應(yīng)性。這一切又離不開浮點運算和內(nèi)存帶寬,因此英偉達(dá)建立了硬件來提供這些功能。

下面又是一條短片,這個內(nèi)容很好玩,展示了推理模型的實用性和計算需求:



這里的 Case 是讓大模型安排婚禮宴席的座位。

一個傳統(tǒng)文本模型可以安排得很快速高效,但卻是錯誤的。浪費了 439 個 token;推理模型則可以搞定這個問題,但需要超過 8,000 個 token。

所以,使這一切都能高效運行不僅需要大量的硬件,還需要大量的軟件優(yōu)化,甚至需要操作系統(tǒng)來處理像批量處理這樣的基本優(yōu)化。

單個GPU無法同時滿足兩個階段的極端需求——預(yù)填充(Pre-fill)需要高算力,解碼(Decode)則需要高帶寬,那就得通過多 GPU 協(xié)同優(yōu)化。NVLink 完成連接這一步之后,還需要一個操作系統(tǒng)來進(jìn)行動態(tài)任務(wù)分配或后續(xù)的優(yōu)化,提供 GPU 的利用率,這就引出了老黃真正的重點——分布式推理服務(wù)庫NVIDIA Dynamo


“它就是這個 AI 工廠的操作系統(tǒng)。” 黃仁勛說。

Dynamo 的對比對象是 VMWare。VMWare 是基于 CPU 系統(tǒng)構(gòu)建的,而 Dynamo 是基于 GPU 系統(tǒng)構(gòu)建的。值得一提的是——Dynamo 還開源

現(xiàn)在再次回到了硬件和性能的話題上。黃仁勛將 NVL8 Hopper 配置與 Blackwell 進(jìn)行比較。下面圖表表達(dá)的是 H 系列每兆瓦每秒的 token 與每用戶每秒的 token:


由于這里講解圖表說了很多數(shù)據(jù),所以老黃防止觀眾太無聊,還調(diào)侃了一句“只有在英偉達(dá),你才會被數(shù)學(xué)折磨。”

對于服務(wù)提供商,長時間內(nèi)產(chǎn)生大量 token 意味著大量收入,所以之前 DeepSeek 公布模型成本利潤率 545% 的時候驚呆了不少人。Blackwell 在硬件上有所改進(jìn),并支持更低精度的數(shù)據(jù)格式(FP4),從而在相同能耗下處理更多的數(shù)據(jù):


Dynamo 則可以使 Blackwell NVL72 更加快速——而且這是在等功率下,而不是等芯片下,一代就提升了 25 倍。下圖標(biāo)注了這種情況下曲線的兩處亮點,老黃稱之為“最大 Q 值”(Max Q),是人工智能最大吞吐量和最高質(zhì)量之間的平衡:


最后就是這個曲線的帕累托最優(yōu)邊界(在一個分配系統(tǒng)中,沒有可能通過重新分配使某個個體更好而不使任何其他個體變得更壞的狀態(tài)),Blackwell 可以達(dá)到 Hooper 的 40 倍(等效功率)性能:


這里老黃的推銷語是:“你買的(Blackwell)越多,賺的越多。”


順帶一提,此處現(xiàn)場音頻設(shè)備爆音了一下,影響到了黃仁勛,他尷尬地停頓了一秒左右。不得不感嘆,這種頂級科技演講場合也難免出現(xiàn)一些小問題。

下一個短片展示英偉達(dá)如何為各種數(shù)據(jù)中心構(gòu)建數(shù)字孿生,這個過程其實就是所謂“AI 工廠”,使用數(shù)字孿生可以提前計劃和優(yōu)化工廠流程,最終達(dá)成一次性構(gòu)建:


接下來就是下一代芯片架構(gòu)的發(fā)布,由于文章開頭我們已經(jīng)寫過參數(shù),此處只寫寫演講中一些細(xì)節(jié)性的內(nèi)容。

Blackwell Ultra NVL72 將于今年下半年出貨,如今各行各業(yè)正處于必須規(guī)劃支出的階段,也就是要給英偉達(dá)的硬件、基礎(chǔ)設(shè)施和生態(tài)系統(tǒng)下多年份的訂單。所以老黃希望可以明確英偉達(dá)未來的路線圖,直接一口氣規(guī)劃到 2028。

2026 下半年的 Rubin 由 Vera Rubin NVL144 由 Vera Arm CPU + Rubin GPU 組成:


黃仁勛強調(diào),未來當(dāng)英偉達(dá)討論 NVLink 互聯(lián)域時,將不再以“GPU 芯片數(shù)量”為單位,而是以“GPU 核心裸片(die)數(shù)量”為統(tǒng)計標(biāo)準(zhǔn)。

例如,“NVL144”表示該 NVLink 域內(nèi)包含 144 個 GPU 核心裸片,而非 144 顆獨立 GPU 芯片。


然后是 2027 年下半年的 Rubin Ultra NVL576,“看到這個,你應(yīng)該倒吸一口涼氣。


Rubin 將大幅降低人工智能計算的成本。



進(jìn)一步擴展護(hù)城河

這一段開頭,黃仁勛回顧了六年前英偉達(dá)以 69 億美元收購 Mellanox 的這件往事,后面這次收購成就了業(yè)界第一款專為 AI 打造的以太網(wǎng)網(wǎng)絡(luò)平臺 NVIDIA Spectrum-X,其實就是為了六個字:進(jìn)軍網(wǎng)絡(luò)市場。

所以老黃也推出了最新的英偉達(dá)網(wǎng)卡 CX-8 和 CX-9,希望在 Rubin 時代(2026)將 GPU 擴展到數(shù)十萬甚至更多。


英偉達(dá)擴展得越來越大,數(shù)據(jù)中心的規(guī)模將達(dá)到體育場大小。那樣的話,銅連接不夠用,就需要使用光連接——而光連接可能會非常耗能。因此,英偉達(dá)計劃通過共封裝硅光子技術(shù)Photonics,使光網(wǎng)絡(luò)更加高效。


基于一種稱為微環(huán)調(diào)制器(MRM)的技術(shù),英偉達(dá)正在與晶圓廠合作開發(fā)的新 3D 堆疊工藝制造。

這里老黃直接把一堆線纜帶到了臺上,然后發(fā)現(xiàn)解不開:


“我的媽呀。”(原文 Oh mother of god)

解開后露出了欣慰的笑容:


老黃講解了現(xiàn)在光學(xué)網(wǎng)絡(luò)是如何工作的。首先,兩條線每一邊的每個端口都有單獨的傳輸器。這既可靠又有效,但電到光的轉(zhuǎn)換(再轉(zhuǎn)換回電)會消耗大量的電力。

并且,“每塊 GPU 都會有 6 個傳輸器”。這將消耗 180 瓦(每個多 30 瓦)并且需要數(shù)千美元的傳輸器。所有由收發(fā)器消耗的功率都是本可以用于 GPU 的功率。這使得英偉達(dá)無法向客戶銷售更多的 GPU。


這場演講肯定不會提出無法解決的問題,所以接下來果不其然又是廣告時間。

一段介紹光學(xué)原理的短片之后,硅光子 Quantum-X(InfiniBand)交換機正式亮相,將在 2025 年下半年發(fā)布。2026 年下半年則會發(fā)售另一款 Spectrum-X 交換機,它沒有光電收發(fā)器,直接光纖輸入,最多可支持 512 端口。


這一通節(jié)省下來,數(shù)據(jù)中心可以增加 10 個 Rubin Ultra 機架。

老黃這里又展示了另一個路線圖,表示現(xiàn)在英偉達(dá)每年會推出一個新平臺,同時公布了下下一代架構(gòu)——費曼(Feynman)


接下來聊聊企業(yè)。“人工智能和機器學(xué)習(xí)已經(jīng)重新發(fā)明了整個計算堆棧。處理器不同,操作系統(tǒng)也不同,上面的應(yīng)用程序也不同,你協(xié)調(diào)的方式也不同,運行它們的方式也不同。讓我給你舉一個例子:未來訪問數(shù)據(jù)的方式將與過去完全不同。不再是精確地檢索你想要的數(shù)據(jù),而是人類產(chǎn)生困惑,提出一個問題,讓 AI 告訴答案。”

“這也是企業(yè)未來的運作方式。我們有 AI 智能體,它們是我們數(shù)字勞動力的一部分。世界上有十億知識工作者——未來甚至可能會有 100 億數(shù)字工作者與我們并肩工作,最終實現(xiàn) 100% 的軟件工程師。”

我確信,到今年年底,100% 的英偉達(dá)軟件工程師將得到人工智能的幫助。Agent 將無處不在,企業(yè)運營的內(nèi)容和我們的運營方式將會有根本性的不同。”

“因此,我們需要一條新的計算機生產(chǎn)線。”——說完這句話之后,最最重點的地方斷流了,這下真的出大問題了。

官網(wǎng)也短暫地從直播變成了錄播狀態(tài),我記錄了這個珍貴的一刻(畫面就卡在這個迷你電腦上面了):


恢復(fù)到直播后回放發(fā)現(xiàn),中間斷掉的地方也沒補上,直接跳轉(zhuǎn)到了下一段。

有個梗說得好,果然全世界都是草臺班子!

幸好事后已經(jīng)知道,其實這里就是在發(fā)布DGX Spark。這是英偉達(dá)之前 CES 2025 宣布的 Project DIGITS 迷你電腦的最終名稱。它還會有個加強版,迷你工作站DGX Station




GPU 加速存儲。英偉達(dá)已與所有主要的存儲供應(yīng)商合作。

然后是新的合作,戴爾將提供一系列基于 NVIDIA 的系統(tǒng)。


本段最后,再次提到 CES 2025 宣布過的 NVIDIA Nemo Llame Nemotron 模型——這次是加了個 Reasoning 后綴,代表推理。因為是開源模型,此處圖表同時對標(biāo)了 Llama 3.3 和DeepSeek R1 Llama 70B



通用機器人時代降臨

一個短片開場,萬眾期待的機器人環(huán)節(jié)終于來了!

上來就講述一個現(xiàn)狀:“世界嚴(yán)重缺乏人力工人。


短片內(nèi)容大多是英偉達(dá)以前具身智能視頻的回顧。比如使用數(shù)字孿生創(chuàng)建一個虛擬設(shè)施來幫助訓(xùn)練機器人。(當(dāng)機器人在虛擬世界中出錯時,不會有任何東西損壞)這些機器人將通過對物理世界的 AI 模擬進(jìn)行訓(xùn)練。


一輪鋪墊之后,主角正式登場,英偉達(dá)發(fā)布人形機器人通用基礎(chǔ)模型NVIDIA Isaac GROOT N1:開頭講過,token 可以解釋萬物,這里就是將感知 token 和文本 token 分別輸入到慢思考(System 2)的視覺語言模型和快思考(System 1)的擴散 Transformer 模型里,最終輸出行動 token 給機器人,讓它有所反應(yīng)。



黃仁勛這里做了個預(yù)言:“物理 AI 和機器人學(xué)發(fā)展得如此之快。請大家關(guān)注這個領(lǐng)域。這很有可能成為最大的行業(yè)之一。”

呼應(yīng)開場那張增長圖:


老黃還回顧了 Omniverse + Cosmos 模擬是如何工作的。使用 Cosmos 創(chuàng)建各種環(huán)境來幫助訓(xùn)練,這個過程中類似現(xiàn)在的獎勵模型,需要設(shè)置一個可驗證的獎勵。

在機器人學(xué)中,可驗證的獎勵其實就是物理。如果機器人以物理上正確的方式行為,那么這就可以被驗證為準(zhǔn)確的。


下一個短片,咱們的主角「牛頓物理引擎」(Newton Physics Engine)正式登場:



而這一次,短片不再是短片。通過 Newton,迪士尼的短片從數(shù)字變?yōu)榱爽F(xiàn)實,讓機器人 Blue 站到了黃仁勛的跟前。

“讓我們結(jié)束這場主會。該吃午飯了。” 也是在這一刻,老黃宣布 GR00T-N1 開源,引爆現(xiàn)場。


一輪總結(jié)之后,最后自然還是用短片收尾。

英偉達(dá)的技術(shù)從游戲到計算機視覺、再到 AI、自動駕駛、人形機器人,一座「AI 工廠」平地而起,最終再次呼應(yīng)了本次演講的開頭,老黃邀請大家進(jìn)入的那所英偉達(dá)總部,變形成了一座飛船,飛向無垠的宇宙。


NVIDIA GTC 2025 以 Blackwell Ultra GPU、光子網(wǎng)絡(luò)交換機和開源機器人模型 GR00T-N1,重新定義了 AI 算力邊界。從芯片逼近物理極限到機架級“超級 GPU”,從量子計算實驗室到桌面級 AI 超算,黃仁勛的“AI 工廠”正將科幻場景落地。

這場技術(shù)狂歡的終章,或許正是星辰大海的起點。

【活動分享】2025 全球機器學(xué)習(xí)技術(shù)大會(ML-Summit)將于 4 月 18-19 日在上海舉辦。大會共 12 大主題、50+ 海內(nèi)外專家,聚焦下一代大模型技術(shù)和生態(tài)變革技術(shù)實踐。詳情參考官網(wǎng):http://ml-summit.org/。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中共中央批準(zhǔn):陳杰任上海市委常委

中共中央批準(zhǔn):陳杰任上海市委常委

新京報
2025-06-13 22:16:45
2.26米張子宇首秀12分鐘18+7:身旁韓旭顯嬌小 名嘴高贊勢不可擋

2.26米張子宇首秀12分鐘18+7:身旁韓旭顯嬌小 名嘴高贊勢不可擋

顏小白的籃球夢
2025-06-13 21:45:59
伊朗被打無人敢管,中國罕見帶頭表態(tài),以色列這次已闖下大禍

伊朗被打無人敢管,中國罕見帶頭表態(tài),以色列這次已闖下大禍

溫度歷史
2025-06-13 22:57:08
這妞厲害!來橫店三個月從配角到女二!

這妞厲害!來橫店三個月從配角到女二!

TVB的四小花
2025-06-14 01:16:34
四川后天起迎39℃燒烤模式 雷雨突襲能降溫嗎

四川后天起迎39℃燒烤模式 雷雨突襲能降溫嗎

心鳶zzz
2025-06-14 08:40:47
國防部:要求日方停止危險挑釁行徑

國防部:要求日方停止危險挑釁行徑

看看新聞Knews
2025-06-13 23:13:46
36歲女子猛撩29歲小伙,小伙直接找不著北,網(wǎng)友:姜還是老得辣

36歲女子猛撩29歲小伙,小伙直接找不著北,網(wǎng)友:姜還是老得辣

農(nóng)村情感故事
2025-06-12 17:41:29
江西一女刑犯在獄中懷孕,獄警調(diào)查3天后,卻在女人堆里找出奸夫

江西一女刑犯在獄中懷孕,獄警調(diào)查3天后,卻在女人堆里找出奸夫

懸案解密檔案
2025-06-13 10:26:24
兩伊戰(zhàn)爭拯救了中國的兵工廠:看當(dāng)年的出口額,至今無法超越

兩伊戰(zhàn)爭拯救了中國的兵工廠:看當(dāng)年的出口額,至今無法超越

蓮花盛開
2024-11-29 21:19:05
哪吒汽車被申請破產(chǎn),管理人機構(gòu)已確定

哪吒汽車被申請破產(chǎn),管理人機構(gòu)已確定

新京報
2025-06-13 20:29:49
瓦爾迪:我也想去看村超加入他們,我踢草根足球時可沒這場面

瓦爾迪:我也想去看村超加入他們,我踢草根足球時可沒這場面

直播吧
2025-06-13 12:13:25
天王山來了!SGA35+3+3統(tǒng)治第四節(jié),雷霆111-104力克步行者

天王山來了!SGA35+3+3統(tǒng)治第四節(jié),雷霆111-104力克步行者

運籌帷幄的籃球
2025-06-14 10:04:42
福耀科技大學(xué)招生數(shù)量引熱議,家長恐慌:這誰敢去

福耀科技大學(xué)招生數(shù)量引熱議,家長恐慌:這誰敢去

史書無明
2025-06-13 12:55:53
半天離職!上海一芯片團(tuán)隊幾乎全裁!賠償N+3!

半天離職!上海一芯片團(tuán)隊幾乎全裁!賠償N+3!

芯榜
2025-06-14 10:59:23
美記:霍姆格倫賽后一瘸一拐地走向球隊更衣室

美記:霍姆格倫賽后一瘸一拐地走向球隊更衣室

雷速體育
2025-06-14 12:32:28
下周行情(6.16日-20日)要點早知道

下周行情(6.16日-20日)要點早知道

玉名W
2025-06-14 09:20:06
任正非承認(rèn)落后,外媒也指出華為芯片比美國落后,但結(jié)果破防了

任正非承認(rèn)落后,外媒也指出華為芯片比美國落后,但結(jié)果破防了

互聯(lián)魚
2025-06-13 15:22:45
中國稀土能成戰(zhàn)略武器,他倆夫妻居功至偉,眼下急需解決一個問題

中國稀土能成戰(zhàn)略武器,他倆夫妻居功至偉,眼下急需解決一個問題

阿胡
2025-06-11 11:56:30
總理是叛徒?俄羅斯“最大內(nèi)鬼”浮出水面,竟然一直藏在普京身邊

總理是叛徒?俄羅斯“最大內(nèi)鬼”浮出水面,竟然一直藏在普京身邊

小lu侃侃而談
2025-06-10 20:06:43
越扒越有!那爾那茜特權(quán)或是“家族傳承”?合照曝光,關(guān)系太驚人

越扒越有!那爾那茜特權(quán)或是“家族傳承”?合照曝光,關(guān)系太驚人

葡萄說娛
2025-06-14 10:02:28
2025-06-14 12:52:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術(shù)的創(chuàng)造者和使用者
2526文章數(shù) 7599關(guān)注度
往期回顧 全部

財經(jīng)要聞

樓市權(quán)威發(fā)聲

頭條要聞

牛彈琴:中東大戰(zhàn)開啟 以色列遭受幾十年來最猛烈攻擊

頭條要聞

牛彈琴:中東大戰(zhàn)開啟 以色列遭受幾十年來最猛烈攻擊

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

健康
時尚
親子
旅游
公開課

呼吸科專家破解呼吸道九大謠言!

在時尚中國之夜,共赴榮耀東方時刻

親子要聞

寶寶害怕吃藥怎么辦?爸爸傳授的冷靜

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 林芝县| 丁青县| 汝南县| 长沙县| 茌平县| 林西县| 荣昌县| 包头市| 五大连池市| 卢氏县| 浦北县| 奇台县| 开平市| 轮台县| 九台市| 淮阳县| 桓仁| 密山市| 泰兴市| 焦作市| 仁化县| 曲靖市| 汕头市| 射阳县| 宕昌县| 正安县| 永兴县| 贵溪市| 盘山县| 西乌| 贵港市| 襄汾县| 巴塘县| 海阳市| 房山区| 海南省| 突泉县| 镇远县| 上高县| 萨迦县| 抚顺市|