整理 | 褚杏娟
“十年后我們會說,我們需要無處不在的人工智能,就像互聯(lián)網(wǎng)和電力一樣。”英偉達(dá) CEO 黃仁勛 5 月 19 日在 Computex2025 的開幕演講的開始再次強(qiáng)調(diào)了 AI 及英偉達(dá)作為 AI 基礎(chǔ)設(shè)施的重要性。
這次演講中,黃仁勛分享了關(guān)于人工智能和機(jī)器人未來的觀點(diǎn)以及一些新的計算產(chǎn)品。但與之前的傳言不同,黃仁勛并未在演講中提及 CPU。
此外,演講最后,黃仁勛還稱將建立中國臺灣省辦事處。從公布的渲染圖可以看到,英偉達(dá)在中國臺灣地區(qū)的辦事處大樓采用了類似宇宙飛船的設(shè)計風(fēng)格,命名為 NVDIA Constellation。黃仁勛表示,該園區(qū)將盡快開始建造,為員工提供辦公空間。
為推理加速
此次發(fā)布重點(diǎn)之一是圍繞擴(kuò)展版的 Blackwell 平臺——內(nèi)部稱為 Blackwell Ultra AI。
在此之前,黃仁勛重點(diǎn)提到了之前在 GTC 上分享到的 AI 發(fā)展歷程:Agentic AI 和 Physical AI。
“一旦 AI 具備推理能力和感知能力(如多模態(tài)處理,讀取 PDF、搜索、使用工具),就成為了 Agentic AI。”黃仁勛說道,Agentic AI 能完成:給定目標(biāo)、逐步拆解、思考最佳方案、考慮后果,然后執(zhí)行計劃,其中可能包括研究、使用工具或與其他 Agent 協(xié)作。
黃仁勛認(rèn)為,Agentic AI 本質(zhì)上是數(shù)字形態(tài)的機(jī)器人:Agentic AI 本質(zhì)上是 “理解、思考、行動” 的循環(huán),而這也是機(jī)器人技術(shù)的閉環(huán)。
而對于接下來的 Physical AI,即理解真實(shí)世界的 AI,如理解慣性、摩擦力、因果關(guān)系等。
黃仁勛表示, Physical AI 是機(jī)器人革命的基石,能對物理環(huán)境進(jìn)行推理等。從 “單次響應(yīng)” 轉(zhuǎn)向 “思考型”、“推理型”、“推理時間擴(kuò)展型” AI,需要更多計算。因此,英偉達(dá)創(chuàng)建了新系統(tǒng) Grace Blackwell。
“我很高興地宣布,我們的 Grace Blackwell 系統(tǒng)在經(jīng)歷了艱難的開發(fā)過程后,現(xiàn)在已全面投入生產(chǎn)。基于 HGX 主板的 Blackwell 系統(tǒng)自去年以來已全面投入生產(chǎn),并于 2 月開始交付。Grace Blackwell 已被多家云服務(wù)提供商采納,并在 Twitter 等平臺上獲得廣泛認(rèn)可。 我們計劃在本季度升級到 Grace Blackwell GB300 版本,GB300 配備了升級版 Blackwell 芯片,其推理性能提升了 1.5 倍,HBM 內(nèi)存容量增加了 1.5 倍,網(wǎng)絡(luò)連接能力翻倍,增強(qiáng)了整體系統(tǒng)性能。”
據(jù)介紹,Grace Blackwell 具備 “擴(kuò)展” 能力:“向上擴(kuò)展”(Scale up)指將單個計算機(jī)變?yōu)榫扌陀嬎銠C(jī);“向外擴(kuò)展”(Scale out)指連接多臺計算機(jī)分布式處理。“向外擴(kuò)展容易,向上擴(kuò)展極難 —— 構(gòu)建超越半導(dǎo)體物理極限的大型計算機(jī)極其困難,而這正是 Grace Blackwell 的使命。”黃仁勛說道。
Grace Blackwell GB300 系統(tǒng)達(dá) 40 PFLOPS,約相當(dāng)于 2018 年 Sierra 超級計算機(jī)的性能。“Sierra 超級計算機(jī)配備 18000 塊 Volta GPU,而這里一個節(jié)點(diǎn)就取代了整臺超級計算機(jī),六年內(nèi)性能提升 4000 倍,這是‘超摩爾定律’。”黃仁勛說道。
黃仁勛在現(xiàn)場還展示了 GB200 Grace Blackwell 超級芯片。他表示,英偉達(dá)的 AI 算力每 10 年提升大約 100 萬倍。公司已與臺積電的合作促成了一種名為 COOS-L 的新工藝,使得大規(guī)模芯片的制造成為可能。同時,公司開發(fā)了“全球最快”的交換機(jī) NVLink,目前運(yùn)行速度為 7.2TB/s。NVLink 主干網(wǎng)帶寬達(dá)到 130TB/s,連接了 72 個 GPU,采用創(chuàng)新的布線和結(jié)構(gòu)化同軸電纜。
此外,Vera Rubin(Vera 是 CPU,Rubin 是 GPU)整體性能是 GB300 的 3.3 倍,CPU 內(nèi)存容量是 Grace 的 4.2 倍,內(nèi)存帶寬是 Grace 的 2.4 倍,預(yù)計將于 2026 年下半年量產(chǎn)出貨;此外,黃仁勛還預(yù)覽了下一代 AI 超級芯片 Rubin Ultra,內(nèi)存帶寬是前代的 8 倍,性能是 GB300 的 14 倍,下一代 GPU 架構(gòu)采用了最新的 Feynman。
融入每個計算平臺
“數(shù)據(jù)中心正在經(jīng)歷幾十年來的根本性重構(gòu)——AI 正在融入每一個計算平臺。”黃仁勛說道。
基于此,英偉達(dá)宣布推出 NVLink Fusion,助力構(gòu)建 AI 基礎(chǔ)設(shè)施,而非僅僅構(gòu)建單一、特定的超級芯片。
據(jù)悉,F(xiàn)usion 旨在幫助云服務(wù)商將 AI 工廠規(guī)模擴(kuò)展到百萬級 GPU,兼容任何 ASIC(專用集成電路),并可與英偉達(dá)的機(jī)架級系統(tǒng)和端到端網(wǎng)絡(luò)平臺整合,后者可實(shí)現(xiàn)高達(dá) 800 Gbps 的數(shù)據(jù)吞吐能力。
通過 NVLink Fusion,包括富士通(Fujitsu)與高通(Qualcomm)在內(nèi)的 CPU 廠商也可與英偉達(dá) GPU 搭配,構(gòu)建高性能 AI 工廠。此外,基于 NVLink 打造定制化 AI 計算方案的廠商還包括:聯(lián)發(fā)科(MediaTek)、邁威爾(Marvell)、阿捷科技(Alchip)、Astera Labs、新思科技(Synopsys) 和 Cadence 等。
RTX Pro Enterprise 則是新發(fā)布的一款全能服務(wù)器,是用于 AI 代理的計算機(jī):無論是文本、圖片還是視頻模態(tài),支持全球所有已知模型和應(yīng)用,甚至支持《孤島危機(jī)》等游戲。“RTX Pro 服務(wù)器已在所有行業(yè)合作伙伴中批量生產(chǎn),這可能是我們有史以來市場推廣規(guī)模最大的系統(tǒng)。”黃仁勛說道。
黃仁勛還提到,DeepSeek R1 有突破性的性能提升,其計算能力提高了四倍。“DeepSeekR1 確實(shí)是送給全球 AI 行業(yè)的禮物,其計算機(jī)科學(xué)突破意義重大,為全球研究者開辟了新方向。DeepSeek-R1 影響著人們對 AI 和推理的思考,為行業(yè)和世界做出了重大貢獻(xiàn)。”
個人 AI 計算機(jī)即將發(fā)布
現(xiàn)場,黃仁勛宣布,英偉達(dá)將聯(lián)合臺積電、富士康在中國臺灣省建立 AI 超級計算機(jī)。
黃仁勛表示,此前在 CES 上談到的 Project DIGITS 的個人 AI 計算機(jī) DGX Spark 已全面投產(chǎn),即將在未來幾周上市。它面向那些想要擁有自己的超級計算機(jī)的人,各公司將自行定價。黃仁勛表示:“每個人都可以在圣誕節(jié)擁有一臺。”
黃仁勛還展示了另一臺個人超級計算機(jī) DGX Station。采用與巨型系統(tǒng)采用相同的編程模型,采用單一架構(gòu),具備運(yùn)行 1 萬億參數(shù)大模型的能力和性能。
開發(fā)者與全球計算的鏈接:Lepton
開發(fā)人員可以使用 Lepton,根據(jù)其運(yùn)營需求利用特定區(qū)域的 GPU 計算能力進(jìn)行按需和長期計算。
Lepton 是一個人工智能平臺,它提供了一個計算市場,將構(gòu)建當(dāng)今代理和物理人工智能應(yīng)用程序的全球開發(fā)人員與 Nvidia 云合作伙伴全球網(wǎng)絡(luò)提供的數(shù)萬個 GPU 連接起來。
英偉達(dá)的云合作伙伴包括:CoreWeave、Crusoe Energy、Firmus Technologies、富士康 GMI Cloud、Lambda Labs、Nscale、軟銀(SoftBank)以及 Yotta Data Services 等。
“Nvidia DGX Cloud Lepton 將我們的全球 GPU 云提供商網(wǎng)絡(luò)與 AI 開發(fā)者連接起來。我們正在與 NCP 攜手打造一個全球規(guī)模的 AI 工廠。”黃仁勛表示。
Lepton 平臺將 GPU 購買和管理過程抽象化,使合作伙伴能以統(tǒng)一的方式向開發(fā)者提供 GPU 算力資源。英偉達(dá)稱,這一方式讓開發(fā)者和企業(yè)能夠?qū)W⒂?AI 功能的開發(fā)與實(shí)驗,同時靈活獲取他們在測試、訓(xùn)練和部署模型時所需的算力資源。
為加速計算研發(fā)新架構(gòu)
“現(xiàn)在我們的主題演講 90% 不再圍繞 GeForce,但這并非因為我們不愛 GeForce——GeForce RTX 50 系列迎來了有史以來最成功的發(fā)布,是我們歷史上發(fā)布速度最快的產(chǎn)品,而 PC 游戲已經(jīng)有 30 年歷史,這足以說明 GeForce 的非凡。但現(xiàn)在讓我們談?wù)労诵牡膸臁!秉S仁勛說道。
一切當(dāng)然始于 CUDA。他表示,通過讓 CUDA 盡可能高性能、高普及,全球 CUDA 安裝量龐大,應(yīng)用程序就能輕松使用 CUDA GPU。安裝量越大、開發(fā)者越愿意創(chuàng)建庫;庫越多,就能實(shí)現(xiàn)更多驚人的功能、開發(fā)出更好的應(yīng)用,為用戶帶來更多價值,進(jìn)而推動更多人購買計算機(jī),更多計算機(jī)又意味著更多 CUDA——這種反饋循環(huán)至關(guān)重要。
然而,加速計算并非通用計算。通用計算中,人們用 Python、C 或 C++ 編寫軟件并編譯,方法論始終一致:編寫應(yīng)用、編譯、在 CPU 上運(yùn)行,但這在加速計算中根本行不通。
因此,英偉達(dá)的邏輯是:深入理解應(yīng)用就能加速應(yīng)用;創(chuàng)建更適合加速計算的架構(gòu),就能讓 99% 的運(yùn)行時間以接近光速的效率運(yùn)行,盡管這些代碼僅占總量的 5%。但大多數(shù)應(yīng)用中,一小部分代碼占據(jù)了大部分運(yùn)行時間。
黃仁勛還提到,英偉達(dá)正在開發(fā)量子經(jīng)典或量子 GPU 計算平臺,他預(yù)測未來所有超級計算機(jī)都有量子加速部分,超級計算機(jī)將擁有 GPU、QPU(量子處理單元)和 CPU。而今年 1 月時黃仁勛表示,量子計算投入使用至少還需要 20 年時間,但 3 月份又公開表示對量子計算應(yīng)用時間的預(yù)測言論是錯誤的。
存儲方面,黃仁勛認(rèn)為,未來的存儲不再是 CPU+ 存儲機(jī)架,而是需要系統(tǒng)嵌入到存儲機(jī)架中,在非結(jié)構(gòu)化數(shù)據(jù)的原始數(shù)據(jù)中進(jìn)行索引、搜索和排序,這一過程計算密集。因此,未來多數(shù)存儲服務(wù)器前端將配備 GPU 計算節(jié)點(diǎn)。
讓機(jī)器人學(xué)習(xí)“成為機(jī)器人”
“Agentic AI 本質(zhì)上是數(shù)字機(jī)器人,因為機(jī)器人需要感知、理解和規(guī)劃,這與 Agentic AI 的功能一致。但我們也想建造物理機(jī)器人,而物理機(jī)器人首先需要‘學(xué)習(xí)如何成為機(jī)器人’,這在現(xiàn)實(shí)世界中效率低下,因此必須創(chuàng)建虛擬世界讓機(jī)器人學(xué)習(xí),而虛擬世界必須遵循物理定律。”黃仁勛說道。
機(jī)器人領(lǐng)域最大的挑戰(zhàn)(也是 AI 整體的最大挑戰(zhàn))是數(shù)據(jù)策略,這需要大量研究和技術(shù)投入。黃仁勛表示,在機(jī)器人領(lǐng)域,人類演示至關(guān)重要,人類演示可以告訴機(jī)器人如何執(zhí)行任務(wù),AI 可以從中學(xué)習(xí)泛化。但如果想教機(jī)器人大量技能,就需要很多的遠(yuǎn)程操作人員(被稱為“軌跡數(shù)據(jù)”,trajectories)。因此,英偉達(dá)用 AI 擴(kuò)展人類演示中收集的數(shù)據(jù),來訓(xùn)練 AI 模型。
由于人工演示數(shù)據(jù)生成速度有限,英偉達(dá)開發(fā)了GR00T-Dreams——一個可以自動生成機(jī)器人在新環(huán)境中執(zhí)行任務(wù)的視頻系統(tǒng)。它甚至可以根據(jù)一張圖片,生成視頻供機(jī)器人學(xué)習(xí)新任務(wù)。
這屬于合成數(shù)據(jù)生成,即通過 AI 模擬任務(wù)過程,提供用于訓(xùn)練機(jī)器人的大規(guī)模高質(zhì)量數(shù)據(jù)。
GR00T-Dreams 也補(bǔ)充了Isaac GR00T-Mimic工具,后者可以通過 Omniverse 和 Cosmos 從少量人類演示中擴(kuò)展出更多動作數(shù)據(jù),而 Dreams 則可生成全新的視頻內(nèi)容。
黃仁勛還表示,已與 DeepMind 和 Disney Research 合作開發(fā)了全球最先進(jìn)的物理引擎 Newton,計劃于七月開源。據(jù)介紹,Newton 完全支持 GPU 加速,具有高度可微性和超實(shí)時操作能力,能夠通過經(jīng)驗實(shí)現(xiàn)有效學(xué)習(xí)。
“為了實(shí)現(xiàn)機(jī)器人技術(shù),我們需要 AI;為了訓(xùn)練 AI,又需要 AI。這正是 Agent 時代的偉大之處——需要大量合成數(shù)據(jù)生成、技能學(xué)習(xí)和巨大計算量。”黃仁勛說道。
黃仁勛表示,英偉達(dá)正在將該物理引擎整合進(jìn) Nvidia 的 ISAAC 模擬器,這一整合能夠以真實(shí)的方式讓這些機(jī)器人“活”起來。未來,英偉達(dá)會將訓(xùn)練好的 AI 模型植入仿真機(jī)器人,讓它學(xué)習(xí)成為優(yōu)秀的機(jī)器人。
英偉達(dá)還公布了其類人機(jī)器人基礎(chǔ)模型Isaac GR00T N1.5的首次重大更新。GR00T N1.5 相較前一代模型在適應(yīng)新環(huán)境和工作空間配置方面能力更強(qiáng)。英偉達(dá)表示,該版本顯著提升了模型在物料搬運(yùn)與制造任務(wù)(如物體分類與歸位)中的成功率,并可部署于公司將在年內(nèi)發(fā)布的Jetson Thor機(jī)器人計算平臺上。GR00T 模型的早期采用者包括:AeiRobot、Foxlink Lightweel 和 NEURa Robotics 等公司。
此外,黃仁勛表示,正在使用 Isaac Groot 平臺與汽車行業(yè)并行推進(jìn)機(jī)器人系統(tǒng)。Isaac Groot 平臺由一種名為 Jetson Thor 的新處理器驅(qū)動,專為機(jī)器人應(yīng)用而設(shè)計,適用于從自主車輛到人機(jī)系統(tǒng)。英偉達(dá)的 Isaac 操作系統(tǒng)管理所有神經(jīng)網(wǎng)絡(luò)處理、傳感器處理和數(shù)據(jù)管道,利用一支專業(yè)機(jī)器人團(tuán)隊開發(fā)的預(yù)訓(xùn)練模型來增強(qiáng)系統(tǒng)能力。
https://siliconangle.com/2025/05/19/nvidias-computex-2025-roundup-ai-gpu-compute-marketplace-nvlink-fusion-future-humanoid-ai/
聲明:本文為 AI 前線整理,不代表平臺觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
AICon 2025 強(qiáng)勢來襲,5 月上海站、6 月北京站,雙城聯(lián)動,全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合,匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票,一同探索 AI 應(yīng)用邊界!!
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.