黃仁勛發(fā)力支持Agent、新設(shè)中國研發(fā)點(diǎn)，賈揚(yáng)清Lepton被收購后現(xiàn)狀曝光！

媒體：黃仁勛押注Agent對決華為

2025-05-19 17:27:24　來源: AI前線

北京舉報

分享至

整理 | 褚杏娟

“十年后我們會說，我們需要無處不在的人工智能，就像互聯(lián)網(wǎng)和電力一樣。”英偉達(dá) CEO 黃仁勛 5 月 19 日在 Computex2025 的開幕演講的開始再次強(qiáng)調(diào)了 AI 及英偉達(dá)作為 AI 基礎(chǔ)設(shè)施的重要性。

這次演講中，黃仁勛分享了關(guān)于人工智能和機(jī)器人未來的觀點(diǎn)以及一些新的計算產(chǎn)品。但與之前的傳言不同，黃仁勛并未在演講中提及 CPU。

此外，演講最后，黃仁勛還稱將建立中國臺灣省辦事處。從公布的渲染圖可以看到，英偉達(dá)在中國臺灣地區(qū)的辦事處大樓采用了類似宇宙飛船的設(shè)計風(fēng)格，命名為 NVDIA Constellation。黃仁勛表示，該園區(qū)將盡快開始建造，為員工提供辦公空間。

為推理加速

此次發(fā)布重點(diǎn)之一是圍繞擴(kuò)展版的 Blackwell 平臺——內(nèi)部稱為 Blackwell Ultra AI。

在此之前，黃仁勛重點(diǎn)提到了之前在 GTC 上分享到的 AI 發(fā)展歷程：Agentic AI 和 Physical AI。

“一旦 AI 具備推理能力和感知能力（如多模態(tài)處理，讀取 PDF、搜索、使用工具），就成為了 Agentic AI。”黃仁勛說道，Agentic AI 能完成：給定目標(biāo)、逐步拆解、思考最佳方案、考慮后果，然后執(zhí)行計劃，其中可能包括研究、使用工具或與其他 Agent 協(xié)作。

黃仁勛認(rèn)為，Agentic AI 本質(zhì)上是數(shù)字形態(tài)的機(jī)器人：Agentic AI 本質(zhì)上是 “理解、思考、行動” 的循環(huán)，而這也是機(jī)器人技術(shù)的閉環(huán)。

而對于接下來的 Physical AI，即理解真實(shí)世界的 AI，如理解慣性、摩擦力、因果關(guān)系等。

黃仁勛表示， Physical AI 是機(jī)器人革命的基石，能對物理環(huán)境進(jìn)行推理等。從 “單次響應(yīng)” 轉(zhuǎn)向 “思考型”、“推理型”、“推理時間擴(kuò)展型” AI，需要更多計算。因此，英偉達(dá)創(chuàng)建了新系統(tǒng) Grace Blackwell。

“我很高興地宣布，我們的 Grace Blackwell 系統(tǒng)在經(jīng)歷了艱難的開發(fā)過程后，現(xiàn)在已全面投入生產(chǎn)。基于 HGX 主板的 Blackwell 系統(tǒng)自去年以來已全面投入生產(chǎn)，并于 2 月開始交付。Grace Blackwell 已被多家云服務(wù)提供商采納，并在 Twitter 等平臺上獲得廣泛認(rèn)可。我們計劃在本季度升級到 Grace Blackwell GB300 版本，GB300 配備了升級版 Blackwell 芯片，其推理性能提升了 1.5 倍，HBM 內(nèi)存容量增加了 1.5 倍，網(wǎng)絡(luò)連接能力翻倍，增強(qiáng)了整體系統(tǒng)性能。”

據(jù)介紹，Grace Blackwell 具備 “擴(kuò)展” 能力：“向上擴(kuò)展”（Scale up）指將單個計算機(jī)變?yōu)榫扌陀嬎銠C(jī)；“向外擴(kuò)展”（Scale out）指連接多臺計算機(jī)分布式處理。“向外擴(kuò)展容易，向上擴(kuò)展極難 —— 構(gòu)建超越半導(dǎo)體物理極限的大型計算機(jī)極其困難，而這正是 Grace Blackwell 的使命。”黃仁勛說道。

Grace Blackwell GB300 系統(tǒng)達(dá) 40 PFLOPS，約相當(dāng)于 2018 年 Sierra 超級計算機(jī)的性能。“Sierra 超級計算機(jī)配備 18000 塊 Volta GPU，而這里一個節(jié)點(diǎn)就取代了整臺超級計算機(jī)，六年內(nèi)性能提升 4000 倍，這是‘超摩爾定律’。”黃仁勛說道。

黃仁勛在現(xiàn)場還展示了 GB200 Grace Blackwell 超級芯片。他表示，英偉達(dá)的 AI 算力每 10 年提升大約 100 萬倍。公司已與臺積電的合作促成了一種名為 COOS-L 的新工藝，使得大規(guī)模芯片的制造成為可能。同時，公司開發(fā)了“全球最快”的交換機(jī) NVLink，目前運(yùn)行速度為 7.2TB/s。NVLink 主干網(wǎng)帶寬達(dá)到 130TB/s，連接了 72 個 GPU，采用創(chuàng)新的布線和結(jié)構(gòu)化同軸電纜。

此外，Vera Rubin（Vera 是 CPU，Rubin 是 GPU）整體性能是 GB300 的 3.3 倍，CPU 內(nèi)存容量是 Grace 的 4.2 倍，內(nèi)存帶寬是 Grace 的 2.4 倍，預(yù)計將于 2026 年下半年量產(chǎn)出貨；此外，黃仁勛還預(yù)覽了下一代 AI 超級芯片 Rubin Ultra，內(nèi)存帶寬是前代的 8 倍，性能是 GB300 的 14 倍，下一代 GPU 架構(gòu)采用了最新的 Feynman。

融入每個計算平臺

“數(shù)據(jù)中心正在經(jīng)歷幾十年來的根本性重構(gòu)——AI 正在融入每一個計算平臺。”黃仁勛說道。

基于此，英偉達(dá)宣布推出 NVLink Fusion，助力構(gòu)建 AI 基礎(chǔ)設(shè)施，而非僅僅構(gòu)建單一、特定的超級芯片。

據(jù)悉，F(xiàn)usion 旨在幫助云服務(wù)商將 AI 工廠規(guī)模擴(kuò)展到百萬級 GPU，兼容任何 ASIC（專用集成電路），并可與英偉達(dá)的機(jī)架級系統(tǒng)和端到端網(wǎng)絡(luò)平臺整合，后者可實(shí)現(xiàn)高達(dá) 800 Gbps 的數(shù)據(jù)吞吐能力。

通過 NVLink Fusion，包括富士通（Fujitsu）與高通（Qualcomm）在內(nèi)的 CPU 廠商也可與英偉達(dá) GPU 搭配，構(gòu)建高性能 AI 工廠。此外，基于 NVLink 打造定制化 AI 計算方案的廠商還包括：聯(lián)發(fā)科（MediaTek）、邁威爾（Marvell）、阿捷科技（Alchip）、Astera Labs、新思科技（Synopsys）和 Cadence 等。

RTX Pro Enterprise 則是新發(fā)布的一款全能服務(wù)器，是用于 AI 代理的計算機(jī)：無論是文本、圖片還是視頻模態(tài)，支持全球所有已知模型和應(yīng)用，甚至支持《孤島危機(jī)》等游戲。“RTX Pro 服務(wù)器已在所有行業(yè)合作伙伴中批量生產(chǎn)，這可能是我們有史以來市場推廣規(guī)模最大的系統(tǒng)。”黃仁勛說道。

黃仁勛還提到，DeepSeek R1 有突破性的性能提升，其計算能力提高了四倍。“DeepSeekR1 確實(shí)是送給全球 AI 行業(yè)的禮物，其計算機(jī)科學(xué)突破意義重大，為全球研究者開辟了新方向。DeepSeek-R1 影響著人們對 AI 和推理的思考，為行業(yè)和世界做出了重大貢獻(xiàn)。”

個人 AI 計算機(jī)即將發(fā)布

現(xiàn)場，黃仁勛宣布，英偉達(dá)將聯(lián)合臺積電、富士康在中國臺灣省建立 AI 超級計算機(jī)。

黃仁勛表示，此前在 CES 上談到的 Project DIGITS 的個人 AI 計算機(jī) DGX Spark 已全面投產(chǎn)，即將在未來幾周上市。它面向那些想要擁有自己的超級計算機(jī)的人，各公司將自行定價。黃仁勛表示：“每個人都可以在圣誕節(jié)擁有一臺。”

黃仁勛還展示了另一臺個人超級計算機(jī) DGX Station。采用與巨型系統(tǒng)采用相同的編程模型，采用單一架構(gòu)，具備運(yùn)行 1 萬億參數(shù)大模型的能力和性能。

開發(fā)者與全球計算的鏈接：Lepton

開發(fā)人員可以使用 Lepton，根據(jù)其運(yùn)營需求利用特定區(qū)域的 GPU 計算能力進(jìn)行按需和長期計算。

Lepton 是一個人工智能平臺，它提供了一個計算市場，將構(gòu)建當(dāng)今代理和物理人工智能應(yīng)用程序的全球開發(fā)人員與 Nvidia 云合作伙伴全球網(wǎng)絡(luò)提供的數(shù)萬個 GPU 連接起來。

英偉達(dá)的云合作伙伴包括：CoreWeave、Crusoe Energy、Firmus Technologies、富士康 GMI Cloud、Lambda Labs、Nscale、軟銀（SoftBank）以及 Yotta Data Services 等。

“Nvidia DGX Cloud Lepton 將我們的全球 GPU 云提供商網(wǎng)絡(luò)與 AI 開發(fā)者連接起來。我們正在與 NCP 攜手打造一個全球規(guī)模的 AI 工廠。”黃仁勛表示。

Lepton 平臺將 GPU 購買和管理過程抽象化，使合作伙伴能以統(tǒng)一的方式向開發(fā)者提供 GPU 算力資源。英偉達(dá)稱，這一方式讓開發(fā)者和企業(yè)能夠?qū)Ｗ⒂?AI 功能的開發(fā)與實(shí)驗，同時靈活獲取他們在測試、訓(xùn)練和部署模型時所需的算力資源。

為加速計算研發(fā)新架構(gòu)

“現(xiàn)在我們的主題演講 90% 不再圍繞 GeForce，但這并非因為我們不愛 GeForce——GeForce RTX 50 系列迎來了有史以來最成功的發(fā)布，是我們歷史上發(fā)布速度最快的產(chǎn)品，而 PC 游戲已經(jīng)有 30 年歷史，這足以說明 GeForce 的非凡。但現(xiàn)在讓我們談?wù)労诵牡膸臁！秉S仁勛說道。

一切當(dāng)然始于 CUDA。他表示，通過讓 CUDA 盡可能高性能、高普及，全球 CUDA 安裝量龐大，應(yīng)用程序就能輕松使用 CUDA GPU。安裝量越大、開發(fā)者越愿意創(chuàng)建庫；庫越多，就能實(shí)現(xiàn)更多驚人的功能、開發(fā)出更好的應(yīng)用，為用戶帶來更多價值，進(jìn)而推動更多人購買計算機(jī)，更多計算機(jī)又意味著更多 CUDA——這種反饋循環(huán)至關(guān)重要。

然而，加速計算并非通用計算。通用計算中，人們用 Python、C 或 C++ 編寫軟件并編譯，方法論始終一致：編寫應(yīng)用、編譯、在 CPU 上運(yùn)行，但這在加速計算中根本行不通。

因此，英偉達(dá)的邏輯是：深入理解應(yīng)用就能加速應(yīng)用；創(chuàng)建更適合加速計算的架構(gòu)，就能讓 99% 的運(yùn)行時間以接近光速的效率運(yùn)行，盡管這些代碼僅占總量的 5%。但大多數(shù)應(yīng)用中，一小部分代碼占據(jù)了大部分運(yùn)行時間。

黃仁勛還提到，英偉達(dá)正在開發(fā)量子經(jīng)典或量子 GPU 計算平臺，他預(yù)測未來所有超級計算機(jī)都有量子加速部分，超級計算機(jī)將擁有 GPU、QPU（量子處理單元）和 CPU。而今年 1 月時黃仁勛表示，量子計算投入使用至少還需要 20 年時間，但 3 月份又公開表示對量子計算應(yīng)用時間的預(yù)測言論是錯誤的。

存儲方面，黃仁勛認(rèn)為，未來的存儲不再是 CPU+ 存儲機(jī)架，而是需要系統(tǒng)嵌入到存儲機(jī)架中，在非結(jié)構(gòu)化數(shù)據(jù)的原始數(shù)據(jù)中進(jìn)行索引、搜索和排序，這一過程計算密集。因此，未來多數(shù)存儲服務(wù)器前端將配備 GPU 計算節(jié)點(diǎn)。

讓機(jī)器人學(xué)習(xí)“成為機(jī)器人”

“Agentic AI 本質(zhì)上是數(shù)字機(jī)器人，因為機(jī)器人需要感知、理解和規(guī)劃，這與 Agentic AI 的功能一致。但我們也想建造物理機(jī)器人，而物理機(jī)器人首先需要‘學(xué)習(xí)如何成為機(jī)器人’，這在現(xiàn)實(shí)世界中效率低下，因此必須創(chuàng)建虛擬世界讓機(jī)器人學(xué)習(xí)，而虛擬世界必須遵循物理定律。”黃仁勛說道。

機(jī)器人領(lǐng)域最大的挑戰(zhàn)（也是 AI 整體的最大挑戰(zhàn)）是數(shù)據(jù)策略，這需要大量研究和技術(shù)投入。黃仁勛表示，在機(jī)器人領(lǐng)域，人類演示至關(guān)重要，人類演示可以告訴機(jī)器人如何執(zhí)行任務(wù)，AI 可以從中學(xué)習(xí)泛化。但如果想教機(jī)器人大量技能，就需要很多的遠(yuǎn)程操作人員（被稱為“軌跡數(shù)據(jù)”，trajectories）。因此，英偉達(dá)用 AI 擴(kuò)展人類演示中收集的數(shù)據(jù)，來訓(xùn)練 AI 模型。

由于人工演示數(shù)據(jù)生成速度有限，英偉達(dá)開發(fā)了GR00T-Dreams——一個可以自動生成機(jī)器人在新環(huán)境中執(zhí)行任務(wù)的視頻系統(tǒng)。它甚至可以根據(jù)一張圖片，生成視頻供機(jī)器人學(xué)習(xí)新任務(wù)。

這屬于合成數(shù)據(jù)生成，即通過 AI 模擬任務(wù)過程，提供用于訓(xùn)練機(jī)器人的大規(guī)模高質(zhì)量數(shù)據(jù)。

GR00T-Dreams 也補(bǔ)充了Isaac GR00T-Mimic工具，后者可以通過 Omniverse 和 Cosmos 從少量人類演示中擴(kuò)展出更多動作數(shù)據(jù)，而 Dreams 則可生成全新的視頻內(nèi)容。

黃仁勛還表示，已與 DeepMind 和 Disney Research 合作開發(fā)了全球最先進(jìn)的物理引擎 Newton，計劃于七月開源。據(jù)介紹，Newton 完全支持 GPU 加速，具有高度可微性和超實(shí)時操作能力，能夠通過經(jīng)驗實(shí)現(xiàn)有效學(xué)習(xí)。

“為了實(shí)現(xiàn)機(jī)器人技術(shù)，我們需要 AI；為了訓(xùn)練 AI，又需要 AI。這正是 Agent 時代的偉大之處——需要大量合成數(shù)據(jù)生成、技能學(xué)習(xí)和巨大計算量。”黃仁勛說道。

黃仁勛表示，英偉達(dá)正在將該物理引擎整合進(jìn) Nvidia 的 ISAAC 模擬器，這一整合能夠以真實(shí)的方式讓這些機(jī)器人“活”起來。未來，英偉達(dá)會將訓(xùn)練好的 AI 模型植入仿真機(jī)器人，讓它學(xué)習(xí)成為優(yōu)秀的機(jī)器人。

英偉達(dá)還公布了其類人機(jī)器人基礎(chǔ)模型Isaac GR00T N1.5的首次重大更新。GR00T N1.5 相較前一代模型在適應(yīng)新環(huán)境和工作空間配置方面能力更強(qiáng)。英偉達(dá)表示，該版本顯著提升了模型在物料搬運(yùn)與制造任務(wù)（如物體分類與歸位）中的成功率，并可部署于公司將在年內(nèi)發(fā)布的Jetson Thor機(jī)器人計算平臺上。GR00T 模型的早期采用者包括：AeiRobot、Foxlink Lightweel 和 NEURa Robotics 等公司。

此外，黃仁勛表示，正在使用 Isaac Groot 平臺與汽車行業(yè)并行推進(jìn)機(jī)器人系統(tǒng)。Isaac Groot 平臺由一種名為 Jetson Thor 的新處理器驅(qū)動，專為機(jī)器人應(yīng)用而設(shè)計，適用于從自主車輛到人機(jī)系統(tǒng)。英偉達(dá)的 Isaac 操作系統(tǒng)管理所有神經(jīng)網(wǎng)絡(luò)處理、傳感器處理和數(shù)據(jù)管道，利用一支專業(yè)機(jī)器人團(tuán)隊開發(fā)的預(yù)訓(xùn)練模型來增強(qiáng)系統(tǒng)能力。

https://siliconangle.com/2025/05/19/nvidias-computex-2025-roundup-ai-gpu-compute-marketplace-nvlink-fusion-future-humanoid-ai/

聲明：本文為 AI 前線整理，不代表平臺觀點(diǎn)，未經(jīng)許可禁止轉(zhuǎn)載。

AICon 2025 強(qiáng)勢來襲，5 月上海站、6 月北京站，雙城聯(lián)動，全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合，匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票，一同探索 AI 應(yīng)用邊界！！

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.