新智元報道
編輯:KingHZ
【新智元導讀】推理模型開始「自言自語」、量子計算進入臨界點……AI大航海時代已然啟航,這不是一次產品發布會,而是未來的預言書。巴黎GTC大會,黃仁勛開講了!這次他脫下了皮衣。
「AI是世界上創造的最偉大的平等工具。」
在巴黎,黃仁勛這樣說道。
他表示,人工智能既不會引發反烏托邦式災難,也不會導致壟斷,它是解放人類的工具。
再巴黎GTC會議后的新聞發布會上,黃仁勛認為AI的確改變了職場,但駁斥了Dario Amodei最近關于AI導致大裁員的預測:
每個人的工作都會發生變化。雖然部分崗位會被替代,但也會涌現出大量新職業……
當公司更具生產力時,他們會雇傭更多人。
這次英偉達還簽了個大單:直接賣了1萬塊GPU!
這些GPU將用于在德國建設全球首個工業AI云平臺,加速歐洲工業巨頭的制造應用。
這次歐洲之行,英偉達收獲滿滿,包括與法國、德國、意大利等國家達成合作。
左右滑動查看
此外,與多家公司和研究機構建立了合作關系,包括與Mistral合作開發AI云服務等。
黃仁勛還宣布了DGX Lepton項目,助力歐洲擴大AI影響力:
DGX Cloud Lepton正在連接歐洲開發者與全球AI基礎設施。我們正在與來自歐洲的伙伴共同打造AI工廠網絡,供開發者、研究人員和企業將本地的突破性成果擴展為全球性創新。
這意味著客戶能夠自動將推理工作負載從不同的云平臺之間轉移,同時理論上保持相同的軟件用戶界面和體驗。
如果DGX Lepton成功,它將為所有新云(neocloud)創建標準的用戶體驗、價值和性能水平,這將導致這些新云陷入激烈的價格戰,最終使利潤降至極低的商品水平。
這是英偉達首次在巴黎舉行GTC大會,拉開2025年VivaTech的序幕,揭示了從智能體系統到AI工廠的下一階段AI計算。
從感知AI到自主AI
正是英偉達的GPU,使AI革命成為可能。
而AI,早已是英偉達關注的重點。
在巴黎GTC上,黃仁勛回顧了AI的發展,強調了AI在理解、感知、推理、規劃和執行任務方面的進步。
AI的第一波浪潮:感知智能
回到2012年,那時英偉達與開發者合作,「深度學習」的新算法橫空出世,誕生了AlexNet,這被認為是AI的宇宙大爆炸時刻。
AlexNet由Alex Krizhevsky, Ilya Sutskever,和「深度學習教父」Hinton使用Cuda和C++開發
在過去15年,AI的進展非常迅速。
第一階段是讓計算機看懂圖像、聽懂語音、識別模式。這就是「感知智能」。
第二波浪潮:生成式人工智能(GenerativeAI)
最近這五年,AI進入了第二階段——生成式人工智能GenAI。
AI不只是識別,還能生成圖像、生成語言內容。
它擁有「多模態」能力——能夠同時理解圖像和文字,所以我們可以用文字“提示”AI去創作圖像。
這項能力極大地提升了我們生產內容的效率。
AI能寫、能畫、能說、能演,這開啟了「內容生成革命」。
為了支持開源生態,讓開發者與企業也能擁有世界一流的大模型,于是英偉達打造了NeMo框架和Nemotron項目。
NeMo是NVIDIA開發的全棧大模型平臺,而Nemotron是提升開源模型質量的專項計劃。
LLaMA Nemotron針對性強化了開源的Llama模型,效率和準確率大幅度提升。
在多個領域,Nemotron模型排名領先,性能優異。
第三波浪潮:AgenticAI
現在進入了第三波浪潮 ——智能體AI(Agentic AI)。
智能不僅僅是識別或生成內容,更是能“理解、推理、規劃并執行任務”。
我們正在開啟新一波AI浪潮。
從根本上說,智能是關于理解、感知、推理、規劃任務(如何解決問題),然后執行任務。
真正的智能包括三個核心循環:
感知(Perception)
推理(Reasoning)
規劃(Planning)
它允許應用一些以前學過的規則,來解決從未見過的問題。
這就是聰明人之所以聰明的原因,他們能夠解決復雜問題,將問題一步步分解,思考如何解決問題;也許會進行研究,也許會學習一些新信息,獲得一些幫助;使用工具,并一步步解決問題。
智能體AI(Agentic AI)具備這些能力,它能將所學知識應用到新問題中,逐步拆解復雜問題,找到解決方案。比如:
面對沒見過的問題,AI可以自己想步驟、找工具、搜索資料、調用其他智能體、整合上下文,并一步步完成任務。
英偉達提供了完整的Agent平臺。
企業客戶正在用它構建專屬Agent系統:
Cisco(思科):用于企業安全情報的AI平臺;
SAP:將AI集成到業務自動化;
DeepL:用于翻譯系統的AI平臺;
PhotoRoom:用于AI圖像與視頻編輯;
Kodo(前Kodium):AI代碼助手;
Iola:語音交互系統;
全球最大臨床試驗自動化平臺:也使用NeMo構建智能體。
第四波浪潮:進入機器人時代
在實際實現中,智能體AI的具身化以及現在的生成能力正在生成運動。
這種AI不是生成視頻、圖像或文本,而是生成局部運動。它能夠行走,或者伸手抓取東西,使用工具。AI以物理形式具身化的能力基本上就是機器人技術。
這些能力,即實現智能體(基本上是信息機器人)和具身化AI(物理機器人)的基本技術,現在已經擺在我們面前。
從虛擬世界走向現實,這就是「具身智能」(EmbodiedAI)的世界。機器人就是這種智能的物理體現。
目前,我們正處于兩個核心AI領域交匯的時刻:
(1)信息型機器人(像ChatGPT這樣的聊天助手);
(2)實體型機器人(可以在物理世界中行動的AI)。
這兩類智能體現在都已經成為現實,我們正在迎來AI發展的全新時代!
對于AI來說,這真是令人興奮的時刻。
但這一切都始于都始于英偉達的第一張顯卡:GeForce 256。
GeForce 256
加速千行百業
GeForce帶來了計算機圖形。
這是有史以來開發的第一個加速計算應用程序,計算機圖形的發展令人難以置信。
GeForce將CUDA帶給世界,這使得機器學習研究人員和AI研究人員能夠推進深度學習。
隨后,深度學習徹底改變了計算機圖形,并使我們將計算機圖形提升到全新的水平成為可能。
黃仁勛展示了計算機模擬:光子模擬、物理模擬、粒子模擬。
所有一切從根本上來說都是模擬,而不是動畫,也不是藝術。
它之所以看起來如此美麗,是因為世界本身就是美麗的,數學也是美麗的。
那么,讓我們一起來看看吧。
這本質上就是模擬,而且看起來非常美麗。
現在能夠模擬幾乎所有事物的規模和速度,可以將所有事物都變成數字孿生。
因為所有事物都可以被數字孿生,我們可以在將其投入物理世界之前,完全以數字方式進行設計、規劃、優化和操作。
一切都在軟件中構建,英偉達將這一想法現在已經成為現實:
所有物理事物都將以數字方式構建。
所有宏偉的事物都將以數字方式構建。
所有以巨大規模運行的事物都將首先以數字方式構建,并且會有數字孿生來操作它們。
現在的「GB300 NVL 72」看起來是這樣的。
該計算設備重兩噸半,1.2萬個零件,大約300萬美元。120千瓦,由150家工廠制造,200家技術合作伙伴與英偉達合作完成
它已經完全投入生產。它被設計成一臺思考機器。
這意味著它能夠推理、規劃,并且像人一樣,花費大量時間自言自語。
加速AI推理
推理模型正在自言自語,我們需要30到40倍的性能提升。
它不再是那種一問一答的ChatGPT,現在是推理模型,當思考時,它會生成更多的token。
它會一步步地分解問題、推理;嘗試各種不同的路徑:也許是思維鏈(chain of thoughts),也許是思維樹(tree of thoughts)的最佳結果。
它會反思自己的答案。
可能你已經看到這些研究模型在反思答案,說「這是一個好答案嗎?你能做得更好嗎?」然后推理模型會說:「哦,是的,我能做得更好。」然后回去思考更多。
因此,這些思考模型、推理模型實現了令人難以置信的性能,但這需要更多的算力。
而最終的結果,MVLink 72 Blackwells的架構,帶來了性能的巨大飛躍,在僅僅一代之內實現30到40倍的性能提升。
根據摩爾定律,半導體物理學,每三到五年只有大約兩倍的性能提升。
而解讀下圖的方式是:X軸代表它思考的速度。Y軸代表工廠在同一時間支持大量用戶時的產出量。
加速計算
英偉達曾經夢想,創建全新的計算平臺,去完成傳統計算機無法完成的任務。
他們加速了CPU,創造了一種全新的計算方式,稱為「加速計算」。
他們最初的應用之一是分子動力學模擬。從那以后,他們走過了漫長的道路,開發了無數的庫。
事實上,使加速計算與眾不同的原因在于,它不僅僅是一個新的處理器,也不僅僅是你編譯代碼就能運行的軟件。
你必須徹底重新設計你的計算方式,重新構思你的算法。而這對大多數人來說極其困難——
要將軟件和算法重新構建為高度并行化的形式并不容易。
所以,他們創建了各種庫,幫助每一個行業、每一個應用領域實現加速。
每一個這樣的庫都為開發者打開了新的可能。
比如:
計算光刻,也許是今天半導體設計中最重要的應用之一;它在臺積電、三星等大型晶圓廠中運行,在芯片制造之前會運行一個基于反物理算法的流程,稱為Computational Lithography(計算光刻)。
稀疏求解器、代數多重網格求解器等。
cuOpt:剛剛開源的應用庫,它能加速決策制定,優化數百萬變量和約束的問題,比如旅行商問題。
這些只是他們提供的部分庫。
他們有400多個類似的庫,每一個都加速特定的應用領域,每一個都為行業打開新的可能。
另一個極其重要的是CUDA Q。它將CUDA擴展到量子經典領域。
量子計算拐點
英偉達開發CUDAQ已經好幾年了。
黃仁勛認為:「量子計算正在發生拐點。」
眾所周知,在近30年前,第一個物理量子比特就被演示了。
第一一個糾錯算法于1995年被發明,而在2023年,將近30年后,世界上第一個邏輯量子比特由谷歌演示。從那時起,幾年后,邏輯量子比特的數量(由大量帶糾錯的物理量子比特表示)開始增長。
就像摩爾定律一樣,完全可以預期每5年邏輯量子比特增加10倍,每10年增加100倍。這些邏輯量子比特將得到更好的糾錯,更健壯,性能更高,更有彈性,當然也將繼續可擴展。
英偉達與世界各地的量子計算公司以多種不同的方式合作,而歐洲相關從業者最多。
現在,英偉達很清楚:「我們已經觸手可及,能夠在未來幾年將量子計算,量子經典計算應用于可以解決一些有趣問題的領域。」
這是真正激動人心的時刻。
在接下來的幾年里,或者至少是下一代超級計算機,都將配備QPU,并且QPU將連接到GPU。QPU當然會進行量子計算,而GPU將用于預處理、控制、糾錯(這將是計算密集型的)、后處理等。
就像加速CPU一樣,現在有QPU與GPU協同工作,以實現下一代計算。
參考資料:
https://www.youtube.com/watch?v=X9cHONwKkn4%20
https://www.nvidia.cn/gtc/paris/keynote/
https://nvidianews.nvidia.com/news/nvidia-builds-worlds-first-industrial-ai-cloud-to-advance-european-manufacturing
https://media.iprsoftware.com/219/files/20255/gtc-paris-2025-keynote-deck.pdf
https://fortune.com/2025/06/11/nvidia-jensen-huang-disagress-anthropic-ceo-dario-amodei-ai-jobs/
https://abcnews.go.com/Technology/wireStory/nvidia-chief-calls-ai-greatest-equalizer-warns-europe-122745910
https://x.com/SemiAnalysis_/status/1932802502069755956
https://blogs.nvidia.cn/blog/nvidia-dgx-cloud-lepton-connects-europes-developers-to-global-nvidia-compute-ecosystem/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.