夢晨 聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
英偉達(dá)官宣新辦公室落戶中國臺灣省臺北市,但居然是從太空飛下來的嗎?
當(dāng)然,這只是黃仁勛在Computex大會上展示的CG特效,但背后還有這樣一層意思:
如此逼真的畫面中,只有1/10的像素是顯卡渲染的,剩下全部內(nèi)容為AI預(yù)測。
當(dāng)初是GeForce顯卡讓AI成為現(xiàn)實,現(xiàn)在AI反過來給GeForce顯卡帶來顛覆性變革。
除了正式宣布新辦公室地址,會上英偉達(dá)還宣布多款重磅新品:
面向個人有DGX Station,在桌面跑1T參數(shù)大模型,這回刀法也不用了,足足給到800GB內(nèi)存。
面向企業(yè)有RTX PRO Server,可加速從AI智能體、物理AI、科學(xué)計算到渲染、3D圖形和視頻等各種用例。
同時老黃還表示英偉達(dá)正在經(jīng)歷一次轉(zhuǎn)型,從一家芯片公司擴展到一家AI基礎(chǔ)設(shè)施公司。
過去幾十年,英偉達(dá)從造GPU芯片到造超算系統(tǒng),現(xiàn)在造數(shù)據(jù)中心都已經(jīng)不滿足了,接下來要交付的是“星際之門”、xAI Colossus超級計算集群這樣的大項目。
老黃表示,AI基礎(chǔ)設(shè)施市場將以數(shù)萬億美元衡量。
此外,這場演講中的其他亮點還有:
- 發(fā)布半定制化NVLink Fusion(混搭,有IP就可用)
- 推出英偉達(dá)AI數(shù)據(jù)平臺
- 宣布與迪士尼合作機器人項目
下面一起來看。
“買的越多,創(chuàng)造的越多”
今年第三季度,英偉達(dá)主打產(chǎn)品將升級到Blackwell架構(gòu)GB300超級芯片。
與GB200相比,GB300在算力和內(nèi)存上約提升50%,網(wǎng)絡(luò)連接性能則提升1倍。
2個超級新品組成1個計算節(jié)點(node),老黃在現(xiàn)場還拆開實物,詳細(xì)展示了其內(nèi)部構(gòu)造。
2018年的Sierra超級計算機中包含18000塊英偉達(dá)Volten架構(gòu)GPU,如今一個Blackwell計算節(jié)點就可提供同等的算力。
按黃式數(shù)學(xué),這叫6年時間性能提升約4000倍。
將這些節(jié)點連接在一起就需要NVLink,這次老黃重點了系統(tǒng)的“脊柱”NVLink Spine,內(nèi)含總長兩英里(3.218公里)的5000條銅纜,將每塊芯片之間全互聯(lián),實現(xiàn)每秒14.4TB的全連接帶寬。
這次宣布的新品則是NVLink Fusion,允許合作伙伴將NVLink技術(shù)應(yīng)用于定制的機架。
也就是說,非英偉達(dá)的CPU和其他加速器也可以與英偉達(dá)產(chǎn)品結(jié)合使用,同時享有NVLink的高速連接。
數(shù)據(jù)中心產(chǎn)品之外,英偉達(dá)在桌面產(chǎn)品上再次發(fā)力。
老黃先透露,之前宣布的個人AI計算機DGX Spark已全面投產(chǎn),將于數(shù)周內(nèi)上市。
DGX Spark采用英偉達(dá)GB10芯片,能夠提供每秒1000萬億次的AI運算,用于微調(diào)和推理最新AI模型。
升級款DGX Station,則首次搭載了與數(shù)據(jù)中心同款的GB300超級芯片。
英偉達(dá)表示DGX Station屬于全新設(shè)計的計算機類別,適用于在桌面上開發(fā)和運行大規(guī)模AI訓(xùn)練和推理工作負(fù)載。
高達(dá)784GB的大容量統(tǒng)一內(nèi)存,最高支持運行1T參數(shù)的大模型,也就是說671B的滿血DeepSeek R1能跑一個半。
面向企業(yè)的RTX Pro Server搭載了8塊RTX PRO 6000服務(wù)器版GPU,96GB GDDR7內(nèi)存,1.6TB/s內(nèi)存帶寬。
一臺RTX Pro Server機架包括4臺RTX PRO Server服務(wù)器,提供120PFlops的FP4峰值算力。
現(xiàn)場也特意用了DeepSeek R1模型的測試數(shù)據(jù),每花費500萬美元,RTX PRO Server的性價比是H100的四倍。
花更少的錢,生成更多的token。
對于這一系列新品,老黃這次改變了促銷口號。
從“買的越多,省得越多”,變成了“買的越多,創(chuàng)造的越多”。
GPU之外一系列新發(fā)布
老黃表示,人類要查詢像SQL這樣的結(jié)構(gòu)化數(shù)據(jù),而AI想要查詢的是非結(jié)構(gòu)化數(shù)據(jù),因此需要打造新型存儲平臺,也就是NVIDIA AI數(shù)據(jù)平臺。
這個新型的存儲平臺不再是依靠CPU,而是配備計算GPU。
并且打造了一個新型查詢系統(tǒng)——Nvidia AIQ或IQ,就像SQL服務(wù)器、SQL軟件和文件存儲軟件一樣,類似一個復(fù)雜的軟件層。
他還提到,加速運算始于CUDA-X,這個集合幾乎包含了所有領(lǐng)域的加速運算。
比如,Aerial和Sionna能夠?qū)I帶到5G和6G;Monai可以用于醫(yī)學(xué)成像;Earth-2用于天氣預(yù)報;Coup quantum用于量子經(jīng)典計算架構(gòu);以及Megatron、Dynamo、NIXL等包含了深度學(xué)習(xí)所有的訓(xùn)練庫。
英偉達(dá)正在研究一類量子經(jīng)典或量子GPU計算平臺——CUDAQ,與全球優(yōu)秀企業(yè)合作,將AI帶入5G和6G。
并且,老黃還提到未來的超級計算機就是具有QPU和GPU的QPU。
物理AI,是機器人革命的基石。
老黃舉了個例子,比如說滾動一個球,根據(jù)球的速度,它可能到了汽車底下或者汽車的另一邊,但它沒有消失;又比如面前有張桌子,最好的選擇是繞過它或者鉆過去,而不是直接穿過它。
在人工智能時代,AI能夠推理類似的物理事件是極其重要的。
而如今要做的事情就是研究一種能夠根據(jù)提示自主生成視頻,然后進(jìn)行訓(xùn)練的機器人。
在此構(gòu)想之下,英偉達(dá)/谷歌DeepMind/迪士尼合作開發(fā)了專為機器人開發(fā)而構(gòu)建的新一代開源物理引擎Newton,可讓機器人學(xué)習(xí)如何以更高的精度處理復(fù)雜任務(wù)。
One More Thing
除了演講現(xiàn)場火爆,在會場外的英偉達(dá)紀(jì)念品攤位這次也很受歡迎。
亮點是其中的文化衫,印滿了老黃的Q板頭像。
只能說,老黃現(xiàn)在是明星級待遇。
視頻回放:
https://www.youtube.com/watch?v=TLzna9__DnI
參考鏈接:
[1]https://www.nvidia.com/en-us/products/workstations/dgx-station/
[2]https://nvidianews.nvidia.com/news/nvidia-rtx-pro-servers-speed-trillion-dollar-enterprise-it-industry-transition-to-ai-factories
[3]https://x.com/JSolomonCNBC/status/1924245721311809845
— 完 —
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.