網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

英偉達(dá)新“桌面超算”800GB大內(nèi)存，滿血DeepSeek R1能裝1個半

2025-05-19 16:09:21　來源: 量子位

臺灣舉報

分享至

夢晨聞樂發(fā)自凹非寺
量子位 | 公眾號 QbitAI

英偉達(dá)官宣新辦公室落戶中國臺灣省臺北市，但居然是從太空飛下來的嗎？

當(dāng)然，這只是黃仁勛在Computex大會上展示的CG特效，但背后還有這樣一層意思：

如此逼真的畫面中，只有1/10的像素是顯卡渲染的，剩下全部內(nèi)容為AI預(yù)測。

當(dāng)初是GeForce顯卡讓AI成為現(xiàn)實，現(xiàn)在AI反過來給GeForce顯卡帶來顛覆性變革。

除了正式宣布新辦公室地址，會上英偉達(dá)還宣布多款重磅新品：

面向個人有DGX Station，在桌面跑1T參數(shù)大模型，這回刀法也不用了，足足給到800GB內(nèi)存。

面向企業(yè)有RTX PRO Server，可加速從AI智能體、物理AI、科學(xué)計算到渲染、3D圖形和視頻等各種用例。

同時老黃還表示英偉達(dá)正在經(jīng)歷一次轉(zhuǎn)型，從一家芯片公司擴展到一家AI基礎(chǔ)設(shè)施公司。

過去幾十年，英偉達(dá)從造GPU芯片到造超算系統(tǒng)，現(xiàn)在造數(shù)據(jù)中心都已經(jīng)不滿足了，接下來要交付的是“星際之門”、xAI Colossus超級計算集群這樣的大項目。

老黃表示，AI基礎(chǔ)設(shè)施市場將以數(shù)萬億美元衡量。

此外，這場演講中的其他亮點還有：

發(fā)布半定制化NVLink Fusion（混搭，有IP就可用）
推出英偉達(dá)AI數(shù)據(jù)平臺
宣布與迪士尼合作機器人項目

下面一起來看。

“買的越多，創(chuàng)造的越多”

今年第三季度，英偉達(dá)主打產(chǎn)品將升級到Blackwell架構(gòu)GB300超級芯片。

與GB200相比，GB300在算力和內(nèi)存上約提升50%，網(wǎng)絡(luò)連接性能則提升1倍。

2個超級新品組成1個計算節(jié)點(node)，老黃在現(xiàn)場還拆開實物，詳細(xì)展示了其內(nèi)部構(gòu)造。

2018年的Sierra超級計算機中包含18000塊英偉達(dá)Volten架構(gòu)GPU，如今一個Blackwell計算節(jié)點就可提供同等的算力。

按黃式數(shù)學(xué)，這叫6年時間性能提升約4000倍。

將這些節(jié)點連接在一起就需要NVLink，這次老黃重點了系統(tǒng)的“脊柱”NVLink Spine，內(nèi)含總長兩英里（3.218公里）的5000條銅纜，將每塊芯片之間全互聯(lián)，實現(xiàn)每秒14.4TB的全連接帶寬。

這次宣布的新品則是NVLink Fusion，允許合作伙伴將NVLink技術(shù)應(yīng)用于定制的機架。

也就是說，非英偉達(dá)的CPU和其他加速器也可以與英偉達(dá)產(chǎn)品結(jié)合使用，同時享有NVLink的高速連接。

數(shù)據(jù)中心產(chǎn)品之外，英偉達(dá)在桌面產(chǎn)品上再次發(fā)力。

老黃先透露，之前宣布的個人AI計算機DGX Spark已全面投產(chǎn)，將于數(shù)周內(nèi)上市。

DGX Spark采用英偉達(dá)GB10芯片，能夠提供每秒1000萬億次的AI運算，用于微調(diào)和推理最新AI模型。

升級款DGX Station，則首次搭載了與數(shù)據(jù)中心同款的GB300超級芯片。

英偉達(dá)表示DGX Station屬于全新設(shè)計的計算機類別，適用于在桌面上開發(fā)和運行大規(guī)模AI訓(xùn)練和推理工作負(fù)載。

高達(dá)784GB的大容量統(tǒng)一內(nèi)存，最高支持運行1T參數(shù)的大模型，也就是說671B的滿血DeepSeek R1能跑一個半。

面向企業(yè)的RTX Pro Server搭載了8塊RTX PRO 6000服務(wù)器版GPU，96GB GDDR7內(nèi)存，1.6TB/s內(nèi)存帶寬。

一臺RTX Pro Server機架包括4臺RTX PRO Server服務(wù)器，提供120PFlops的FP4峰值算力。

現(xiàn)場也特意用了DeepSeek R1模型的測試數(shù)據(jù)，每花費500萬美元，RTX PRO Server的性價比是H100的四倍。

花更少的錢，生成更多的token。

對于這一系列新品，老黃這次改變了促銷口號。

從“買的越多，省得越多”，變成了“買的越多，創(chuàng)造的越多”。

GPU之外一系列新發(fā)布

老黃表示，人類要查詢像SQL這樣的結(jié)構(gòu)化數(shù)據(jù)，而AI想要查詢的是非結(jié)構(gòu)化數(shù)據(jù)，因此需要打造新型存儲平臺，也就是NVIDIA AI數(shù)據(jù)平臺。

這個新型的存儲平臺不再是依靠CPU，而是配備計算GPU。

并且打造了一個新型查詢系統(tǒng)——Nvidia AIQ或IQ，就像SQL服務(wù)器、SQL軟件和文件存儲軟件一樣，類似一個復(fù)雜的軟件層。

他還提到，加速運算始于CUDA-X，這個集合幾乎包含了所有領(lǐng)域的加速運算。

比如，Aerial和Sionna能夠?qū)I帶到5G和6G；Monai可以用于醫(yī)學(xué)成像；Earth-2用于天氣預(yù)報；Coup quantum用于量子經(jīng)典計算架構(gòu)；以及Megatron、Dynamo、NIXL等包含了深度學(xué)習(xí)所有的訓(xùn)練庫。

英偉達(dá)正在研究一類量子經(jīng)典或量子GPU計算平臺——CUDAQ，與全球優(yōu)秀企業(yè)合作，將AI帶入5G和6G。

并且，老黃還提到未來的超級計算機就是具有QPU和GPU的QPU。

物理AI，是機器人革命的基石。

老黃舉了個例子，比如說滾動一個球，根據(jù)球的速度，它可能到了汽車底下或者汽車的另一邊，但它沒有消失；又比如面前有張桌子，最好的選擇是繞過它或者鉆過去，而不是直接穿過它。

在人工智能時代，AI能夠推理類似的物理事件是極其重要的。

而如今要做的事情就是研究一種能夠根據(jù)提示自主生成視頻，然后進(jìn)行訓(xùn)練的機器人。

在此構(gòu)想之下，英偉達(dá)/谷歌DeepMind/迪士尼合作開發(fā)了專為機器人開發(fā)而構(gòu)建的新一代開源物理引擎Newton，可讓機器人學(xué)習(xí)如何以更高的精度處理復(fù)雜任務(wù)。

One More Thing

除了演講現(xiàn)場火爆，在會場外的英偉達(dá)紀(jì)念品攤位這次也很受歡迎。

亮點是其中的文化衫，印滿了老黃的Q板頭像。

只能說，老黃現(xiàn)在是明星級待遇。

視頻回放：
https://www.youtube.com/watch?v=TLzna9__DnI

參考鏈接：
[1]https://www.nvidia.com/en-us/products/workstations/dgx-station/
[2]https://nvidianews.nvidia.com/news/nvidia-rtx-pro-servers-speed-trillion-dollar-enterprise-it-industry-transition-to-ai-factories
[3]https://x.com/JSolomonCNBC/status/1924245721311809845

— 完 —

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.