99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

英偉達新GPU再王炸,也得靠蹭DeepSeek賣卡

0
分享至



作者|Hayward

原創首發|藍字計劃

一身皮衣黃仁勛,GTC 2025上意氣風發。

雖然最近英偉達的股票跌得比較狠,甚至來到了10年來的最低點,但這不影響老黃,對最新的GPU們信心滿滿。

時間回撥到2月初,DeepSeek的發布在AI領域掀起巨浪。一個中國團隊的產品,僅用了少量的低端GPU(以A100為主)蒸餾現有超大模型就實現了高端GPU(以H100為代表)才有的性能。

高端GPU并非剛需,誰還成噸地采購你老黃的Hopper、Blackwell 核彈?過去在AI行業被奉為金科玉律的“Scaling Law”(規模定律),也就是“模型參數量、數據集、訓練成本越多越好”的觀念也被嚴重沖擊。

這幾年谷歌、Meta、微軟等互聯網大廠成噸地采購H100芯片以維持規模,正是想以算力分勝負、定生死。現在根本不需要如此恐怖的規模,也能讓大模型擁有媲美 OpenAI o1的性能。

一時間,宣稱DeepSeek能讓英偉達走上末路的聲音此起彼伏,特別是海外的社媒平臺發酵最快、傳播最兇。有X網友更坦言“英偉達的一切都將開始瓦解”,這段時間里英偉達的股票一天下跌13%、17%都成了常態。

不過,也有另一種聲音稱,從長期來看DeepSeek的成功反而利好英偉達。

DeepSeek揭示了可以通過“蒸餾現有超大模型”的方法訓練性能出色的大模型,但只是不需要用到H100芯片這等性能怪獸而已,并非完全不依賴計算卡。A100計算卡,也是英偉達家的產品。

玩家的門檻降低了,入場的玩家自然會越來越多,從市場總量來說,對算力的需求還是會上升的。英偉達又是全世界最大的卡販子,總會賣出更多的計算卡。

再說了要蒸餾現有的超大模型,也得先有性能出色的超大模型存在才行,到底還是需要H100這樣的計算卡集群來訓練超大模型,這似乎是個“先有雞還是有蛋”的問題。

只能說兩種聲音都有道理,不過大家最想知道的還是老黃本人的聲音。

這次GTC 2025,我們終于等到老黃的親自回應。



還是那個GPU霸主

按照慣例,我們先來回顧一下這場光門票就要價1萬美元的“科技盛宴”。

簡單來說,英偉達主要發布了四款芯片架構兩款AI電腦一款AI訓練底層軟件和展示了具身機器人相關的進展,其他內容就不贅述了。

· 4款AI芯片架構,分別是將在2025下半年發布的Blackwell Ultra、2026下半年發布的Vera Rubin、2027下半年發布的Vera Rubin Ultra,和2028年的Feynman

全新的超級芯片產品方面,基于Blackwell Ultra架構的GB300 NVL72芯片是上代最強芯片GB200的繼任者,推理是GB200 NVL72的1.5倍,提升幅度不算大,甚至在大會上GB300的直接對比對象還是2年前的H100。



從市場的反應來看大部分人對GB300不太買賬,它沒有上一代GB200的那種“橫空出世”的驚喜感,要說最大的升級點,可能是HBMe內存提升至288GB,就是有點“蘋果今年發布的新機是2TB版本的iPhone 16 Pro Max”的味道了。

重頭戲是英偉達未來的芯片架構規劃,下代超級芯片Rubin NVL144,比GB300 NVL72 強了3.3倍;下下代的Rubin Ultra NVL576性能是GB300 NVL72的14倍,從畫餅給出的性能來看,未來大概率還是會由英偉達掌握GPU算力王座。



· 兩款全新的AI電腦,分別是搭載了GB10 Grace Blackwell超級芯片的DGX Spark,每秒可提供高達 1000 萬億次 AI 運算;搭載了GB300 Grace Blackwell Ultra的DGX Station,可以提供每秒可提供高達2000 萬億次 AI 運算。目前DGX Spark已經開始預售,要價3000美元。

· 開源軟件NVIDIA Dyamo,可以簡單理解為一款AI工廠(數據中心)的操作系統,英偉達說在NVIDIA Blackwell上使用Dynamo優化推理,能讓DeepSeek-R1的吞吐量提升30倍。

· 具身機器人的技術儲備,包括機器人通用基礎模型Isaac GR00T N1、一款配備了GR00T N1模型的機器人:Blue,和Google Mind、迪士尼合作的最新成果。



從發布的產品來看,英偉達還是那個GPU領域的霸主,甚至領導地位已經開始向AI拓展。它們不僅將產品技術路線圖更新至一年一更,未來三年的產品堪稱“超級大餅”,圍繞AI相關的軟件建設也在飛速推進,NVIDIA Dyamo很可能會是未來數據中心的標配。

對于DeepSeek的沖擊,英偉達似乎也有了解決的辦法。



進入“token時代”

終于,黃仁勛首次在公開場合,正面回應了DeepSeek誕生以來對公司造成的沖擊。

首先他把DeepSeek從頭到腳吹了一遍,說DeepSeek R1模型是“卓越的創新”“世界級的開源推理模型”,而且他淡定地表示,不理解為什么大家會把DeepSeek當成英偉達的末日。

至于因DeepSeek而起的關于Scaling Law撞墻的討論,老黃在會上給出了自己的理解。

首先,他在大會上對Scaling Law進行了一次迭代更新:



現在他將Scaling Law細化為PRE-TRAINING SCALINGPOST-TRAINING SCALINGTEST-TIME SCALING三個部分。老黃的意思是,隨著AI進入到不同階段,對Scaling的需求是不斷提高的。

這里要提一下,老黃認為AI的發展分為四個階段:感知人工智能(Perception AI)、生成式人工智能(Generative AI)、代理人工智能(Agentic AI)和未來的物理 AI(Physical AI)。而現在我們正處于代理人工智能階段。



現階段由于推理模型、AI代理的爆發,實際上更加需要Scaling,更加需要算力。

其背后的關鍵是token

以推理模型為例子,模型進行推理時,token的消耗猛漲。用老黃的話,我們不僅需要讓token的吞吐量提升十倍,還需要過去10倍的算力來提升token的輸出速度,最終,需要的算力是之前的100倍

從技術上來說,這不無道理。相比傳統的生成式模型,比如ChatGPT,我們觀察到它沒有列舉推理步驟。輸入問題 → 提供答案,沒中間商差價,答案所呈現的就是最終消耗的token數。

而擁有思維鏈的推理式模型,比如大家熟知的DeepSeek R1,會有一連串的推理過程,有些時候可能推理過程的字數比答案還要多。

R1模型能夠實現推理,是因為會將輸出的token返回上級重新思考、推理,正如比喻大師老黃所說的“每個token都會自我懷疑”,在不斷的懷疑-論證中,形成了推理的過程。但這也會更多地消耗算力和token,推理模型要比傳統生成式模型多消耗的token不是2倍,而是20倍

所以,我們用推理模型時,一大串的思考、推理過程要在前臺展示出來,不僅因為用戶可以從大模型的推理過程介入修正答案,還因為它們不是白送的,不是免費的,而是在消耗一個個token,都是真金白銀,花了錢的地方肯定得讓你看到。

而且市面上的推理模型越來越多,更多的傳統模型也陸續開始加入推理過程,比如谷歌的Gemini,最終token的消耗會呈指數級增長。

這就是老黃堅信Scaling Law沒有失效的底氣。在會上,老黃用傳統模型Llama 3.3 70B與DeepSeek R1 671B進行了對比,統一回答一個復雜問題。最終前者消耗了400多個token但結果不可用,后者的結果堪稱完美,但足足消耗了8559個token。



或許從蒸餾大模型的點子中節約的算力,又會消耗到推理的過程中,說不準這就是AI算力中的能量守恒呢。



DeepSeek讓英偉達GPU賣得更好

除了黃仁勛的激情論證,一個事實是,在這個高token消耗時代,英偉達的GPU的確賣得更猛了。

彭博社報道,OpenAI 預計在「星際之門」首期計劃中,建立一個可以容納40萬個英偉達的 AI 芯片的數據中心綜合體。全部裝滿的話,這會是世界最大的AI算力集群之一。



還有對算力推崇至極的馬斯克,旗下的 xAI 已與戴爾達成 50 億美元協議,用于在孟菲斯建設超級計算機的 AI 服務器;Meta也宣布計劃要擁有相當于 600,000 塊英偉達 H100 芯片的算力。

還有國內的阿里、小米、騰訊等公司,也將部署海量算力作為主要目標。這背后的顯卡供應商,毫無疑問都主要來自英偉達。推理模型鋪開后大公司們對計算卡、算力的熱情絲毫不減,看來至少大公司們仍相信未來是算力的時代。

在個人本地部署領域,DeepSeek R1也沒有真正地減輕個人用戶的算力負擔。

2月中,全網掀起了一陣本地部署DeepSeek R1蒸餾模型的熱潮,但從個人的經驗來看,想要得到較好的模型性能,對電腦配置,也就是算力的要求一點都不低。

以RTX 4080 16GB顯卡為例,擁有9728個CUDA核心,16GB GDDR6X的顯存帶寬為736 GB/s,在顯卡中已經算高端。

但用它在本地部署14B的DeepSeek R1蒸餾模型時,大部分的推理速度只有20-30 tokens/s,需要分析深度問題往往需要等待超過10分鐘。

如果更進一步用它來部署32B的蒸餾模型,推理速度會進一步下降到5-15 tokens/s,生成同樣的回答,就需要等待超過30分鐘。

這樣的效率顯然是不行的。如果想要提高推理速度,有兩個辦法:

選擇更小參數的蒸餾模型部署,但推理的精度、答案的可靠性會明顯下降;

選擇更高配置的硬件,比如RTX 5080/5090,用5090部署32B的蒸餾模型,推理速度也能達到50-60 tokens/s,效率明顯提升,但又讓老黃賣卡的計劃通了。

也許大多數人的算力條件,本地部署的大模型還不如直接打開騰訊元寶高效。

因此,從DeepSeek R1引申出來的“蒸餾模型節省訓練算力”已經被“推理模型消耗算力”抵消,這給了英偉達全新的機遇,可以說DeepSeek的出現為英偉達關上了一扇門,又打開了一扇窗。

最終,我們不得不承認長遠來看算力的需求還會不斷增加,還是利好英偉達。雖說今年Blackwell Ultra擠牙膏,但后面幾年的芯片架構都會有明顯的算力提升。當各大廠的算力吃緊時,老黃的核彈們,又有大展拳腳的機會了。



販賣token焦慮?

縱觀GTC 2025,只要是涉及AI、GPU、算力的部分,老黃都離不開token,甚至有好事的媒體專門統計了他在會上提到“token”的次數,還怪幽默的。

在新Scaling Law時代,token仿佛成了英偉達的救命稻草。雖然從邏輯上看老黃的觀點說得通,但如此頻繁地重復一種邏輯,就像我們在文章中連續寫100次“token”,多少會有人覺得,英偉達有點歇斯底里。

自農歷新年以來,英偉達的市值已經跌去了將近30%,這次發布會的黃仁勛不再像一個技術大拿,不像是那個“全世界最聰明的科學家”、“全球最牛公司的CEO”,而像一個絮絮叨叨的金牌銷售,通過販賣token焦慮的方式,讓大家堅信英偉達仍掌握著未來

不過投資者的信心不來自推銷和布道,而來自產品。事實就是今年下半年面世的GB300確實沒有太多亮點,畫的大餅又比較遙遠。反映到股價上,發布會結束后英偉達的股價依然下跌了3.4%。

其實更令我哭笑不得的是價值3000美元的DGX Spark,根據官網披露的信息這款產品的128GB內存,帶寬只有273GB/s。



盡管老黃將它定義為“可用于本地部署”的AI電腦,但這性能真不敢恭維。不說滿血版671B的DeepSeek R1,跑大部分32B的模型可能也只能實現2-5 tokens/s的輸出效率。用它來跑傳統的模型應該還不賴,但推理模型估計是很困難了。

或許它存在的意義,停留在“讓大家買更強的DGX Station”上罷了。只是如果你一直在販賣token焦慮,最好能拿出更多能解決token焦慮的產品來。

英偉達現在缺乏的不是技術和產品,在GPU領域一騎絕塵,第二名都看不到車尾燈;真正缺乏的,是對消費者的誠意。

參考資料:

APPSO 《剛剛,黃仁勛甩出三代核彈AI芯片!個人超算每秒運算1000萬億次,DeepSeek成最大贏家》

第一財經 《凌晨,黃仁勛重大宣布!》

圖片來源:GTC March 2025 Keynote with NVIDIA CEO Jensen Huang

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這樣躺著睡,就像吃了補藥一樣,陽氣直線上升,簡單又高效!

這樣躺著睡,就像吃了補藥一樣,陽氣直線上升,簡單又高效!

罐兒哥中醫自媒體
2025-06-03 14:51:09
基輔地下導彈基地遭36枚Kh-101導彈轟炸,俄軍面臨絕境

基輔地下導彈基地遭36枚Kh-101導彈轟炸,俄軍面臨絕境

觀察者小海風
2025-06-08 16:48:33
央視報道!醫院免陪護全國推行,費用不納入醫保,每天最高280元

央視報道!醫院免陪護全國推行,費用不納入醫保,每天最高280元

新時代的兩性情感
2025-06-06 15:56:28
反轉!伊萬下課時間敲定,肇俊哲:讓鄭智帶國足,為國產教練正名

反轉!伊萬下課時間敲定,肇俊哲:讓鄭智帶國足,為國產教練正名

何老師呀
2025-06-08 14:57:33
小別勝新婚是什么體驗?網友:成年人的世界好污啊

小別勝新婚是什么體驗?網友:成年人的世界好污啊

解讀熱點事件
2025-06-05 00:10:03
2025暑期檔票房破5億,《碟中諜8》斷層領先,《哪吒2》位列第七

2025暑期檔票房破5億,《碟中諜8》斷層領先,《哪吒2》位列第七

影視高原說
2025-06-08 09:50:36
搞笑女子爆笑笑話,女子不解地問男友,為什么男人有很多女友會被羨慕而女人

搞笑女子爆笑笑話,女子不解地問男友,為什么男人有很多女友會被羨慕而女人

天天明星
2025-06-07 15:57:40
北京一家人聚餐,喝6瓶老茅臺,保潔撿走酒瓶變賣,沒想到買套樓

北京一家人聚餐,喝6瓶老茅臺,保潔撿走酒瓶變賣,沒想到買套樓

濤哥美食匯
2025-06-05 08:48:18
80年去相親,岳父讓我和他兒媳睡在一屋,那晚的情形讓我終生難忘

80年去相親,岳父讓我和他兒媳睡在一屋,那晚的情形讓我終生難忘

民間精選故事匯
2025-05-29 06:10:03
貴州畢節一玉米地現深坑,“一眼看不到底” 鎮政府:目前原因不明,應要回填

貴州畢節一玉米地現深坑,“一眼看不到底” 鎮政府:目前原因不明,應要回填

極目新聞
2025-06-08 13:07:18
病理學專家、復旦大學教授應越英逝世,享年100歲

病理學專家、復旦大學教授應越英逝世,享年100歲

澎湃新聞
2025-06-07 20:48:31
新版人民幣全面落地!紙幣會被取代?蘇州6年試點揭曉真相

新版人民幣全面落地!紙幣會被取代?蘇州6年試點揭曉真相

搬磚營Z
2025-06-08 01:52:44
十個保護自己最好的方式,建議大家一定要看看

十個保護自己最好的方式,建議大家一定要看看

荷蘭豆愛健康
2025-06-07 05:14:45
朝鮮“重大事故”驅逐艦修復平衡性并安全下水

朝鮮“重大事故”驅逐艦修復平衡性并安全下水

新京報
2025-06-06 08:37:12
珠海偶遇陳豪夫婦,陳茵媺其實挺漂亮的,但這身打扮顯得有點老

珠海偶遇陳豪夫婦,陳茵媺其實挺漂亮的,但這身打扮顯得有點老

老吳教育課堂
2025-06-07 16:12:34
心理學上有一個詞:指責型人格(跟誰在一起,就是誰的災難)

心理學上有一個詞:指責型人格(跟誰在一起,就是誰的災難)

第一心理
2025-06-07 18:11:07
當你老了,父母也走了,再去兄弟姐妹家吃頓飯,就會看到三種因果

當你老了,父母也走了,再去兄弟姐妹家吃頓飯,就會看到三種因果

煙臺秀姐
2025-06-07 08:55:58
杭州西子電梯掌門人突然墜亡,警方排除他殺,知情人透露真相

杭州西子電梯掌門人突然墜亡,警方排除他殺,知情人透露真相

任紀煙
2025-06-08 10:38:15
美國100%想對中國開戰,中國對美國霸權的沖擊,遠超當年的伊拉克

美國100%想對中國開戰,中國對美國霸權的沖擊,遠超當年的伊拉克

瀘沽湖
2025-05-22 10:26:23
高考前夕韋東奕又火了!缺牙不找對象原因曝光,張雪峰真說對了!

高考前夕韋東奕又火了!缺牙不找對象原因曝光,張雪峰真說對了!

夢史
2025-06-07 09:27:11
2025-06-08 17:39:00
藍字計劃 incentive-icons
藍字計劃
記錄智能時代的每一次浪潮!前沿科技捕手,AI產品深度洞察。
154文章數 3838關注度
往期回顧 全部

數碼要聞

名額“限量供應”!多地家電國補按下暫停鍵 新一輪政策或已在路上|傳真

頭條要聞

特朗普派國民警衛隊前往洛杉磯后發文:加州州長無能

頭條要聞

特朗普派國民警衛隊前往洛杉磯后發文:加州州長無能

體育要聞

冠軍高芙:只要專注自己 太陽就會照常升起

娛樂要聞

結婚15年紀念!孫儷發長文談夫妻感情

財經要聞

暴漲超9%!白銀狂飆,“搶奪”黃金光環!

科技要聞

馬斯克"越紅線",美政府急尋SpaceX替代品

汽車要聞

復古造型樂趣依舊 寶馬R12 nineT又帥又好騎

態度原創

時尚
手機
游戲
健康
親子

50+女人別再盲目跟風,掌握這凍齡3個秘籍,穿出時髦感不費力

手機要聞

古爾曼:iOS 26將推出全新“游戲”應用,取代Game Center功能

《GTA6》再爆猛料:主角擁有“死神之眼”!

減重專家破解減肥九大謠言!

親子要聞

很多人不信的育兒真相:戶外有多重要

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南通市| 灵台县| 丹阳市| 龙江县| 广州市| 茂名市| 兴海县| 清水河县| 胶南市| 孟津县| 枣庄市| 小金县| 陆川县| 绩溪县| 栾城县| 宜兰县| 扶沟县| 乐清市| 正定县| 永清县| 桑日县| 开鲁县| 广河县| 建德市| 双流县| 太保市| 克山县| 天峨县| 屯门区| 宁陵县| 温宿县| 乌拉特前旗| 凤城市| 宁安市| 乡宁县| 安远县| 社旗县| 漳浦县| 林西县| 保德县| 湘潭市|