99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

太猛了!英偉達讓 Deepseek R1 編寫 GPU 內核,結果 R1 寫的比熟練工程師還好

0
分享至


DeepSeek 又上大分!

英偉達使用 DeepSeek-R1 讓 AI 自動生成 GPU 內核代碼,結果效果超越人類工程師,更離譜的是在 KernelBench Level 1 上實現了 100% 的數值正確性


我們一起來扒一扒事情原委:

隨著 AI 模型越來越強大,要解決的問題也越來越復雜。這時候,一種叫做“推理時序 scaling” (inference-time scaling)的新技巧就火了起來,聽起來高大上,其實說白了,就是給 AI更多的時間去思考

就像我們人類解難題一樣,難題太復雜?那就多花點時間,多想想不同的解法,最終選出最優(yōu)方案!“推理時序 scaling” 就是讓 AI 在推理過程中,分配更多的計算資源,嘗試更多可能性,最終找到最佳答案。這也被稱為AI 的“reasoning” 或 “l(fā)ong-thinking” (長思考)能力

這次 Nvidia 的工程師們就用DeepSeek-R1模型,加上“推理時序 scaling”技術,搞了個實驗,結果讓人驚掉下巴!他們想讓 AI自動生成 GPU 上的 Attention (注意力機制) 內核代碼

要知道,Attention 機制可是大語言模型的基石,但是它的計算量巨大,尤其是處理長文本的時候,簡直是性能殺手!所以,優(yōu)化 Attention 內核代碼就顯得尤為重要。這活兒非常考驗技術,經驗豐富的工程師也要花費大量時間和精力

更麻煩的是,Attention 機制還有各種變體 (比如 causal, relative positional embeddings 等等),多模態(tài)模型 (比如 vision transformers) 還會引入更復雜的 Attention 機制 (Spatial Neighborhood Attention), 人工優(yōu)化簡直要命!

但是!Nvidia 這次直接讓DeepSeek-R1 模型上陣,自動生成這些復雜的 GPU 內核代碼!而且還用上了 “推理時序 scaling” 的大招!

?? “閉環(huán)驗證” + “長時間推理” = 超強 AI 代碼生成器!

Nvidia 的工程師們設計了一個巧妙的“閉環(huán)驗證” (closed-loop)工作流程。簡單來說就是:


  1. 1. 人工給 DeepSeek-R1 模型一個初始 prompt (指令),告訴它要生成什么樣的 GPU 內核代碼


  2. 2. DeepSeek-R1 生成第一版代碼

  3. 3. “驗證器” (verifier) 在 Nvidia H100 GPU 上運行生成的代碼,并進行分析

  4. 4. 驗證器根據分析結果,生成新的 prompt,反饋給 DeepSeek-R1 模型

  5. 5. DeepSeek-R1 模型根據新的 prompt,繼續(xù)優(yōu)化代碼

這個過程就像一個AI 程序員和 AI 代碼評審員之間的持續(xù)對話,不斷迭代優(yōu)化代碼。更厲害的是,Nvidia 工程師們讓這個過程持續(xù)了 15 分鐘!這就是 “推理時序 scaling” 的威力!給 AI 足夠的時間,它就能不斷改進,最終達到驚人的效果!

KernelBench 權威評測:100% Level-1 問題搞定!96% Level-2 問題拿下!

效果怎么樣呢?數據說話!Nvidia 用 Stanford 的KernelBench 基準測試來評估生成的內核代碼。結果顯示,對于Level-1 難度的問題,DeepSeek-R1 生成的代碼 100% 數值正確!對于 Level-2 難度的問題,也達到了 96% 的正確率!


在某些情況下,DeepSeek-R1 生成的內核代碼,性能甚至超過了經驗豐富的工程師手工優(yōu)化的代碼!

推理時間越長,效果越好!

英偉達還展示了“推理時間預算” (inference-time budget)對模型性能的影響。分配給 AI 更多的時間 (超過 10 分鐘),就能顯著提高代碼的正確率!這再次證明了 “推理時序 scaling” 的有效性

Nvidia 這次實驗,無疑展示了DeepSeek-R1 模型“推理時序 scaling”技術在GPU 內核自動生成領域的巨大潛力

未來 AI 可以自動優(yōu)化各種底層代碼,程序員可以把更多精力放在更高層次的創(chuàng)新上,這將極大地加速 AI 技術的發(fā)展!

當然,Nvidia 也承認,這還只是一個開始,要實現更廣泛、更穩(wěn)定的應用,還需要更多的研究和努力。但無論如何,這都是一個激動人心的開端

參考:

https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
瓜達爾港投資了多少,建設了多少年,建成后為什么幾乎沒有輪船停靠?

瓜達爾港投資了多少,建設了多少年,建成后為什么幾乎沒有輪船停靠?

高博新視野
2025-06-23 16:19:10
美軍發(fā)射12枚鉆地彈都沒打穿了?美軍破防:衛(wèi)星照片出現驚人一幕

美軍發(fā)射12枚鉆地彈都沒打穿了?美軍破防:衛(wèi)星照片出現驚人一幕

頭條爆料007
2025-06-22 18:38:00
為什么中國不學外國直接給老百姓發(fā)錢,而是喜歡搞各種“國補”?

為什么中國不學外國直接給老百姓發(fā)錢,而是喜歡搞各種“國補”?

李昕言溫度空間
2025-06-23 11:27:12
吳佳妮曝馬景濤暈倒內情:談新女友后身體越來越差,還不敢見孩子

吳佳妮曝馬景濤暈倒內情:談新女友后身體越來越差,還不敢見孩子

檸檬有娛樂
2025-06-24 09:18:56
重組進行時,中國長安汽車集團更名為“辰致汽車科技集團”

重組進行時,中國長安汽車集團更名為“辰致汽車科技集團”

觀察者網
2025-06-24 06:56:12
川普宣布以-伊停火;美國鉆地彈,炸出三個贏家

川普宣布以-伊停火;美國鉆地彈,炸出三個贏家

近距離
2025-06-24 09:34:24
凌晨2時,上海馬路中央突現“橫躺”男子!司機緊急剎車,兩輛共享單車救命...

凌晨2時,上海馬路中央突現“橫躺”男子!司機緊急剎車,兩輛共享單車救命...

上觀新聞
2025-06-24 12:15:27
BBC:前32場世俱杯空座量超過80萬,最低單場僅3412名觀眾

BBC:前32場世俱杯空座量超過80萬,最低單場僅3412名觀眾

雷速體育
2025-06-23 21:27:28
父母離婚二十年,路過外婆家,父親:探望下外婆,推開門后卻淚崩

父母離婚二十年,路過外婆家,父親:探望下外婆,推開門后卻淚崩

不易一字
2025-06-19 17:02:49
中國女排美國站賽程公布,比賽時間有變,贏幾場能進世聯(lián)賽總決賽

中國女排美國站賽程公布,比賽時間有變,贏幾場能進世聯(lián)賽總決賽

體育大學僧
2025-06-24 08:42:52
降維打擊!中超再迎前英超主力鋒霸:身價曾高達3000萬歐!

降維打擊!中超再迎前英超主力鋒霸:身價曾高達3000萬歐!

邱澤云
2025-06-23 17:05:46
3年5400萬美金!獨行俠大手筆簽約,三狀元豪陣沖冠,保羅真香

3年5400萬美金!獨行俠大手筆簽約,三狀元豪陣沖冠,保羅真香

世界體育圈
2025-06-24 11:51:24
上海超過300個小區(qū)發(fā)現活體!2023年,有人稱遛狗被咬傷

上海超過300個小區(qū)發(fā)現活體!2023年,有人稱遛狗被咬傷

萬象硬核本尊
2025-06-23 21:01:32
中國一旦發(fā)生戰(zhàn)爭,要記得第一時間要帶好這5樣東西,才能保命

中國一旦發(fā)生戰(zhàn)爭,要記得第一時間要帶好這5樣東西,才能保命

阿策聊實事
2025-04-27 17:15:00
延邊阿姨大火才幾天,令人惡心的現象發(fā)生了

延邊阿姨大火才幾天,令人惡心的現象發(fā)生了

觀察鑒娛
2025-06-24 10:20:01
大量橫店、北漂的美女演員們,正瘋狂涌向鄭州,業(yè)內人士曝光真相

大量橫店、北漂的美女演員們,正瘋狂涌向鄭州,業(yè)內人士曝光真相

不似少年游
2025-06-24 07:50:03
端莊大方優(yōu)雅又有女人味的旗袍穿

端莊大方優(yōu)雅又有女人味的旗袍穿

美女穿搭分享
2025-06-24 08:23:43
明日六月初一,建議:少吃西瓜和黃瓜,多吃3樣,火氣減人也舒坦

明日六月初一,建議:少吃西瓜和黃瓜,多吃3樣,火氣減人也舒坦

小談食刻美食
2025-06-24 08:03:23
特朗普稱以伊已同意全面停火,停火有那么容易嗎?還會有變數嗎?

特朗普稱以伊已同意全面停火,停火有那么容易嗎?還會有變數嗎?

之乎者也小魚兒
2025-06-24 09:16:34
藏了40年的爸爸竟是陳道明!不拼爹不炒作,怪不得她這么優(yōu)秀

藏了40年的爸爸竟是陳道明!不拼爹不炒作,怪不得她這么優(yōu)秀

卷史
2025-06-14 18:48:15
2025-06-24 14:35:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
731文章數 320關注度
往期回顧 全部

科技要聞

特斯拉股價飆漲8%,但Robotaxi小違章不斷

頭條要聞

媒體:以伊"12天戰(zhàn)爭"迅速走向停火 不符合以總理利益

頭條要聞

媒體:以伊"12天戰(zhàn)爭"迅速走向停火 不符合以總理利益

體育要聞

如果你喜歡籃球,你沒理由不喜歡步行者

娛樂要聞

名校不是護身符,李雪琴更多黑料被扒

財經要聞

以色列和伊朗同意全面停火!

汽車要聞

7.98萬起 firefly螢火蟲推出電池租用購車方案

態(tài)度原創(chuàng)

數碼
健康
本地
教育
公開課

數碼要聞

優(yōu)派推出三款 VG41V 會議顯示器,頂部 5MP Windows Hello 攝像頭

呼吸科專家破解呼吸道九大謠言!

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

教育要聞

高考志愿填報重要參考數據:2025各地高考一分一段表匯總

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 渝中区| 金坛市| 吉安县| 页游| 三都| 霍林郭勒市| 晋州市| 长子县| 腾冲县| 榆树市| 鹿邑县| 连州市| 炎陵县| 台山市| 东莞市| 东海县| 东乌珠穆沁旗| 化州市| 龙川县| 社旗县| 遂昌县| 建湖县| 汉中市| 得荣县| 浮梁县| 库伦旗| 裕民县| 东兰县| 余姚市| 湘西| 瑞丽市| 汤阴县| 廊坊市| 康马县| 吉安市| 洛隆县| 蓬莱市| 保德县| 兴海县| 大渡口区| 永修县|