99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<s id="qi0og"><li id="qi0og"></li></s>

<cite id="qi0og"></cite>

<pre id="qi0og"></pre>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

擴散語言模型寫代碼！速度比自回歸快10倍

2025-07-10 17:15:12　來源: 量子位

北京舉報

0

分享至

聞樂發(fā)自凹非寺
量子位 | 公眾號 QbitAI

誰說擴散模型只能生成圖像和視頻？

現(xiàn)在它們能高質(zhì)量地寫代碼了，速度還比傳統(tǒng)大模型更快！

Inception Labs推出基于擴散技術(shù)的全新商業(yè)級大語言模型——Mercury。

Mercury突破了自回歸模型 “從左到右” 逐詞生成的限制，采用 “從噪聲到結(jié)構(gòu)化輸出” 的方式，能一次性預測所有方向的token，提高了生成速度。

這樣一來，Mercury還解決了自回歸“一旦生成難以回頭調(diào)整”的問題。

擴散模型并不是僅考慮前面已經(jīng)生成的內(nèi)容，它能在生成過程中進行動態(tài)糾錯修改，具有更大的靈活性。

盡管采用了擴散技術(shù)，Mercury模型系列仍保留了Transformer架構(gòu)。

這確保了該模型能直接復用近年來為大語言模型開發(fā)的高效訓練、推理優(yōu)化技術(shù)（如低階算子優(yōu)化、超參數(shù)調(diào)優(yōu)工具等）。

實測數(shù)據(jù)顯示，面對相同的編程任務，Mercury的代碼生成速度比傳統(tǒng)工具最多快10倍，大幅縮短了開發(fā)周期。

在H100 GPU上實現(xiàn)1109 tokens/秒吞吐量

Mercury用成熟的Transformer作為神經(jīng)網(wǎng)絡基礎，結(jié)合擴散技術(shù)的并行生成能力，既保留了大模型的兼容性，又突破了自回歸模型逐詞生成的速度限制。

擴散生成流程

Mercury的核心創(chuàng)新在于 “擴散式生成”，流程如下：

訓練階段的正向過程：從真實文本（如代碼片段）出發(fā)，逐步加入噪聲（隨機替換、刪除token等），最終變成完全隨機的噪聲序列。
推理階段的反向過程（核心）：從隨機噪聲開始，通過Transformer模型迭代優(yōu)化，逐步去除噪聲，最終生成符合真實分布的文本。每次迭代中，模型會并行修改多個token，而非逐詞生成。

這一過程擴展了此前的離散擴散方法，通過優(yōu)化數(shù)據(jù)處理和計算邏輯，實現(xiàn)了大規(guī)模訓練（萬億級token）。

高效利用硬件

Mercury主要通過并行化文本生成、動態(tài)去噪調(diào)度、混合精度量化等技術(shù)，極致發(fā)揮GPU性能，實現(xiàn)對硬件的高效利用，降低訓練和推理成本。

并行化文本生成

擴散機制允許模型在單次前向傳播中預測多個token，相較于自回歸模型的“從左到右”逐詞生成，顯著提升了GPU利用率。

在NVIDIA H100 GPU上，Mercury Coder Mini和Mercury Coder Small（Mercury Coder系列編碼優(yōu)化產(chǎn)品）分別實現(xiàn)了1109 tokens/秒和737 tokens/秒的吞吐量。

在Copilot Arena的基準測試中，可將響應時間壓縮至其他工具的1/4，同時硬件資源占用減少60%。

動態(tài)去噪調(diào)度算法

Mercury通過自適應調(diào)整去噪步數(shù)，在簡單任務中減少計算量，在復雜任務中保留足夠迭代次數(shù)，實現(xiàn)精度與效率的平衡，從而更高效地利用硬件資源，避免不必要的計算開銷。

混合精度量化技術(shù)

模型在推理時可自動切換至低精度計算模式，內(nèi)存占用減少30%，同時通過殘差補償機制維持輸出質(zhì)量。這讓Mercury能在有限的硬件內(nèi)存條件下運行，且不明顯影響性能。

強大的錯誤糾正能力

與傳統(tǒng)自回歸模型 “從左到右” 逐詞生成，一旦生成難以回頭調(diào)整不同，Mercury不受限于僅考慮前面已生成的內(nèi)容，能夠在生成過程中動態(tài)修改之前的內(nèi)容，具有更大的靈活性。

雙向注意力機制
Mercury在去噪過程中引入上下文雙向關(guān)聯(lián)，能夠更好地理解文本的前后語境，從而更準確地發(fā)現(xiàn)和糾正錯誤。
實時糾錯模塊
模型在去噪步驟中會同步檢測代碼邏輯漏洞，通過強化學習動態(tài)修正輸出。在代碼生成任務中，Mercury Coder可以自動修正邏輯漏洞，還支持函數(shù)級參數(shù)自動校正，能有效提高代碼的準確性和可用性。
多語言語法樹嵌入
Mercury將Python、Java等語言的抽象語法樹（AST）結(jié)構(gòu)融入擴散過程，有助于減少語法錯誤。

超快響應速度與當前CI能力不匹配

在LLMs出現(xiàn)之前，持續(xù)集成/交付（CI/CD）的速度就已經(jīng)成為一個主要瓶頸，這導致開發(fā)人員在測試時把時間浪費在等待拉取請求（PRs）上。

有時，一個更改操作需要在隊列中等待數(shù)小時，甚至有時會因為不穩(wěn)定需要重新開始。

Mercury模型在編寫代碼方面實現(xiàn)了超高速響應，但如果每次代碼更改都需要數(shù)小時進行測試，那么就像這位網(wǎng)友提出的問題一樣：

即使大模型能夠以比人類快100倍的速度寫代碼，但測試速度跟不上的話，這將沒有什么意義。

于是問題來了：

如何緩解超快響應速度與當前CI能力不匹配的問題？

一些人認為因為開發(fā)人員時間比機器時間昂貴得多，所以可以通過簡單地“投入更多機器”來解決CI速度問題。

然而，也有另一些人指出，這對于谷歌等“印鈔機”公司可能可行，但對于普通公司來說，CI預算是固定的，增加計算資源并不是一件容易的事情。

Inception Labs團隊

Mercury的開發(fā)方Inception Labs的三位聯(lián)合創(chuàng)始人是來自斯坦福、UCLA和康奈爾大學的計算機教授。

其中，Stefano Ermon是擴散模型的共同發(fā)明人，他與Sohl-Dickstein等學者共同構(gòu)建了擴散模型的理論基礎，并通過后續(xù)研究推動了模型的實用化。

另一位創(chuàng)始人Aditya Grover曾在Meta FAIR擔任研究科學家。

攻讀博士學位期間，他先后在谷歌DeepMind、微軟研究院和OpenAI實習。

Volodymyr Kuleshov曾在2018年獲得Arthur Samuel最佳論文獎。

該團隊包括來自Google DeepMind、微軟、Meta、OpenAI和NVIDIA的資深人士，目前正專注于用擴散技術(shù)改進大模型性能。

Inception Labs還開放了Mercury模型的在線體驗平臺。

感興趣的朋友可點擊下方鏈接體驗～

論文地址：https://arxiv.org/abs/2506.17298
Mercury在線體驗平臺：https://chat.inceptionlabs.ai/

參考鏈接：
https://news.ycombinator.com/item?id=44489690

— 完 —

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

擴散語言模型九倍推理加速！KV Cache并非自回歸模型專屬

量子位 2025-05-27 17:02:02
0 跟貼 0
MIT發(fā)布自適應語言模型！新任務，自生成遠超「GPT-4.1合成訓練數(shù)據(jù)」

新智元 2025-07-09 09:28:30
1 跟貼 1

單向VLM變雙向！人大斯坦福等提出MoCa框架：雙向多模態(tài)編碼器

新智元 2025-07-10 15:12:09
0 跟貼 0

《永樂大典》正本失蹤之謎，盤個最簡單的邏輯

九江老渭 2025-07-08 11:12:16
239 跟貼 239
Tokens是胡扯，Mamba作者顛覆性觀點，揭露Transformer深層缺陷

機器之心Pro 2025-07-09 18:14:42
2 跟貼 2

河南鄭州一男子上自家電車聞到一股惡臭味 7月8日（發(fā)布），河南鄭州一男子上自家電車聞到一股惡臭味，急

中安在線 2025-07-10 09:59:17
747 跟貼 747

"天堂島"總統(tǒng)來華尋根在族譜里看到自己名字驚喜萬分

上游新聞 2025-07-10 22:01:08
4332 跟貼 4332
3歲寶寶和媽媽對話邏輯清晰有理有據(jù) 網(wǎng)友：以后絕對是個人物

千希視頻 2025-07-09 07:58:25
38 跟貼 38

AI輔助編碼帶來思維方式轉(zhuǎn)變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
VLA統(tǒng)一架構(gòu)新突破：自回歸世界模型引領具身智能

機器之心Pro 2025-07-10 16:13:06
1 跟貼 1
vivo發(fā)端側(cè)多模態(tài)模型，只有3B可理解GUI界面，20項評測表現(xiàn)亮眼

量子位 2025-07-10 13:13:38
1 跟貼 1
馬克龍在英國演講特別提到中國被指十分"大膽"

環(huán)球網(wǎng)資訊 2025-07-10 07:08:19
4208 跟貼 4208
ICCV 2025|UniOcc: 自動駕駛占用預測與推理統(tǒng)一數(shù)據(jù)集及基準平臺

機器之心Pro 2025-07-09 16:25:09
0 跟貼 0
極氪公布新技術(shù)架構(gòu)?取得重大突破引國際關(guān)注

企業(yè)家日報 2025-07-10 13:59:09
15911 跟貼 15911
事關(guān)社保、婚姻登記等這一新規(guī)9月起實施

環(huán)球網(wǎng)資訊 2025-07-09 21:00:15
1 跟貼 1
高一數(shù)學求最值高招：對勾函數(shù)+均值定理求最值難題，高中必刷題

六維坐標系 2025-07-09 19:47:58
4 跟貼 4
【干貨！】3個月IT碼農(nóng) 轉(zhuǎn)行大模型算法工程師：三階段學習路線快速破冰攻克關(guān)鍵技術(shù) 實戰(zhàn)深化

盧菁老師 2025-07-08 17:39:25
0 跟貼 0
走進四川這家工廠，我看到了智元機器人的“誕生”

虎嗅APP 2025-07-11 00:05:01
0 跟貼 0
郭正亮：我覺得蔡正元跟沈逸的邏輯都差不多！

執(zhí)筆寫思念 2025-07-10 14:19:29
0 跟貼 0
告別數(shù)據(jù)噪音，UCSD大模型推理新方法登頂MathVista測評榜

機器之心Pro 2025-07-10 20:15:04
0 跟貼 0
哈佛大學：被父母用心關(guān)注的孩子，其大腦發(fā)育速度比同齡人快30%

尚曦讀史 2025-07-08 19:56:07
180 跟貼 180
女司機體驗開車，轉(zhuǎn)彎竟把大貨車都頂飛，幸虧開的是模型

歡樂多爆笑 2025-07-09 09:17:44
1 跟貼 1
年費最高超2萬元！20萬GPU訓出Grok 4，馬斯克的“野心”被質(zhì)疑，木頭姐：20萬億美元蛋糕正被xAI和OpenAI等瓜分

每日經(jīng)濟新聞 2025-07-10 20:43:17
12 跟貼 12
Grok 4正式發(fā)布！官方宣稱，Grok 4是最新、最強大的旗艦模型

華爾街見聞官方 2025-07-10 13:25:39
3 跟貼 3
殲-35A即將加入作戰(zhàn)部隊序列，9·3閱兵傳來新消息

漢字筆跡心理分析 2025-07-10 10:49:36
0 跟貼 0
真正的智能體軟件工程師：OpenAI研發(fā)A-SWE能寫代碼、測試質(zhì)量、修復Bug

量子位 2025-04-14 19:04:43
0 跟貼 0
Nature子刊：談攀/洪亮團隊開發(fā)蛋白質(zhì)語言模型VenusMine，成功挖掘高效的PET水解酶

生物世界 2025-07-08 16:33:20
0 跟貼 0
過度營銷、家長“躺平”，編程貓如何續(xù)寫新故事？

DoNews 2025-07-10 17:57:36
0 跟貼 0
為什么說在拍攝時熟記各類拍攝參數(shù)是最沒效率的學習方法

一萱攝影 2025-07-06 16:44:46
5 跟貼 5
大模型「越用越快」！SpeedupLLM首次驗證，大降56%推理預算

新智元 2025-07-09 18:40:02
1 跟貼 1
女生把手機轉(zhuǎn)向朋友，一下被美顏參數(shù)嚇一跳，臉瞬間小一圈！

快樂笑星坊 2025-07-10 11:15:30
1 跟貼 1
1591高中數(shù)學應會題，求參數(shù)的取值范圍。出錯率很高

我服子佩 2025-07-09 15:06:17
1 跟貼 1
蔚來，會不會打響新能源爆雷第一槍？

黑噪音 2025-07-10 10:28:11
1 跟貼 1
一個超大質(zhì)量黑洞正在向我們的銀河系拋出超高速恒星

萬物研究 2025-07-10 18:43:45
1 跟貼 1
國外媽媽就是細心，給寶寶小腳丫做模型，既有紀念意義也可愛！

老沾看生活 2025-07-10 14:45:25
0 跟貼 0
男子到殯儀館悼念楊少華哭著大喊：你苦了一輩子

臺海青年 2025-07-10 19:48:00
1444 跟貼 1444
貴出天際的“雪糕刺客”，都倒在了2025年的夏天

紅網(wǎng)論壇 2025-07-09 18:44:14
69 跟貼 69
資本扎堆具身智能 “杭州六小龍”融資不斷

每日經(jīng)濟新聞 2025-07-10 22:18:07
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
修復和改進V8發(fā)動機模型

制造科技 2025-07-07 09:00:27
0 跟貼 0

我想干而沒有干！一男子把藏有GPS追蹤器的鞋子捐給了紅十字會…

我想干而沒有干！一男子把藏有GPS追蹤器的鞋子捐給了紅十字會…

翻開歷史和現(xiàn)實

2025-07-09 23:28:37

世界第1出局阿尼西莫娃2-1力克薩巴倫卡，生涯首進溫網(wǎng)決賽

世界第1出局阿尼西莫娃2-1力克薩巴倫卡，生涯首進溫網(wǎng)決賽

直播吧

2025-07-10 23:19:05

忍不了了！郭德綱內(nèi)涵楊少華兒子：不但要把肉吃沒，骨髓也要吸干

忍不了了！郭德綱內(nèi)涵楊少華兒子：不但要把肉吃沒，骨髓也要吸干

史書無明

2025-07-10 20:59:27

特朗普首次回應訪華，6個字表態(tài)喊話中國，魯比奧處境十分尷尬

特朗普首次回應訪華，6個字表態(tài)喊話中國，魯比奧處境十分尷尬

兵說

2025-07-10 00:30:32

2025暑期保護月取消，國產(chǎn)片3連撲，觀眾集體倒戈，進口片殺瘋了

2025暑期保護月取消，國產(chǎn)片3連撲，觀眾集體倒戈，進口片殺瘋了

電影票房預告片

2025-07-10 15:57:21

網(wǎng)友生日當天被女友氣瘋！體內(nèi)殘留兩個避孕套，稱：個人衛(wèi)生不好

網(wǎng)友生日當天被女友氣瘋！體內(nèi)殘留兩個避孕套，稱：個人衛(wèi)生不好

社會醬

2025-07-10 17:48:15

吃相太難看！這一次，蒙嘉慧也救不了演唱會“劃水擺爛”的鄭伊健

吃相太難看！這一次，蒙嘉慧也救不了演唱會“劃水擺爛”的鄭伊健

頭號劇委會

2025-07-09 23:57:12

他只活了42歲，卻激勵了中國億萬青年，為何自己過得“一塌糊涂”

他只活了42歲，卻激勵了中國億萬青年，為何自己過得“一塌糊涂”

興趣知識

2025-07-11 01:45:28

天水鉛中毒：現(xiàn)實比狗血劇更詭譎

天水鉛中毒：現(xiàn)實比狗血劇更詭譎

通往遠方的路

2025-07-10 07:07:03

聯(lián)合國關(guān)注甘肅幼兒鉛中毒事件：贊賞中國政府有關(guān)部門反應迅速

聯(lián)合國關(guān)注甘肅幼兒鉛中毒事件：贊賞中國政府有關(guān)部門反應迅速

西游日記

2025-07-10 10:27:18

1-2大爆冷！薩巴倫卡轟然出局，仰天長嘯，溫網(wǎng)女單決賽首人產(chǎn)生

1-2大爆冷！薩巴倫卡轟然出局，仰天長嘯，溫網(wǎng)女單決賽首人產(chǎn)生

大秦壁虎白話體育

2025-07-10 23:15:31

烏克蘭聲稱抓獲中國間諜，網(wǎng)友發(fā)現(xiàn)其在閑魚倒賣裝備

烏克蘭聲稱抓獲中國間諜，網(wǎng)友發(fā)現(xiàn)其在閑魚倒賣裝備

DoNews

2025-07-10 19:53:26

香港富四代稱“只花18塊的內(nèi)地窮鬼別來旅游”，評論區(qū)一片叫好

香港富四代稱“只花18塊的內(nèi)地窮鬼別來旅游”，評論區(qū)一片叫好

可達鴨面面觀

2025-07-03 09:02:14

廣東提前批多校排位飆升，廣警漲4.7萬，歷史暴漲95分！

廣東提前批多校排位飆升，廣警漲4.7萬，歷史暴漲95分！

侃故事的阿慶

2025-07-11 00:09:24

武漢男子斥責不拴繩遛狗被打傷，次日送娃上學遭挑釁尾隨

武漢男子斥責不拴繩遛狗被打傷，次日送娃上學遭挑釁尾隨

封面新聞

2025-07-10 16:43:24

江蘇婚禮喜婆婆驚艷全場，神似章子怡，網(wǎng)友：當場犯迷糊

江蘇婚禮喜婆婆驚艷全場，神似章子怡，網(wǎng)友：當場犯迷糊

農(nóng)村情感故事

2025-07-10 17:44:33

這下事情鬧大了！聯(lián)合國兒童基金會為天水幼兒血鉛異常事件發(fā)聲…

這下事情鬧大了！聯(lián)合國兒童基金會為天水幼兒血鉛異常事件發(fā)聲…

翻開歷史和現(xiàn)實

2025-07-10 12:45:20

反轉(zhuǎn)！男子駕車致女友截癱后續(xù)，男方發(fā)聲內(nèi)幕曝光，果然有情況

反轉(zhuǎn)！男子駕車致女友截癱后續(xù)，男方發(fā)聲內(nèi)幕曝光，果然有情況

禾寒敘

2025-07-10 17:18:17

無緣決賽！薩巴倫卡出局后，給鄭欽文帶來2大影響，年終800分不保

無緣決賽！薩巴倫卡出局后，給鄭欽文帶來2大影響，年終800分不保

侃球熊弟

2025-07-10 23:51:19

亞冠燒腦劇：中國球迷在申花球迷區(qū)為日本隊加油被日本球迷打了

亞冠燒腦劇：中國球迷在申花球迷區(qū)為日本隊加油被日本球迷打了

風過鄉(xiāng)

2025-07-10 19:42:42

追蹤人工智能動態(tài)

10835文章數(shù) 176183關(guān)注度

往期回顧全部

科技要聞

Grok4最貴訂閱月費2千，會不會三觀不正？

頭條要聞

退休人員基本養(yǎng)老金為何上調(diào)2% 人社部發(fā)文回應

頭條要聞

退休人員基本養(yǎng)老金為何上調(diào)2% 人社部發(fā)文回應

體育要聞

白衣生涯最后一舞，但魔笛的故事還沒結(jié)束

娛樂要聞

宋佳，真的好叛逆！

財經(jīng)要聞

潮玩規(guī)模破千億的幕后故事

汽車要聞

靠譜奶爸的底氣樂道L90靜態(tài)體驗

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

教育

數(shù)碼

旅游

軍事航空

我完美的發(fā)型被回南天做局了……

教育要聞

勸退：中外合作辦學坑太多，不是所有的學校都叫西浦&寧諾

數(shù)碼要聞

炎炎夏日， “瓶蓋散熱法”在新本上失效了？

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

軍事要聞

內(nèi)塔尼亞胡贈特朗普美軍B-2轟炸機造型“特別禮物”

© 1997-2025 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版主站蜘蛛池模板：昌图县| 隆回县| 花莲县| 南靖县| 克拉玛依市| 喜德县| 福清市| 茌平县| 乌恰县| 五家渠市| 芮城县| 长乐市| 册亨县| 肥乡县| 龙江县| 庄河市| 东光县| 澳门| 古蔺县| 重庆市| 东乡| 平罗县| 绥阳县| 揭阳市| 青阳县| 敖汉旗| 民勤县| 三亚市| 延吉市| 博客| 弥勒县| 铅山县| 迁安市| 宜良县| 西华县| 太仓市| 渭南市| 日照市| 社会| 张家界市| 昌黎县|

<cite id="raacz"></cite>