99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

19歲少年「破解」谷歌新AI?每秒1479 token,擴散再戰GPT!

0
分享至


新智元報道

編輯:KingHZ 英智

【新智元導讀】年僅19歲少年,自稱破解了谷歌最快的語言模型Gemini Diffusion,引爆社交平臺。真相撲朔迷離,但有一點毫無疑問:谷歌I/O大會的「黑馬」,比GPT快10倍的速度、媲美人類程序員的代碼能力,正在掀起一場NLP范式大洗牌。

沒想到擴散模型以一種另類的方式,火起來了!

來自德國的19歲的少年,Georg von Manstein聲稱自己「破解」了谷歌文本擴散模型的原理。


「19歲」「創業」「破解谷歌模型」……

乍看之下,簡直像極了「少年天才挑戰腐朽巨頭」的逆襲劇本,數以萬計的網友被他的推文吸引。


再加上擴散文本生成模型的動態演示,好像谷歌Gemini Diffusion的原理真被他破解了。


但很快就有網友發現,他用的動圖,其實是來自國內的研究(Dream 7B),而后面放出來的幾篇論文也并沒有做任何解釋……


不管這位小哥是不是在「搞抽象」,但谷歌這次提出的Gemini Diffusion卻是一個實打實的干貨。

更重要的是,Gemini Diffusion給擴散模型「再就業」樹立了榜樣。

Gemini Diffusion

每秒1479token

遺憾的是Gemini Diffusion被Veo 3等消息所掩蓋了。

但Gemini Diffusion是谷歌更大的野心:重塑語言生成,利用擴散技術,實現更快、更自由、更可控的文本創作體驗。

Gemini Diffusion最大特點就是速度飛快:比谷歌目前最快的非擴散模型還要快,采樣速度每秒1479個token,啟動時間只要0.84秒。


響應速度之快,以至于谷歌在演示中需刻意放慢速度,才能讓觀眾看清文本生成的內容。


除了生成速度快,在生成文本質量上,尤其是文本連貫性和錯誤糾正方面,Gemini Diffusion也優于傳統的自回歸模型。


Gemini Diffusion三大優點:快速響應、文本更連貫、迭代優化

在實時響應或大批量文本生成場景下,Gemini Diffusion具有明顯優勢。

在任務準確度上,二者各有千秋,取決于任務類型。

Gemini Diffusion,在生成效率和局部準確度方面表現優異,但在通用智能和知識覆蓋方面尚未全面超越當前最強的自回歸模型。

不止是快,代碼和數學也很強

在外部基準上,Gemini Diffusion的性能可與更大的模型相媲美,同時速度也更快。

DeepMind將其與自家的Gemini 2.0 Flash-Lite模型進行了對比,在多個代碼基準上幾乎旗鼓相當。

總體來看,Gemini Diffusion在垂直領域(編程、數學)的準確性已經可與一流模型相比,甚至略有勝出,但在通用知識和推理方面仍有明顯差距。


在外部基準測試中,Gemini Diffusion不僅快,在代碼和數學推理任務上也表現優異:

  • HumanEval代碼測試:一次性通過率達89.6%,與Gemini Flash-Lite持平;

  • AIME 2025數學競賽測試:準確率23.3%,略高于Flash-Lite的20.0%;

  • LiveCodeBench實時編程:得分30.9%,領先Flash-Lite的28.5%。

尤其在長文本、邏輯強、結構復雜的任務中,其全局生成策略展現出對傳統架構的替代潛力。

不過,在通用知識類任務上,其表現仍不如當前最強的自回歸模型:

  • MMLU多任務問答:Gemini Diffusion得分為69.1%,仍低于GPT-4的86.4%。

  • 科學推理GPQA Diamond:準確率40.4%,顯著落后于Flash-Lite的56.5%。

目前,Gemini Diffusion還是實驗性演示版本,要注冊候補名單才有機會體驗。

實測:幾秒完成聊天應用

著名的Web開發工程師Simon Willison,得到了Gemini Diffusion的試用機會。

他表示谷歌所言非虛:

哇,他們說它速度快可不是開玩笑的。


Simon Willison:英國程序員,Web框架Django的共同創作者

在下列視頻中,他給Gemini Diffusion提示是「Build a simulated chat app」,它以每秒857個token的速度作出響應,并在幾秒鐘內生成了一個包含HTML和JavaScript的交互式頁面。

在此之前,唯一一個達到商業級別的擴散模型是今年二月Inception Labs推出的Mercury模型。

Diffusion模型再就業

在AI生圖領域,Diffusion模型節節敗退。

在今年二月,Inception Labs推出了世界上首個擴散語言模型,在速度和成本上比當前一代LLM快多達10倍、便宜多達10倍。

在輸出速度和人工分析編程指數上,可謂「遙遙領先」!


在接受采訪時,斯坦福大學教授、Inception Labs聯合創始人Stefano Ermon表示:

過去很多嘗試將擴散模型用于文本生成都以失敗告終。Mercury之所以成功,是因為我們在訓練和推理算法方面做出了專有的創新。圖像可以模糊地「看個大概」再逐步優化,但語言卻必須嚴守語法規則,這使得迭代優化的過程更加復雜。


Stefano Ermon

而IBM研究員Benjamin Hoover指出,Mercury模型證明了擴散模型正在彌合差距,也指出了趨勢的轉變

兩三年之內,大多數人將會轉向使用擴散模型。這已經是必然了。當我看到Inception Labs的模型時,我意識到,這種轉變會比預想的更快發生。


Benjamin Hoover

而在「AI四巨頭」中,谷歌是第一家推出擴散語言生成模型的巨頭。

這對于擴散研究領域而言,無疑是個振奮人心的信息。

谷歌DeepMind主任科學家(Principal Scientist)Jack Rae表示,Gemini Diffusion的發布感覺像是一個里程碑。


Gemini Diffusion的成功探索向業界證明,非自回歸的擴散架構在大語言模型上切實可行。

擴散模型威逼GPT,而下一代AI正在浮現。

擴散模型再戰自回歸

傳統的自回歸語言模型是一次生成一個詞或一個token,從左到右逐字預測下一個token,按照順序逐步生成文本(見下圖左)。

由于這種生成方式是逐步進行的,因此速度較慢,也可能限制了生成結果的質量和連貫性。

與傳統的自回歸大語言模型不同,Gemini Diffusion采用了擴散模型的架構:它從隨機噪聲出發,逐步細化出完整的文本段落(見下圖右)。

這種過程類似于圖像擴散模型在圖像生成中的應用——從雜亂噪聲開始,通過多次迭代逐漸生成清晰有意義的輸出。


在文本領域,這意味著Gemini Diffusion可以一次生成整個詞塊,并在生成過程中多輪調整糾錯,逐步逼近最終結果。

它在初始階段給出一段粗糙的文本草稿,然后通過迭代不斷改進內容的準確性和一致性,直到得到高質量的輸出。

這種架構上的根本差異帶來了多方面影響:

首先,并行生成整個文本塊使其速度大幅提升(無需逐詞等待)。

其次,全局視角的生成方式有助于長文本的整體連貫性,因為模型能同時考慮文本各部分的關系,而非局限于局部上下文。

最后,迭代精煉允許模型在生成過程中自我檢查并修正錯誤,使輸出更一致可靠。

擴散大語言模型(Diffusion Large Language Model,dLLM)將為LLM帶來一系列全新的能力,包括:

1. 更強的智能代理能力dLLM的速度和效率極高,適用于需要大量規劃和長文本生成的智能體應用。

2. 更高級的推理能力dLLM內置的糾錯機制修復幻覺內容,優化答案,同時保持在幾秒鐘內完成思考。

3. 更可控的生成過程dLLM支持編輯生成內容,并且可以按任意順序生成token。

4. 邊緣設備上的應用得益于其高效性,dLLM非常適合資源受限的場景,例如邊緣設備。

擴散模型:不止生圖

在Y Combinator新聞論壇,網友nvtop對Gemini Diffusion提供了一番解釋:擴散語言模型與谷歌的BERT模型頗有淵源,反而與圖像生成領域中的擴散模型沒有太大關系。

這或許能理解為什么谷歌的這次轉向。


論文鏈接:https://arxiv.org/abs/1810.04805

回憶一下BERT是如何訓練的:

(1)輸入一整句完整的句子(例如:「the cat sat on the mat」)

(2)將其中15%的token替換為[MASK](例如:「the cat [MASK] on [MASK] mat」)

(3)使用Transformer模型并行地預測這些被遮蔽的位置,僅需一步推理(inference)


擴散語言模型的做法則是在這個思路上更進一步。

BERT只能恢復約15%的被遮蔽token(可視為「噪聲」),但完全可以訓練模型來恢復30%、50%、90%,甚至100%被遮蔽的文本。

一旦訓練完成,就可以實現從零開始生成文本:

  • 一開始輸入全部為[MASK]的序列,模型輸出的內容可能是胡言亂語。

  • 然后隨機選出其中10%的token,把它們標記為「已生成」。

  • 在下一次推理中,將剩下90%的位置繼續設為[MASK],保留前面10%。

  • 繼續這樣迭代,在每一輪中都「定住」一部分新的token。

  • 大約迭代10次之后,就能生成完整的文本序列。

這正是擴散語言模型的核心理念。

當然,在實際應用中還有很多優化策略。

如果需要生成很長的文本(例如超過200個token),可以將其切分為多個塊(chunk),先并行生成第一個塊,再逐塊向后生成。

這種方法被稱為Block Diffusion,是一種半自回歸式生成方式


論文鏈接:https://arxiv.org/abs/2503.09573

還可以選擇性地將哪些token在某一輪中被視為「最終生成的」,以及這部分的比例:

  • 在早期階段,模型還處于噪聲狀態,可以一次保留更多token。

  • 在后期接近完成時,則可以多迭代幾輪,每輪只保留少量新token,以提升質量。

總體來看,擴散語言模型雖然也是迭代式的,但所需步驟遠少于自回歸模型。而且用戶可以自由選擇迭代輪數,實現速度與質量之間的權衡。

極端情況下,甚至可以讓擴散模型僅預測最左邊一個被遮蔽的token,這樣它就退化為一個傳統的因果語言模型了。

文本生成范式轉向

當響應延遲不再顯著,人們可以更自然地將AI融入工作流中,實時協作或即時創意迭代將成為可能。

Gemini Diffusion的成功探索向業界證明,非自回歸的擴散架構在大語言模型上切實可行。


可以預見未來會出現自回歸+擴散融合的模型:利用擴散模型快速生成初稿,再用自回歸模型微調潤色,或者反過來通過自回歸生成草稿、擴散模型高效優化。

這種多階段、多模型協作的框架有望結合雙方優勢,提高生成質量和速度。

這些進展預示著擴散模型正嶄露頭角,可能打破過去多年自回歸模型一統NLP天下的格局。

將高速擴散生成與深度推理相結合,可能是其下一步的研發重點之一。

參考資料:

https://fortune.com/2025/05/21/gemini-diffusion-google-io-sleeper-hit-blazing-speed-ai-model-wars/

https://blog.google/technology/google-deepmind/gemini-diffusion/

https://deepmind.google/models/gemini-diffusion/

https://simonwillison.net/2025/May/21/gemini-diffusion/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
收評:創業板指沖高回落跌1.18% 全市場超4200只個股下跌

收評:創業板指沖高回落跌1.18% 全市場超4200只個股下跌

財聯社
2025-05-23 15:03:11
蘭德爾談末節遭雪藏:我在場邊站得有點太久了,我想動起來

蘭德爾談末節遭雪藏:我在場邊站得有點太久了,我想動起來

懂球帝
2025-05-23 13:47:19
破案了!當年逼著刀郎退圈的不是汪峰,更不是楊坤,而是這位

破案了!當年逼著刀郎退圈的不是汪峰,更不是楊坤,而是這位

手工制作阿殲
2025-05-23 12:20:26
歷史上的兩個罪人:一個讓中國倒退百年,一個讓中華民族蒙難

歷史上的兩個罪人:一個讓中國倒退百年,一個讓中華民族蒙難

尚曦讀史
2025-05-09 21:25:03
事實證明,加入瑞典國籍的趙立新,詆毀國家屬于是自毀前程

事實證明,加入瑞典國籍的趙立新,詆毀國家屬于是自毀前程

趣文說娛
2025-05-17 15:57:36
豐滿身材《白雪公主》黑絲高跟展示:還有底部視角!

豐滿身材《白雪公主》黑絲高跟展示:還有底部視角!

游民星空
2025-05-22 11:08:27
49年,偉人得知載濤靠擺攤營生后,當即表示:小攤就不要接著擺了

49年,偉人得知載濤靠擺攤營生后,當即表示:小攤就不要接著擺了

杰絲聊古今
2025-05-22 18:29:26
淚目!朱媛媛寫給17歲女兒的信,句句表遺憾:女兒,請原諒媽媽

淚目!朱媛媛寫給17歲女兒的信,句句表遺憾:女兒,請原諒媽媽

夢史
2025-05-23 15:56:07
還沒等到解放軍,臺島已經插上五星紅旗,賴清德要求北京調整政策

還沒等到解放軍,臺島已經插上五星紅旗,賴清德要求北京調整政策

歷史求知所
2025-05-22 20:00:06
為啥潮汕離婚率全國最低?除了女孩的身段,這5點原因也至關重要

為啥潮汕離婚率全國最低?除了女孩的身段,這5點原因也至關重要

荷蘭豆愛健康
2025-05-22 11:17:58
陳盈駿:自己還未從總決賽的氣氛中脫離,做夢都是布朗在面前投進三分

陳盈駿:自己還未從總決賽的氣氛中脫離,做夢都是布朗在面前投進三分

雷速體育
2025-05-23 18:20:14
朱媛媛剛走,曹穎也自曝患癌:沒多少時間了,害怕看不到兒子長大

朱媛媛剛走,曹穎也自曝患癌:沒多少時間了,害怕看不到兒子長大

八斗小先生
2025-05-23 16:54:19
高開低走!29歲球員李曉明報名中冠,2016年曾獲中超最佳新人獎

高開低走!29歲球員李曉明報名中冠,2016年曾獲中超最佳新人獎

直播吧
2025-05-23 15:53:10
杭州“將軍酒”傳銷頭目一輛奔馳S480被拍賣,22人搶,109萬成交

杭州“將軍酒”傳銷頭目一輛奔馳S480被拍賣,22人搶,109萬成交

天天話事
2025-05-23 15:04:30
世乒賽!2大世界冠軍被淘汰,王曼昱鎖定首枚獎牌,日本男雙3-0

世乒賽!2大世界冠軍被淘汰,王曼昱鎖定首枚獎牌,日本男雙3-0

知軒體育
2025-05-23 18:54:55
已經亡國50年,國王卻依舊健在,仍在繼續號召同胞“企圖復國”

已經亡國50年,國王卻依舊健在,仍在繼續號召同胞“企圖復國”

文史達觀
2025-05-23 06:45:07
上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

懸案解密檔案
2025-05-09 18:00:29
中國不會選擇武統?美專家:等美國徹底衰落后,中國就能和平統一

中國不會選擇武統?美專家:等美國徹底衰落后,中國就能和平統一

以絕望揮劍
2025-05-23 19:53:00
美軍前高官:若中國攻臺并設禁航區,美軍“不得不”擊沉中國軍艦

美軍前高官:若中國攻臺并設禁航區,美軍“不得不”擊沉中國軍艦

媛來這樣
2025-05-22 22:17:21
世乒賽:莫雷加德0-2落后連贏4局逆轉 戶上隼輔,挑戰王楚欽

世乒賽:莫雷加德0-2落后連贏4局逆轉 戶上隼輔,挑戰王楚欽

越嶺體育
2025-05-24 00:26:36
2025-05-24 01:56:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12752文章數 66041關注度
往期回顧 全部

科技要聞

特朗普:iPhone不在美國制造就收25%關稅

頭條要聞

美媒最新披露:馬斯克在特朗普核心圈地位顯著下滑

頭條要聞

美媒最新披露:馬斯克在特朗普核心圈地位顯著下滑

體育要聞

臺下掌聲一片!65歲安帥揮手告別:感謝皇馬

娛樂要聞

趙麗穎否認戀情,與趙德胤沒在一起?

財經要聞

特朗普威脅自6月1日起對歐盟征收50%關稅

汽車要聞

續航720km/充電10分鐘補能500公里 理想i8信息曝光

態度原創

家居
時尚
親子
公開課
軍事航空

家居要聞

輕奢品質 開闊的三口之家

小香風太火了,從20歲穿到70歲都很時髦

親子要聞

五個半月寶寶在家洗澡 獨自愜意地在澡盆中玩水 看起來非常安逸舒適

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

朝驅逐艦下水事故最新調查結果公布

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 凉城县| 中山市| 长阳| 北海市| 中西区| 图木舒克市| 涿州市| 松滋市| 五家渠市| 虎林市| 眉山市| 长宁区| 舞钢市| 新野县| 钦州市| 大丰市| 崇义县| 星子县| 江安县| 电白县| 常宁市| 江油市| 定陶县| 勃利县| 鞍山市| 全椒县| 湾仔区| 盐边县| 沂源县| 乐亭县| 抚松县| 六枝特区| 驻马店市| 简阳市| 涟水县| 湟中县| 思南县| 遵义市| 石景山区| 涪陵区| 竹北市|