99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

田淵棟:連續思維鏈效率更高,編碼多個路徑,“疊加態”并行搜索

0
分享至

聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI

AI也有量子疊加態了?



連續思維鏈的并行搜索類似于量子疊加,比離散型思維鏈更具優勢。

這是AI大牛田淵棟團隊的最新研究成果。



傳統LLM通過生成 “思維token”(如文本形式的中間步驟)進行推理(即離散思維鏈),但在處理復雜任務(如判斷有向圖中節點是否可達)時效率低下,需要O(n^2)步解碼(n為節點數),且容易陷入局部解。

近期研究發現,用連續隱向量(非離散token)進行推理能顯著提升性能,但缺乏理論解釋。

田淵棟領銜來自UC伯克利、UCSD的科學家們利用連續空間中的 “疊加態”,讓大模型進行并行推理,大幅提升了模型在圖可達性等任務中的表現,給上述連續思維鏈提供了理論支持。



團隊證明了:

對于具有n個頂點且直徑為D的圖, 一個包含D步連續CoTs的兩層Transformer可以解決有向圖可達性問題,而具有離散CoTs的恒定深度Transformer的最佳已知結果需要O(n^2)個解碼步驟。

簡單來說,對于有向圖可達性問題,離散思維鏈類似于深度優先搜索(DFS),每次只能選擇單一路徑,導致步驟多且容易受限。

連續思維鏈可以同時編碼多個候選圖路徑,類似于廣度優先搜索(BFS),并且可以利用這種“疊加”進行隱式的「并行搜索」,比離散思維鏈更具優勢。

讓我們來看看實驗細節。

跟著“導航”找思維路徑
像 “導航儀” 一樣的注意力選擇器

團隊設計了一種注意力選擇器機制,使模型能根據當前token選擇性地關注特定位置(如邊的源節點和目標節點),確保信息的有效提取。

這個注意力選擇器就好比我們開車時用的導航儀,能幫模型在一堆信息里精準找到該關注的地方。



具體來說,當模型在處理信息時,遇到特定的 “標記”,比如表示一條邊結束的token,就像導航儀識別出一個路口標識,這時候它就會自動把注意力集中到這條邊的起點和終點節點上。

就像你看到 “前方路口右轉” 的提示后,會重點關注那個路口的位置。

如果沒遇到這種明確的標記,注意力選擇器就會模型去關注開頭的信息,比如問題最開始給出的條件,這樣就能確保模型不會在信息堆里迷路,始終能從正確的起點開始思考。

兩層連續思維Transformer進行疊加態維護

什么是連續思維的“疊加態”?

我們這里所說的“疊加態” 就像一個裝著所有可能答案的“盒子”。

比如,從根節點出發走c步后,這個盒子里不會只裝著一條路徑,而是同時裝著所有c步內可達的節點,這些節點的信息被 “揉” 成一個向量(即思維向量),讓模型能一次性處理所有可能性,而不是一次只考慮一條路徑。

第一層Transformer:“整理” 邊的信息



假設我們有一個有向圖,邊用token表示,每個邊token旁邊還帶著它的源節點(起點)和目標節點(終點)。

此外,根節點r是探索的起點,初始思維向量就是r的嵌入向量



第一層Transformer 有5個注意力頭,每個頭就像一個 “信息收集小助手”,它們的任務是:

  • 當遇到一個邊token時,小助手會 “主動” 關注這個邊的源節點和目標節點,并把這兩個節點的信息 “復制” 到邊token的位置上,就像在邊token旁邊貼兩張標簽,分別寫著 “起點是XXX” 和 “終點是XXX”。
  • 舉個例子:如果有一條邊是從節點A到節點B,邊token會被處理成包含A和B的信息,方便后續使用。

經過第一層處理后,每條邊的信息都被明確標注了起點和終點,初始思維向量也被保留下來,作為下一步探索的基礎。

第二層Transformer:“并行探索” 所有可能路徑



這一層就像 “探索指揮官”,它會根據當前的疊加態(即當前能到達的所有節點),去尋找下一步能到達的新節點:

  • 假設當前疊加態里有節點集合Vc(c步內可達的節點),模型會 “掃描” 所有邊,看看哪些邊的源節點在Vc里。比如,若Vc里有節點A和B,就查看從A和B出發的所有邊。
  • 對于符合條件的邊,其目標節點會被 “添加” 到疊加態中,形成新的節點集合Vc+1(c+1步內可達的節點)。這就好比從A和B出發,發現能到達C和D,于是把C和D也放進 “盒子”,讓下一輪探索能考慮這些新節點。

MLP層:“過濾” 和 “平衡”

  • 過濾噪聲:疊加態在擴展過程中可能會混入一些 “不重要的節點”(類似盒子里進了雜物),MLP層會像 “篩子” 一樣,把那些權重很小的節點(即幾乎不可能到達的節點)過濾掉,只保留有價值的節點。
  • 平衡權重:過濾后,MLP層會讓剩下的節點在疊加態中的 “權重” 變得均勻,就像把盒子里的節點信息整理得整整齊齊,不讓某個節點的信息 “壓倒” 其他節點,確保模型能公平地考慮每一個可能的路徑。



對比試驗及結果

團隊使用ProsQA數據集的子集進行實驗,該子集中的問題需要3-4推理步長來解決,且圖中的每個節點都作為一個專用token注入到詞匯表中。

實驗結果顯示,采用COCONUT(連續思維鏈)的2層Transformer模型在解決ProsQA問題時表現出色,準確率接近100%

相比之下,12層的離散CoT模型準確率僅為83%,而無CoT基線模型只能解決約75%的任務。



此外,團隊還通過對注意力模式和連續思維表示的分析,進一步證實了模型中存在預期的疊加態搜索行為,直接支持了“疊加態存在”的理論假設。



不僅能搞科研,還能寫小說

田淵棟任職于Meta GenAI(前FAIR),但業余時間是一位小說家(doge)。

沒錯,具體來說是科幻小說家。

田淵棟在談到第一部作品的寫作動因時說:

在AI最火熱的時候我寫了本小說

2020年到2021年,他完成了第一部長篇科幻小說《破曉之鐘》,該作品于2024年6月正式出版。



《破曉之鐘》講述了幾個初出茅廬的科學家們如何面對來自外太空的挑戰、如何處理人類危機的故事。

但區別于《三體》,《破曉之鐘》的技術背景離我們當前所處的時代更近,甚至都是我們這幾年人人都在談論、全球火熱的技術風口。

這本書的核心觀點是:AI只是在模仿數據,卻讓人誤以為它有智慧

這一觀點寫于ChatGPT爆火之前,卻精準預言了大語言模型的本質。

這部作品也收獲了不少讀者的好評。





田淵棟在今年5月接受交大校友采訪時還透露,由于寫第一部小說時還沒有大模型,所以每個字都是自己手敲的,接下來的第二部應該會用AI嘗試一下輔助寫作。

目前,他的第二部小說正在構思中,還是延續《破曉之鐘》世界觀,時間線會往后推很多,可能涉及到“群體意識”和“星際殖民”這類議題。

他說:

我希望寫出更大的宇宙,但核心依然是人類的選擇與掙扎。



論文地址:https://arxiv.org/abs/2505.12514


[1]https://x.com/tydsh/status/1935206012799303817
[2]https://zhuanlan.zhihu.com/p/15135181332?share_code=1io696PXYfDXY&utm_psn=1919011036050219530
[3]https://www.douban.com/doubanapp/dispatch/book/36946627?dt_dapp=1

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
超級模特何穗大膽泳裝身材真好,個子太高

超級模特何穗大膽泳裝身材真好,個子太高

鄉野小珥
2025-06-04 03:42:44
大瓜!baby被曝婚內出軌,與出軌對象在車內動靜大,聊天記錄炸裂

大瓜!baby被曝婚內出軌,與出軌對象在車內動靜大,聊天記錄炸裂

跳跳歷史
2025-06-19 12:00:41
你喝的“100%椰子水”是真的百分百嗎?揭開椰子水市場的真實與謊言

你喝的“100%椰子水”是真的百分百嗎?揭開椰子水市場的真實與謊言

每日經濟新聞
2025-06-19 17:04:19
鬧大了!重慶69歲老婦人持刀襲警被擊斃,內幕曝光令人氣憤!

鬧大了!重慶69歲老婦人持刀襲警被擊斃,內幕曝光令人氣憤!

白馬驚天劍
2025-06-19 09:44:16
慘淡收場!囤了30多年郵票年冊,去市場問回收價,已淪為“廢紙”

慘淡收場!囤了30多年郵票年冊,去市場問回收價,已淪為“廢紙”

收藏大視界
2025-06-19 20:04:00
地堡克星終于來啦!“炸彈之王”GBU57 已經抵達約旦美軍基地!

地堡克星終于來啦!“炸彈之王”GBU57 已經抵達約旦美軍基地!

翻開歷史和現實
2025-06-19 09:28:03
留下主教練!四個字評價一下火箭的這波操作

留下主教練!四個字評價一下火箭的這波操作

直播吧
2025-06-20 00:29:15
兒子丟失2年后,央視張澤群發文:父親去了,兒子丟了,取消罷了

兒子丟失2年后,央視張澤群發文:父親去了,兒子丟了,取消罷了

不寫散文詩
2025-06-19 15:49:41
領證了,孫穎莎官宣喜訊,開心喊話,困擾大事解決了,父母欣喜祝福

領證了,孫穎莎官宣喜訊,開心喊話,困擾大事解決了,父母欣喜祝福

最愛乒乓球
2025-06-19 14:55:13
伊朗媒體稱伊又擊落一架以色列F-35戰機!以防長警告伊朗:如果繼續襲擊,德黑蘭將化為火海

伊朗媒體稱伊又擊落一架以色列F-35戰機!以防長警告伊朗:如果繼續襲擊,德黑蘭將化為火海

每日經濟新聞
2025-06-15 00:21:17
等了一夜,伊朗要讓全世界“銘記幾個世紀”的事沒有發生

等了一夜,伊朗要讓全世界“銘記幾個世紀”的事沒有發生

近距離
2025-06-19 10:34:12
這樣弄,男人直接腿軟

這樣弄,男人直接腿軟

五月的書房
2025-06-18 01:01:24
得知國家被襲,上海一伊朗旅游團分批回國,導游:我帶過最傷心的團,生死面前都是小事

得知國家被襲,上海一伊朗旅游團分批回國,導游:我帶過最傷心的團,生死面前都是小事

瀟湘晨報
2025-06-18 11:24:59
女演員突發疾病變植物人!最新情況

女演員突發疾病變植物人!最新情況

魯中晨報
2025-06-19 15:02:03
德黑蘭警察總長拉丹被斬首,全伊朗的婦女都應該感謝以色列

德黑蘭警察總長拉丹被斬首,全伊朗的婦女都應該感謝以色列

肖走教授
2025-06-19 04:46:08
江蘇美女老師梁嬌去世!僅38歲,老公離世不到百天,小女兒才7歲

江蘇美女老師梁嬌去世!僅38歲,老公離世不到百天,小女兒才7歲

裕豐娛間說
2025-06-19 09:18:07
馬斯克,重回白宮!真應了那句話沒有永遠的敵人,只有永遠的利益

馬斯克,重回白宮!真應了那句話沒有永遠的敵人,只有永遠的利益

老友科普
2025-06-19 14:43:47
老人生前的存款,有密碼也取不了?銀行員工:多加個步驟輕松取回

老人生前的存款,有密碼也取不了?銀行員工:多加個步驟輕松取回

小談食刻美食
2025-06-19 16:32:35
五局擊敗保加利亞女排,中國女排斬獲世界聯賽香港站兩連勝

五局擊敗保加利亞女排,中國女排斬獲世界聯賽香港站兩連勝

澎湃新聞
2025-06-19 22:52:29
韋東奕又去聽王虹教授講座了,連續三天坐第一排聽講,還有學生為王虹獻花

韋東奕又去聽王虹教授講座了,連續三天坐第一排聽講,還有學生為王虹獻花

極目新聞
2025-06-19 13:30:31
2025-06-20 00:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10698文章數 176169關注度
往期回顧 全部

科技要聞

羅永浩數字人爆火,可怕的不是5500萬GMV

頭條要聞

美打擊伊核設施計劃披露 特朗普鼓勵以總理"繼續干"

頭條要聞

美打擊伊核設施計劃披露 特朗普鼓勵以總理"繼續干"

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網爆火

財經要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續航長 純電小車凱翼拾月Mate上市

態度原創

健康
教育
藝術
手機
軍事航空

呼吸科專家破解呼吸道九大謠言!

教育要聞

2025年山東夏季合格考準考證打印操作詳細教程

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

小米紅米新品下周來 新品開箱體驗搶先看

軍事要聞

俄羅斯告誡美國不要攻擊伊朗

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 湖北省| 荣成市| 噶尔县| 五原县| 资兴市| 永城市| 米泉市| 阿拉善左旗| 那曲县| 迁安市| 凉城县| 都安| 河曲县| 莱阳市| 苍溪县| 房产| 新竹市| 离岛区| 湘西| 宜兰县| 渝北区| 平乐县| 汝阳县| 山东省| 定南县| 延津县| 舟山市| 迁西县| 湖南省| 高密市| 曲阳县| 万源市| 巩义市| 集贤县| 繁峙县| 扶绥县| 龙海市| 安新县| 延津县| 黔南| 开平市|