99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

哈佛新論文揭示 Transformer 模型與人腦“同步糾結”全過程!AI也會猶豫、反悔?

0
分享至


大數據文摘出品

近日,來自哈佛大學、布朗大學以及圖賓根大學研究者們,共同發表了一項關于Transformer模型與人類認知處理相關性的研究論文:

——《Linking forward-pass dynamics in Transformers and real-time human processing》

意譯過來就是:Transformer模型的“思考過程”與人類大腦實時認知的奇妙相似


換句話說,它想搞清楚一個“老問題”:AI模型的內部處理過程,和人類大腦的實時認知,有多少相似?

過去我們研究AI和人類的相似性,最常見的做法是什么?“看結果”:讓AI做題,看它答對多少,概率分布和人的選擇對不對得上。例如,讓GPT寫作文、識別圖片、做邏輯推理,然后對照人類的數據,得出一個“AI越來越像人了”的結論。

但這其實只是表象。

想象一個場景:在答一道不太確定的選擇題,先想到了一個看似正確的選項,但又覺得不太對,猶豫半天,才最終敲定答案。AI模型也一樣,也許在中間某一層,更傾向于一個“直覺答案”,但再往后,才被訓練出來的知識“糾正”了過來。

問題來了:AI和人類,不只是最后的選項,連中間的“掙扎”和“轉變”也能被對齊嗎?

這篇論文的作者,換了個角度:不只看AI模型的輸出,還要扒一扒Transformer每一層的“處理動態”,與人腦處理信息的“實時軌跡”是否能對上。

01 AI和人腦,真的在“想”同一件事嗎?


圖注:方法概述。用Transformer模型中得出的過程性指標預測人類處理負荷和行為反應指標的能力。

論文作者把Transformer每一層的輸出和變化都做了記錄,提出了一系列“處理負載”的指標:

  • 不確定性(entropy)

  • 信心(log probability)

  • 相對信心(正確vs直覺答案)

  • boosting(模型在某一層對正確答案的主動“拉高”)

這些東西聽起來很技術,但可以簡單理解為:AI每一層都在“思考”,每過一層,它對答案的信心發生了一點點變化。

有的題,AI一上來就很有把握,信心很快升高;有的題,AI在中間反復徘徊,甚至先押錯,再修正。

這和我們人類做題的“熟練-猶豫-反應慢-反悔-最終確定”是不是很像?

02 實驗結果:AI和人類“走彎路”的相似瞬間


圖注:研究中分析的人類任務示意圖。(a) 回憶(自由回答)首都名稱。(b) 識別(強制選擇)首都名稱。(c) 通過鼠標移動對典型和非典型動物實例進行分類(Kieslich 等, 2020)。(d) 判斷三段論推理的邏輯有效性。(e) 對分布外圖像進行物體識別。

論文做了幾個個實驗,分別對應不同的認知任務和人機對比:

①“首都殺手題”——AI和人類的集體下意識。


圖注:研究1a(回憶首都),Llama-2 7B模型。(a)-(d) 基于模型各層計算的處理指標。(e) 各指標相較于基線模型的BIC差異。數值越高越好。星號表示統計顯著。

比如,美國州首都題。這題在答題界有個綽號,叫“首都殺手”:

  • 出題人問:“伊利諾伊州的首都是哪?”

  • 人類幾乎下意識地想說:“芝加哥!”

  • 然后突然一個激靈,想起,“不對,是斯普林菲爾德!”

以為這樣的“反轉”只有人類會有?其實AI也會!

論文里的Llama-2模型,每一層都像個小AI腦細胞在投票。結果顯示:在模型的中間層,AI的信心值一度“押寶”在芝加哥上,就像腦海里那個脫口而出的錯誤答案??傻搅撕蟀氤?,隨著層數加深,AI忽然“剎車”,把信心轉回了斯普林菲爾德。這就是AI和人類都在“下意識→反思→修正”的本能流程里打了個滾。

更絕的是,有的試題AI和人類都“執迷不悟”。比如問“澳大利亞首都”,一堆人寫悉尼,一堆AI也把概率壓在悉尼上,最后才有一部分“覺醒”,想起是堪培拉。

②“鯨魚歸屬”——鼠標和神經元一起漂移


圖注:研究2(動物實例分類),Llama-2 7B模型。(a)-(d) 基于模型各層計算的處理指標。(e) 各指標與基線模型的BIC差異,數值越高越好。星號表示統計顯著。

再看動物分類題。問:“鯨魚是魚還是哺乳動物?”人類是不是腦子里先蹦出來“魚”,又覺得哪里不對,才慢慢改口?

  • 人類實驗里,受試者的鼠標先朝“魚”方向飄過去,走了一小段“彎路”,再折回“哺乳動物”,畫出一條漂亮的“糾結弧線”。

  • AI模型內部,“信心”指標在前幾層也更偏向“魚”,直到后面層數才被訓練出的知識拉回“哺乳動物”。

有趣的是,AI和人類不僅選項重合,連“走神”的路徑也同步:人類在鼠標上徘徊的那一秒,AI在網絡里也“猶豫”著。

03. “邏輯陷阱”——AI和人類被套路的瞬間


圖注:(三段論推理中的內容效應),Llama-2 7B模型。(a)-(d) 針對邏輯結果與先驗信念一致的題目,基于模型各層計算的處理指標。(e)-(h) 針對引發“內容效應”的題目(即邏輯結果與先驗信念不一致),基于模型各層計算的處理指標。(i) 各指標及數據子集與基線模型的BIC差異,數值越高越好。由于EntropyLayer和BoostLayer在所有題目中的數值相同,因此未進行比較。

再來點燒腦的。經典的三段論邏輯推理題:

“所有A是B,所有B是C,那么所有A是C嗎?”

人類本來邏輯在線,但題目稍微摻點“常識偏見”,比如“所有有翅膀的動物會飛,所有會飛的動物能上天,所以所有有翅膀的動物都能上天嗎?”大腦會直接被“常識”帶偏。

AI也是。論文里發現:只要題目設計得足夠“繞”,AI和人類一樣,都在中間層“陷入迷霧”,先押寶在那個直覺答案上,過了幾個“腦回路”,才慢慢拉回正軌。

04. “圖片辨認”——AI和人類都在“霧里看花”


圖注:OOD物體識別,ViT-Base模型。(a)-(b) 基于模型各層計算的處理指標。(c) 各指標分組與基線模型的BIC差異,數值越高越好。

視覺任務上也是同理。比如一張加了馬賽克或奇怪濾鏡的貓咪圖片,問“這是啥?”你可能先說“狗?”,再揉揉眼睛,才發現是“貓”。

AI的Vision Transformer也是這樣,剛開始層級信心分布很分散,也許更偏向“狗”,但隨著層數推進,才慢慢聚焦到“貓”這個類別。

有沒有發現?AI和人的“迷茫-清醒”過程竟然如此一致。

03 OMT:應該關注AI內部的“思考過程”

我們一直用AI做“黑箱”——輸入-輸出,像函數一樣。但這篇論文告訴我們,也許更值得關注的,是AI內部的“思考過程”。

AI在遇到難題時,真的會“走彎路”,和人一樣“卡殼”; 不同的任務,不同的模型規模,AI的“思考路徑”也會變化; 這種“動態過程”不是專為模仿人類設計,而是AI自然訓練出來、為了完成任務自己學會的“捷徑”;

這意味著,也許我們能用AI,去發現哪些刺激、哪些設計會讓人類更難處理,甚至反向指導人類實驗設計。

輸出只是終點,過程才是靈魂。

GPU算力按需租用

A100/H100 GPU算力按需租用,

秒級計費,平均節省開支30%以上!

掃碼了解詳情?


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
得了癌癥的患者是怎么離開人間的?網友:有點慘,但建議大家看完

得了癌癥的患者是怎么離開人間的?網友:有點慘,但建議大家看完

解讀熱點事件
2025-07-05 00:10:03
泰柬百年恩怨因為什么?柬埔寨為何要雞蛋碰石頭?

泰柬百年恩怨因為什么?柬埔寨為何要雞蛋碰石頭?

史政先鋒
2025-07-24 21:51:20
今天下午!傳來廣東的重磅消息,麥考爾正式加盟宏遠

今天下午!傳來廣東的重磅消息,麥考爾正式加盟宏遠

郝小小看體育
2025-07-25 17:53:53
她被判死刑后,愿捐554億幫國家賺錢,只求饒自己一命,結局如何

她被判死刑后,愿捐554億幫國家賺錢,只求饒自己一命,結局如何

阿器談史
2025-07-23 19:43:25
戴琳:申花今年中超肯定奪冠,王鈺棟明年再不留洋肯定廢了

戴琳:申花今年中超肯定奪冠,王鈺棟明年再不留洋肯定廢了

雷速體育
2025-07-25 11:13:58
網盤中的加密文件,二十年后依然回味無窮

網盤中的加密文件,二十年后依然回味無窮

街機時代
2025-04-27 16:10:02
華為鴻蒙智行: 已看到某平臺所謂“測試”,不予置評

華為鴻蒙智行: 已看到某平臺所謂“測試”,不予置評

觀察者網
2025-07-25 16:18:48
鄰居大娘找我借50萬,我拒絕,第二天警察敲門:大媽跟你有來往嗎

鄰居大娘找我借50萬,我拒絕,第二天警察敲門:大媽跟你有來往嗎

濤哥講堂
2025-07-21 10:30:20
1962年,82歲麥克阿瑟聽聞印度對中國開戰,一番犀利評論直戳要害

1962年,82歲麥克阿瑟聽聞印度對中國開戰,一番犀利評論直戳要害

歷史求知所
2025-07-24 17:25:02
馮德萊恩不“除”,中歐關系不得安寧

馮德萊恩不“除”,中歐關系不得安寧

羅富強說
2025-07-25 17:54:58
8歲男孩喝荔枝皮煮湯下火,高燒不退送往icu,檢測報告父親愣在原地

8歲男孩喝荔枝皮煮湯下火,高燒不退送往icu,檢測報告父親愣在原地

罪案洞察者
2025-07-19 14:30:45
小燕子帶著女兒小四月大理度假,塑料袋裝舊愛馬仕有點奇怪??!

小燕子帶著女兒小四月大理度假,塑料袋裝舊愛馬仕有點奇怪啊!

農城浪子
2025-07-25 11:08:30
比亞迪辟謠漢繞圈事件,別讓謠言毀了中國新能源車!

比亞迪辟謠漢繞圈事件,別讓謠言毀了中國新能源車!

創作者_1470992743975
2025-07-25 17:21:10
解放軍臺海巡航再升級,馬英九攤牌:大陸若要武統,臺島絕不接受

解放軍臺海巡航再升級,馬英九攤牌:大陸若要武統,臺島絕不接受

小笛科技
2025-07-24 12:37:36
陳佩斯《戲臺》票房井噴,多少資方該臉紅?黃渤這次又賭對了

陳佩斯《戲臺》票房井噴,多少資方該臉紅?黃渤這次又賭對了

銀河史記
2025-07-23 00:20:47
特斯拉首家餐廳6小時狂賺33萬,馬斯克:上海店要讓麥當勞睡不著

特斯拉首家餐廳6小時狂賺33萬,馬斯克:上海店要讓麥當勞睡不著

史書無明
2025-07-23 15:39:51
《戲臺》:國產喜劇,進化到這個地步了?

《戲臺》:國產喜劇,進化到這個地步了?

舒心醬
2025-07-25 00:33:32
痛惜!哈工大研三學生龔建瑞去世,僅26歲,出身寒門多次獲獎學金

痛惜!哈工大研三學生龔建瑞去世,僅26歲,出身寒門多次獲獎學金

裕豐娛間說
2025-07-25 15:58:33
特朗普與馬科斯劃清界限,杜特爾特離開ICC拘留所?菲律賓要變天

特朗普與馬科斯劃清界限,杜特爾特離開ICC拘留所?菲律賓要變天

老謝談史
2025-07-25 18:52:52
64歲費翔現場淚灑,感慨家中無人,傳遞不婚不育的反思。

64歲費翔現場淚灑,感慨家中無人,傳遞不婚不育的反思。

云間娛樂
2025-07-23 19:50:15
2025-07-25 19:56:49
大數據文摘 incentive-icons
大數據文摘
專注大數據,每日有分享!
6712文章數 94448關注度
往期回顧 全部

科技要聞

36款熱門車高危智駕場景測試,“團滅”!

頭條要聞

馬斯克轉發讓懂車帝輔助駕駛測試"火"了 鴻蒙智行回應

頭條要聞

馬斯克轉發讓懂車帝輔助駕駛測試"火"了 鴻蒙智行回應

體育要聞

39歲的落選秀,被稱為NBA最完美的人

娛樂要聞

汪蘇瀧不忍了 !張碧晨痛失《年輪》演唱權

財經要聞

劉煜輝:當下重要不是找確定性而是轉折點

汽車要聞

李斌一口氣講了近3個小時樂道L90 原因是為啥?

態度原創

數碼
旅游
藝術
公開課
軍事航空

數碼要聞

專業主播的生產力革命:Aiboo 直播一體機深度體驗報告

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

吳謙少將任中國駐埃及使館國防武官

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 巩留县| 东兰县| 军事| 新田县| 林甸县| 肃北| 普兰店市| 丹凤县| 东台市| 万年县| 兴文县| 曲水县| 雷山县| 会东县| 息烽县| 泸溪县| 麻城市| 淄博市| 宜阳县| 辉南县| 同德县| 乐至县| 田林县| 德兴市| 福州市| 克拉玛依市| 曲阳县| 凯里市| 湖北省| 桦甸市| 朝阳区| 旬阳县| 永德县| 建德市| 斗六市| 灌南县| 六安市| 灵丘县| 丹凤县| 连城县| 游戏|