網易首頁 > 網易號 > 正文申請入駐

Nature：原以為 AI 只會算題，直到它用人類的邏輯闖關心理實驗…

2025-07-08 22:08:22　來源: 世界科學

上海舉報

分享至

設置星標關注，從此你的世界多點科學~

AI應用已滲透人類生活的各方各面，在很多比拼智能的領域，它們可以戰勝人類頂尖大師，甚至將領域拔高到人類本不可想象的層次，例如棋弈能手AlphaGo和蛋白質三維結構預測大神Alphafold。

不過AI現有的局限性也顯而易見，其中重要一項就是通用性不足、限于特定化任務。例如，人類棋手能每天開車去棋館，但要叫AI棋手開展駕駛的話，它就抓瞎了。

而在近些年成為行業焦點的通用人工智能AGI，其終極追求正是與人類智能無異的系統，像人類一樣執行各種復雜任務的能力，模仿人類又超越人類的通用性和適應性。

這就會引出一個很有趣的話題：一個完全模仿人類智能的AI，是否也應當擁有人類的心智，擁有所謂的“人性”？

根據《自然》雜志7月的最新報道，有國際科學家團隊通過將大量原本針對人類志愿者的心理學實驗投向AI，使其經受“人性”訓練，得到了一個表現出某些人類般心智特征的類ChatGPT系統，名為“半人半馬”(Centaur)。

給模型起名“半人半馬”致敬了希臘神話中上半身為人、下半身為馬的怪物

近幾十年來，認知科學家建立起復雜的理論體系用以解釋人類心智的多種功能，包括學習、記憶、決策等。為驗證理論，科學家通過實驗觀察人類行為是否符合理論預測。

部分理論經得起實踐檢驗，甚至還解釋了人類心智的某些獨特之處。舉個例子，人類通常傾向于確定性選項而非風險決策，即便可能因選擇確定性(比如五千元必得收益)而錯失高收益的機會(比如有望博得十幾萬的賭局)。

《自然》新研究的作者之一、德國亥姆霍茲慕尼黑研究中心的認知科學家馬塞爾·賓茨(Marcel Binz)表示：“這些理論各自僅解釋心智的某一特征，但我們的最終目標是整體性地理解人類心智，并揭示其各方面之間的聯系。”

賓茨對ChatGPT等大語言模型有濃厚興趣，認為它們“展現出某種類人的特質”。“詢問任何問題，它們都能給出合理回應。ChatGPT是首個具備些許人類式通用智能特征的計算系統。”

Meta公司于2023年開源的LLaMA(Large Language Model Meta AI)模型是這種通用性的代表，促使賓茨及其團隊設想：能否通過訓練使其在多維度(而非單一維度)上模擬人類心智？

于是，他們決定讓LLaMA學習心理學實驗數據。

團隊精選了160項心理學實驗以提供訓練素材，包括來自6萬多名志愿者的超1000萬條行為反應數據。這些實驗涵蓋多種認知任務：志愿者在游戲中操控飛船開展太空尋寶；記憶列表上的眾多單詞；嘗試在兩臺賠率不同的老虎機里博取最大收益……

接著，賓茨等人讓LLaMA像人類志愿者一樣參與每項實驗。當AI系統做出與人類相似的反應時，研究人員給予獎勵。“我們本質上是在訓練它模仿人類受試者的選擇。”

訓練得到“半人半馬”后，研究團隊就要測試其模擬人類心理的水平了。

在首輪測試中，賓茨等人將一些人類志愿者的反應信息拋給AI(此前從未有接觸)，結果系統基于已知信息準確預測了志愿者后續的行為。

到游戲測試環節，“半人半馬”復刻了人類的智謀。以太空尋寶游戲為例，系統自主開發出與志愿者相同的尋寶策略；不僅如此，當研究人員改變游戲情節，把飛船換成飛毯后，AI與人類的響應一致，都是將原有策略直接轉移至新情境。賓茨感嘆：“系統展現出顯著的泛化能力。”

進入邏輯推理測試環節，機器再現“人性”：人類能答對的題，它也答對；人類容易答錯的，它也往往判斷有誤。

最后，賓茨等人放了個大招——石頭剪刀布。2022年的一項關于人類心理學實驗曾通過此博弈游戲探索人類如何觀察、學習、預判他人的行為模式。這回，要讓“半人半馬”經歷同樣的對局。

結果令人驚喜。AI與人類一樣，都能觀察判斷對手的猜拳策略，準確識別對手的行為模式甚至預判其下一步行動；但當研究團隊把猜拳對手從真人玩家換成算法后，AI也像人類一樣，難以拆解對手策略。

引用賓茨的觀點：“‘半人半馬’能更準確預測真人對手而非算法玩家的行為，這證明系統確實掌握了人類認知中一些至關重要的東西。”

新成果獲得學界高度評價。

斯坦福大學認知科學家拉斯·波爾德拉克(Russ Poldrack)評價道：“這確實是第一個能像人類一樣完成各種類型任務的模型，令人印象深刻。”

紐約大學計算機科學家伊利亞·蘇霍盧茨基(Ilia Sucholutsky)驚嘆：“‘半人半馬’的表現顯著優于傳統認知模型。”

當然，也有部分同行持保留態度。荷蘭拉德堡德大學計算認知科學家奧利維亞·格斯特(Olivia Guest)指出，由于研究者構建“半人半馬”時未采用任何認知理論框架，其預測結果對人類心智運作機制的揭示作用有限。

印第安納大學認知科學家加里·盧皮安(Gary Lupyan)強調，他們的終極追求是能解釋人類思維的理論。“目標不在預測，而在于理解本質。”

賓茨坦然承認，“半人半馬”系統現階段還無法指向某種新的心智理論，但他也期待這款語言模型成為檢驗新理論的基準，展現單一模型模擬多元人類行為的高超水準。

賓茨團隊正著手將心理學實驗數據庫規模擴充至5倍于現狀的水平，并計劃對系統作進階訓練。

資料來源：

《世界科學》雜志版在售中歡迎訂閱

月刊定價

15元/期

全年訂閱價

180元

點擊左側圖片或以下方訂閱方式選購

方式一：

掃描二維碼，“雜志鋪”訂閱有折扣～

方式二：

全國各地郵局訂閱郵發代號：4-263

方式三：

機構訂閱，請撥打

021-53300839；

021-53300838

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

失敗147次后，他三天寫出萬能提示詞模板，600萬網友吵翻了

量子位 2025-07-13 17:09:11
0 跟貼 0
宇樹機器人復雜環境穩定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
199 跟貼 199

垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0

AI教父Hinton暴論：AI永生之日，全人類變烤面包倒計時！

新智元 2025-07-18 19:54:53
2 跟貼 2
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0

研發自動化的初衷是讓每一個研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0

騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
0 跟貼 0
快應用智慧服務生態支持智能體一鍵部署+小程序零成本遷移

雷科技 2025-07-18 22:33:00
0 跟貼 0

下個萬億美元市場！老黃：人形機器人要落地

量子位 2025-05-19 20:06:49
0 跟貼 0
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0
AI正大大降低動漫等虛擬內容制作門檻

量子位 2025-04-25 14:16:10
0 跟貼 0
AI的母語是什么？不是英語，不是漢語

量子位 2025-05-23 17:58:54
0 跟貼 0
網友實測Veo3視頻旋風：模擬車展、上課、ASMR

量子位 2025-05-25 09:14:22
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
教授指控知名期刊：我的論文可能被 AI 拒稿了

生物學霸 2025-07-17 17:22:09
2 跟貼 2
AI能“嘗”出酸甜苦咸，分辨咖啡和可樂，研究被Nature報道了

機器之心Pro 2025-07-16 18:23:43
0 跟貼 0
7B模型超越DeepSeek-R1：模仿人類教師，弱模型也能教出強推理LLM

量子位 2025-06-25 14:29:03
168 跟貼 168
飛書WPS們大戰AI辦公：不拼功能拼「閉環」

雷科技 2025-07-18 22:31:07
1 跟貼 1
走進麥當勞：把AI轉化成真正可用的生產力

虎嗅APP 2025-07-19 00:55:04
0 跟貼 0
馬斯克推出AI虛擬男友“Valentine”，靈感來自《暮光之城》和《五十度灰》

華爾街見聞官方 2025-07-19 03:32:27
0 跟貼 0
重新審視AI明星工程師的天價薪酬

經濟觀察報 2025-07-19 00:58:05
0 跟貼 0
具身概念及具身智能的起源

白駒談人機 2025-07-15 00:03:42
0 跟貼 0
阿德勒哲學課：8個深刻的人性洞見

聽哲學 2025-07-18 22:07:48
0 跟貼 0
中國人工智能市場規模可能會達到500億美元

每日經濟新聞 2025-05-08 22:13:42
0 跟貼 0
心理學家：經歷挫折后，我們的大腦是如何變的更強？

心理學家Tracey 2025-07-17 18:35:24
0 跟貼 0
威爾弗雷德·比昂：精神分析領域的革命性思想家

十八點心理 2025-07-18 20:14:45
0 跟貼 0
六盤水馬拉松 | 19℃涼都賽道，奔跑捕捉山水與美食雙重詩意

馬拉松跑步健身 2025-07-18 22:51:09
0 跟貼 0
交易心理學的重要性

聶小倩的投資圈 2025-07-16 20:43:10
0 跟貼 0
心理學上的高情商人情世故

80后小芳 2025-07-18 20:00:00
0 跟貼 0
這十句話解決你所有的焦慮!

潤林手工 2025-07-16 11:41:22
0 跟貼 0
【百人百城】006位，見識專業的力量

十八點心理 2025-07-18 20:14:29
0 跟貼 0
為啥NPD會在你快樂的時候反倒覺得痛苦？你的痛苦可以反向喂養他

江左梅娘 2025-07-14 17:12:35
0 跟貼 0
河南省宜陽縣司法局開展情緒管理分類教育活動

河洛法治 2025-07-18 17:40:27
0 跟貼 0
青少年心情極度壓抑煩躁如何疏導

飛翔展雁韻 2025-07-18 14:39:37
0 跟貼 0
男子搞不懂這種商業邏輯，一分錢一個的打火機，賠的連底褲都沒了

美妙一籮筐 2025-07-17 14:23:05
752 跟貼 752
商務部：我國社零實際購買力已超過美國為美國的1.6倍

財聯社 2025-07-18 10:18:23
26160 跟貼 26160
牛彈琴：外賣大戰成目前最慘烈商戰全世界目瞪口呆

大象新聞 2025-07-18 07:48:38
9196 跟貼 9196
墜入峽谷的愛與冒險，特工情侶揭秘二戰生化實驗

33追劇社 2025-07-16 10:53:00
1 跟貼 1
英偉達CEO黃仁勛：我是中國人，后來成為美籍華人

盧菁老師 2025-07-18 17:39:03
0 跟貼 0

世界科學

《世界科學》編輯部運營賬號

1739文章數 26866關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

家居

時尚

親子

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你到底該和什么樣的人做朋友？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Nature：原以為 AI 只會算題，直到它用人類的邏輯闖關心理實驗…

凌晨，OpenAI重磅更新，Manus們算白忙活嗎

娃哈哈員工:宗慶后曾欲將51%股份給長子 宗馥莉僅40%

娃哈哈員工:宗慶后曾欲將51%股份給長子 宗馥莉僅40%

夏聯-楊瀚森8+8+5+3帽 開拓者大勝火箭

王琳自曝被兒子打，承認自己水性楊花

娃哈哈爭產大戰：杜建英的進擊

售30萬?方程豹鈦7高配版有激光雷達/車載無人機

態度原創

熱聞|清明假期將至，熱門目的地有哪些?

簡構智居 現代功能美學

這么丑的五指鞋，會是OOTD新風向嗎？

兒科醫生反向科普：如果你想讓孩子慢慢變笨，應該怎么做？ #睡個好覺

娃哈哈員工:宗慶后曾欲將51%股份給長子宗馥莉僅40%

娃哈哈員工:宗慶后曾欲將51%股份給長子宗馥莉僅40%

夏聯-楊瀚森8+8+5+3帽開拓者大勝火箭

簡構智居現代功能美學