設置星標 關注,從此你的世界多點科學~
AI應用已滲透人類生活的各方各面,在很多比拼智能的領域,它們可以戰勝人類頂尖大師,甚至將領域拔高到人類本不可想象的層次,例如棋弈能手AlphaGo和蛋白質三維結構預測大神Alphafold。
不過AI現有的局限性也顯而易見,其中重要一項就是通用性不足、限于特定化任務。例如,人類棋手能每天開車去棋館,但要叫AI棋手開展駕駛的話,它就抓瞎了。
而在近些年成為行業焦點的通用人工智能AGI,其終極追求正是與人類智能無異的系統,像人類一樣執行各種復雜任務的能力,模仿人類又超越人類的通用性和適應性。
這就會引出一個很有趣的話題:一個完全模仿人類智能的AI,是否也應當擁有人類的心智,擁有所謂的“人性”?
根據《自然》雜志7月的最新報道,有國際科學家團隊通過將大量原本針對人類志愿者的心理學實驗投向AI,使其經受“人性”訓練,得到了一個表現出某些人類般心智特征的類ChatGPT系統,名為“半人半馬”(Centaur)。
給模型起名“半人半馬”致敬了希臘神話中上半身為人、下半身為馬的怪物
近幾十年來,認知科學家建立起復雜的理論體系用以解釋人類心智的多種功能,包括學習、記憶、決策等。為驗證理論,科學家通過實驗觀察人類行為是否符合理論預測。
部分理論經得起實踐檢驗,甚至還解釋了人類心智的某些獨特之處。舉個例子,人類通常傾向于確定性選項而非風險決策,即便可能因選擇確定性(比如五千元必得收益)而錯失高收益的機會(比如有望博得十幾萬的賭局)。
《自然》新研究的作者之一、德國亥姆霍茲慕尼黑研究中心的認知科學家馬塞爾·賓茨(Marcel Binz)表示:“這些理論各自僅解釋心智的某一特征,但我們的最終目標是整體性地理解人類心智,并揭示其各方面之間的聯系。”
賓茨對ChatGPT等大語言模型有濃厚興趣,認為它們“展現出某種類人的特質”。“詢問任何問題,它們都能給出合理回應。ChatGPT是首個具備些許人類式通用智能特征的計算系統。”
Meta公司于2023年開源的LLaMA(Large Language Model Meta AI)模型是這種通用性的代表,促使賓茨及其團隊設想:能否通過訓練使其在多維度(而非單一維度)上模擬人類心智?
于是,他們決定讓LLaMA學習心理學實驗數據。
團隊精選了160項心理學實驗以提供訓練素材,包括來自6萬多名志愿者的超1000萬條行為反應數據。這些實驗涵蓋多種認知任務:志愿者在游戲中操控飛船開展太空尋寶;記憶列表上的眾多單詞;嘗試在兩臺賠率不同的老虎機里博取最大收益……
接著,賓茨等人讓LLaMA像人類志愿者一樣參與每項實驗。當AI系統做出與人類相似的反應時,研究人員給予獎勵。“我們本質上是在訓練它模仿人類受試者的選擇。”
訓練得到“半人半馬”后,研究團隊就要測試其模擬人類心理的水平了。
在首輪測試中,賓茨等人將一些人類志愿者的反應信息拋給AI(此前從未有接觸),結果系統基于已知信息準確預測了志愿者后續的行為。
到游戲測試環節,“半人半馬”復刻了人類的智謀。以太空尋寶游戲為例,系統自主開發出與志愿者相同的尋寶策略;不僅如此,當研究人員改變游戲情節,把飛船換成飛毯后,AI與人類的響應一致,都是將原有策略直接轉移至新情境。賓茨感嘆:“系統展現出顯著的泛化能力。”
進入邏輯推理測試環節,機器再現“人性”:人類能答對的題,它也答對;人類容易答錯的,它也往往判斷有誤。
最后,賓茨等人放了個大招——石頭剪刀布。2022年的一項關于人類心理學實驗曾通過此博弈游戲探索人類如何觀察、學習、預判他人的行為模式。這回,要讓“半人半馬”經歷同樣的對局。
結果令人驚喜。AI與人類一樣,都能觀察判斷對手的猜拳策略,準確識別對手的行為模式甚至預判其下一步行動;但當研究團隊把猜拳對手從真人玩家換成算法后,AI也像人類一樣,難以拆解對手策略。
引用賓茨的觀點:“‘半人半馬’能更準確預測真人對手而非算法玩家的行為,這證明系統確實掌握了人類認知中一些至關重要的東西。”
新成果獲得學界高度評價。
斯坦福大學認知科學家拉斯·波爾德拉克(Russ Poldrack)評價道:“這確實是第一個能像人類一樣完成各種類型任務的模型,令人印象深刻。”
紐約大學計算機科學家伊利亞·蘇霍盧茨基(Ilia Sucholutsky)驚嘆:“‘半人半馬’的表現顯著優于傳統認知模型。”
當然,也有部分同行持保留態度。荷蘭拉德堡德大學計算認知科學家奧利維亞·格斯特(Olivia Guest)指出,由于研究者構建“半人半馬”時未采用任何認知理論框架,其預測結果對人類心智運作機制的揭示作用有限。
印第安納大學認知科學家加里·盧皮安(Gary Lupyan)強調,他們的終極追求是能解釋人類思維的理論。“目標不在預測,而在于理解本質。”
賓茨坦然承認,“半人半馬”系統現階段還無法指向某種新的心智理論,但他也期待這款語言模型成為檢驗新理論的基準,展現單一模型模擬多元人類行為的高超水準。
賓茨團隊正著手將心理學實驗數據庫規模擴充至5倍于現狀的水平,并計劃對系統作進階訓練。
資料來源:
《世界科學》雜志版在售中 歡迎訂閱
月刊定價
15元/期
全年訂閱價
180元
點擊左側圖片或以下方訂閱方式選購
方式一:
掃描二維碼,“雜志鋪”訂閱有折扣~
方式二:
全國各地郵局訂閱 郵發代號:4-263
方式三:
機構訂閱,請撥打
021-53300839;
021-53300838
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.