(來源:MIT Technology Review)
當前,人工智能發(fā)展的核心悖論在于:神經(jīng)網(wǎng)絡(luò)雖以人腦為靈感來源,卻在運行機制上與生物體存在本質(zhì)差異。一個蹣跚學步的幼兒僅需日常飲食和語言互動就能自然習得溝通能力;而科技巨頭卻不得不動用核電站級的能源、制造環(huán)境代價,甚至引發(fā)數(shù)據(jù)倫理爭議,才能維持其大語言模型的運轉(zhuǎn)。
這種仿生與異質(zhì)并存的特征,使人工智能與腦科學形成了奇妙的鏡像關(guān)系。雖然二者在能耗和數(shù)據(jù)需求上存在數(shù)量級的差異,但作為地球上僅有的兩個能實現(xiàn)復(fù)雜語言生成的系統(tǒng),它們確實共享著某些深層特性:都采用分布式并行處理架構(gòu)(人腦依靠 860 億生物神經(jīng)元,AI 依賴參數(shù)化的虛擬節(jié)點);都展現(xiàn)出涌現(xiàn)性的智能特征;也都讓研究者陷入“知其然不知其所以然”的困境。
作為橫跨神經(jīng)科學與人工智能報道的從業(yè)者,筆者目睹了這一交叉領(lǐng)域的勃興。神經(jīng)科學家們普遍認為,構(gòu)建類似大腦的神經(jīng)網(wǎng)絡(luò)是該領(lǐng)域最有前途的途徑之一,這種觀點也開始蔓延到心理學領(lǐng)域。
上周,在權(quán)威期刊Nature上發(fā)表的兩篇背靠背研究中,展示了神經(jīng)網(wǎng)絡(luò)在心理實驗中預(yù)測人類和其他動物行為的應(yīng)用。這兩項研究都表明,這些經(jīng)過訓練的模型可以幫助科學家加深對人類思維的理解。但預(yù)測行為和解釋行為的產(chǎn)生是兩碼事。
原始的大型語言模型并不擅長模擬人類行為,例如在賭場等讓人喪失理智的場景中,它們?nèi)员3诌壿嬇袛唷?strong>在第一項研究中,研究人員對基于 Meta 的開源模型 Llama 3.1 進行微調(diào)優(yōu)化,通過 160 個心理學實驗的超過一千萬個決策的專項訓練,包含“選擇最優(yōu)老虎機獲取最大收益”或“記憶字母序列”等任務(wù),獲得的名為“半人馬”(Centaur)的模型能夠以高保真度模擬人類的選擇模式和反應(yīng)時間。
與使用簡單數(shù)學方程的傳統(tǒng)心理學模型相比,“半人馬”模型在行為預(yù)測方面表現(xiàn)更優(yōu)。準確預(yù)測人類在心理學實驗中的反應(yīng)本身就極具價值:例如科學家可在招募付費受試者前,先用該模型在計算機上預(yù)演實驗。但研究者在其論文中提出,“半人馬”不應(yīng)僅作為預(yù)測工具——通過解析其模擬人類行為的機制,或能催生關(guān)于心智運作的新理論。
不過部分心理學家質(zhì)疑該模型對理解心智的貢獻。雖然其行為預(yù)測確實優(yōu)于傳統(tǒng)模型,但參數(shù)規(guī)模卻超出后者十億倍。模型的外在表現(xiàn)像人類,絕不意味著內(nèi)在機制亦如此。荷蘭拉德堡德大學計算認知科學助理教授 Olivia Guest 將其比作計算器:雖能準確預(yù)測數(shù)學天才的加法答案,但研究計算器無助于理解人類算術(shù)機制。
即便“半人馬”真能捕捉人類心理的某些關(guān)鍵特征,科學家仍難從其數(shù)百萬“神經(jīng)元”中提取洞見。盡管人工智能研究者正努力破解大語言模型的工作原理,這個黑箱仍未被真正打開。要理解這種巨型神經(jīng)網(wǎng)絡(luò)心智模型,其難度恐怕不亞于直接研究人腦本身。
這種困境在另一項研究中得到某種程度的平衡。第二項研究聚焦微型神經(jīng)網(wǎng)絡(luò)(最小僅含單個神經(jīng)元),卻能預(yù)測小鼠、大鼠、猴子乃至人類行為。因其結(jié)構(gòu)極簡,研究者可追蹤每個神經(jīng)元的激活狀態(tài),從而解析整個網(wǎng)絡(luò)的預(yù)測機制。雖無法保證這些模型與模擬大腦的運作方式相同,但至少能為人類和動物認知研究提供可驗證的假說。
可解釋性需要代價。與能處理數(shù)十種任務(wù)的“半人馬”不同,每個微型網(wǎng)絡(luò)僅適用于單一任務(wù),例如某個網(wǎng)絡(luò)專精預(yù)測人類選擇老虎機的行為?!靶袨樵綇?fù)雜,所需網(wǎng)絡(luò)就越大,”紐約大學心理學與神經(jīng)科學助理教授、該研究的領(lǐng)導(dǎo)者 Marcelo Mattar 指出(他同時參與了“半人馬”項目),“代價就是模型變得極其難以理解。”
這種預(yù)測與理解的權(quán)衡正是神經(jīng)網(wǎng)絡(luò)科學的典型特征。Mattar 的研究正在縮小這一差距——盡管網(wǎng)絡(luò)規(guī)模極小,其預(yù)測精度仍超越傳統(tǒng)心理學模型。Anthropic 等機構(gòu)對大模型可解釋性的研究也是如此。但就目前而言,從人類心智到氣候系統(tǒng)再到蛋白質(zhì)結(jié)構(gòu),我們對復(fù)雜系統(tǒng)的理解能力已遠遠落后于預(yù)測能力。
站在技術(shù)哲學的高度來看,我們正在見證一場新的“認識論轉(zhuǎn)向”:當傳統(tǒng)還原論方法在復(fù)雜系統(tǒng)前節(jié)節(jié)敗退時,神經(jīng)網(wǎng)絡(luò)既提供了新的研究工具,也帶來了新的認知困境?;蛟S正如量子力學顛覆經(jīng)典物理的認知框架那樣,理解智能本質(zhì)的革命性突破,正孕育在這些預(yù)測與解釋的張力之中。
https://www.technologyreview.com/2025/07/08/1119777/scientists-use-ai-unlock-human-mind/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.