神經元是通過電信號和化學信號在全身傳遞信息的神經細胞,它們在組織中按照一定規律排列,通常會根據功能聚集。例如,語言研究發現,一些神經元簇似乎專注于處理動詞,而另一些則專門負責名詞。不過,這些功能區是如何形成的,科學界尚未得出明確結論。
以往的人工智能語言模型已經能夠成功識別這些功能性的神經元簇,但對它們在大腦中如何排列尚未涉及。
近日,研究人員開發了一種名為 TopoLM 的全新語言模型。它不僅可以模擬神經元的功能聚集特性,還首次再現了這些細胞在大腦中的空間排列模式。在題為《TopoLM: brain-like spatio-functional organization in a topographic language model》的論文中,研究團隊詳細介紹了 TopoLM 如何成功預測大腦皮層語言系統的空間功能分布。這篇論文入選 ICLR 2025(國際學習表征會議)口頭報告。
“我們借鑒了大腦視覺處理機制的研究,對語言模型的內部結構做了一些細微調整,引入了一條新規則,使得模型的內部表征在空間上更加‘平滑’。最終形成的 TopoLM 模型構建了空間聚類結構,其功能與人腦語言處理過程中觀察到的活動高度一致?!盢euroAI 實驗室負責人、助理教授 Martin Schrimpf 表示。
“這是一個基礎性問題,我們希望了解大腦中的空間或功能集群最初是如何產生的。”Schrimpf 補充道:“TopoLM 顯示,可能僅憑一條簡單規則——即相鄰神經元傾向于執行相似功能——就能實現這樣的組織結構。”
構建具有類腦空間功能組織的地形語言模型
研究人員認為,TopoLM 為提升人工智能系統與人類認知功能的一致性提供了新思路,也為腦啟發計算和神經語言學的研究提供了實踐框架。
“這代表我們朝著打造更具類腦結構的人工智能系統邁出了激動人心的一步。我們的核心目標之一是構建更好的大腦模型,而 TopoLM 將我們距離實際臨床應用又推進了一步,未來有望用于幫助患有語言障礙或相關語言缺陷的人群。”論文作者之一、NeuroAI 與 IC 自然語言處理實驗室(NLP)博士助理 Badr AlKhamissi 表示。
TopoLM:跨語言選擇聚類的個體反應
這項研究還帶來了在可解釋性方面的進展,也就是對大型語言模型(LLM)內部運行機制的理解。LLM 通常通過“向量”來表示每一個人工“神經元”,而要理解模型學到的內容,往往需要對每個向量逐個或成組分析。
TopoLM 則通過將內部結構組織為功能簇,使研究人員能夠直接觀察這些簇及其組成,從而更清晰地理解模型如何表示和處理語言。這種聚類結構本身就體現了語義上的重要類別。
接下來,這項前沿研究將進入新階段:EPFL 團隊計劃在人體大腦中驗證模型預測的準確性。
“TopoLM 的表現遠超我們的預期,我們希望驗證它的預測是否在真實大腦中成立。模型中有一些尚未在人腦中發現的神經元簇,可能是因為此前從未有人嘗試尋找。我們將與在美從事人體實驗的同事合作,啟動一項成像研究,以確定這些簇是否真實存在?!盨chrimpf 總結道。
參考內容:
Neil Rathi et al, TopoLM: brain-like spatio-functional organization in a topographic language model, arXiv (2024). DOI: 10.48550/arxiv.2410.11516
僅用于學術分享,若侵權請留言,即時刪侵!
歡迎加入腦機接口社區交流群,
探討腦機接口領域話題,實時跟蹤腦機接口前沿。
加微信群:
添加微信:RoseBCI【備注:姓名+行業/專業】。
歡迎來稿
1.歡迎來稿。投稿咨詢,請聯系微信:RoseBCI
點擊投稿:
2.加入社區成為兼職創作者,請聯系微信:RoseBCI
一鍵三連「分享」、「點贊」和「在看」
不錯過每一條腦機前沿進展
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.