來源:DeepTech深科技
深度神經網絡(DNN,Deep Neural Network)作為 AI 領域的重要突破,在視覺感知任務中展現出卓越的性能表現,其識別準確率等關鍵指標甚至已在特定場景下超越人類水平。這使人們普遍認為,人工智能技術的快速發展將促進對生物智能的深入理解。
然而,由美國布朗大學和美國哥倫比亞大學聯合團隊最近開展的一項研究卻提出了不同的觀點:隨著 AI 模型在物體識別任務上的表現越來越強,其在神經表征(如下顳葉皮層活動模式)和行為反應(如注意力分配策略)兩個關鍵維度上,與靈長類動物視覺系統的差異反而越來越大。
這提示人們,高性能的 AI 模型并不等于類腦模型,也就是說,模型如果只是為了提升任務準確率,未必會更接近大腦的運算機制。這對神經科學、認知科學與 AI 交叉研究敲響警鐘:不能再假設“AI 表現越好,就越接近人腦”。這一發現挑戰了人們長期以來的假設,即 AI 的進步將自然而然地推動腦與認知科學的發展。
該論文第二作者、哥倫比亞大學在讀博士生馮品源對 DeepTech 表示:“未來的 AI 研究需要明確目標——是構建功能性工具,還是理解大腦機制。如果是后者,我們需要反過來用腦與認知科學的發現來約束模型的設計,而不是僅依賴工程優化。”
圖丨論文主要作者從左至右分別為:德魯·林斯利(Drew Linsley)、馮品源和托馬斯·瑟爾(Thomas Serre)(來源:資料圖)
日前,相關論文以《更強大的人工智能并不意味著更好的生物模型》(Better artificial intelligence does not mean better models of biology)為題發表在預印本網站
arXiv[1]。布朗大學德魯·林斯利(Drew Linsley)研究助理教授是第一作者,馮品源是第二作者,布朗大學托馬斯·瑟爾(Thomas Serre)教授擔任通訊作者。
圖丨相關論文(來源:
arXiv
從歷史維度來看,人工智能的發展起源于對人腦機制的探索,這一淵源在專業術語中仍有體現——諸如“神經網絡”“表征”等核心概念都直接借鑒自神經科學與心理學等領域。典型如諾貝爾物理學獎得主杰弗里·辛頓(Geoffrey Hinton)的學術軌跡,其早期認知心理學研究對人腦的探索為后續 AI 突破奠定了理論基礎。
然而,隨著計算硬件的迭代升級和技術范式的革新,AI 發展的主導力量已從神經科學、心理學轉向計算機科學,這一轉變帶來了研究范式的根本性重構。過去人們相信,通過優化任務表現(比如 ImageNet 分類 [2]),模型就能自發學到類似人腦的表征,但是從 AI 目前的發展來看,這套邏輯正在失效。
圖丨隨著深度神經網絡在物體識別方面的性能提升,它們作為生物視覺模型的適用性反而降低了(來源:
arXiv
在這一研究背景下,團隊提出了“和諧化”方法,嘗試在模型優化中引入人類視覺的注意機制。通過調整訓練數據和目標函數,使模型決策時更關注與人類視覺系統一致的關鍵區域,初步驗證了提升模型生物合理性的可行性。
然而,該方法仍面臨核心挑戰:高質量人類行為數據的匱乏使得優化過程本質上仍未完全脫離監督學習的框架。盡管如此,這一研究方向具有雙重價值——既增強了模型可解釋性,又為理解人類視覺機制提供了新視角。
圖丨隨著深度神經網絡開發策略在過去十年間的演變,驅動其生物視覺預測的模型因素也發生了相應變化(來源:
arXiv
基于這些發現,該研究強調視覺科學需要建立獨立于工程 AI 的方法論體系,同時選擇性吸收神經科學的啟示來優化 DNN 的能效、泛化和魯棒性。
重點突破方向包括:時間編碼機制、動態稀疏連接(模擬神經節能)、反饋/橫向結構(實現類皮層的注意調控)、突觸可塑性(支持持續學習)以及多模態整合(借鑒海馬記憶機制)。這些探索需要在生物合理性與計算效率間尋求平衡,優先實現工程可行的關鍵特性,而非完全模擬生物細節。
研究指出,當前工程優化的 AI 模型存在系統性偏差,視覺科學研究需審慎使用。未來的突破有賴于生物數據與大規模訓練的深度結合,這需要神經科學、認知科學和 AI 領域在實驗平臺、訓練流程和評估標準上建立協同機制。
需要了解的是,大腦不是為靜態單一模態任務進化的,而是在一個不斷變化、充滿多感官輸入的世界中發展出來的。因此,傳統監督學習的原理和大腦的學習機制之間存在本質差異。正是這一認知推動了自監督學習的興起,該方法通過從原始數據中自主發掘潛在規律,有效減少了對人工標注的依賴,展現出更強的生物合理性。
另外,如果希望模型學到類似生物的視覺策略,訓練環境也應該是多模態、動態、交互式的。例如,可以設計一個虛擬環境,模型需要不斷與環境互動、預測未來、聚焦目標以及躲避風險。
馮品源解釋說道:“這樣的環境將促使模型發展出更強的注意機制、時序整合機制和多模態融合能力。隨著具身智能概念的火爆,越來越多的人也關注這一方向——從讓 AI 靜態感知到真實世界的物體進行交互,從中獲得有用的多維度信息。”
圖丨深度神經網絡能夠通過訓練來模擬類人的視覺策略(來源:
arXiv
目前,馮品源在哥倫比亞大學祖克曼研究所(Zuckerman Institute)下屬的“視覺推理”實驗室(Visual Inference Lab)研究人與 AI 的視覺機制,他的導師是尼古拉斯·克里格斯科特(Nikolaus Kriegeskorte)教授。
他正在努力將認知科學和神經科學的見解推動 AI 發展,同時利用 AI 促進對人類智能的理解。在加入哥倫比亞大學之前,他在布朗大學獲得碩士學位,師從托馬斯·瑟爾(Thomas Serre)教授,主要研究人類與機器在表征對齊方面的關系。
托馬斯·瑟爾團隊的前期研究為這一領域奠定了重要基礎。在視覺行為層面,他們開發的新型對齊機制首次實現了 AI 在復雜場景中與人類認知策略的高度一致;在神經表征層面,他們發現工程優化的 AI 模型與生物視覺的神經活動模式存在系統性偏離。這些發現為構建新一代神經可解釋的感知模型提供了理論框架和方法學指導。
未來,該團隊將聚焦兩個方向繼續研究:圍繞 AI 模型展開深度探索,從動態數據(如視頻)中學習,使模型的視覺能力更靠近人類;繼續構建橫跨認知科學、神經科學與計算機科學領域的大規模數據平臺,推動跨學科研究標準的建立與互認。這些方向有助于為 AI 與生物智能研究提供更豐富的視角。
參考資料:
1.https://arxiv.org/pdf/2504.16940
2.https://ieeexplore.ieee.org/document/5206848
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到3月31日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.