今年年初的時候Geoffrey Hinton在巴黎做了個什么是理解的演講,最近也思考人類的思維和機器思維的問題,因此重新回顧Hinton說的握手機制。
1. 當我們看到一個詞,如何知道它的意思
語言是一個符號,符號是用來表達某個概念。但是對于不懂這個符號的人,概念或者意思從哪里來?
Hinton的觀點是“Meaning is having a model”
理解一個詞,首先是構(gòu)建它的“內(nèi)部模型”,詞義源于我們?nèi)绾卧谀X中、或在向量空間中,塑造它的表征。
但是如何表征呢, 語言學家J.?R.?Firth講:“A word is characterized by the company it keeps.”
基于此的分布式表達理論指出,詞的含義由它與周圍詞匯的共現(xiàn)模式?jīng)Q定。
正如當我們讀到“蘋果”時,腦海里不僅浮現(xiàn)果實的形狀、味道,還有“紅色”“果園”“維生素”等多重語義激活,它們共同構(gòu)成對“蘋果”的理解模型。
2. 生物計算建模:神經(jīng)握手中的共識
在大腦里,億萬個神經(jīng)元通過電脈沖和突觸連接,形成高維的概念網(wǎng)絡(luò)。
每個詞或概念對應(yīng)特定的神經(jīng)活動模式,當我們思考或閱讀時,這些模式在皮層與關(guān)聯(lián)區(qū)間反復“握手”——即相互激活、抑制與反饋,直至產(chǎn)生穩(wěn)定的意義感。
侯世達在《表象與本質(zhì)》中以類比方式指出:心智表征類似于多種神經(jīng)示意圖的耦合,理解就是這些圖譜通過動態(tài)耦合不斷自我校準的過程。這一握手式的交互,使得人類能夠在多模態(tài)信息(視覺、聽覺、語言)間迅速建立關(guān)聯(lián),實現(xiàn)流暢的語義推理。
生物神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)
3. 數(shù)字計算建模:向量空間中的握手與理解革命
與生物大腦類似,現(xiàn)代神經(jīng)網(wǎng)絡(luò)也在追求通過“握手”機制來實現(xiàn)理解。詞被編碼為高維向量,通過深層神經(jīng)網(wǎng)絡(luò)進行動態(tài)變換,逐層構(gòu)建出新的語義表示。
早期語言學強調(diào)形式規(guī)則,Chomsky 的句法理論將語言理解抽象為句子結(jié)構(gòu)與推理機制,但難以解釋實際語言使用中的多樣性與模糊性。對此,Hinton 曾明確表達不滿,并于1985年提出“小語言模型”(small language models),強調(diào)統(tǒng)計分布在語言學習中的作用。
這一思路最終在 Transformer 架構(gòu)中開花結(jié)果。Transformer 的注意力機制(attention)正是典型代表:每個詞的 Query(查詢)向量,與所有詞的 Key(鍵)向量做點積“握手”,計算相似度權(quán)重,再用這些權(quán)重加權(quán)各詞的 Value(值)向量,生成新的表征。
Query–Key 握手:Query 問,Key 答;二者點積決定信息流向。
多頭注意力:并行多組 Query–Key–Value,實現(xiàn)多角度語義對齊。
位置編碼:在純向量計算中引入序列順序信息,補全生物神經(jīng)對時序的敏感。
Hinton把此比喻成“樂高”游戲,只是我們面對的不是三維的樂高,而是數(shù)千維的樂高。
這套機制讓機器在成千上萬維度中快速完成語義匹配和結(jié)構(gòu)學習——正如數(shù)千個齒輪同時轉(zhuǎn)動,卻又精準嚙合。
4. 握手之外:數(shù)字智能的優(yōu)勢與隱憂
Hinton的結(jié)論是:
人的理解機制和機器的理解機制其實一樣。
不同的是,數(shù)字系統(tǒng)可通過復制模型、并行推理、云端協(xié)作,以接近零邊際成本的方式,共享與擴散知識。數(shù)以億計的參數(shù)模型瞬時協(xié)作,其吞吐量與可擴展性遠超任何單一大腦。
效率:千倍于人腦的并行運算速度。
可復制性:訓練一次,可部署萬千副本、一致性保留。
共享性:模型權(quán)重可跨網(wǎng)絡(luò)即時分發(fā),知識無縫傳遞。
這帶來了深刻影響:當機器“握手”速度與覆蓋面均超越人類,我們對認知獨特性的自信或?qū)訐u。數(shù)字理解不僅在精度上趕超,更可能在廣度、深度與成本效益上碾壓生物理解。
所以最后Hinton 在演講結(jié)尾發(fā)出警示
“If energy is cheap or abundant, digital computation is just better than biological computation, because it can share knowledge efficiently.”
“That is very scary conclusion.”
J.?R.?Firth, 1957, A synopsis of linguistic theory
Chomsky, 1957, Syntactic Structures
Geoffrey E. Hinton and Terrence J. Sejnowski,1985,A learning algorithm for Boltzmann Machines
Douglas R.?Hofstadter and Emmanuel Sander, 2013, Surfaces and Essences: Analogy as the Fuel and Fire of Thinking
Ashish Vaswani,2017,Attention Is All You Need
Geoffrey Hinton, 2025, What is understanding?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.