預測編碼理論認為:大腦不是被動地接收感官輸入,而是主動地預測即將到來的感官信息,并利用這些預測來指導知覺和行為。那么應(yīng)該如何為其進行建模呢?
撰文 | 黃振業(yè)(中國科學院理論物理研究所2022級博士研究生)
導語
我們的神經(jīng)系統(tǒng)時刻接收著大量感官信息,但它并非只是一個被動的接收器。相反,它更像一個“預言家”,不斷預測外界環(huán)境發(fā)生的事情!這就是神經(jīng)科學中的一個重要理論——預測編碼(Predictive Coding)。預測編碼最初源于信號處理技術(shù),后被引入神經(jīng)科學,揭示了大腦感知世界的機制。其核心觀點是:神經(jīng)系統(tǒng)在感知環(huán)境信號時會主動預測,而非被動接收。以下兩個例子能幫助我們感受到這種預測機制的存在。
(1)不存在的正方形
圖1:Kanizsa正方形錯覺[1]。
上圖中似乎存在一個白色正方形?但實際上只有四個帶有缺口的圓盤。然而,基于以往看到正方形輪廓的經(jīng)驗,我們的大腦主動預測并補全了這個形狀。
(2)在前方還是在后方?
圖2:Flash-lag錯覺[2]。
在上圖中,綠色點似乎出現(xiàn)在紅色點運動軌跡后方(左方)。實際上,綠色點實際出現(xiàn)的位置比紅色點位置超前,但被感知為滯后。這是因為我們的大腦對紅點的位置進行了預測,提前感知到紅色點的位置,而對閃爍的綠色點的響應(yīng)較慢,從而產(chǎn)生錯覺。
視網(wǎng)膜的預測編碼
預測編碼被引入神經(jīng)科學時,首先用于視網(wǎng)膜編碼的建模。
如下圖所示,自然圖像中相近像素的關(guān)聯(lián)度很高,這意味著相鄰像素通常非常相似。一個像素的亮度很大程度上可以被周圍像素預測。
圖3: 自然圖片以及水平方向上不同像素距離的關(guān)聯(lián)函數(shù)。
上述例子為空間上的預測,實際上在時間上也可以進行類似的預測編碼,在此不去贅述。
層級預測編碼
大腦的信息處理存在層級結(jié)構(gòu),高層級神經(jīng)元對低層級神經(jīng)元具有反饋調(diào)節(jié)作用。預測編碼理論因此擴展至層級結(jié)構(gòu)。高層級神經(jīng)元對低層級神經(jīng)元進行預測,并調(diào)節(jié)其響應(yīng)。其處理信息的框架如圖所示。
圖5: 層級預測編碼示意圖。
為什么高層級的神經(jīng)元能夠?qū)Φ蛯蛹壍纳窠?jīng)元活動進行預測呢?高層級神經(jīng)元相比于低層級神經(jīng)元能夠接收到更多信息,利用得到的信息可以對低層級神經(jīng)元的活動進行預測。層級預測編碼成功地解釋了神經(jīng)系統(tǒng)中存在的非經(jīng)典感受野現(xiàn)象。
圖6:非經(jīng)典感受野示意圖[6]。
如上圖為情景效應(yīng),中間區(qū)域為神經(jīng)元感受野。當感受野外圍的刺激模式與中心區(qū)域一致時(上圖),神經(jīng)元的響應(yīng)會被預測到,神經(jīng)元響應(yīng)減弱(下圖);當感受野外部的輸入與感受野內(nèi)部的刺激模式不同時,神經(jīng)元響應(yīng)則更強。
方興未艾的預測編碼理論
隨著研究的推進,預測編碼被應(yīng)用到更真實的脈沖神經(jīng)網(wǎng)絡(luò);其理論框架也被推廣到自由能原理;在功能解釋上,預測編碼成為理解感知、注意力和空間認知等高級認知功能的機制之一;在編碼性質(zhì)上,預測編碼系統(tǒng)展現(xiàn)出豐富的相變現(xiàn)象。預測編碼為理解大腦智能提供了新的視角,這一充滿活力的理論將繼續(xù)引領(lǐng)我們深入探索大腦這一“預測機器”的奧秘。
本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號“中國科學院理論物理研究所”,原題目為《Doctor Curious 65:預測編碼:神經(jīng)系統(tǒng)的主動感知》。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.