在 20 世紀(jì)后半期,物理學(xué)沿著前半世紀(jì)的發(fā)現(xiàn)繼續(xù)發(fā)展。量子力學(xué)理論為我們揭示了宇宙的奧秘,從而催生了大量實(shí)用應(yīng)用。
隨后,物理學(xué)開(kāi)始應(yīng)對(duì)另一個(gè)重大挑戰(zhàn)——復(fù)雜性。這包括自然系統(tǒng)的復(fù)雜性,例如生態(tài)系統(tǒng)和氣候,也包括人類(lèi)制造的系統(tǒng),如經(jīng)濟(jì)市場(chǎng)和交通系統(tǒng)。人類(lèi)大腦及其所處的社會(huì)系統(tǒng)是最終的復(fù)雜系統(tǒng)。
實(shí)際上,大腦的復(fù)雜性激發(fā)了人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,目的是通過(guò)數(shù)據(jù)學(xué)習(xí)來(lái)解決問(wèn)題,就像我們通過(guò)經(jīng)驗(yàn)學(xué)習(xí)一樣。這種“深度學(xué)習(xí)”自此對(duì)科學(xué)作出了巨大貢獻(xiàn),并在本月獲得了諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)的認(rèn)可。如今,我們正處于一個(gè)由大數(shù)據(jù)和超大規(guī)模計(jì)算驅(qū)動(dòng)的科學(xué)新時(shí)代的起點(diǎn)。未來(lái)幾十年,深度學(xué)習(xí)將對(duì)科學(xué)產(chǎn)生何種影響?
我的新書(shū)《ChatGPT與人工智能的未來(lái):深度語(yǔ)言革命》(ChatGPT and the Future of AI: The Deep Language Revolution)回顧了大語(yǔ)言模型的起源,并探討了將塑造下一代人工智能的研究工作。(我還會(huì)在我的 Substack 專(zhuān)欄《Brains and AI》中繼續(xù)討論這個(gè)話(huà)題。)本書(shū)節(jié)選部分描述了語(yǔ)言的演變?nèi)绾斡绊懘笳Z(yǔ)言模型,并探討了神經(jīng)科學(xué)與人工智能的概念如何相互交融,推動(dòng)這兩個(gè)領(lǐng)域的前進(jìn)。
語(yǔ)言的演變
我曾參加過(guò)一場(chǎng)在洛克菲勒大學(xué)舉辦的研討會(huì),其中一場(chǎng)小組討論涉及語(yǔ)言及其起源。兩位在各自領(lǐng)域內(nèi)享有盛名的學(xué)者對(duì)語(yǔ)言的觀點(diǎn)截然相反:諾姆·喬姆斯基(Noam Chomsky)認(rèn)為,既然語(yǔ)言是天生的,那么一定存在一個(gè)獨(dú)特演化于人類(lèi)的“語(yǔ)言器官”。悉尼·布倫納(Sydney Brenner)則持更生物學(xué)的觀點(diǎn),認(rèn)為演化會(huì)找到非直觀的解決方案。布倫納以他的機(jī)智聞名,他舉了個(gè)例子:與其尋找一種“語(yǔ)言基因”,不如考慮可能存在一種“語(yǔ)言抑制基因”,演化在猩猩中保留了這種基因,但在人類(lèi)中將其阻斷。
鳥(niǎo)類(lèi)學(xué)習(xí)鳴唱的過(guò)程和人類(lèi)獲得語(yǔ)言的方式之間有一些相似之處。洛克菲勒大學(xué)的埃里希·賈維斯(Erich Jarvis)試圖理解能學(xué)習(xí)復(fù)雜歌曲的鳥(niǎo)類(lèi)(如金絲雀和椋鳥(niǎo))和無(wú)法學(xué)習(xí)歌曲的其他鳥(niǎo)類(lèi)之間的大腦差異。他對(duì)多種鳥(niǎo)類(lèi)的基因組進(jìn)行了測(cè)序,發(fā)現(xiàn)了兩者之間的差異。他特別發(fā)現(xiàn)了一個(gè)基因,該基因控制從高聲中樞(HVc)向下層運(yùn)動(dòng)區(qū)域的投射發(fā)育,而這些下層區(qū)域負(fù)責(zé)驅(qū)動(dòng)鳴管肌肉的控制。在發(fā)育過(guò)程中,這個(gè)基因通過(guò)抑制產(chǎn)生歌曲所需的直接投射來(lái)發(fā)揮作用。在鳴禽的高聲區(qū),這個(gè)基因沒(méi)有表達(dá),這使得投射能夠形成,從而實(shí)現(xiàn)對(duì)鳥(niǎo)鳴的快速控制。令人驚訝的是,他發(fā)現(xiàn)在人類(lèi)中相同的基因在喉部運(yùn)動(dòng)皮層中被“沉默”了,而這個(gè)區(qū)域會(huì)向控制聲帶的運(yùn)動(dòng)區(qū)域投射;但在黑猩猩中,該基因并未被沉默。悉尼·布倫納不僅機(jī)智,而且判斷正確!
同樣重要的是對(duì)聲道的改造,使其能夠快速調(diào)節(jié)寬頻譜的聲音頻率。嘴部和喉部的快速發(fā)音序列是大腦能生成的最快的運(yùn)動(dòng)程序。這些結(jié)構(gòu)是脊椎動(dòng)物的古老部位,經(jīng)過(guò)演化的改進(jìn)和完善,使得人類(lèi)可以進(jìn)行語(yǔ)言交流。為了解釋語(yǔ)言的奧秘而假設(shè)的“語(yǔ)言器官”,實(shí)際上是分布在預(yù)先存在的感覺(jué)運(yùn)動(dòng)系統(tǒng)之中的。
支撐語(yǔ)言和思維的大腦機(jī)制是共同演化的。皮層和基底神經(jīng)節(jié)之間的回路本來(lái)用于生成動(dòng)作序列,后來(lái)被重新用于學(xué)習(xí)和生成詞語(yǔ)序列。人類(lèi)前額皮層的巨大擴(kuò)展使得類(lèi)似的回路可以生成一系列的思維。基底神經(jīng)節(jié)在強(qiáng)化學(xué)習(xí)中作為一個(gè)參與者,它學(xué)習(xí)采取下一步行動(dòng)的價(jià)值,使行動(dòng)和語(yǔ)言朝著實(shí)現(xiàn)未來(lái)的獎(jiǎng)勵(lì)和目標(biāo)方向發(fā)展。
Transformer 模型的外環(huán)讓人聯(lián)想到大腦中皮層和基底神經(jīng)節(jié)之間的回路,該回路被認(rèn)為對(duì)學(xué)習(xí)和生成運(yùn)動(dòng)動(dòng)作序列至關(guān)重要,并與運(yùn)動(dòng)皮層一起運(yùn)作,在與前額皮層的回路中產(chǎn)生思維序列。基底神經(jīng)節(jié)還會(huì)自動(dòng)化經(jīng)常練習(xí)的序列,從而釋放出參與意識(shí)控制的皮層區(qū)域的神經(jīng)元去處理其他任務(wù)。遇到特殊或稀有情況時(shí),皮層可以介入控制。當(dāng)多個(gè)皮層區(qū)域的輸入在基底神經(jīng)節(jié)中匯聚時(shí),產(chǎn)生更廣泛的背景信息,有助于決定下一步的動(dòng)作或思維。基底神經(jīng)節(jié)可能就像 Transformer 中強(qiáng)大的多頭注意力機(jī)制。在皮層和基底神經(jīng)節(jié)之間的回路中,任何一個(gè)區(qū)域都可以在決策中發(fā)揮作用。
大語(yǔ)言模型通過(guò)預(yù)測(cè)句子中的下一個(gè)詞來(lái)進(jìn)行訓(xùn)練。為什么這種方法如此有效?為了更好地進(jìn)行預(yù)測(cè),Transformer 學(xué)習(xí)了句子結(jié)構(gòu)的內(nèi)部模型,甚至構(gòu)建了更復(fù)雜的語(yǔ)義模型,用于理解詞語(yǔ)之間的含義和關(guān)系。模型還必須學(xué)習(xí)句子的因果結(jié)構(gòu)。令人驚訝的是,僅通過(guò)一步步的預(yù)測(cè)可以學(xué)習(xí)到這么多內(nèi)容。如果大腦沒(méi)有利用這種“逐步推進(jìn)”的方法來(lái)構(gòu)建對(duì)世界的內(nèi)部模型,那將是令人意外的。
強(qiáng)化學(xué)習(xí)中的時(shí)間差分學(xué)習(xí)算法也是基于預(yù)測(cè)的,只不過(guò)是預(yù)測(cè)未來(lái)的獎(jiǎng)勵(lì)。AlphaGo 使用時(shí)間差分學(xué)習(xí)來(lái)學(xué)習(xí)如何做出一系列長(zhǎng)時(shí)間的走棋,以贏得圍棋比賽。這樣一個(gè)只預(yù)測(cè)前一步的簡(jiǎn)單算法,是如何實(shí)現(xiàn)如此高水平博弈的呢?基底神經(jīng)節(jié)同樣通過(guò)練習(xí)使用相同的算法學(xué)習(xí)一系列行動(dòng)以實(shí)現(xiàn)目標(biāo)。例如,網(wǎng)球發(fā)球涉及復(fù)雜的快速肌肉收縮序列,需要反復(fù)練習(xí)才能變得自動(dòng)化。
小腦是一個(gè)重要的大腦結(jié)構(gòu),它與大腦皮層互動(dòng),能夠預(yù)測(cè)運(yùn)動(dòng)指令的期望感覺(jué)和認(rèn)知后果。在控制理論中,這被稱(chēng)為“前向模型”,因?yàn)樗梢栽趧?dòng)作發(fā)生前預(yù)測(cè)運(yùn)動(dòng)指令的結(jié)果。同樣,通過(guò)預(yù)測(cè)下一步會(huì)發(fā)生什么以及從錯(cuò)誤中學(xué)習(xí),可以建立一個(gè)關(guān)于身體和肌肉特性的復(fù)雜預(yù)測(cè)模型。
這三個(gè)例子中的共同之處在于,它們?cè)诓煌瑫r(shí)間尺度上都有大量數(shù)據(jù)可用于自監(jiān)督學(xué)習(xí)。智能是否可以通過(guò)自監(jiān)督學(xué)習(xí)產(chǎn)生,通過(guò)不斷進(jìn)行小范圍預(yù)測(cè)來(lái)逐步構(gòu)建越來(lái)越復(fù)雜的內(nèi)部模型?或許嬰兒大腦就是通過(guò)不斷預(yù)測(cè)和觀察結(jié)果,同時(shí)與世界進(jìn)行主動(dòng)互動(dòng),快速學(xué)習(xí)世界的因果結(jié)構(gòu)。在這一方向上已經(jīng)取得了一些進(jìn)展,例如使用深度學(xué)習(xí)從視頻中學(xué)習(xí)直觀物理知識(shí)。
大腦和人工智能正在趨同嗎?
大腦和人工智能的研究基于相同的基本原理:高度連接的并行架構(gòu),通過(guò)數(shù)據(jù)和經(jīng)驗(yàn)進(jìn)行學(xué)習(xí)訓(xùn)練。20 世紀(jì)的腦科學(xué)發(fā)現(xiàn)啟發(fā)了新的機(jī)器學(xué)習(xí)算法:視覺(jué)皮層的分層區(qū)域啟發(fā)了卷積神經(jīng)網(wǎng)絡(luò),而操作性條件反射啟發(fā)了強(qiáng)化學(xué)習(xí)中的時(shí)間差分學(xué)習(xí)算法。與人工神經(jīng)網(wǎng)絡(luò)的進(jìn)展相并行,“大腦計(jì)劃”(BRAIN Initiative)在 21 世紀(jì)通過(guò)支持創(chuàng)新神經(jīng)技術(shù)的發(fā)展加速了神經(jīng)科學(xué)的發(fā)現(xiàn)。神經(jīng)科學(xué)家正在利用機(jī)器學(xué)習(xí)來(lái)分析來(lái)自數(shù)萬(wàn)個(gè)神經(jīng)元和數(shù)十個(gè)大腦區(qū)域的同步記錄,并自動(dòng)化重建通過(guò)連續(xù)切片電子顯微鏡得到的神經(jīng)回路。這些進(jìn)展改變了我們對(duì)皮層分布式處理的理解,并催生了新的腦功能概念框架,推動(dòng)了更加先進(jìn)和大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型的出現(xiàn)。
人工智能和神經(jīng)科學(xué)的新概念框架正在趨同,加速了它們的進(jìn)展。人工智能和神經(jīng)科學(xué)之間的對(duì)話(huà)形成了一個(gè)良性循環(huán),豐富了這兩個(gè)領(lǐng)域。通過(guò)分析超高維空間中隱藏單元的活動(dòng)模式,人工智能理論正在形成,而我們也用同樣的方式研究大腦活動(dòng)。分析大語(yǔ)言模型中活動(dòng)模式的動(dòng)態(tài)變化,可能會(huì)揭示一個(gè)共同的基礎(chǔ)數(shù)學(xué)結(jié)構(gòu),從而幫助我們更深入地理解智能。例如,有大語(yǔ)言模型在黑白棋的棋盤(pán)布局上進(jìn)行訓(xùn)練,并通過(guò)探查揭示出其內(nèi)部形成了黑白棋規(guī)則的模型。
如何“下載”一個(gè)大腦
現(xiàn)在我們可以全面探究大腦中的神經(jīng)元活動(dòng),或許能夠解開(kāi)其中一個(gè)最大的謎團(tuán):分布在眾多神經(jīng)元中的信息是如何整合成統(tǒng)一的感知,并用于決策之中。大腦的結(jié)構(gòu)是分層的,每一層都在不同的時(shí)間尺度上負(fù)責(zé)決策,無(wú)論是在感覺(jué)系統(tǒng)還是運(yùn)動(dòng)系統(tǒng)中。我們可以構(gòu)建擁有多個(gè)子網(wǎng)絡(luò)的深度多模態(tài)模型,將它們整合成一個(gè)統(tǒng)一系統(tǒng),從而獲得有關(guān)潛意識(shí)決策機(jī)制和有意識(shí)控制機(jī)制的洞見(jiàn)。
傳統(tǒng)上,神經(jīng)元在特定任務(wù)的背景下接受測(cè)試,例如視覺(jué)刺激響應(yīng),其中選擇和刺激的數(shù)量是有限的。這種嚴(yán)格控制的刺激和響應(yīng)方式有助于在任務(wù)背景下解釋神經(jīng)記錄。但事實(shí)上,神經(jīng)元可以參與多種任務(wù)且以多種方式發(fā)揮作用,因此從單一任務(wù)中得出的解釋可能具有誤導(dǎo)性。如今,我們能夠?qū)φ麄€(gè)大腦中成千上萬(wàn)個(gè)神經(jīng)元進(jìn)行記錄,并通過(guò)機(jī)器學(xué)習(xí)分析記錄數(shù)據(jù)、解剖行為。然而,神經(jīng)科學(xué)家仍在使用舊的單任務(wù)范式。一個(gè)解決方案是訓(xùn)練神經(jīng)元應(yīng)對(duì)多種任務(wù),但例如訓(xùn)練一只猴子完成每個(gè)任務(wù)通常需要數(shù)周甚至數(shù)月的時(shí)間。另一種方法是將任務(wù)的復(fù)雜性在更長(zhǎng)時(shí)間間隔上擴(kuò)展,使其更接近自然行為。
然而,使用離散任務(wù)來(lái)研究行為存在一個(gè)更根本的問(wèn)題。現(xiàn)實(shí)世界中動(dòng)物的自然行為主要是自發(fā)且交互式的,特別是在社會(huì)行為中更是如此。研究這種自發(fā)的連續(xù)行為要比研究緊密約束的反射性行為困難得多。
假設(shè)一個(gè)大語(yǔ)言模型接受了在自然行為過(guò)程中對(duì)大腦活動(dòng)的海量記錄,同時(shí)結(jié)合身體和眼動(dòng)追蹤、視頻、聲音及其他多模態(tài)數(shù)據(jù)進(jìn)行訓(xùn)練。大語(yǔ)言模型是自監(jiān)督的,可以通過(guò)跨數(shù)據(jù)流預(yù)測(cè)缺失數(shù)據(jù)片段來(lái)進(jìn)行訓(xùn)練。雖然從傳統(tǒng)實(shí)驗(yàn)角度來(lái)看,這種方法可能并不科學(xué)有用,但從大語(yǔ)言模型所提供的新計(jì)算視角來(lái)看卻很有意義。
一個(gè)大型神經(jīng)基礎(chǔ)模型(LNM)可以在自然條件下基于大腦活動(dòng)和行為數(shù)據(jù)進(jìn)行訓(xùn)練,方式類(lèi)似于當(dāng)前訓(xùn)練大語(yǔ)言模型的方式。得到的 LNM 可用于許多新任務(wù),就像預(yù)訓(xùn)練的大語(yǔ)言模型能夠應(yīng)對(duì)新查詢(xún)并執(zhí)行許多新任務(wù)一樣。這些預(yù)訓(xùn)練的 LNM 雖然與大語(yǔ)言模型一樣需要高昂的訓(xùn)練成本,但一旦預(yù)訓(xùn)練完成,它可以為科學(xué)界提供一個(gè)共同資源以進(jìn)行探究和分析。這將徹底改變大腦研究方式,同時(shí)減少所需的實(shí)驗(yàn)動(dòng)物數(shù)量。類(lèi)似地,個(gè)人的大腦活動(dòng)也可用于訓(xùn)練一個(gè)適合的 LNM,創(chuàng)造出一個(gè)該人的“永生”生成版本。
這聽(tīng)起來(lái)像科幻,但沖繩科學(xué)技術(shù)研究所的 Gerald Pao 已經(jīng)在大約擁有 10 萬(wàn)個(gè)神經(jīng)元的果蠅和斑馬魚(yú)幼體上實(shí)現(xiàn)了這一點(diǎn)。幾乎所有的神經(jīng)元都被光學(xué)記錄下來(lái),通過(guò)對(duì)神經(jīng)信號(hào)敏感的熒光染料顯示出神經(jīng)活動(dòng),同時(shí)監(jiān)控其行為。Pao 研究的自發(fā)行為是斑馬魚(yú)幼體在缺氧環(huán)境中的逃避行為和果蠅的行走行為。他使用了由加州大學(xué)圣地亞哥分校的斯克里普斯海洋學(xué)研究所的 George Sugihara 提出的動(dòng)態(tài)系統(tǒng)理論中的收斂交叉映射(CCM)方法,來(lái)提取記錄的神經(jīng)元與行為之間的因果關(guān)系。這種方法提取了一個(gè)簡(jiǎn)化的圖形模型,捕捉了控制行為的低維大腦子空間。在日本 AI 橋梁云基礎(chǔ)設(shè)施(ABCI)上的超級(jí)計(jì)算機(jī)中,分析了約 10 萬(wàn)個(gè)神經(jīng)元的記錄。當(dāng)模型啟動(dòng)時(shí),它生成的自發(fā)行為與真實(shí)生物中的觀察結(jié)果無(wú)法區(qū)分。關(guān)鍵在于同時(shí)分析神經(jīng)記錄和行為,僅分析其中一個(gè)不足以重現(xiàn)該行為。
這一實(shí)踐證明,在擁有足夠的腦活動(dòng)和行為同步記錄數(shù)據(jù)的情況下,大腦活動(dòng)和行為可以“下載”到一個(gè)模型中。
作者:Terrence Sejnowski
譯者:EY
封面:Michael Robson
原文:
https://www.thetransmitter.org/large-language-models/are-brains-and-ai-converging-an-excerpt-from-chatgpt-and-the-future-of-ai-the-deep-language-revolution
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.