EngramNCA: a Neural Cellular Automaton Model of Memory Transfer
記憶傳遞的神經(jīng)細(xì)胞自動機(jī)模型
https://arxiv.org/pdf/2504.11855
摘要
本研究介紹了 EngramNCA,這是一種神經(jīng)細(xì)胞自動機(jī)(NCA),它融合了公開可見的狀態(tài)和私有的、細(xì)胞內(nèi)部的記憶通道。該模型的靈感來自新興的生物學(xué)證據(jù),這些證據(jù)表明記憶存儲不僅限于突觸變化,還涉及細(xì)胞內(nèi)機(jī)制。所提出的模型包含兩個組成部分:GeneCA 是一種 NCA,經(jīng)過訓(xùn)練可以從包含不可變“基因”編碼的種子細(xì)胞中發(fā)育出不同的形態(tài);GenePropCA 是一個輔助 NCA,在不改變細(xì)胞可見狀態(tài)的前提下調(diào)節(jié)細(xì)胞的私有“遺傳”記憶。這種架構(gòu)通過可見通道與私有通道之間的相互作用,實(shí)現(xiàn)了復(fù)雜形態(tài)的編碼與傳播,從而能夠從共享的“遺傳”基質(zhì)中生長出多樣化的結(jié)構(gòu)。EngramNCA 支持分層且共存的形態(tài)的出現(xiàn),為人工系統(tǒng)中去中心化的記憶存儲與傳遞提供了新的見解。這些發(fā)現(xiàn)對于開發(fā)具有適應(yīng)性的自組織系統(tǒng)具有潛在意義,并可能有助于更廣泛地理解生物與合成環(huán)境中的記憶機(jī)制。
數(shù)據(jù)/代碼:本文的網(wǎng)頁版附帶視頻內(nèi)容,可在此處訪問;GitHub 倉庫地址可在此處獲??;代碼可在 Colab 上運(yùn)行,鏈接也已提供。在網(wǎng)頁版本中,代表視頻的圖片均已超鏈接至對應(yīng)的視頻。
引言
目前,生物學(xué)和人工智能領(lǐng)域關(guān)于記憶的最主流理論是“突觸學(xué)說”(synapses dogma)(Mayford 等,2012),即信息存儲的位置是在突觸處。因此,人們普遍認(rèn)為記憶的存儲是通過突觸強(qiáng)度的變化來實(shí)現(xiàn)的(Cajal,1894)。然而,越來越多的證據(jù)對這一觀點(diǎn)提出了挑戰(zhàn):記憶也可能以私有的形式存在于神經(jīng)細(xì)胞內(nèi)部(甚至可能存在于其他類型的細(xì)胞中)(Abraham 等,2019),而突觸僅僅是這些私有記憶的一種可見回響(Gold 和 Glanzman,2021)。一些令人信服的例子包括:將經(jīng)過訓(xùn)練的海兔(Aplysia)體內(nèi)提取的 RNA 注入未訓(xùn)練個體中所觀察到的記憶轉(zhuǎn)移現(xiàn)象(Bedécarats 等,2018);將經(jīng)過訓(xùn)練的渦蟲(planaria)制成“湯”并喂給未訓(xùn)練的渦蟲后出現(xiàn)的記憶傳遞現(xiàn)象(McConnell,1967);以及被斬首后再生頭部仍保留長期記憶的渦蟲實(shí)驗(yàn)(Shomrat 和 Levin,2013a)。這些發(fā)現(xiàn)表明,RNA 在細(xì)胞間的轉(zhuǎn)移可以影響細(xì)胞功能與行為,包括記憶的存儲與傳遞。從實(shí)際角度看,細(xì)胞可以通過胞外囊泡(包裹著 RNA 和其他分子的膜結(jié)合顆粒)或納米隧道管(在細(xì)胞之間形成直接物理連接的結(jié)構(gòu))將 RNA 分子轉(zhuǎn)移到周圍環(huán)境中。
在本研究中,我們提出了一種神經(jīng)細(xì)胞自動機(jī)(Neural Cellular Automaton, NCA)模型(Mordvintsev 等,2020),該模型允許細(xì)胞內(nèi)存在私有記憶的存儲,并支持細(xì)胞之間的記憶傳遞。通過模擬這種記憶機(jī)制,相比傳統(tǒng)僅依賴于公開可見細(xì)胞狀態(tài)的經(jīng)典 NCA,我們或許能夠?qū)崿F(xiàn)更豐富的細(xì)胞間通信,并生成更為復(fù)雜、穩(wěn)定的模式。我們將這一新模型命名為 EngramNCA ,其中“engram”在神經(jīng)心理學(xué)中指的是生物體中記憶的物理載體,即記憶存儲的方式。
我們對 NCA 模型進(jìn)行了以下兩個方面的擴(kuò)展:
每個細(xì)胞都具有一個 公開可見的狀態(tài) (由一定數(shù)量的公共 CA 通道組成),相鄰細(xì)胞可以訪問該狀態(tài),并將其作為更新細(xì)胞狀態(tài)的信息來源。這類似于通過突觸向鄰近細(xì)胞傳遞信息。
每個細(xì)胞還擁有一個 私有記憶 (由一定數(shù)量的私有 CA 通道組成),只有該細(xì)胞本身可以訪問。它代表了某種更為持久地儲存在細(xì)胞內(nèi)部的狀態(tài),可以通過類似 RNA 轉(zhuǎn)移(或其他合理的分子轉(zhuǎn)移機(jī)制)的方式傳遞或共享給其他細(xì)胞。
當(dāng) CA 細(xì)胞更新其狀態(tài)時,其內(nèi)部的神經(jīng)網(wǎng)絡(luò)(所有細(xì)胞共享相同權(quán)重的神經(jīng)網(wǎng)絡(luò))會作用于其鄰域中的可見通道,以及自身的私有記憶。結(jié)果就是可見部分與細(xì)胞內(nèi)部(私有)記憶之間的相互作用。因此,重點(diǎn)在于訓(xùn)練 NCA 充分利用其細(xì)胞內(nèi)部的記憶能力,因?yàn)檫@些記憶不能被其他細(xì)胞直接訪問。因此,它必須學(xué)會通過可見通道產(chǎn)生一種“回響”,以便與鄰居協(xié)調(diào)完成集體計(jì)算任務(wù)。
這種協(xié)調(diào)是通過以下方式實(shí)現(xiàn)的:
首先,我們訓(xùn)練一個 NCA,使其可以從一個種子細(xì)胞生長出一組基本形態(tài)。最初唯一包含代表目標(biāo)形態(tài)的遺傳信息(私有記憶)的就是種子細(xì)胞本身。每種形態(tài)由不同的私有表示編碼。因此,這個 NCA 必須僅通過可見通道來完成全局任務(wù)。一旦訓(xùn)練完成,該 NCA 的神經(jīng)網(wǎng)絡(luò)權(quán)重將被凍結(jié),不再改變。我們將這個第一個神經(jīng)網(wǎng)絡(luò)稱為 GeneCA 。
隨后,我們在前述基礎(chǔ)上再訓(xùn)練另一個 NCA,它不會操作和改變細(xì)胞的可見信息,而只能修改它們的私有“遺傳”記憶,即一組私有通道。因此,它必須學(xué)習(xí)一種機(jī)制來調(diào)節(jié)這些私有信息,使得先前學(xué)到的基本形態(tài)(或其組合)能夠在正確的時間和位置被使用和激活。我們將這個第二個神經(jīng)網(wǎng)絡(luò)稱為 GenePropCA ,全稱是 GenePropagationCA。
GenePropCA 機(jī)制是對細(xì)胞之間 RNA 分子傳輸?shù)囊环N抽象,提供了一種功能傳遞的形式。所傳遞的功能被儲存在細(xì)胞的內(nèi)部記憶中,并反過來影響 GeneCA 的行為(即細(xì)胞的可見狀態(tài))。
需要注意的是,在生物系統(tǒng)中,這兩種類型的信息傳遞——突觸傳遞與 RNA 傳遞——可能發(fā)生在兩個不同的時間尺度上。通常,突觸通過放電傳遞的速度要快于 RNA 的傳遞。然而,在我們的框架中,我們嘗試了不同時間尺度的設(shè)置(基本上讓 GeneCA 比 GenePropCA 運(yùn)行得更快,或反之),并未影響整體功能。總體而言,系統(tǒng)學(xué)會了調(diào)整來自兩種 NCA 的更新頻率,以解決當(dāng)前的任務(wù)。
我們對所提出的 NCAs 在多種形態(tài)發(fā)生任務(wù)中進(jìn)行了測試,包括:
簡單但穩(wěn)定的基本形態(tài)的生長;
基本形態(tài)的分布外混合形態(tài);
由基本形態(tài)組合形成的更復(fù)雜的形態(tài);
可移動的基本形態(tài),如 Lenia 中的滑翔器(gliders)。
相關(guān)工作
關(guān)于神經(jīng)細(xì)胞自動機(jī)(Neural Cellular Automata, NCAs)
神經(jīng)細(xì)胞自動機(jī)將經(jīng)典細(xì)胞自動機(jī)框架與現(xiàn)代深度學(xué)習(xí)相結(jié)合,通過使用基于梯度優(yōu)化的神經(jīng)網(wǎng)絡(luò)取代手工設(shè)計(jì)的狀態(tài)更新規(guī)則。早期對細(xì)胞自動機(jī)的研究(例如 (Wolfram, 2002))表明,簡單的局部規(guī)則可以產(chǎn)生復(fù)雜的整體行為。(Mordvintsev 等, 2020) 在此基礎(chǔ)上提出了“生長型神經(jīng)細(xì)胞自動機(jī)”(Growing Neural Cellular Automata)模型,該模型使用基于梯度的學(xué)習(xí)方法訓(xùn)練一個卷積網(wǎng)絡(luò),通過迭代更新網(wǎng)格,使得從單個種子出發(fā)能夠生成復(fù)雜圖像,并在受損后仍具有再生能力。
Miller(2004)的開創(chuàng)性研究探索了進(jìn)化出具有自我修復(fù)和自我調(diào)節(jié)能力的細(xì)胞自動機(jī)以生成“法國國旗”圖案,展示了進(jìn)化算法如何發(fā)現(xiàn)用于復(fù)雜形態(tài)發(fā)生的多樣化規(guī)則集。Nichele 等人(2017)通過神經(jīng)進(jìn)化方法擴(kuò)展了形態(tài)發(fā)生型細(xì)胞自動機(jī),將其作為 CA 規(guī)則的生成機(jī)制。Pontes-Filho 等人(2023)展示了一種進(jìn)化至臨界狀態(tài)的 NCA,這一現(xiàn)象隨后被 Guichard(2024)進(jìn)一步研究。Kvalsund 等人(2024)討論了 NCA 作為一種分布式新皮層模型。
一系列擴(kuò)展研究拓寬了 NCA 的能力范圍。Randazzo 等人(2020)探索了自分類任務(wù);Hernandez 等人(2021)提出了 NCA 流形(NCA Manifold),構(gòu)建了不同形態(tài)發(fā)生過程的嵌入空間;Tesfaldet 等人(2022)開發(fā)了基于注意力機(jī)制的 NCA,將自注意力機(jī)制整合到更新過程中,使每個細(xì)胞能夠動態(tài)關(guān)注其局部鄰域中的關(guān)鍵特征,并捕捉更長距離的依賴關(guān)系;Grasso 和 Bongard(2022)提出了“賦能神經(jīng)細(xì)胞自動機(jī)”(Empowered Neural Cellular Automata),引入信息論目標(biāo)(即“賦能”)以促進(jìn)魯棒且協(xié)調(diào)的行為;Palm 等人(2022)提出了變分神經(jīng)細(xì)胞自動機(jī)(Variational Neural Cellular Automata),這是一種概率生成模型,通過變分推斷捕捉多樣化的涌現(xiàn)動態(tài);Mordvintsev 等人(2022)提出了各向同性的 NCA 版本;而 Pande 和 Grattarola(2023)則提出了分層 NCA(Hierarchical NCA),用于在不同尺度上建模涌現(xiàn)行為。
在應(yīng)用領(lǐng)域的擴(kuò)展進(jìn)一步體現(xiàn)了 NCA 框架的多功能性。Variengien 等人(2021)將 NCA 應(yīng)用于倒立擺系統(tǒng)的控制器演化中;Horibe 等人(2022)展示了 NCA 在軟體機(jī)器人形態(tài)再生中的應(yīng)用,突出了其類似生物再生的自我修復(fù)潛力;Najarro 等人(2022)研究了一種稱為 HyperNCA 的超網(wǎng)絡(luò)方法,通過發(fā)育過程生成人工神經(jīng)網(wǎng)絡(luò);最近,Reimers 等人(2023)提出了一種具有局部自注意力機(jī)制的路徑搜索 NCA,訓(xùn)練自動機(jī)協(xié)同探索環(huán)境并定位能量源;Randazzo 和 Mordvintsev(2024)利用 NCA 構(gòu)建了一個可演化的植物生態(tài)系統(tǒng);而最新提出的“可微邏輯細(xì)胞自動機(jī)”(Differentiable Logic Cellular Automata)由 Miotti 等人(2025)開發(fā),它將可微邏輯門與傳統(tǒng)神經(jīng)細(xì)胞自動機(jī)結(jié)合,實(shí)現(xiàn)了離散、可解釋的更新規(guī)則,同時保留了基于梯度訓(xùn)練的優(yōu)勢。
與記憶印跡(Memory Engrams)相關(guān)的工作
對我們啟發(fā)最大的一項(xiàng)工作是 (Pappadopoulos, 2023),該研究探討了通過引入額外通道來編碼不同形態(tài)的可能性。此外,(Sudhakaran 等, 2022) 提出了一種“目標(biāo)編碼器”(goal-encoder),其功能與我們提出的 GenePropCA 類似;而 (Bessonov 等, 2015) 的研究也與我們的思路有相似之處,并使用細(xì)胞自動機(jī)作為實(shí)驗(yàn)平臺。還有 (Winge 等, 2023) 的研究靈感也有一定相似性,不過他們使用的是帶有細(xì)胞記憶的神經(jīng)元模型,實(shí)現(xiàn)方式有所不同。
更廣泛地說,我們還深受 (Mitchell 和 Cheney, 2024) 以及 (Hartl 和 Levin, 2024) 的啟發(fā)。這些研究指出,生命系統(tǒng)中編碼了穩(wěn)健且可適應(yīng)的生成模型,用于指導(dǎo)發(fā)育和再生過程。這類工作強(qiáng)調(diào),生物譜系會積累“記憶印跡”(memory engrams)——即一種潛在表征,使生物體即便在受到擾動時也能可靠地重建其形態(tài)與功能。這一概念正是我們提出 EngramNCA 的核心思想:通過雙通道記憶機(jī)制(公開狀態(tài)與私有狀態(tài)),模擬生物系統(tǒng)中觀察到的記憶分布式存儲與傳遞現(xiàn)象。
方法
在本節(jié)中,我們將介紹對 (Mordvintsev 等, 2020) 所提出架構(gòu)的整體修改,并詳細(xì)說明兩個新模型(GeneCA 與 GenePropCA)的具體實(shí)現(xiàn)方式,這兩個模型共同構(gòu)成了 EngramNCA 的基礎(chǔ)架構(gòu)。我們還將提供它們各自結(jié)構(gòu)的示意圖,以及它們之間如何相互作用的說明。
受扁形蟲(Planarians)與海兔(Aplysia)中觀察到的 RNA 記憶傳遞機(jī)制的啟發(fā),我們在 NCA 的隱藏狀態(tài)中增加了一個“私有記憶帶”(private tape)。不同于將這個“記憶帶”簡單附加到原有隱藏狀態(tài)中的做法,我們選擇將部分隱藏通道私有化(privatize),以確保任何性能提升都不是由于模型容量的增加(詳見附錄1中關(guān)于隱藏通道掩碼對任務(wù)性能影響的分析)。
我們假設(shè),這種“私有記憶帶”的擴(kuò)展可以被用來編碼多種行為模式,例如生長不同的形狀或表達(dá)不同的計(jì)算邏輯。圖1中展示了細(xì)胞通道的組成,包括 RGB 通道、alpha 通道、三個額外的公共通道,以及代表“私有記憶帶”的三個基因通道(G1、G2 和 G3)。
我們選擇通過二進(jìn)制形式在“記憶帶”中編碼不同的“基本形態(tài)”(primitives)。這些基本形態(tài)可以是簡單的形狀如凸多邊形,也可以是更復(fù)雜的組合結(jié)構(gòu),比如蜥蜴表情符號的身體部分。圖2和圖3分別展示了三種基礎(chǔ)幾何形態(tài)和蜥蜴身體部件的編碼示例。
“記憶帶”的長度需要滿足:2基因通道數(shù)≥ 基本形態(tài)的數(shù)量。這樣才能確保每個基本形態(tài)都有唯一的二進(jìn)制編碼。然而,出于后文將討論的原因,通常我們會在基因通道中保留一些未使用的“冗余位”(buffer)。這是因?yàn)榛蛲ǖ罃?shù)量與共享隱藏通道之間的平衡非常微妙——通道的私有化會導(dǎo)致性能下降(詳情請見附錄1)。
GeneCA
第一個模型(見圖4),我們命名為 GeneCA ,其任務(wù)是學(xué)習(xí)基本形態(tài)的嵌入表示。該模型借鑒了 (Mordvintsev 等, 2020) 的架構(gòu),并進(jìn)行了擴(kuò)展,加入了 (Mordvintsev 等, 2022) 中使用的拉普拉斯卷積濾波器。
值得注意的是,GeneCA 的參數(shù)僅生成一個部分的細(xì)胞狀態(tài)更新向量,該向量包含除基因通道外的所有通道。在隨機(jī)更新步驟之后,基因通道會被復(fù)制并附加到更新向量中,以防止其隨時間退化。這導(dǎo)致在整個 NCA 細(xì)胞網(wǎng)絡(luò)中,基因通道的信息不會發(fā)生變化或傳播。
需要強(qiáng)調(diào)的是,由于每次運(yùn)行開始時唯一初始化的活細(xì)胞是一個種子細(xì)胞,因此除了種子細(xì)胞以外的所有細(xì)胞在其基因通道中都沒有信息(即全為零)。這意味著 GeneCA 必須學(xué)會從單個種子細(xì)胞出發(fā)生長出基本形態(tài),而不能依賴于將基因通道信息傳遞給其他細(xì)胞的機(jī)制。此外,這也意味著細(xì)胞實(shí)際上無法觀察到鄰近細(xì)胞的私有記憶帶(private tape)。
GenePropCA
GenePropCA 模型(見圖5)的任務(wù)是利用 GeneCA 所學(xué)到的基因嵌入。通過讓 GeneCA 根據(jù)特定嵌入來生成基本形態(tài),這些嵌入現(xiàn)在攜帶了關(guān)于基本形態(tài)的潛在信息。我們假設(shè),每個嵌入中的潛在信息可以被修改,從而產(chǎn)生分布外的行為,這樣 GenePropCA 就能夠傳播并修改“基因”,以實(shí)現(xiàn)預(yù)定目標(biāo)。
GenePropCA 的架構(gòu)與 GeneCA 類似,神經(jīng)網(wǎng)絡(luò)參數(shù)也生成部分細(xì)胞狀態(tài)更新。但在這種情況下,只有基因通道會被更新。和 GeneCA 一樣,在異步的部分更新之后,未被修改的細(xì)胞狀態(tài)會被復(fù)制并附加回去,使得 GenePropCA 對非基因通道沒有任何影響。
EngramNCA —— 集成模型
EngramNCA 集成模型(見圖6)結(jié)合了 GeneCA 和 GenePropCA 來生成最終的形態(tài)。GeneCA 可以獨(dú)立于 GenePropCA 運(yùn)行,并能生成基本形態(tài);而 GenePropCA 則依賴于 GeneCA,因?yàn)樗膮?shù)是訓(xùn)練用來操控 GeneCA 動態(tài)的。
在第 N 步,CA 的當(dāng)前狀態(tài)被傳入 GeneCA,GeneCA 僅修改可見和隱藏通道,生成一個中間狀態(tài);隨后,該中間狀態(tài)被傳入 GenePropCA,GenePropCA 僅修改基因編碼通道,從而生成第 N+1 步的狀態(tài)。
這一設(shè)計(jì)的核心思想是讓 GenePropCA 學(xué)會利用 GeneCA 中基于基因嵌入的動力學(xué),從而生成比 GeneCA 更復(fù)雜的形態(tài)。
如需了解所提出模型(包括 GeneCA、GenePropCA 和集成模型 EngramNCA)的正式數(shù)學(xué)定義以及訓(xùn)練過程的詳細(xì)說明,請參閱附錄2中的相關(guān)章節(jié)。
分層生長任務(wù)
在 (Mordvintsev 等, 2020) 中提出的傳統(tǒng) NCA 模型中,神經(jīng)網(wǎng)絡(luò)參數(shù)用于編碼期望的行為。實(shí)際上,神經(jīng)網(wǎng)絡(luò)可以被視為形態(tài)的“基因”,每種不同的形態(tài)都需要訓(xùn)練一個新的 NCA。這使得在同一網(wǎng)格(lattice)上實(shí)現(xiàn)共存的形態(tài)或動態(tài)變得尤為困難,因?yàn)槎鄠€ NCA 之間會產(chǎn)生相互干擾。
我們的模型為這一問題提供了一種可能的解決方案:將形態(tài)結(jié)果與一個不變的種子細(xì)胞綁定。通過這種方式,我們假設(shè) NCA 學(xué)會了適用于任何形態(tài)的一般性生長動力學(xué),同時學(xué)習(xí)了特定編碼下的細(xì)節(jié)形態(tài)動力學(xué)。
生成共存的基本形態(tài)
分層生長任務(wù)的第一步是生成共存的形態(tài) 。也就是說,使用相同的 NCA 參數(shù)集(即我們的 GeneCA),生成多個不同的形態(tài)。這類似于 (Mordvintsev 等, 2020) 中描述的原始生長任務(wù):多種形態(tài)應(yīng)在時間上保持邊界清晰、穩(wěn)定不變,一旦完全生成后其形狀不再變化。
我們進(jìn)行了多個實(shí)驗(yàn),包括:
多個高復(fù)雜度的基本形態(tài)(蜥蜴身體部件,見圖7左側(cè));
少量中等復(fù)雜度的基本形態(tài)(基礎(chǔ)多邊形,見圖7中部);
少量低復(fù)雜度的形狀(垂直線和水平線,見圖7右側(cè))。
從基本形態(tài)生成復(fù)合形態(tài)
在訓(xùn)練好 GeneCA 后,我們接著訓(xùn)練 GenePropCA,使其能夠利用“基因”所代表的潛在空間嵌入來生成更復(fù)雜的形態(tài)。我們使用了前述三種不同復(fù)雜度的 GeneCA 來測試 GenePropCA 在不同情境下的能力:
高基本形態(tài)數(shù)量、低組合復(fù)雜度的任務(wù):例如生成蜥蜴(圖8左側(cè)),其中只有一種有效的組合方式;
低基本形態(tài)數(shù)量、高組合復(fù)雜度的任務(wù):例如由垂直線和水平線生成類似分形的結(jié)構(gòu)(圖8右側(cè));
上述兩者的結(jié)合:用基礎(chǔ)多邊形生成蜥蜴形態(tài)。
生成共存的復(fù)合形態(tài)
在層次結(jié)構(gòu)的最后一步,我們嘗試從同一個 GeneCA 和 GenePropCA 中生成多個共存的形態(tài) 。為此,我們將模型提升到更高一層的層級,并賦予 GenePropCA 自己的“元基因”(meta-genes)。這些元基因只有 GenePropCA 能夠看到,但無論是它自身還是 GeneCA 都無法修改它們。GenePropCA 使用這些元基因來對整個形態(tài) 進(jìn)行編碼。
訓(xùn)練過程
在本節(jié)中,我們描述了模型的訓(xùn)練流程,包括兩個不同的訓(xùn)練階段、一種特殊的池化方法(用于同時訓(xùn)練多個基本形態(tài))、以及在訓(xùn)練 GenePropCA 時如何凍結(jié) GeneCA 的權(quán)重。
我們在所有圖像上的訓(xùn)練使用的損失函數(shù)是像素級均方誤差(Pixelwise-MSE),正如 (Mordvintsev 等, 2020) 所采用的那樣:
其中 H 、 W 、 C 是圖像的維度, I 是參考圖像, I^ 是 NCA 的最終狀態(tài)。
GeneCA 的訓(xùn)練
GeneCA 的訓(xùn)練過程類似于 (Mordvintsev 等, 2020) 中提出的池化訓(xùn)練(pool-training)方法。然而,為了實(shí)現(xiàn)對多個基本形態(tài)的基因編碼,我們?yōu)槊恳粚Α盎?基本形態(tài)”分配了獨(dú)立的樣本池供采樣和更新。此外,目標(biāo)圖像也被擴(kuò)展為一個目標(biāo)批次(target batch),該批次包含每個圖像的 n 次重復(fù),其中 n 是批量大小的一個因子。這樣做的目的是使得每次訓(xùn)練中損失函數(shù)能夠考慮到批量中的多張圖像。為了避免對某個特定基本形態(tài)產(chǎn)生訓(xùn)練偏差,應(yīng)使批量大小是基本形態(tài)數(shù)量的整數(shù)倍。圖9展示了在 GeneCA 框架下進(jìn)行“批量多圖像”訓(xùn)練的過程示意圖。
GenePropCA 的訓(xùn)練
GenePropCA 的訓(xùn)練采用了與 GeneCA 相同的批量訓(xùn)練技術(shù)。通常情況下,我們只訓(xùn)練單一形態(tài);不過,也可以通過犧牲更多通道作為“元基因”(meta genes)來同時訓(xùn)練多個形態(tài)。這些元基因不受 GeneCA 和 GenePropCA 的影響。
在訓(xùn)練 GenePropCA 時,GeneCA 的權(quán)重會被凍結(jié),但在反向傳播損失到 GenePropCA 時,仍會使用 GeneCA 在生長過程中產(chǎn)生的梯度貢獻(xiàn)。這確保了 GenePropCA 的動力學(xué)是基于 GeneCA 的動態(tài)之上進(jìn)行條件約束的。圖10 展示了在 GeneCA 權(quán)重被凍結(jié)的情況下對 GenePropCA 進(jìn)行訓(xùn)練的過程。
實(shí)驗(yàn)結(jié)果
我們對模型在不同配置下進(jìn)行了測試,以下是我們實(shí)驗(yàn)的結(jié)果。一般來說,NCA 的網(wǎng)格大小為 30×30,總共有 16 個通道,其中前四個通道分別對應(yīng) alpha 透明度通道和三個顏色通道(RGB)。在剩余的 12 個隱藏通道中,有 8 個被私有化,即可以被讀取但不能被 GeneCA 修改。
生成共存的基本形態(tài)
我們選擇了三種基本形態(tài)作為目標(biāo)形狀:藍(lán)色正方形、綠色圓形和紅色三角形。這些基本形態(tài)在私有記憶帶中具有相應(yīng)的獨(dú)熱編碼(one-hot encoding)。
GeneCA 被訓(xùn)練用于更新 CA 的公開通道,使得圍繞種子細(xì)胞生長出正確的基本形態(tài)。需要強(qiáng)調(diào)的是,在此階段沒有基因傳播機(jī)制,只有 GeneCA 根據(jù)當(dāng)前可訪問的私有與公開通道計(jì)算并更新公開通道。
在測試過程中,我們選擇不同的細(xì)胞作為種子細(xì)胞,并修改其私有記憶帶的內(nèi)容。
在圖11頂部展示了如何將三種基本形態(tài)的二進(jìn)制編碼分配給 CA 中的三個不同細(xì)胞,它們之間的距離足夠遠(yuǎn),以避免屬于不同形態(tài)的細(xì)胞之間發(fā)生相互作用。從種子細(xì)胞開始,經(jīng)過若干次更新步驟后逐漸形成相應(yīng)的形狀及其顏色。之后,這些形態(tài)保持穩(wěn)定。
圖12 展示了當(dāng)種子細(xì)胞彼此靠得較近、導(dǎo)致生成的基本形態(tài)本應(yīng)發(fā)生重疊時的情形。如圖所示,這些形狀仍然保持高度區(qū)分性。特別是相同類型的基本形態(tài)之間既沒有重疊也沒有顏色混合,而是形成了明顯的邊界。例如,彼此靠近的圓形會形成類似梳子的結(jié)構(gòu)(圖12頂部)。而當(dāng)不同類型的基本形態(tài)相遇時,邊界則不那么清晰,不同形態(tài)之間可能會出現(xiàn)顏色混合現(xiàn)象(如圖12底部所示)。盡管如此,仍能明顯區(qū)分不同形態(tài),且不會出現(xiàn)某一形態(tài)完全覆蓋另一形態(tài)的情況。值得注意的是,這種情形在訓(xùn)練過程中并未出現(xiàn)過。
訓(xùn)練過程中僅使用了三種獨(dú)熱編碼,但在測試階段我們可以偏離這一設(shè)定,使用不同的二進(jìn)制數(shù)組作為種子細(xì)胞的私有編碼。這實(shí)際上意味著“基因”的混合。如圖13所示,這種做法會導(dǎo)致相應(yīng)混合形態(tài)的生長??梢钥闯?,這些混合形態(tài)是原始基本形態(tài)的變形疊加,顏色也從單一顏色過渡到兩種顏色的混合。在某一基本形態(tài)未生長的區(qū)域,另一種基本形態(tài)占主導(dǎo)地位,因此圓形與正方形的組合最容易發(fā)生混合。發(fā)育完成后,這些混合形態(tài)也能保持穩(wěn)定。這種穩(wěn)定性似乎受到基本形態(tài)最大尺寸的限制,并適用于任何形式的編碼混合。
隨后,我們重復(fù)了類似的實(shí)驗(yàn),只不過這次使用蜥蜴圖像的身體部件作為基本形態(tài),如圖14所示。由于部件數(shù)量超過三個,編碼方式不再是獨(dú)熱形式。與之前一樣,放置一個具有相應(yīng)編碼的種子細(xì)胞后,能夠生長出穩(wěn)定的形態(tài),即使這些形態(tài)具有更復(fù)雜的形狀和顏色分布。
最后,我們還使用了非常簡單的單色垂直線和水平線作為基本形態(tài),如圖15所示。這是后續(xù)實(shí)驗(yàn)的基礎(chǔ)設(shè)置。
從基本形態(tài)生成復(fù)雜形態(tài)
在下一步實(shí)驗(yàn)中,我們引入了 GenePropCA 。目標(biāo)是在 GeneCA 的權(quán)重被凍結(jié)(僅能生長基本形態(tài))的前提下,訓(xùn)練 GenePropCA 來生成完整的復(fù)雜形態(tài)。
以蜥蜴為例,GenePropCA 按照前述方式進(jìn)行訓(xùn)練:初始種子細(xì)胞包含“軀干”(torso)的基本形態(tài)編碼,而 GeneCA 是基于整個蜥蜴的身體部件(腿、頭、軀干、尾巴)進(jìn)行訓(xùn)練的。如圖16所示,蜥蜴的軀干首先被生長出來,隨后 CA 繼續(xù)生長出四肢、尾巴和頭部。當(dāng)蜥蜴完全生長完成后,關(guān)閉 GenePropCA 并不會導(dǎo)致形態(tài)崩潰,而是由 GeneCA 繼續(xù)維持蜥蜴的形狀。
該實(shí)驗(yàn)被重復(fù)進(jìn)行,這次選擇圓形、正方形和三角形作為基本形態(tài),并在 GenePropCA 訓(xùn)練過程中使用藍(lán)色圓形作為種子細(xì)胞。實(shí)驗(yàn)也取得了成功,如圖17所示。即使 GeneCA 并未訓(xùn)練所有最終蜥蜴所包含的基本形態(tài),甚至某些基本形態(tài)完全不是來自目標(biāo)圖像,GenePropCA 仍然能夠泛化并促進(jìn)基因傳播,從而引導(dǎo)蜥蜴的生長,盡管其質(zhì)量略遜于圖16所示的情況。
圖18顯示了種子細(xì)胞的選擇確實(shí)會影響結(jié)果:只有在使用與 GenePropCA 訓(xùn)練時完全相同的種子細(xì)胞時,蜥蜴才能成功生長。
進(jìn)一步的實(shí)驗(yàn)表明,即便某些種子細(xì)胞在 GeneCA 的訓(xùn)練過程中并未作為基本形態(tài)使用,也可以用于訓(xùn)練 GenePropCA 來生成蜥蜴。
圖19 展示了一個實(shí)驗(yàn),在該實(shí)驗(yàn)中,簡單的單色垂直線和水平線被組合成一個類似分形的結(jié)構(gòu),且表現(xiàn)令人滿意。這表明,模型不僅可以將大量復(fù)雜的原始形態(tài)組合為更少基本形態(tài)構(gòu)成的較簡單結(jié)構(gòu)(如之前的蜥蜴案例),還能夠?qū)⑸倭亢唵蔚脑夹螒B(tài)組合為由大量基本形態(tài)構(gòu)成的更復(fù)雜結(jié)構(gòu)(這里的分形樣結(jié)構(gòu)),從而展示了 EngramNCA 在不同層次復(fù)雜性之間靈活轉(zhuǎn)換的能力。
從基本形態(tài)生成共存的復(fù)雜形態(tài)
在形態(tài)生成的最后一項(xiàng)實(shí)驗(yàn)中,我們測試了 GenePropCA 是否還能同時生成多個不同的復(fù)雜形態(tài) 。為此,我們在模型中引入了一個額外的通道作為“元基因”(meta-gene),該通道既不能被 GeneCA 也不能被 GenePropCA 修改。隨后訓(xùn)練 GenePropCA 根據(jù)元基因的編碼以及種子細(xì)胞的初始編碼來生成不同的形態(tài)。
圖20 展示了 GenePropCA 利用相同的 GeneCA 基因編碼,同時生成了蜥蜴和蝴蝶兩種形態(tài)。蜥蜴的整體再現(xiàn)質(zhì)量有所下降,而蝴蝶作為一個相對更簡單的形態(tài),則被更準(zhǔn)確地再現(xiàn)出來。
可移動的基本形態(tài)
與生成靜態(tài)形態(tài)這一相對簡單的任務(wù)不同,我們還希望測試 GenePropCA 是否能夠利用嵌入空間,并學(xué)習(xí)一個復(fù)雜的動態(tài)系統(tǒng) 的行為。為此,我們選擇模擬 Lenia(Chan, 2019) 中的滑翔器(glider)動力學(xué)。Lenia 是一種連續(xù)型細(xì)胞自動機(jī),可以展現(xiàn)出高度復(fù)雜的動態(tài)行為。
我們選擇了一個動態(tài)行為較為復(fù)雜的滑翔器(見圖21),其運(yùn)動模式并非簡單的空間平移,因此要成功模擬它需要模型真正理解其內(nèi)在動力學(xué),而非僅僅記憶幀序列。
- GeneCA
被訓(xùn)練以 Lenia 視頻的第一幀為起點(diǎn);
- GenePropCA
則采用一種類課程式(quasi-curriculum-style)的學(xué)習(xí)策略:在訓(xùn)練過程中定期將更多視頻幀加入訓(xùn)練集,直到第500幀為止。
每次訓(xùn)練都按順序從第一幀到當(dāng)前訓(xùn)練集的最后一幀進(jìn)行,并在反向傳播前對所有幀的損失進(jìn)行累積。
逐幀的損失累積在這里非常重要,因?yàn)榕c靜態(tài)形態(tài)生成不同,NCA 在狀態(tài)之間的時間演化過程 至關(guān)重要。
作為對比,我們也使用相同的方法訓(xùn)練了一個標(biāo)準(zhǔn) NCA,并設(shè)置其參數(shù)總量等于 GeneCA 與 GenePropCA 參數(shù)之和。
圖22 顯示了一個標(biāo)準(zhǔn) NCA 在訓(xùn)練 500 幀 Lenia 視頻后的結(jié)果??梢钥闯觯瑯?biāo)準(zhǔn) NCA 在前期大致能復(fù)制出滑翔器的動態(tài),但在某個時間點(diǎn)之后模擬失敗,可能是因?yàn)樗皇恰坝洃洝绷擞?xùn)練中的具體幀,而沒有真正學(xué)會背后的動態(tài)規(guī)律。
圖23 展示了使用我們的方法(GeneCA + GenePropCA)訓(xùn)練 500 幀 Lenia 視頻的結(jié)果??梢钥吹?,我們的方法在視覺上更接近原始 Lenia 視頻。此外,在第 500 幀之后形態(tài)依然保持穩(wěn)定,顯示出模型已經(jīng)學(xué)習(xí)到了更為通用、時間上穩(wěn)定的動態(tài)行為。雖然未能完美復(fù)現(xiàn) Lenia 的滑翔器,但結(jié)果已相當(dāng)不錯。
總結(jié)與討論
神經(jīng)科學(xué)中長期以來的主流觀點(diǎn)認(rèn)為,記憶主要通過突變觸可塑性來存儲和傳遞——即所謂的“突觸學(xué)說”(synaptic dogma)(Kandel, 2001)。該觀點(diǎn)認(rèn)為,突觸強(qiáng)度的變化是信息在神經(jīng)回路中編碼的主要方式。然而,越來越多的實(shí)驗(yàn)證據(jù)表明,記憶存儲也可能涉及細(xì)胞內(nèi)過程和分子機(jī)制。
例如,在海兔(Aplysia)中的研究表明,將訓(xùn)練動物體內(nèi)提取的 RNA 注入未受訓(xùn)練的個體中,可以誘導(dǎo)出類似記憶的變化,這暗示著除了傳統(tǒng)的突觸修改之外,分子基質(zhì)可能也參與了記憶的形成(Bedécarats 等,2018)。同樣,在渦蟲(planaria)上的研究也顯示,即使被斬首后再生頭部,它們?nèi)阅鼙A粝惹皩W(xué)習(xí)的行為,進(jìn)一步表明記憶可能存在于非突觸、細(xì)胞內(nèi)部的結(jié)構(gòu)中(McConnell, 1962;Shomrat 和 Levin, 2013b)。
這些發(fā)現(xiàn)對生物學(xué)和計(jì)算模型中的記憶理解都具有重要意義。傳統(tǒng)模型強(qiáng)調(diào)網(wǎng)絡(luò)層面的交互和突觸權(quán)重調(diào)整,而近期的研究則越來越關(guān)注基因表達(dá)和細(xì)胞內(nèi)信號級聯(lián)在長期記憶存儲中的作用(Kandel 等,2014)。發(fā)育生物學(xué)的研究成果也為這一更廣泛的觀點(diǎn)提供了支持;例如,基因調(diào)控網(wǎng)絡(luò)能夠協(xié)調(diào)復(fù)雜的形態(tài)發(fā)生過程(Davidson, 2006),強(qiáng)調(diào)了整合快速突觸信號與較慢的基因介導(dǎo)過程的多時間尺度信息傳遞潛力。
受這些生物學(xué)洞見的啟發(fā),一些新興的計(jì)算框架——如本文提出的 EngramNCA 模型——正在探索雙重信息存儲模式。在這些模型中,系統(tǒng)具備一種雙重狀態(tài)表示:一個公開可訪問的通道,用于模擬突觸活動;以及一個私有通道,用于表示細(xì)胞內(nèi)的記憶。這種雙通道方法反映了生物系統(tǒng)中即時突觸信號與較慢分子記憶傳遞之間的分離,為捕捉復(fù)雜的發(fā)育和記憶動態(tài)提供了更為細(xì)致的基礎(chǔ)。
將生物學(xué)中的記憶原理整合進(jìn)計(jì)算模型中,最終可能為構(gòu)建更加穩(wěn)健和適應(yīng)性強(qiáng)的系統(tǒng)鋪平道路。我們的結(jié)果表明,細(xì)胞中固定的記憶部分有助于穩(wěn)定地表達(dá)已學(xué)習(xí)的模式。此外,我們還發(fā)現(xiàn)使用私有記憶可以更準(zhǔn)確地再現(xiàn) Lenia 的動態(tài)行為。這一觀察支持了我們提出的機(jī)制,作為解釋真實(shí)生物體中記憶存儲方式的一種可能。更重要的是,它還表明,細(xì)胞記憶可能是實(shí)現(xiàn) AI 中更穩(wěn)定分布式系統(tǒng)的一個有前景的方向。
穩(wěn)定性是人工智能領(lǐng)域中的一個開放問題,通常通過池化訓(xùn)練(pool-training)緩解。未來的一項(xiàng)研究方向是在無法應(yīng)用池化訓(xùn)練的情境下,使用 EngramNCA 的細(xì)胞記憶機(jī)制。此外,我們認(rèn)為 EngramNCA 可以適用于更復(fù)雜的任務(wù)集,例如抽象與推理語料庫(Abstraction and Reasoning Corpus, ARC)(Chollet, 2019)。
進(jìn)一步而言,EngramNCA 模型還可以為神經(jīng)科學(xué)提供有價(jià)值的見解,因?yàn)樗峁┝艘粋€與新興生物學(xué)證據(jù)相一致的計(jì)算框架,這些證據(jù)表明記憶機(jī)制超越了傳統(tǒng)的突觸學(xué)說。通過展示同時具備公開可見狀態(tài)和私有內(nèi)部記憶的系統(tǒng)如何發(fā)展出更穩(wěn)定的模式、層次結(jié)構(gòu)和魯棒的信息傳遞,該模型提出了潛在的機(jī)制,用于解釋諸如組織再生后的記憶保留或 RNA 介導(dǎo)的記憶轉(zhuǎn)移等生物現(xiàn)象。
具體來說,該模型展示了細(xì)胞內(nèi)記憶組件如何與突觸連接協(xié)同工作,從而構(gòu)建更具彈性和多樣性的記憶系統(tǒng)——這或許可以解釋為什么渦蟲可以在被斬首后仍保留記憶,或者為什么 RNA 的轉(zhuǎn)移可以誘導(dǎo)學(xué)習(xí)行為。這種計(jì)算方法可以通過預(yù)測細(xì)胞層級記憶機(jī)制如何在不同時間尺度和空間組織中相互作用,指導(dǎo)未來的神經(jīng)科學(xué)實(shí)驗(yàn)設(shè)計(jì),最終促進(jìn)我們對生物系統(tǒng)中記憶編碼、存儲與檢索機(jī)制的更深入理解。
附錄1
本節(jié)詳細(xì)介紹了為確定在通道私有化(privatization)過程中 NCA 圖像重建質(zhì)量下降所進(jìn)行的初步實(shí)驗(yàn)。我們測量了蜥蜴表情符號的重建損失曲線,以及 NCA 在受到損傷后的再生能力。
對于所有實(shí)驗(yàn),每個私有化水平下的訓(xùn)練都基于相同的種子重復(fù)一次;而再生實(shí)驗(yàn)則重復(fù)了一百次,每次損傷位置固定且相同,并適用于所有私有化水平。
在這些實(shí)驗(yàn)中,我們測試了三種不同類型的 NCA:
DummyVCA(虛擬向量 NCA) :感知核(sensing kernels)的通道維度與未掩碼的 NCA 通道一致。然而,在涉及鄰域感知的卷積操作(如 Sobel 濾波器)中,私有化通道會被替換為一個全零的虛擬向量。
MaskedCA(掩碼 NCA) :感知核的通道維度與未掩碼的 NCA 通道一致。但在感知卷積完成后,輸出張量中對應(yīng)于私有化通道的部分會被置零(即掩碼處理)。
ReducedCA(縮減通道 NCA) :感知核的通道維度被縮減,不包含私有化通道。輸入狀態(tài)也被截?cái)?,排除私有化通道后傳入感知核。之后再通過補(bǔ)零將狀態(tài)擴(kuò)展回原始未掩碼的通道數(shù)量,以匹配原始 NCA 的通道維度。
用于訓(xùn)練和評估重建效果的損失函數(shù)是 PixelwiseMSE(像素級均方誤差) :
其中 H、W、C 是圖像的維度,I 是參考圖像,I^ 是 NCA 的最終狀態(tài)。
初步實(shí)驗(yàn)結(jié)果
圖24 展示了三種模型在不同私有化水平(0、4、8、12,從上到下)下的損失曲線(從左到右)。在私有化水平為 0 和 4 時,三種模型表現(xiàn)相當(dāng);而在私有化水平為 8 時,DummyVCA 的表現(xiàn)明顯更差。最終,在私有化水平為 12 時,ReducedCA 表現(xiàn)最好。
從私有化水平 0 到 4,損失曲線沒有明顯變化;但隨著更多通道被私有化,模型的學(xué)習(xí)能力開始下降。
圖25 顯示了蜥蜴表情符號的重建質(zhì)量(以最后損失的移動平均值,窗口為10)隨著通道被私有化而下降的趨勢。由于數(shù)據(jù)存在噪聲,三種模型之間無法進(jìn)行明確比較,可以認(rèn)為它們表現(xiàn)相似。
圖26 展示了三種模型在嘗試修復(fù)受損蜥蜴圖像時的平均再生損失(mean regrowth loss)。與最終損失類似,隨著私有化通道數(shù)量增加,再生質(zhì)量也隨之下降。此處的數(shù)據(jù)同樣具有較大的噪聲,甚至更為明顯。這很可能是由于 NCA 的異步更新特性所導(dǎo)致。
根據(jù)這些初步實(shí)驗(yàn)的結(jié)果,我們得出結(jié)論:隨著通道被私有化,NCA 的圖像重建質(zhì)量確實(shí)會下降。然而,不同的架構(gòu)選擇對性能損失的影響并不顯著。因此,我們最終選擇了 MaskedCA 版本用于通道縮減,因?yàn)樗菍?shí)現(xiàn)起來最簡單的方式。
附錄2
所提出模型的數(shù)學(xué)細(xì)節(jié)
在本節(jié)中,我們將以數(shù)學(xué)方式詳細(xì)定義所提出的模型。
細(xì)胞自動機(jī)框架
我們將 EngramNCA 形式化為一個細(xì)胞網(wǎng)格,其中 H 和 W 是網(wǎng)格的尺寸,N 是通道的總數(shù)。位于位置 (i,j) 的每個細(xì)胞 ci,j 都包含一個狀態(tài)向量,并被劃分為三個組成部分:
原文鏈接:https://arxiv.org/pdf/2504.11855
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.