A Path to Universal Neural Cellular Automata
通向通用神經細胞自動機的道路
https://arxiv.org/pdf/2505.13058
摘要
細胞自動機因其能夠通過簡單且局部的規則生成復雜的動態行為而廣受贊譽,像康威“生命游戲”這樣的經典離散模型已被證明具有通用計算能力。近年來的研究進展將細胞自動機擴展到了連續域,這引發了一個重要問題:這些系統是否仍然具備實現通用計算的能力?與此同時,神經細胞自動機作為一種新興范式逐漸興起,在該范式中,規則是通過梯度下降進行學習的,而非人工設計。
本研究探討了神經細胞自動機在連續空間中發展出一種通用細胞自動機的可能性,并通過梯度下降訓練來實現這一目標。我們提出了一種細胞自動機模型、目標函數以及訓練策略,以引導神經細胞自動機向實現通用計算的方向演化。實驗結果表明,該系統成功訓練出了若干基礎計算原語——例如矩陣乘法與轉置運算,并最終實現了在細胞自動機狀態中直接模擬一個用于解決MNIST手寫數字分類任務的神經網絡。
這些成果標志著朝向構建模擬形式的通用計算機邁出的基礎性一步,對于理解連續動力學中的通用計算原理,以及通過機器學習自動化發現復雜細胞自動機行為具有重要意義。
關鍵詞 神經細胞自動機(Neural Cellular Automata)、自組織(Self-organization)、涌現(Emergence)、新型計算(Exotic Computing)
1 引言
細胞自動機(Cellular Automata, CA)是一類引人入勝的計算模型,因其能夠通過簡單的規則生成復雜行為而吸引了多個學科研究者的關注 [10]。其核心結構通常由一個網格組成,每個單元格處于有限數量的狀態之一,并在離散的時間步中根據固定的確定性規則進行演化。這一規則被統一應用于所有單元格,決定了每個單元格的狀態轉換,僅依賴于其當前狀態及其鄰居的狀態。盡管結構簡單,細胞自動機已成為研究涌現現象和復雜系統的重要基石 [31]。數學證明已經表明,一些著名的細胞自動機模型,如康威“生命游戲”、初等細胞自動機和Wireworld,具備通用計算能力,突顯了它們驚人的表達力與強大功能 [8, 24]。除了這些形式化證明之外,研究人員還在這些細胞自動機中構建了完整的圖靈機,盡管這一過程通常需要大量細致的人工設計和時間投入。
近年來,連續型細胞自動機的發展彌合了傳統模型(如康威“生命游戲”)的離散特性與現實世界模擬之間的差距。例如Lenia [6] 和SmoothLife [21] 擴展了經典細胞自動機,以連續動態模擬類似生命的圖案。然而,一個關鍵的開放性問題仍然存在:這些模型是否具備通用計算能力?雖然基于它們的表達潛力,答案可能是肯定的,但目前尚無法明確證明。由于缺乏離散狀態和明確的轉換邊界,連續模型難以可靠地編碼符號信息——微小擾動可能導致隨時間推移的顯著偏差,從而破壞計算所需的穩定性。此外,與傳統細胞自動機清晰的邊界和相互作用不同,連續模型往往表現出平滑、模糊的動力學特性,使得設計具有可預測行為的模塊化組件(如導線、邏輯門或存儲元件)變得更加困難。原本在離散細胞自動機中就已經非常繁瑣的任務,在連續域中變得更加困難,甚至幾乎不可能實現,這凸顯了構建高效模擬計算機的一個根本性挑戰。
與此同時,神經細胞自動機(Neural Cellular Automata, NCA)作為一種新的范式逐漸興起,它將經典細胞自動機的局部、分布式動力學與神經網絡的表示能力和可訓練性相結合 [18]。不同于傳統細胞自動機中手動設計更新規則的方式,NCA 利用可微分架構,其中規則由神經網絡參數化,并通過梯度下降進行端到端優化。這種方法使得從數據中學習復雜的行為和動態成為可能,避免了手動設計規則的需求。最近的研究已證明,NCA 可以被訓練執行多種任務:從自組織形成復雜的形態 [18],到解決算法推理任務(如一維ARC挑戰)[9],再到表現出集體行為的涌現 [22],以及人工神經網絡的增長 [19]。這些結果展示了 NCA 在計算建模和模式生成方面的多功能性。鑒于經典細胞自動機的圖靈完備性,NCA 提供了一個令人興奮的新視角來探索規則空間——不是通過手工工程,而是通過優化方法尋找規則。本質上,NCA 將規則發現轉化為一個機器學習問題。這種轉變意義重大:過去需要人工精心設計規則集以產生期望行為的傳統方式,現在被交給了學習算法本身。通過時間反向傳播結合 NCA 的可微分性質,可以靈活地自動化調整高度非平凡的動力學系統。
在本研究中,我們探討了神經細胞自動機范式在開發連續通用細胞自動機 [29] 方面的潛力,目標是通過梯度下降訓練,促使一個通用圖靈機 [27] 在連續細胞自動機中自然涌現。通用神經細胞自動機的發展不僅出于學術興趣或創建有趣的模擬,它還觸及了一些基本問題:連續動態系統是否具備實現通用計算的潛力?是否有可能創造出一種通用的模擬計算機?本文為實現這一宏偉愿景奠定了基礎框架,并展示了有希望的初步進展。首先,我們提出了一個新的框架,區分了 NCA 中“硬件”與“狀態”的概念。在這個抽象模型中,CA 規則作為“物理法則”,主導著時間和空間中的狀態轉換,類似于支配計算的基本定律;CA 狀態則作為動態的物理基質——類似于計算機中的電荷或大腦中的神經化學模式;而“硬件”則代表一種不可變的支撐結構,在整個模擬過程中保持空間配置不變。該硬件可被“物理法則”(即 CA 規則)用于引導計算,但在運行期間不可更改,為涌現行為提供穩定的支撐結構。其次,我們引入了初步的目標函數和訓練設置,旨在引導 NCA 在連續域中實現通用計算。第三,我們進行了實驗,展示了如何在 NCA 框架下訓練出基本的計算構件——如矩陣乘法、點積和轉置運算。最后,我們通過直接在可變的 CA 狀態中模擬一個神經網絡,成功解決了 MNIST 手寫數字分類任務,從而展示了這些基本構件的實際應用價值。這些成果標志著關鍵的第一步,說明了 NCA 如何利用梯度下降將連續細胞自動機塑造成強大的通用計算系統。
2 相關工作
離散型細胞自動機(Discrete CA)長期以來一直是研究通用計算的基石,因為它們能夠通過簡單而局部的規則生成復雜行為。許多離散型細胞自動機模型已被證明具有圖靈完備性,例如康威“生命游戲”[12, 24]、初等細胞自動機中的 Rule 110 [8, 32]、Langton 螞蟻 [11] 和 Wireworld [2]。這些研究依賴于離散狀態,并通常需要大量人工設計的工作來構建特定結構。為了減輕這種負擔,研究人員使用了進化算法來自動生成具有特定性質的規則或模式 [17, 25],雖然減少了人工干預,但這些方法仍然聚焦于離散系統和預定義目標,而非通用計算。
向連續型細胞自動機(continuous CA)的轉變旨在將離散模型與現實世界的模擬系統聯系起來,從而引發對其計算潛力的探討。像 Lenia [6] 和 SmoothLife [21] 這樣的模型引入了平滑的狀態轉換,產生了類似生命的涌現圖案,但它們是否具備通用計算能力仍未得到證實。最近的一些研究嘗試使用進化搜索方法在 Lenia 中自動發現和優化圖案 [1, 23],盡管這些探索強調特定行為的生成,而非面向通用計算。同樣地,也有研究利用梯度下降對 Lenia 的圖案和規則進行優化 [14],但同樣沒有以通用計算為目標。
神經細胞自動機(NCA)標志著一種范式轉變:它用通過梯度下降訓練的神經網絡替代了手工設計的規則。NCA 已被成功應用于多種任務,如形態發生 [18]、分類 [22] 和解決如一維 ARC 挑戰等難題 [9]。與我們研究最相關的是 HyperNCA [19],該模型使用 NCA 來“生長”人工神經網絡,表明其具有更廣泛的計算適應性。這些進展突出了 NCA 在自動化規則發現方面的優勢,將手動設計的負擔轉移到了機器學習之上。然而,以往的 NCA 研究主要集中在模式生成或特定任務上。值得一提的是,Peter Whidden [30] 首次在 NCA 中實現了矩陣復制和乘法任務,我們的方法正是在此基礎上發展而來,進一步驗證了 NCA 在連續計算環境中的潛力。非常近期的研究 [20] 也展示了 NCA 規則可以通過(可微分的)邏輯門實現,這證實了可以在標準數字硬件上運行自組織系統。此外,與我們的工作并行發展的另一項研究 [13] 采用了類似思路:他們為單元格增加了“私有內存帶”,結果顯示系統具備穩定的多任務處理能力。
我們的研究與模擬計算領域,特別是連接生物學與硅基系統的神經形態計算密切相關。模擬計算利用連續的物理系統,借助波傳播、擴散和材料特性等物理現象來持續地表示和變換信息,避免了數字系統中量化的開銷 [28]。NCA 受生物神經網絡啟發,后者主要采用局部計算以提高能效 [4, 5, 16]。局部性原則在這兩類系統中都至關重要,并且表明即使不依賴全局連接,復雜的計算也可以從簡單的局部規則中涌現。大腦中計算與記憶的共存結構提供了一種解決方案,用于緩解隨著模型復雜度增加而日益嚴重的馮·諾依曼瓶頸 [3]。神經形態系統通過帶有本地存儲器的分布式處理單元實現這一生物原理,通常使用混合信號電路來近似神經動力學,同時保持高能效 [7, 15, 26]。
盡管深度學習得益于針對并行矩陣運算優化的軟硬件協同設計而迅速發展,但這種專業化同時也限制了算法創新只能圍繞當前硬件支持的操作展開。通過探索像 NCA 這樣具有局部交互特性的系統如何實現通用計算,我們可以開發出更加靈活的計算架構:在保留生物系統局部性約束的同時,充分利用硅基器件的速度優勢。這種方法可能催生出一種新的計算系統,在計算能力與生物智能所具有的高效性和適應性之間實現更好的平衡。
3 方法
我們利用 CAX [9] 庫實現高性能的神經細胞自動機(Neural Cellular Automata, NCA),并在單塊 L40 GPU 上運行所有實驗。
3.1 通用設置
本框架的目標是展示神經細胞自動機作為通用計算基質的能力。為此,我們在 NCA 的狀態空間中直接執行多種任務(見第 3.4 節)。在本研究中,我們提出了一種新的架構設計,以增強其計算能力。我們的方法將 NCA 的狀態空間劃分為兩個不同的組成部分:
可變狀態(Mutable State) :這是主要的工作空間(任務輸入在此被轉換為輸出)。在一次實驗/任務執行過程中,只有這一部分的狀態隨時間變化。它構成了計算的物理基質,意味著任務(如矩陣運算)直接嵌入在這個空間中,輸入的變換必須在此狀態下完成。可變狀態的更新動態由第 3.2 節中描述的 NCA 規則控制。
不可變狀態(Immutable State) :這作為專門的“硬件”配置,具有空間異質性。該“硬件”可以是整體式的(與整個網格同形),也可以是模塊化的(針對每個特定任務實例使用不同專用組件構成)。這一部分在訓練過程中被學習,但在任何一次實驗/任務實例中保持固定不變。具體細節將在第 3.3 節中說明。
總體而言,該框架支持一種雙層優化策略:
在全局層面,我們訓練一個通用的 NCA 規則(感知函數和更新函數),以支持多樣化的計算操作;
在任務特定層面,我們優化個體的“硬件”配置。
系統通過利用局部可用的“硬件”來調整其動態行為,從而實現特定任務的計算(類似于在主板上放置正確的組件)。從效率角度來看,這種架構也帶來了顯著的實際優勢:一旦通用的 NCA 規則被訓練完成,適應新任務只需優化“硬件”配置,這一過程比從頭開始訓練完整的 NCA 規則要節省大量計算資源。完整的訓練細節將在第 3.5 節中詳細描述。
3.2 神經細胞自動機
我們開發了能夠在其可變狀態 中直接解決任務的計算模型,其動態行為由局部單元格之間的相互作用所決定。這些相互作用由一個神經網絡進行參數化,該神經網絡作為細胞自動機的規則。這個神經網絡的兩個核心組成部分是其感知函數(Perceive Function)和 更新函數(Update Function) :
感知函數(Perceive Function)
感知函數通過在可變狀態 的局部鄰域上應用可學習的卷積濾波器,來收集每個單元格周圍的信息。該模塊將輸入的狀態通道轉換為一個更高維度的感知向量,用以捕捉相關的局部空間模式。卷積核大小、填充方式和激活函數都是可配置的超參數。
更新函數(Update Function)
更新函數利用感知向量和局部“硬件”向量來更新每個單元格的狀態。我們的架構采用了一個基于注意力機制的更新模塊,它通過對感知信息 P 在外部輸入向量 I(編碼任務相關信息或全局上下文,在本實現中代表局部單元格的“硬件”)上的條件化,計算出狀態更新量 ΔS。具體步驟如下:
每個單元格接收一個感知向量 P (表示局部空間模式)和一個硬件向量 I (即其不可變狀態)。
硬件向量 I 通過一個注意力機制激活不同的“計算模式”:
這種設計使得 NCA 能夠根據局部“硬件”動態調整其行為——位于輸入區域的單元格可能激活與輸出區域或計算區域不同的計算路徑。結果是一個靈活的計算基質:相同的底層規則可以根據“硬件”上下文執行多種不同的操作。
3.3 硬件(不可變狀態)
如第 3.1 節簡要所述,我們方法中的一個核心創新在于將計算狀態劃分為可變部分 與不可變部分 。這種區分使得更新模型的角色(需要最大通用性和表達能力)與任務特定的“硬件”配置(可以多樣化且可精細調整)得以分離。我們探索了兩種不同的方式來設計這些專用“硬件”配置。
3.3.1 整體式硬件(Monolithic Hardware)
我們的第一種實現方式是對具有與計算狀態相同空間維度、以及固定數量隱藏通道的任務特定參數進行優化。這種方法成功地在多個任務上訓練了 NCA,并為每個任務使用專門的“硬件”。經過優化的“硬件”配置在視覺上是可解釋的,能夠幫助我們理解特定任務所需的計算流程(見圖3)。
然而,這種方法缺乏泛化能力。例如,為從左下到右上的矩陣平移任務優化的“硬件”,若需執行反向操作則必須重新訓練。此外,它也削弱了 NCA 本身固有的尺度無關性(scale-free nature) :一個用于小規模矩陣乘法的 NCA 若不重新調整“硬件”,就無法推廣到更大尺寸的矩陣。這些限制促使我們進一步開發了一種模塊化“硬件”方法。
3.3.2 模塊化硬件(Modular Hardware)
為了克服整體式“硬件”的局限性,我們提出了一種模塊化且可組合的設計方法。類似于主板上通過不同功能組件模擬所需行為的方式,我們訓練了三種面向特定用途的“硬件”組件:
- 輸入嵌入向量(Input Embedding Vector)
:指定在計算任務中接收輸入信號的單元格。那些在可變狀態中接收輸入的單元格會將其對應的輸入嵌入向量包含在其不可變狀態中。
- 輸出嵌入向量(Output Embedding Vector)
:標記在特定任務中作為輸出的單元格。
- 任務嵌入向量(Task Embedding Vector)
:使 NCA 能夠識別所需輸入-輸出轉換類型。這個學習得到的向量會被添加到每個單元格的“硬件”狀態中。
這三個核心組件隨后根據具體任務實例被手動組裝 ,以構建特定的任務示例。最終形成的不可變狀態在整個實驗過程中始終對更新規則可見。
這種模塊化的方法在保留 NCA 尺度無關性的同時,滿足了執行多樣化計算任務所需的局部異質性基質。我們還展示了該方法具備零樣本泛化能力(zero-shot generalization) ,即 NCA 可以完成未見過的任務配置,甚至實現復合任務鏈式執行(composite task chaining) (詳見第 4.3 節)。
3.4 任務
為了訓練出具備執行通用計算能力的魯棒且多用途的神經細胞自動機(Neural Cellular Automata, NCA)模型,我們實現了一個基于矩陣操作的靈活任務框架。這些任務涵蓋了不同的計算能力,用以測試 NCA 在整個網格中處理、轉換和路由信息的能力。
通過這一綜合框架,神經細胞自動機(NCA)發展出了通用的計算能力,能夠穩健地應對任務類型、輸入分布、矩陣大小和空間排列等變化。
3.5 訓練
為了使我們的神經細胞自動機(Neural Cellular Automaton, NCA)具備執行多種計算任務的能力,我們采用了一種聯合訓練框架。該框架在同一組不同的任務實例上同時優化一個共享的 NCA 規則。
每個任務由一個特定的目標(即對輸入執行的操作)定義,通常一個任務實例包括:初始網格狀態 S0、期望的目標最終狀態 ,以及通常一個掩碼 M,用于指示網格中與評估相關的區域。
在訓練過程中,我們會從各種任務中采樣組成一個批次。對于每一個任務實例,NCA 模型會在給定數量的離散時間步 內演化初始狀態 S0,以生成最終狀態。為了增強 NCA 的穩定性,在計算損失時所使用的最終狀態會隨機選取于之間的時間點。
損失函數(通常是帶掩碼的誤差度量,例如均方誤差 MSE)用于衡量在掩碼 M 所定義的相關區域內,實際達到的最終狀態與目標狀態之間的差異。隨后使用基于梯度的優化方法來最小化這一損失。
與共享 NCA 規則以及任何共享的輸入輸出“硬件”組件(在模塊化“硬件”設置中)相關的參數,會根據批次中所有任務的梯度進行更新,從而促進通用計算原語的學習。而屬于任務專用模塊的參數(在整體式“硬件”中,或在模塊化設置中的任務組件),則僅使用其對應任務實例所產生的梯度進行更新,以實現行為的專業化。
這種聯合優化過程促使一個多功能的 NCA 系統逐漸浮現:它能夠通過學習到的局部動力學執行多種計算功能,并根據當前呈現的任務“硬件”動態調整自身行為。
4 實驗與結果 4.1 任務訓練 4.1.1 聯合訓練(Joint Training)
在多任務訓練設置中,我們的神經細胞自動機(Neural Cellular Automata, NCA)通過共享的更新規則架構結合任務專用的“硬件”組件,成功地同時掌握了多種矩陣操作。
我們的研究結果表明,單個 NCA 可以發展出適用于不同矩陣任務的通用計算原理,同時保留每個具體操作所需的專門化參數。這種多任務學習能力揭示了 NCA 的基本計算多樣性。
通過在統一框架下同時學習執行諸如矩陣乘法、平移、轉置和旋轉等多種操作,模型展示了對完整矩陣運算體系的掌握——這是更復雜計算的基本構建模塊。這一多任務基礎直接支持了更復雜的組合應用,例如我們在第 4.2 節中展示的 MNIST 分類器模擬。
將復雜操作分解為更小的矩陣任務,并通過相同的底層細胞機制進行處理的能力,展示了實現日益復雜計算的可行路徑。通過證明 NCA 能夠可靠地執行這些基本操作,我們為未來在更復雜組合任務上的研究奠定了基礎,包括完整的神經網絡模擬、算法推理,甚至可能實現在細胞基質內完全運行的更高級計算模型。
4.1.2 下游任務微調(Downstream Task Fine-tuning)
一旦 NCA 完成預訓練,我們架構的一個關鍵優勢便顯現出來:適應新任務只需對“硬件”配置進行微調,而保持核心 CA 更新規則不變。這種方法顯著降低了適應新任務所需的計算資源。
在我們的實驗中,僅微調“硬件”的訓練速度比重新訓練整個模型提高了兩倍。然而,仍需進行更全面的對比分析,以評估聯合訓練與微調之間的優劣差異。
4.2 MNIST 分類器模擬
我們通過使用神經細胞自動機(Neural Cellular Automata, NCA)在其計算工作空間中直接模擬一個完整的神經網絡,展示了一個實際的下游應用場景。具體來說,我們模擬了一個用于解決 MNIST 手寫數字分類任務的單層多層感知機(Multi-Layer Perceptron, MLP)。
首先,我們預訓練了一個簡單的線性前饋網絡,以足夠高的準確率對 MNIST 數字進行分類。該分類器僅使用一個權重矩陣而沒有偏置項,其推理過程只需要將展平后的輸入圖像與權重矩陣進行矩陣乘法運算,然后通過 argmax 操作確定預測的數字類別。
我們的 NCA 模型也已在較小的 8×8 矩陣乘法任務上進行了預訓練。雖然我們可以期望模型在更大的矩陣上具備泛化能力,但像 MNIST 分類所需規模(784×10)的操作已經超出了該模型的處理能力。為了解決這一限制,我們采用了分塊矩陣分解(block-matrix decomposition)方法 ,將 MNIST 圖像的分類任務拆分為多個符合 NCA 狀態約束的小型 8×8 矩陣操作。
這些分解后的操作可以直接在 NCA 的計算狀態中執行,而無需針對特定任務進行微調,從而展示了我們方法對新型矩陣分布的魯棒性。
NCA 可以并行處理每個分塊的矩陣乘法操作,之后我們對結果進行匯總,重建出完整的分類 logits(輸出得分)。在評估性能時,我們將基于 NCA 的模擬結果與原始分類器的預測和準確率進行對比。盡管由于多個子操作之間的誤差傳播導致了一定程度的準確率下降,但模型仍表現出可觀的性能(模擬分類準確率為約 60%,而原始分類器為 84%,兩者預測一致的比例約為 69%)。
我們認為,這為通過 NCA 實現神經網絡模擬的可行性 提供了實證依據。
這項研究對模擬計算和物理計算具有重要意義。如果我們的 NCA 更新規則能夠通過物理狀態轉換來實現,那么它將為不依賴二進制運算的物理神經網絡模擬 提供一條可行路徑。利用專門為這種計算范式設計的硬件,在矩陣運算層面直接運行,相較于傳統的數字方法,有望在效率和性能方面帶來顯著提升。
4.3 未來方向:任務組合與神經編譯器
我們所開發的模塊化“硬件”配置使得通過組件組合直接創建分布外任務(out-of-distribution tasks)成為可能。這種靈活性使我們能夠設計出 NCA 并未顯式訓練過的新型計算場景,同時仍能成功執行。
例如,我們可以利用矩陣平移任務嵌入和多個目標區域(target tiles),將一個中心矩陣復制到多個角落位置(如圖6所示)。這個簡單的例子展示了我們的架構如何在無需額外訓練的情況下,支持超出訓練數據分布的操作。
這一框架為通過基本操作的順序鏈式組合 來構建復雜復合任務打開了通路。考慮以下多步驟流程(見圖7底圖):
從一個輸入矩陣開始,使用目標區域將其復制到兩個角落位置;
更換當前“硬件”配置,用新參數將這些目標重新定義為輸入,然后朝向第三個角落執行矩陣乘法;
再次更新“硬件”,對結果矩陣進行旋轉,并將其返回原始位置。
雖然這樣的復合序列本身可能并不具備實際用途,但它展示了一項關鍵能力:NCA 可以通過對“硬件”參數的順序重配置 來執行復雜的算法流程。這項能力為更高級別的計算推理和抽象奠定了基礎。
這種復合任務鏈還突出了穩定性 在實現可組合計算中的核心作用。當 NCA 的計算狀態中產生的輸出作為后續操作的輸入時,建立穩定的狀態表示變得至關重要。
正如生物系統中穩態(homeostasis)在外部變化下維持內部平衡一樣,NCA 也需要一種計算穩態(computational homeostasis) ,以在不同操作之間保持可靠的狀態表示。類似地,模擬計算機也可能需要穩態機制,才能在不丟失信息的前提下成功執行擴展的任務鏈和計算鏈。
我們認為,這種順序操作模型暗示了一種引人注目的雙時間尺度(dual-timestep)神經編譯方法 :
在 神經元時間尺度 上,NCA 的可變狀態根據其更新規則演化,形成計算的基本動力學;
在 編譯器時間尺度 上,“硬件”參數被重新配置,以提供任務抽象和高層程序步驟。
這種職責分離機制——快速的神經元動態負責計算,較慢的“硬件”變化控制程序流程——在連續、可微分的基質中模仿了經典計算機架構的設計理念。
隨著這一方法的發展成熟,它有望實現將算法直接編譯為神經細胞自動機 ,從而將神經網絡的靈活性與程序化執行相結合。這或許可以通過我們在下一節中詳細介紹的更優任務抽象與“硬件”生成機制來進一步推動實現。
4.3.1 基于圖的“硬件”超網絡(Graph-based Hardware Hypernetwork)
最后,在前幾種“硬件”方法局限性的基礎上,我們目前正在開發一種更具系統性和原則性的基于圖的“硬件”生成框架 ,該框架在靈活性和尺度不變性方面均有顯著提升。
這一正在進行中的(WIP)方法依賴于一種任務表示抽象:將計算操作建模為一個圖結構,其中節點代表輸入和輸出區域,邊則編碼這些區域之間需要執行的具體變換。
該框架的核心是一個“硬件元網絡(Hardware Meta-Network) ”,由兩個主要組件構成:
- 圖神經網絡(GNN)編碼器
- 基于坐標的超網絡(hypernetwork)
GNN 處理一個任務圖結構,其中:
節點包含有關輸入和輸出區域的歸一化空間信息;
邊表示區域之間需要執行的具體操作(例如矩陣乘法、旋轉等)。
通過多層消息傳遞機制,GNN 將該圖結構壓縮成一個固定維度的潛在任務向量(latent task vector) ,用以捕捉單個任務實例的核心計算需求。
超網絡生成“硬件”
隨后,這個潛在表示被用于條件化一個基于坐標的 MLP 超網絡 ,該超網絡以尺度無關的方式 為網格中每一個空間位置生成對應的“硬件”向量。該超網絡利用**位置編碼(positional encodings)**來創建空間變化的“硬件”模式,從而引導 NCA 在整個網格上的計算動態行為。
關鍵特性 :這種方法保持了精確的空間不變性——任務描述是相對于網格尺寸進行歸一化的,這意味著生成的“硬件”可以自動適應不同的網格大小和區域位置,而無需重新訓練。
人機接口與任務抽象
這種基于圖的表示為人與連續型 NCA 基質之間的交互提供了一個直觀的接口。用戶可以通過自然的圖結構(輸入、輸出、操作)來定義任務,而元網絡會將這些描述自動翻譯為合適的“硬件”配置。
這種方法實質上改進了“編譯器”的概念——即在人類意圖與 NCA 的計算能力之間建立橋梁,使得任務鏈式組合與“硬件”隨時間演化的過程得以更清晰地定義。
此外,圖結構也為我們在初始實現基礎上進行豐富擴展提供了可能:
通過邊屬性對任務進行排序,支持 順序執行規劃 ;
通過隨時間修改任務圖,實現 動態“硬件”重配置 ,從而構建一個補充細胞自動機快速神經動態的第二層動態機制。
這種層次化的時間結構——快速神經動態實現局部計算,慢速“硬件”動態引導算法流程 ——與傳統計算架構中時鐘周期操作與高層程序執行之間的二分法非常相似。
在統一的可微分框架中實現這一結構,最終可能催生出更加高效且具有適應性的連續計算范式。
5 結論
在歷史上,關于通用計算 (universal computation)在細胞自動機中的探索主要局限于離散系統 ,如康威“生命游戲”和初等細胞自動機已被證明能夠模擬通用圖靈機,展現出驚人的計算能力。然而,將這種能力擴展到連續型細胞自動機 (continuous cellular automata)面臨重大挑戰,主要源于缺乏離散狀態以及平滑、模擬動態所固有的不穩定性。
在本研究中,我們采取了一種務實的初步方法,利用神經細胞自動機 (Neural Cellular Automata, NCA)作為基質,在連續域中發展通用計算能力,從而邁出了克服這些障礙的第一步。通過使用梯度下降 來訓練 NCA 規則,我們展示了一種無需手動設計規則即可塑造復雜計算行為的新路徑,將發現規則的負擔從人類智慧轉移到了機器學習之上。
我們的實驗結果表明,NCA 能夠成功編碼諸如矩陣乘法與轉置 等基礎計算原語,甚至可以直接在其狀態空間中模擬一個用于解決 MNIST 手寫數字分類任務的神經網絡。這些發現表明,NCA 可以成為傳統計算架構與自組織系統之間的橋梁,提供一種與模擬系統高度契合的新型計算范式。
這一聯系對于設計高效的人工智能模型計算框架尤其具有前景,特別是在對能效和魯棒性要求極高的場景中。我們的方法暗示了一種可能性:不必為每個任務重新訓練全新的規則,而是可以發現最優的“硬件”配置,利用固定物理規律來實現低開銷、有意義的計算。
展望未來,我們認為這項工作為計算科學的變革性進展 奠定了基礎。通過在多樣化的物理實現中自動化地發現通用計算機,NCA 有可能徹底改變我們如何利用新材料和新系統進行計算,最終催生出超高能效的模擬硬件系統 或隨資源需求線性擴展的計算范式 。
盡管仍存在諸多挑戰——例如穩定連續動態以實現可靠的符號編碼、以及將這些系統擴展到更復雜的任務——但 NCA 在連續細胞自動機中實現通用計算的潛力,為我們開辟了全新的探索方向。
歸根結底,這項研究不僅深化了我們對連續動態中計算本質 的理解,也為下一代自適應、高能效計算技術 的發展鋪平了道路。
原文鏈接:https://arxiv.org/pdf/2505.13058
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.