99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

馬爾可夫毯的宏觀物理發現框架

0
分享至

DYNAMIC MARKOV BLANKET DETECTION FOR MACROSCOPIC

PHYSICS DISCOVERY

基于動態馬爾可夫毯的宏觀物理發現框架

https://arxiv.org/pdf/2502.21217



摘要

自由能原理(FEP)及其相關的馬爾可夫毯(Markov blankets)和本體勢(ontological potentials)最近被提出,作為一種廣義建模方法的核心組成部分,能夠數學地描述在隨機動力系統中持續存在的任意對象;也就是說,這是一種關于“每一個”“事物”的數學理論。在這里,我們利用FEP發展出一種數學物理方法,用于識別對象、對象類型以及支配它們行為的宏觀、對象類型特定的規則。為此,我們深入探討了馬爾可夫毯、強化學習、系統辨識理論和宏觀物理學發現之間的深層聯系。

更具體地說,我們利用馬爾可夫毯的統計特性來實現文獻中系統等價性的兩個條件,并開發了一種子系統發現的方法,即如何最優地將一個系統劃分為子系統,以及如何最優地對(子)系統進行分類。通過馬爾可夫毯的統計特性,我們證明:如果一個給定系統的兩個子系統其馬爾可夫毯具有相同的穩態統計特性或獎勵率,則這兩個子系統是弱等價的;而如果它們邊界的時間演化或路徑具有相同的統計特性,則它們是強等價的。

這使我們能夠形式化地根據對象與其環境的相互作用方式來定義對象類型。同時,這也讓我們可以將系統辨識與宏觀物理學發現的問題重新表述為馬爾可夫毯檢測的問題。我們采用生成模型的方法,并使用變分貝葉斯期望最大化算法,開發出一種動態馬爾可夫毯檢測算法,能夠在僅部分觀測微觀動力學的情況下,識別并分類宏觀對象。

這種無監督算法使用貝葉斯注意力機制,顯式地標記可觀測的微觀元素在其當前系統中的角色,將其歸類為某一宏觀對象的內部元素或邊界元素;并且它還能識別支配該對象與環境相互作用的宏觀物理定律。由于這些標簽是動態變化的或隨時間演化的,因此該算法能夠識別穿越固定介質或與環境交換物質的復雜對象。

這種方法直接引出了一個靈活的結構化無監督算法類別,能夠合理地將復雜的多粒子或多組件系統劃分為一系列相互作用的宏觀子系統,即所謂的“對象”或“事物”。我們推導了幾個這類宏觀物理學發現算法的例子,并通過簡單的數值實驗展示了其效用,在這些實驗中,該算法正確地標注了牛頓擺、燃燒的導火線、洛倫茲吸引子和模擬細胞的組成部件。

1 引言

在本文中,我們重新審視了系統辨識理論、工程學和統計物理學中用于系統識別與分類的方法,并借助信息論的工具進行分析,特別是使用了自由能原理(FEP)文獻中發展出的馬爾可夫毯(Markov blankets)和本體勢函數(ontological potential functions)等概念。受近年來從信息論原理出發推導經典力學和統計力學成果的啟發[31, 10],我們提出了一種新的FEP推導方式,強調其如何用于寫出定義對象類型或表型的“本體勢函數”。

這種方法基于Jaynes最大熵原理(maximum caliber principle)的相對熵表述[41, 36, 42],并對宏觀對象或某一類型的子系統的邊界(即馬爾可夫毯)施加約束條件。我們展示了這些馬爾可夫毯約束完全刻畫了一個對象或對象類型與其環境中其他對象之間的相互作用,從而以該子系統對其他子系統的影響為依據,形式化地定義其行為特征。

這種方法涵蓋了當代強化學習、系統辨識理論和宏觀物理學發現中更常見的對象識別與分類方法。

系統及其子系統的識別與分類問題表面上看似簡單。用通俗的語言來說,傳統的系統辨識理論提出的問題是:如何用一個簡單的黑箱函數逼近器來描述一個多組分系統的復雜相互作用和行為?在標準的系統辨識方法中,用戶將子系統識別為一個大型多組分復雜系統中的連通子集,然后刻畫該子系統的輸入與輸出之間的關系。

例如,在強化學習中,系統的輸入是智能體的觀測,輸出是其動作。將輸入映射到輸出的函數稱為“策略”(policy),在這種背景下,如果兩個智能體執行相同的策略,則在相同輸入條件下會執行相同的行為,因此被認為是等價的。更一般地,具有相同輸入-輸出關系的兩個子系統可以被認為屬于同一類型。

除了提供一種對子系統進行分類的方法外,這種方法的優勢在于它能夠通過建模為一個簡單的傳遞函數或低維動力系統,來提供對復雜子系統的簡潔描述。這通常涉及“黑箱化”整個系統內部的組成部分:即在一個多對象或多組件系統周圍畫出一個邊界,然后確定一個(希望是簡化的)數學表達式,用以總結邊界內部復雜活動對其邊界的影響,即通過其對子系統邊界的影響(也就是它與其他子系統的輸入-輸出關系)來描述。在此設定下,邊界本身是一個任意的、由用戶定義的邊界,用于將感興趣的子系統與其他子系統區分開。

在強化學習中使用的系統等價性定義來自系統辨識理論:如果兩個系統具有相同的輸入-輸出關系或策略,無論其內部機制細節如何,它們就被認為屬于同一類型。

在統計物理學中,也使用了類似的宏觀系統等價性概念。如果兩個系統可以用相同的動力系統或能量函數(哈密頓量或拉格朗日量)建模,則它們被視為同一類型。系統辨識方法與統計物理方法之間的主要區別在于后者使用了一種粗粒化程序(coarse-graining procedure)來簡化復雜的微觀動力學。

這一過程始于在一個連通的微觀粒子體積周圍畫出一個任意邊界,并識別出概括該體積內微觀成分活動的宏觀狀態變量(如溫度、壓力和密度)。隨后,從對微觀動力學的理解中推導出連接內部狀態變量與邊界上守恒量凈通量的規則或定律。由于通量是一種守恒量,不同的體積可以相互連接,從而得到描述更大系統的場方程,而該大系統本身又由使用相同通量變量的小子系統組成。于是,某種類型的宏觀系統就可以被識別為那些可以用相同通量-狀態關系建模的連通體積——也就是說,它是一桶水,因為桶中的每個流體元素都具有相同的通量-狀態關系。這將狀態空間擴展為依賴于宏觀物體形狀的場,并將水桶視為提供了邊界條件。

自由能原理(FEP)被提出作為一個通用的數學建模框架,統一了統計力學與信息論,并為信念形成與更新以及信息處理提供了形式化的、生物學上合理的途徑。FEP從對“事物”或“對象”的數學定義開始:任何我們可以合理地稱之為“對象”的東西,必須由一個邊界將其與環境隔開。在FEP框架下,這個邊界被形式化為一個馬爾可夫毯,它建立了該對象與其環境之間的條件獨立性。

在這個框架中,對象不是通過物理狀態與通量或用戶標記的輸入與輸出來定義的,而是通過馬爾可夫毯上的信息流動來定義的。嚴格來說,馬爾可夫毯是對一組變量 Z ? X 的統計邊界的定義:它是最小的一組 B ? X,使得給定毯 B 后,Z 與不在 Z 或 B 中的所有其他變量之間是條件獨立的 [15, 36]。

在FEP文獻中,馬爾可夫毯通常被用來形式化“對象”的概念,因為馬爾可夫毯的統計特性完整地刻畫了一個對象與其環境中其他對象之間的輸入-輸出關系。

這個看似抽象的邊界定義實際上隱含在系統辨識和統計物理學中所使用的邊界的定義之中。在系統辨識中,系統的邊界直接由其輸入和輸出來定義。完整地指定一個系統的輸入和輸出后,就可以將該子系統視為對整個系統起驅動作用的力量。同樣,在統計物理學中,對進入和離開一個子系統的通量(flux)的了解完全刻畫了該子系統及其對系統其余部分的影響,這與初始條件加上邊界條件足以確定狀態變量演化的方式是一致的。

因此,“條件獨立性是子系統與其環境之間邊界的一個屬性”這一觀點并不存在爭議。因此在FEP文獻中有人主張,我們可以根據對象的馬爾可夫毯來定義對象類型或表型。然而為了準確起見,我們指出:更準確的說法應該是,在給定系統中存在一個馬爾可夫毯,僅僅表明該系統可以被劃分為兩個相互作用的子系統——僅此而已。

一旦識別出一個馬爾可夫毯,我們就可以利用它總結相關子系統的輸入和輸出這一事實,得出結論:正是馬爾可夫毯的統計特性定義了一個對象類型。最近的研究已經明確指出了在穩態下保證子系統及其馬爾可夫毯劃分存在的數學條件 [44, 20];而在基于路徑的FEP公式中,它們的存在性是可以被保證的 [43, 44]。

相比之下,如何以數據驅動的方式首先發現這些邊界的問題卻鮮有關注。事實上,在大多數FEP文獻中,研究重點是對存在馬爾可夫毯的情況下信息流動的動力學進行解釋,因此通常假設馬爾可夫毯是存在的,即其存在性和范圍是先驗指定的。當文獻中確實提出了識別馬爾可夫毯的方法時,例如在[17]中,關注的是平穩分布中的近似毯結構。這種類型的馬爾可夫毯即使是在具有實際毯結構的系統中也很少實現。

此外,馬爾可夫毯總是被假定為靜態的——或者與固定組件相關聯,從而造成一種錯誤印象:像行波、火焰和生物體這樣表現出物質更新的事物無法被建模為具有馬爾可夫毯的對象 [35, 30]。

綜上所述,所有這些都表明FEP文獻中缺失的關鍵成分是一個能夠識別動態馬爾可夫毯子系統的程序,從而能夠描述廣泛的靜態和非靜態現象,包括火焰、閃電、生物體以及其他具有瞬態或可滲透邊界的系統,這些系統可能隨時出現或消失。

這就需要闡明一個理論框架以及相關的推理算法類別,使我們能夠比喻性地“按事物本身的關節來切割世界”:即將復雜的多組分系統劃分為宏觀對象和對象類型,并發現支配這些對象之間相互作用的物理定律或宏觀規則。理想情況下,這種無監督劃分應滿足以下兩個條件:

  1. 能夠對對象及其相互作用提供一個緊湊、低維的描述;

  2. 在很大程度上符合人類直覺,即它生成的系統到子系統的劃分應與人類對相關感知現象的直覺大致一致。

出于下文將要說明的原因,我們所描述的這類算法被稱為動態馬爾可夫毯檢測算法 。我們整體方法的基礎是對FEP在系統隨時間演化的路徑或軌跡空間中的表述,該表述源自Jaynes的最大熵原理,并結合了基于馬爾可夫毯的對象和對象類型的定義。

這種表述直接引出了“本體勢函數”的概念,它是通過施加在毯統計特性和毯動力學上的約束來定義的,可以用作對象類型分類的基礎。在這里,“毯統計特性”指的是用子系統與環境之間的輸入-輸出關系來總結其動力學行為的一般方式;而“毯動力學”則指的是邊界本身如何隨時間變化。

從對象和對象類型的這一定義出發,我們考慮了一類宏觀生成模型,該模型使用兩種類型的潛在變量:

  1. 宏觀潛在變量,用于以與施加馬爾可夫毯結構一致的方式對微觀動力學進行粗粒化;

  2. 潛在分配變量,用于標記微觀元素或觀測值在其所屬宏觀對象、邊界或環境中的角色。

關鍵在于,這些潛在分配變量也允許隨時間演化,演化方式需與馬爾可夫毯結構保持一致。

最后,通過采用貝葉斯方法進行模型發現,我們利用貝葉斯推理中的自動奧卡姆剃刀效應,選擇將系統劃分為子系統的方案,使得全局動力學盡可能簡單或低維。

總之,我們將系統辨識問題重新表述為一個馬爾可夫毯檢測問題。我們采用生成模型的方法,并使用變分貝葉斯期望最大化算法,開發出一種動態馬爾可夫毯檢測算法,能夠在僅部分觀測微觀動力學的情況下,識別并分類宏觀對象。

這種無監督算法使用貝葉斯注意力機制,顯式地標記微觀元素的當前角色,將其歸類為某一宏觀對象的內部元素或邊界元素;并且它還能識別支配該對象與環境相互作用的宏觀物理定律。由于這些標簽是動態變化的或隨時間演化的,因此該算法能夠識別穿越固定介質或與環境交換物質的復雜對象。

至關重要的是,這種方法消除了傳統系統辨識通常依賴的任意人為設定邊界的必要,從而實現了對復雜系統的無監督分割,將其劃分為一系列相互作用的宏觀對象集合。此外,由于其基礎是發現馬爾可夫毯的統計特性,它自然繼承了識別對象類型的能力,使我們能夠根據支配對象與環境相互作用的宏觀規則或定律來對子系統進行分類。

本文其余部分的結構如下:我們首先概述馬爾可夫毯及其在FEP中的應用。然后我們討論強化學習、系統辨識理論和宏觀物理學發現的核心要素,將兩種關于系統等價性的概念映射到馬爾可夫毯的統計特性上,并討論其局限性。

接下來,我們在FEP框架下重新審視馬爾可夫毯,探討靜態與動態馬爾可夫毯的數學性質。隨后,我們介紹馬爾可夫毯檢測算法,并展示其應用于簡單系統的數值實驗結果。最后,我們討論這項工作對FEP整體的影響以及未來的研究方向。我們認為,FEP文獻中所提出的馬爾可夫毯統計特性為我們提供了建立“本體勢函數”概念所需的數學工具,即一個通過邊界約束嚴格定義對象類型的函數。


2 自由能原理:核心要素 2.1 自由能原理表述中的馬爾可夫毯

從高層次來看,FEP(自由能原理)的標準表述始于統計物理學的方程,并在其中引入了馬爾可夫毯結構。
“馬爾可夫毯”這一概念最初由Pearl提出[33],作為識別影響關于某一給定“內部”隨機變量集合取值推理的所有隨機變量的完整集合的一種手段。
從實用角度來看,在圖模型中,若已知每個節點的馬爾可夫毯,就可以用來識別用于高效概率推理的消息傳遞算法的結構。
這一性質直接繼承自對一組“內部”隨機變量 z?X的馬爾可夫毯的定義:即存在一個集合 b?X,使得 z⊥s∣b,其中 s是 z和 b并集的補集,或者等價地:

在有向圖形模型中,一組節點Z的馬爾可夫毯(Markov blanket)包括Z中所有節點的父母節點、Z中所有節點的子節點以及Z中子節點的父母節點。這建立了Z中的節點與不在B的毯子中的所有其他節點之間的條件獨立關系,即S = (Z ∪ B)c,其中上標c表示補集,


在自由能原理(FEP)中,這種馬爾可夫毯結構是通過假設微觀系統的動力學可以被劃分為三個變量子集來實現的:內部變量(z)、邊界變量(b)以及外部或環境變量(s),且滿足以下關系:


條件獨立性源于 s與 z之間不存在直接的因果相互作用,但可以直觀地理解為:如果路徑 bτ被觀察到,則它可以被視為兩個獨立子系統的已知驅動因素。需要注意的是,與此系統相關的馬爾可夫毯適用于路徑 (即系統的時序演化或軌跡),而不是穩態分布。同樣重要的是要注意,那些具有毯結構的動力系統(即符合公式6的系統),通常不會導致也具有毯結構的穩態分布。關于這一普遍規律的一些例外情況,請參見文獻[15]。

馬爾可夫毯與子系統或對象類型之間的聯系也直接來源于這種條件獨立關系。這是因為,兩個邊界路徑相同的對象,無論其內部動力學細節如何,從定義上來說必須對環境產生相同的影響。因此,可以通過馬爾可夫毯的路徑統計來定義對象類型。另請參見文獻[42]。關鍵在于,這種基于統計的對象類型的定義,與系統辨識理論中使用的對象類型定義是一致的,而系統辨識是強化學習中的標準方法。這是因為毯統計完全刻畫了子系統與其環境之間的相互作用,從而包含了子系統的輸入和輸出。因此,兩個內部結構和狀態可能非常不同的對象,只要它們具有相同的邊界統計特性,就會具有相同的輸入-輸出關系,并以完全相同的方式與環境進行交互。這一點在簡單的例子中很容易看出:我們可以將毯劃分為直接影響外部變量的“主動狀態”和直接影響內部變量的“感覺狀態”,即 b={a,o}。在這種情況下,將貝葉斯規則直接應用于基于馬爾可夫毯定義的對象類型 ,就可以直接計算出,這正是我們所熟知的智能體策略或子系統的響應函數。

值得一提的是,這種基于馬爾可夫毯統計的系統等價性表述比系統辨識中的表述更為完整,因為它不僅包含所討論智能體或對象的策略。這是由于方程是對稱的,因此毯統計信息還編碼了外部系統的“策略”,即。這清楚地表明,基于馬爾可夫毯的對象類型定義是依賴于環境的


2.2 最大效度路徑與本體勢函數

任何定義的價值都在于其預測能力。在此,我們展示當結合 Jaynes 的最大效度原理 (principle of maximum caliber)[23, 10, 31]時,這種基于馬爾可夫毯統計的對象定義可以直接導出一個“本體勢函數”(ontological potential function),該函數通過實現某一類型對象所需的宏觀行為規則,形式化了“對象類型”的概念,而這里的“類型”正是由馬爾可夫毯的路徑統計所定義的 [41, 36]。

具體來說,給定馬爾可夫毯上的路徑統計 p(bτ),利用 Jaynes 的最大效度原理,我們可以識別出一個能量函數以及相應的拉格朗日函數(Lagrangian),這些函數描述了環境、邊界和對象變量的動力學,從而生成具有該類型的對象。

這與物理學中系統分類的概念是一致的:在物理學中,系統是通過它們所最小化的能量函數或作用量(stationary actions)來定義的。(關于基于最大熵原理的類似論證,請參見文獻 [27]。)

在這里,我們展示了邊界統計特性可以直接導出一個特定于對象的能量函數——即一個本體勢函數,它對應于廣義自由能及相關拉格朗日函數。這一結果彌合了基于馬爾可夫毯的對象類型定義與統計物理中的“類型”概念之間的差距,并自然地引出了基于對其馬爾可夫毯施加統計約束的系統分類方法 [37]。

將馬爾可夫毯統計與 Jaynes 的最大效度原理 (principle of maximum caliber)相結合所得到的目標函數正是自由能 ,這為自由能原理 (FEP)提供了一種替代性的推導方式。為此,我們借鑒了近年來從純信息論角度出發對統計物理的重新推導 [31, 10],并在最大效度框架中引入邊界約束。我們展示了這種方法最終會歸結為一個自由能最小化問題 ,與基于路徑表述的 FEP 的核心要素是一致的 [36]。

Jaynes 的最大效度原理是一種信息論的表述方法,它將受約束的最大熵方法 [24] 擴展到了狀態空間中的路徑或軌跡空間上。這種信息論方法在統計推斷中被廣泛使用,用于確定某種數據的最簡潔模型;即我們在由數據或已知物理定律得出的約束條件下,最大化熵或效度 [23]。最近的研究表明,當將 Jaynes 原理應用于狀態空間中的路徑時,可以為物理學的基本方程提供一個信息論的基礎:也就是說,給定一組適當選擇的約束條件,通過優化 Jaynes 的效度目標函數,可以直接導出經典物理、統計物理和量子物理的所有核心方程,并且以一種清晰的方式揭示作用量(action)、能量(energy)、功(work)與熱(heat)(哈密頓函數或拉格朗日函數)之間的深層關系 [10, 31]。

該原理還可直接用于推導非平衡態統計物理中的重要定理,包括 Crooks 定理、Noether 定理、Jarzynski 不等式,以及熱力學第二定律本身 [31, 22, 19]。

當 Jaynes 的最大效度原理與基于馬爾可夫毯統計的對象類型定義結合時,其幾乎普適的適用性使我們能夠將非平穩 (non-stationary)和非遍歷系統 (non-ergodic systems)納入 FEP 的建模框架之中,而這一點在以往的建模形式下難以實現(參見 [6, 35, 11, 30])。正如我們將看到的那樣,這種靈活性使我們能夠定義——并最終以數據驅動的方式發現 ——那些用來建模非平穩、不斷變化、具有移動性的實體(如火焰、閃電、行波)以及與環境進行物質交換的對象所需的動態或“游移”的馬爾可夫毯。

2.2.1 Jaynes 原理與本體勢函數

數學上,最大效度原理始于對物理定律的概率性(通常是粗粒化的)描述,記作 。接著假設我們擁有某一特定系統的額外信息,這些信息表現為一些時間依賴的期望值形式的約束條件:



期望能量、熵與自由能之間的這種關系,使我們能夠將效度最大化 (caliber maximization)問題轉化為一個自由能最小化 問題,這與自由能原理(FEP)的最新表述是一致的 [16]。此外,在獲得拉格朗日函數之后,可以直接推導出相應的哈密頓函數,并將其解釋為:哈密頓動力學給出的是最可能的路徑 [10]。那些不隨時間變化的約束條件,再結合時間平移對稱性的假設,可以直接導致拉格朗日乘子 λ為常數,并識別出一個守恒的能量量 (λ?F)。

關鍵在于,我們可以將這種以對數配分函數形式出現的自由能解釋為一個勢函數 ,其偏導數可以導出廣義意義上的熱和功的概念 [31]。在最大效度框架下,正是這些約束條件 最終導致了這個勢函數的存在,以及描述物理系統的朗之萬方程和哈密頓動力學。這意味著約束本身就可以被視為定義系統類型的因素。

因此,我們得出結論:這個自由能泛函是噪聲動力系統的本體勢函數 ,也是對“每一個”“事物”的通用定義中的核心組成部分。

2.2.2 “每一個”“事物”的馬爾可夫毯

FEP 方法在 Jaynes 的最大效度原理基礎上所增加的是對“每一個”“事物”的邊界 的物理定義。也就是說,FEP 在最大效度的基礎上引入了一種觀點:邊界不僅僅是虛構的(例如體積之間的通量關系),而是對應于明確且可分離的對象 。這一觀點繼承自“子系統由邊界或毯約束所定義”的概念。

將上述定義的本體勢函數與馬爾可夫毯對子系統類型的定義相結合,可以直接得出在一個給定環境中對子系統、“對象”或“事物”的簡單定義:


很容易證明,施加馬爾可夫毯約束并不會破壞從先驗動力學中繼承下來的條件獨立性結構。雖然可以強行讓某個特定的 p(bτ)直接實現 [10],但我們發現更直觀的做法是用一組(可能是無限的)瞬時期望約束 來重新表示這個毯分布。

當然,要表示一個任意的 p(bτ)所需的約束,并不一定是通常與最大效度目標函數一起使用的那種“瞬時”約束。然而,我們更傾向于使用瞬時約束,因為它們能導致因果性的動力學行為,因此被認為是“物理上可實現的”。

我們通過定義一個時間依賴的馬爾可夫毯 ΩB(t)?X,并施加如下形式的約束來限制在這一類瞬時約束之內:

請注意,當這一方法應用于一個作為流形 (manifold)的馬爾可夫毯時,幾何約束只是在相應的朗之萬方程中引入了一個額外的通量項,并不會改變其整體結構。這是由于限制邊界約束于邊界元素上的示性函數(indicator function)的時間導數所導致的結果。無論該毯是否連通、或是否持續存在一段時間,這一結論都成立。

同樣需要注意的是,通過合理選擇約束函數 fB(?),我們可以對流形 ΩB(t)的形狀和演化施加約束。這種方法的靈活性來源于這樣一個事實:邊界 ΩB(t)既可以被明確指定 ,也可以被視為一個隨機變量,其支撐集是先驗分布 p(?)所定義的所有馬爾可夫毯的集合。

在繼續之前,我們指出一些與系統辨識 (systems identification)和強化學習 (reinforcement learning)之間的聯系。如前所述,馬爾可夫毯統計等價 意味著策略等價 。在強化學習中,這通常被稱為兩個智能體之間的“強等價”(strong equivalence)。由于策略可以從毯統計中推導出來,因此馬爾可夫毯統計的等價性意味著策略等價;也就是說,具有相同馬爾可夫毯統計的智能體屬于同一類型。

強化學習中還有一個“弱等價”(weak equivalence)的概念,指的是實現相同獎勵率的智能體。在無限時間視野下,若獎勵函數僅依賴于動作和結果,則由平穩邊界統計定義的智能體必然實現相同的獎勵率。反過來也成立:在最大熵逆強化學習范式 [49, 45] 所施加的假設條件下,具有相同平穩邊界統計的智能體擁有相同的獎勵函數。這意味著,“弱等價”的智能體對應于對邊界平穩分布 p~(b)施加的約束。

還可以更直接地看到與強化學習的聯系,即注意到 Jaynes 的最大效度目標函數與 KL 控制理論 [26, 12] 之間存在關聯。這清楚地表明,基于馬爾可夫毯統計的對象類型概念以及相關的本體勢函數,涵蓋了系統辨識和當代強化學習中使用的各種系統等價性相關概念。

簡而言之,這種基于最大效度原理和馬爾可夫毯統計的對象類型定義具有理想的性質:它具有廣泛的適用性 ,與系統辨識理論一致,并且與一個一致的目標函數——自由能 ——相關聯。雖然由 FB所施加的具體約束細節指示了對象的具體類型,但約束函數本身的總體特性也可用于對不同類型的對象進行分類。

這也暗示了一種可能性:可以根據毯的定義域及其所施加的“本體論”或對象類型特定約束的種類,發展出一套不同對象類型的分類體系。例如,在統計物理文獻中,通常將那些只依賴于 x的約束稱為幾何約束。本文提出的方法至少闡明了可以定義約束的三個自由度:邊界 ΩB(t)的形狀或拓撲結構 、邊界的動力學行為 ,以及邊界的統計特性

例如,從拓撲角度看,細胞的邊界是一個球面,它是動態的,因為它與環境交換物質,并且在實現穩態(homeostasis)的程度上具有平穩的邊界統計特性。而另一方面,剛體本質上沒有內部狀態,因此它的“邊界”是靜態的(指形狀不變),但從它可以移動的角度看,它又是動態的。

2.3 一個簡單的例子:火焰

對“事物”的馬爾可夫毯定義,一個常見的批評是該定義不適用于火焰 [30, 35]。這一誤解源于一個錯誤的假設:即馬爾可夫毯必須是靜態的,或必須與物質綁定在一起。然而,本文所提出的框架由于引入了對動態邊界的考慮,因此能夠很好地描述火焰以及其他行波現象。

例如,考慮一個在一維導火索上燃燒的簡單火焰,它表現為一個非定常的行波 (我們在后續章節中會提供一個數值示例)。在此情況下,我們將邊界定義為區分已燃區域與未燃區域的點 ,記作 yb(t)。我們所施加的約束是:在該點處的溫度應對應于驅動火焰傳播的放熱化學反應的著火溫度




2.4 到目前為止的總結

在實踐中,如何使用一個本體勢函數 ?我們首先通過指定一個關于動力學的先驗分布 p(x˙,x,t)來定義一種物理;然后通過約束條件來指定邊界的統計特性。由此得到的動力系統可以確保產生由這些邊界統計所定義的那種對象。

這可以被理解為回答了如下問題:(1)微觀元素(包括子系統的內部和外部元素)必須如何組織自身,或者(2)為了生成特定類型的邊界,能量必須如何注入并耗散于系統之中。

然而,這種實例化目標對象的方法仍然無法讓我們確定:在一個給定的動力系統中,哪些特定的子集應當被視為一個“對象”。它只是告訴我們一些關于那些我們已經識別出的、能夠支持特定類型對象的系統的性質。

事實上,盡管上述方法都很有用,它們都無法充分解決子系統識別與分類 的問題,其根本原因在于:這些方法中的邊界實際上是由用戶定義的

既然我們已經確認合理的邊界對應于馬爾可夫毯,那么很自然地會得出這樣一個結論:任何擁有一張馬爾可夫毯的元素集合都對應一個對象。不幸的是,馬爾可夫毯的定義過于寬泛,難以實際應用,因為每一個微觀元素在每一個時刻快照下都有一個馬爾可夫毯(見圖2a);參見文獻 [6] 中的批判性討論。


因此,FEP 文獻中的大部分工作采納了一個額外的“成物性”(thing-ness)原則:即平穩性(stationarity)[9]。也就是說,該馬爾可夫毯和對象必須是整個系統的一個適當子集,并且構成該毯和對象的元素必須不隨時間變化 [15]。

這一假設將任意一個流體元排除在外,因為在流體中物質可以自由進出該元素。當這種情況發生時,物質通過馬爾可夫毯從對象內部轉移到外部,因此該毯相對于流體中的組成元素而言并不是平穩的。但這同時也排除了建模各種有趣系統——甚至是可能最有趣的系統——的可能性,例如具有動態邊界或經歷物質更替的系統。

在此,我們認為這種對邊界的平穩性定義對于我們的目的來說既是過于嚴格 ,又是不夠嚴格 的。

一方面,它過于嚴格,因為它禁止我們將火焰或任何行波視為一個對象。這是因為隨著波動傳播,構成行波介質的元素也在發生變化。

另一方面,它又不夠嚴格,因為它意味著任何任意連接的元素子集都可以對應一個對象。以上面的火焰例子為例,這意味著導火索上任何一段原本被火焰燃燒的部分都必須被視為一個“事物”,無論其溫度分布、反應速率及其動力學行為如何。

這個例子清楚地表明:我們需要一個更加通用的對象或“事物”的定義,它應該能夠容納可以移動或變化的馬爾可夫毯 的概念,并應包含系統整體動力學的某些方面。

此外,引入動態馬爾可夫毯會導致任何一個給定系統中存在的馬爾可夫毯數量大幅增加。顯然,我們需要一個額外的原則,來幫助我們選擇那些真正對應于我們愿意稱為“事物”的馬爾可夫毯。

既然我們的目標是以合理的方式在世界的“關節處”進行切割,那么一個顯而易見的選擇就是采用作用于全局動力學上的奧卡姆剃刀原理 (Occam’s razor)。我們通過尋找具有動態馬爾可夫毯結構的低維動力系統,并采用貝葉斯建模方法來實現奧卡姆剃刀原理,從而落實這一新原則。

3 動態馬爾可夫毯檢測算法

我們現在以一般形式介紹一種具有動態馬爾可夫毯結構 的概率生成模型,該模型可以被“反演”(invert),用于識別馬爾可夫毯,并根據對象的毯統計特性和動力學行為對對象進行類型分類。

一般來說,馬爾可夫毯檢測是一個困難的問題 。即使在靜態環境下,它也是一個NP難問題 [18, 48]。這是因為在即便毯是平穩的情況下,給定系統中馬爾可夫毯的數量也會隨著系統組件數量的增加而呈組合式增長。如果允許馬爾可夫毯是動態變化的,問題只會變得更加復雜。

我們通過借鑒宏觀物理規律發現 的方法來繞過這一難題,這種方法專注于發現能夠總結高維系統的低維動力學。具體來說,我們提出了一類降維算法 ,將高維動力系統劃分為具有馬爾可夫毯結構的子系統。

這基于一個假設:低維潛在變量的動力學具有馬爾可夫毯結構 ,并且原始高維觀測空間中的每一個元素都只受其中一個低維潛在變量的驅動。

例如,在假設系統中存在一個單一對象的情況下,我們尋找一組狀態變量來表示環境 s,以及為每個對象定義的兩組狀態變量:

  • 一組用來總結屬于邊界的元素的整體行為 b ;

  • 另一組用來描述邊界內部元素的整體行為 z 。

我們保留了“內部元素集合可能為空”的可能性。

為了發現具有非平穩毯結構的對象 ,我們在模型中設計了足夠的靈活性,方法是直接將邊界 ΣB(t)建模為一個潛在分配變量 。這是通過構建一個動態注意力機制 (dynamic attention mechanism)實現的,該機制以概率方式為每一個微觀元素或測量值分配一個標簽。這些標簽表明該元素是內部元素 外部元素 還是毯元素

這些標簽之間的轉換遵守馬爾可夫毯的通常規則:

  • 禁止從內部到外部的標簽轉換;

  • 標簽轉換的概率僅依賴于宏觀的毯變量。


具體而言,每個測量值所關聯的標簽決定了它的條件獨立性關系

當 的情況時,也有類似的方程成立。盡管該觀測模型是以生成形式 書寫的,但它實際上對應于一個從觀測值到目標宏觀變量的帶有噪聲的非線性投影 ,并由分配變量進行調制。

宏觀變量的動力學以及分配變量的轉移概率 都受到約束,必須服從馬爾可夫毯結構 ;此外還有一個附加限制:標簽的轉移概率僅依賴于邊界變量



這構成了這一類馬爾可夫毯發現算法 的一般形式。

為了將這種通用的動態馬爾可夫毯模型轉化為更易處理的形式,需要引入一些額外的簡化假設。

例如,可以通過遞歸切換動力學系統實現非線性動力學,并通過變分推理加以發現 [29];或者由神經網絡指定并通過梯度下降進行學習 [34]。

在此,我們假設采用簡單的線性動力學,并使用一個切換線性變換 來實例化非線性觀測模型。

我們還將假設分配變量的轉移概率在先驗上獨立于宏觀潛在變量。

這導致了一個混合了離散和連續潛在變量的因子隱馬爾可夫模型 (factorial Hidden Markov Model, HMM),其獨特之處在于:每一個觀測節點 i所關聯的標簽都有其獨立的離散 HMM 。參見圖 4。


對于單一對象的情況,該線性模型表示如下:


其中矩陣 A通過在右上角和左下角 放置零塊來施加馬爾可夫毯結構的約束。

同樣地,的均值也被限制為包含零塊,使得每個觀測值僅依賴于三個連續潛在變量中的一個。

這些約束通過拉格朗日乘子的作用施加在均值上。

為了減少模型的退化性(degeneracy),我們假設 是對角矩陣,并通過對拉格朗日乘子施加后驗均值的單位跡(unit trace)。

這進一步借助貝葉斯推理中自動發生的“奧卡姆剃刀效應”,鼓勵模型發現低維的宏觀動力學。

為了建模非線性觀測模型,我們將離散潛在分配變量的取值域擴展為包括與每個標簽 S,B,Z相關的“角色”(roles)。

這實際上為標簽分配變量實例化了一個分層隱馬爾可夫模型 (Hierarchical Hidden Markov Model, HHMM),其中馬爾可夫毯結構在層次結構的最高層被強制執行,而最低層則表示一個線性專家混合模型(mixture of linear experts),用于描述目標宏觀變量與觀測之間的關系。

如圖 3b 所示。

請注意,我們也可以對動力學使用同樣的技巧,從而實現一個遞歸切換的動力系統;但我們選擇保留線性動力學并結合非線性觀測模型,以此作為 Koopman 嵌入技巧(Koopman embedding trick)的一種實例化 [28]。

3.1 推斷與學習

我們使用變分貝葉斯期望最大化 (Variational Bayesian Expectation Maximization, VBEM)來近似貝葉斯推斷,其后驗分布在參數和兩類潛在變量上進行因子分解,即:


這遵循了“注意、推斷、重復”(Attend, Infer, Repeat , AIR)范式 [14],其中對分配變量軌跡 ωi(t)的后驗更新對應于注意力機制的更新 ,隨后是聯合推斷 s、b和 z,然后在更新參數的后驗分布之前再次重復這一過程。

請注意,將這兩個步驟展開為一個神經網絡實現后,會得到一種強大的Transformer 架構 [46] 的變體,但該架構具有額外的結構,使得注意力變量在網絡各層之間相互關聯。


4 結果

我們展示了一些簡單的數值實驗,用以演示動態馬爾可夫毯檢測算法 如何合理地標注牛頓擺(Newton’s cradle)、燃燒導火索、洛倫茲吸引子(Lorenz attractor)以及一個人工生命模擬系統中的各個組件。

該模型的推斷與學習是通過一個定制的消息傳遞框架實現的,專門設計用于利用條件共軛性 (conditional conjugacy)和隨機坐標上升法 (stochastic coordinate ascent)[21]。

動態馬爾可夫毯檢測算法及其所依賴的 VBEM 推斷模塊的代碼可在以下地址找到:
https://github.com/bayesianempirimancer/pyDMBD

所有模擬都在完整數據集上進行訓練,學習率設為 0.5,共訓練 50 輪(epochs),并至少重復 10 次。所示結果來自在對數似然下界(ELBO)上表現最佳的一次計算運行。

4.1 牛頓擺(Newton’s Cradle)

牛頓擺的模擬由 5 個大小和形狀完全相同的球體組成,它們通過繩子懸掛,彼此之間的間距正好等于任意一個球的直徑。

當系統處于靜止狀態時,這些球緊挨在一起,剛好接觸。

當最左側的球被初始置于遠離其他四個球的位置時,它會向下擺動,在回到靜止位置時停止運動,并將其動量依次傳遞給其他球體。

這些球隨后按順序移動,并將動量最終傳遞給最右側的球,使其向上擺動并離開原來的位置;之后再返回并重復這一過程。

如果初始擾動了兩個球,則會有兩個球從另一側彈出,以此類推。

我們模擬了一個牛頓擺,其初始擾動分別為 0 個、1 個、2 個或 3 個球 ,擾動角度是在 0 到 3π/2之間隨機選擇的相同角度。

之后,所有球都會受到一個小角度的隨機擾動,其標準差為 0.1 弧度

將基于作用力的靜態馬爾可夫毯檢測算法 [15] 應用于該數據集時,無論系統的動力學如何,也不管初始有多少個球被擾動,它總是只發現一個對象,且該對象以中間的球為中心。

相比之下,動態馬爾可夫毯檢測算法 (DMBD)對球的標注方式更符合人類直覺:

我們傾向于將牛頓擺的動力學感知為一個鐘擺 ,或是一對分別位于左側和右側的相互作用的球組 。這兩種常見的認知方式恰好對應于這個簡單的 DMBD 算法最常發現的兩種劃分方式。

具體而言,圖 5 展示了這兩種解決方案,其中顏色表示標簽:綠色代表邊界(boundary),紅色和藍色分別代表對象(object)與環境(environment)。

當初始擾動了兩個或更多球時,一起運動的球總會被賦予相同的標簽。

最常被識別出的解決方案(圖 5a-c)將運動中的球 標記為對象,不論它們位于擺的哪一側。在這種情況下,環境標簽被分配給那些基本保持靜止的球。

而邊界則由那些在碰撞中短暫獲得高速度的球組成。因此,邊界在大多數時間并不具有物理上的真實存在感。

第二種最常見的劃分方式將邊界設為靜止的球 ,并將運動的球標記為對象和環境。此時,一側的球始終被標記為環境,另一側的球被標記為對象,見圖 5(d-f)。

同樣地,當最左側或最右側的球基本處于靜止狀態時,它們就成為了邊界的一部分。


4.2 燃燒的導火索

為了展示該方法如何處理火焰 行波現象 ,我們模擬了一個在一維介質中傳播的燃燒前鋒,即一根燃燒的導火索

我們將導火索建模為一個非均勻介質 ,由離散的燃料顆粒組成,這些顆粒之間的間距是隨機的,均值為1,方差為0.02。氧化劑被建模為一個具有無限來源的擴散過程 ,其方向與導火索垂直。它對燃燒的影響在于決定了熱量釋放的速率。當顆粒達到臨界溫度 時,燃燒開始發生。假設導火索具有恒定的熱擴散系數 1。


我們選擇這個簡化模型的原因是:即使在沒有對燃料顆粒大小、位置和氧化劑可用性進行隨機擾動 的情況下,已知該模型也能夠支持以平穩 周期性 混沌方式 傳播的行波 [4]。

在此模型中,可觀測變量 yit包括每個位置 i上的燃料濃度氧化劑濃度以及溫度

總體而言,在燃燒前鋒前方 ,燃料和氧化劑都很充足;而在燃燒前鋒后方 ,燃料已經耗盡,但氧化劑仍然充足;在燃燒前鋒內部 ,燃料迅速降至零,氧化劑先下降然后恢復到當前可獲得的水平,同時釋放出熱量(見圖8a)。

我們通過系統地改變燃料的可用性 (作為位置的函數)和氧化劑的可用性 (作為時間的函數),模擬了多種類型的燃燒波。

這些參數的組合驅動了燃料顆粒燃燒過程中熱量釋放速率的變化

此外,我們還在一個小范圍內(0.4 到 0.5)調整了著火溫度

這導致了以不同平均速度傳播的燃燒波,并伴隨著周期性或隨機波動

某些燃燒波甚至會熄滅

圖8(b) 展示了一個燃燒波速度呈現周期性波動 的例子。


有趣的是,內部變量 與對象位置幾乎沒有相關性,似乎僅表示熱量釋放 (參見圖9)。

相比之下,環境變量 與火焰位置的相關性最強。

為完整起見,我們指出:雖然這里展示的結果是最常見的結果,但該算法有時也會收斂到不太合理的解。

例如,有時“對象”對應于燃燒波后方已被燃燒的部分,“邊界”則對應于熱量釋放區域

然而,前面描述的那些解對應的ELBO (證據下界)更高,因此在貝葉斯模型比較中被明顯偏好。

4.3 洛倫茲吸引子(Lorenz Attractor)

洛倫茲吸引子也為這種方法提供了一個獨特的測試平臺。在本例中,只有一個三維觀測值,即對象的 x,y,z位置。

該系統的混沌動力學支持兩個低維(約 2 維)吸引子,以及在這些吸引流形之間切換的全局動力學。

在此情形下,算法發現了一種可以稱為相變 的現象:當軌跡靠近左側吸引子時,被標記為“對象”;而當靠近右側吸引子時,則被標記為“環境”。邊界標簽則合理地對應于描述這兩個吸引子之間過渡過程 的軌跡部分。

由于“對象”與“環境”之間的對稱性,我們也可以將這種現象解釋為一個相變建模 的例子:一個單一對象在穿過相變邊界后改變了其身份(identity)。


4.4 合成生物學模擬

作為最后一個例子,我們使用 Particle Lenia 來模擬一個表現出類細胞結構和行為的自組織系統。我們采用其中的“旋轉體”(rotator)示例 [7] 進行模擬。

在這個模型中,單個粒子通過距離依賴的吸引與排斥函數 來表征彼此之間的相互作用,從而展現出有趣的自組織行為。

如圖11所示,初始狀態下是一團隨機分布的粒子,很快它們就自發形成一個類似細胞的結構,包含一個“細胞核”和一個簡單的“細胞膜”。


經過一段時間后,膜上發展出類似鞭毛的旋轉結構 ,而細胞核則收縮成更小的形狀。

我們將這個模擬用作多對象識別方案 的測試平臺,希望算法能夠識別出細胞的不同“部分”實際上是處于共同環境中的不同對象。

我們假設存在 11 個不同的對象,每個對象由毯變量和對象變量的二維動力學所表征。

每個對象通過毯潛變量和對象潛變量各自的單一角色 與觀測值相關聯,以鼓勵發現具有空間局部性的對象。

在展示的示例中,該模擬共識別出 5 個對象,分別對應于:

  1. 無序狀態 (綠色)
  2. 簡單細胞膜 (黃色)
  3. 復雜細胞膜 (橙色)
  4. 無序細胞核 (紫色)
  5. 緊致細胞核 (藍色)

    這說明了該方法在將復雜系統分割為多個相互作用的動態子系統方面的

潛在實用性

5 討論

在本文中,我們將自由能原理 (FEP)、貝葉斯力學 馬爾可夫毯 以及本體勢函數 置于更廣泛的貝葉斯統計 信息論 思想之中,這些思想交匯于 Jaynesian 和貝葉斯對數學物理及一般數學建模的方法之間。


具體而言,我們在此展示的工作表明:若要將 FEP 的邏輯和構建應用于建模有趣的“事物”,我們必須跳出 FEP 自身的邏輯框架,并引入一個額外的原則——用來從指數級數量的可能馬爾可夫毯劃分中選出“最佳”的那一個。令人滿意的是,這一原則正是我們在最初發展 FEP 時所依賴的核心思想:Jaynes 原理 驚奇最小化(surprise minimization)。

這對我們來說并不意外,因為我們開發的動態馬爾可夫毯檢測算法本身正是建立在導致 FEP 發展的相同基礎理念之上。

我們提出了一類模型及其相關的推斷算法,將動態馬爾可夫毯檢測問題視為一個宏觀物理規律發現 的問題。其根本在于識別那些能夠產生系統整體最簡明宏觀描述的動態邊界元素。

該過程的輸出是一組特定對象類型 的宏觀規則,這些規則決定了對象邊界與其所處環境之間的相互作用方式(通過某些可能是虛構的內部變量進行中介)。

我們為這種方法提供了動機:

  • 我們主張是馬爾可夫毯的統計特性定義了對象類型,這一觀點與系統辨識理論和強化學習一致;

  • 同時我們也指出,當與 Jaynes 的最大效度原理 相結合時,這種定義自然地引出了我們熟悉的關于相關物理系統的描述,如能量函數、哈密頓量和拉格朗日量;

  • 此外,這些數學工具的結合直接導出了以 本體勢函數 為特征的對象描述,而該勢函數恰好對應于 自由能泛函

  • 因此,這也提供了一種從 信息論 (最大效度建模)出發的 FEP 替代性推導方法,而不是傳統上從統計物理方程出發的 FEP 推導路徑。

僅憑這種基于信息論的對象分類方法,無法確定在一個系統中眾多動態毯中哪一個應被視為“真正的子系統”。為了解決這一模糊性,我們訴諸于另一個原則:簡約性 (parsimony)。也就是說,好的標簽應該帶來整個系統的一種緊湊、低維的描述。

這并不是說被標記的對象具有某種形而上學上的意義,而是說好的標簽對于預測、泛化和數據壓縮是有用的。

為了理解這一切如何普遍適用,我們可以考慮一個簡單的例子:質子。盡管它由大量更為基本的粒子構成,但如果我們正確地將這些粒子組成的集合標記為“質子”,那么我們的觀測熵就會降低——僅僅因為質子帶有正電荷、具有特定質量等性質,并因此表現出相應的行為;而一個隨機選擇的粒子可能具有不同的質量和電荷,因而行為也會不同。

事實上,正是出于這個原因,人們才給這個粒子群體賦予了一個標簽:這個標簽具有預測能力。換言之,在已知質子可觀測屬性(位置、動量、自旋等)的情況下,只要知道它的標簽,我們就可以預測它將如何與環境中的其他事物相互作用,而無需去思考其內部發生了什么。

換句話說,好的標簽在全局范圍內最小化了未來觀測的條件熵 (或稱“驚奇”)。在這個意義上,在數學物理建模中,標簽扮演著可檢驗假設 的解釋角色:

一個好的假設之所以有意義,是因為它讓數據變得不那么令人驚訝——即當我們假設生成數據的過程可以被標記為某種類型時,數據就變得合情合理。

因此,標簽之所以有用,是因為它們讓我們能夠簡潔地描述事物的動力學或可觀測行為,從而在面對新數據或回顧舊數據時減少“驚奇”。

事物的動力學取決于它們的屬性,而標簽則是表示具有相似屬性和行為的事物的一種有效方式。

事實上,如果在某個標簽條件下,我們觀測的熵并沒有下降,那么根據定義,標簽與觀測之間的互信息為零,這意味著這個標簽無論是在實用層面還是信息論意義上都是無意義的。

有趣的是, 條件熵 正是與自由能原理(FEP)最密切相關的“驚奇”目標。然而,在FEP文獻中,驚奇最小化的角色是以 同義反復 的方式處理的,而不是以經驗性方式:其核心觀點是“事物會最小化驚奇”,而不是說“將某物標記為特定類型的對象可以最小化我的驚奇”。

舉個具體的例子來說明這一點:質子。如果我們正確地將某個粒子標記為“質子”,那么我們的觀測熵就會降低——哪怕僅僅是因為質子具有正電荷、特定質量等屬性,并因此表現出相應的行為;而一個隨機選擇的粒子可能具有不同的質量和電荷,因而行為也會不同。

事實上,這正是我們為何要給它賦予一個標簽的原因:該標簽具有預測能力。也就是說,在已知可觀測屬性(位置、動量、自旋等)的情況下,只要知道它的標簽,我們就可以預測該粒子將如何與環境中的其他事物相互作用。

為了達到這個目的,我們可以思考一下為什么我們要把質子稱為一個“事物”。如果標簽使用得當,它就能減少不確定性/熵,并增強我們對質子及其整體系統行為的預測能力。換句話說,好的標簽在全局范圍內最小化了驚奇。

這表明,“驚奇最小化”這一目標在經驗層面上扮演著關鍵角色。

這與FEP傳統上的討論方式有所不同。一個好的同義反復可以為定義提供一個好的起點。FEP從“對象”的定義出發:對象是一組被馬爾可夫毯包裹的狀態集合,其內部狀態或主動狀態(或路徑)最小化驚奇(通過毯狀態或路徑的自由能來表征),并由此推導出最小作用量原理和隨之而來的貝葉斯力學。

換言之,FEP文獻的重點一直是事物的必要性質 ,而非經驗性地發現哪些集合我們可以合理地標記為對象。

相反地,也是互補的方式,本文所提出的方法則基于馬爾可夫毯的對象類型定義,但采用了觀察者或建模者的經驗視角,旨在為觀察者在建模系統動力學時所做的決策提供一種解釋依據。

5.1 對FEP的技術性批評的回應

本研究回應了一些關于基于FEP建模的核心技術性批評與局限性,這些問題此前在很大程度上仍未解決。

基于馬爾可夫毯的系統識別方法已被證明頗具爭議(例如參見 [6, 35, 11, 5])。有人認為,馬爾可夫毯對“對象”及其“類型”的定義并不像其支持者所說的那樣顯而易見或理所當然 [35]。

另一類批評指出,實際上識別馬爾可夫毯(無論是在數學上還是在現實世界數據中的經驗層面)都依賴于非平凡的建模決策,因此馬爾可夫毯的形式體系并沒有其所聲稱的那樣容易或廣泛適用 [6]。

還有一些人指出,FEP普遍適用性的演示似乎與其所假設的馬爾可夫毯形式以及非平衡穩態條件之間存在矛盾,后者共同保證了生物體與環境之間、或內部狀態與外部狀態之間的劃分 [1, 5, 11, 30]。

事實上,基于馬爾可夫毯的宏觀對象定義曾被批評為是不恰當的 (因為許多有趣的系統看起來擁有多個馬爾可夫毯 [6]),或者不適用于那些與環境強耦合、高度變化或與環境交換物質的系統 [35, 11, 30]。

顯然,我們最感興趣的系統往往是開放系統 :它們與環境交換物質和能量,遠離熱力學平衡,并且通常具有移動、動態甚至可能不連續的邊界。

那些被視為馬爾可夫毯方法適用性反例的事物,恰恰是那些具有移動或游移邊界的實體,比如火焰和生物體。

這個問題尤其成問題,因為FEP最初就是為建模大腦動力學和生命體行為而發展起來的,也正是在這個應用領域最為人所知。

正如人們所希望的那樣,這些批評引發了大量爭論,并明確承認:FEP在穩態下表述時,僅適用于一類相當“特殊”的宏觀對象,即那些只與環境稀疏或弱相互作用的對象 [15, 1]。

在此,我們認為,這些批評大多源于FEP文獻先前對“靜態”馬爾可夫毯結構的關注。

從數學角度來看,其中一些反對意見在將FEP從狀態空間表述轉向路徑基礎 (path-based)或路徑積分 (path integral)表述后得到了解決 [43, 16],這種新表述使我們無需對系統的穩態統計特性做出假設(詳見 [36] 中的詳細討論),也無需依賴整個系統的平穩統計中近似存在的馬爾可夫毯結構。

在基于路徑的FEP表述中,感興趣的數量及其相關方程現在是針對系統的路徑定義的,即它們是在構成結構化空間或軌跡集的對象上定義的,每個軌跡代表系統隨時間演化的一種特定方式。

此外,考慮動態毯 與最大效度建模 [36, 42],使我們能夠識別包含相變的復雜系統中的合理對象和邊界,并建立具有瞬態和移動邊界的對象模型。

我們在此的貢獻是提供一個數學框架及數值演示,明確展示這類動態對象可以在該框架內進行建模,從而在經驗層面上解決了文獻中的這場爭論。

5.2 生態位構建與環境在主動推斷中的作用

在我們對燃燒導火索的模擬中,環境 扮演了一個出人意料的角色:我們注意到,火焰的位置最好通過環境狀態來追蹤,而不是通過燃燒網絡的內部狀態。

我們在前文中也指出,由于控制馬爾可夫毯動力學的方程在內部狀態和外部狀態之間是對稱的,因此該毯編碼了內部子系統 外部子系統 各自的策略。由此我們可以得出結論:基于馬爾可夫毯的對象類型定義總是依賴于環境 的。

這一結果與最近關于重新思考環境在主動推斷中角色 的研究非常契合,也與將主動推斷應用于社會文化系統 的研究相一致 [47]。

這些研究考慮了一種多尺度遞歸嵌套結構 的動力學,這種結構將個體智能體、它們所構成的社會文化系統,以及它們通過行動所塑造的生態位(niche)耦合在一起 [8, 39, 47, 32]。

并不是每一種任務或情境都必須以“智能體”為中心來建模。相反,我們可以將智能體建模為更廣泛環境中的一種特殊部分——即那些對其他智能體具有高度顯著性的部分;參見例如 [13]。

這也呼應了該傳統下先前關于生態位構建 (niche construction)的研究,強調FEP所描述的對象之間的同步性具有對稱性這一特性,可以被智能體加以利用。

這些研究建模了生態位居住者對生態位的被動構建 (習慣性、非故意的行為)與主動構建 (如有意的設計),從而引導某些特定模式的行為發生,而抑制其他行為的發生 [8, 38]。

5.3 未來方向

我們對這類馬爾可夫毯檢測算法的一個具體實現依賴于線性近似 ,以及對毯(標簽)動力學與宏觀動力學的解耦假設

這一選擇導致了這樣一個算法:它能夠合理地劃分系統結構,但在預測方面并不可靠。原因有兩個:

  1. 線性動力學假設

    使得系統中任何非線性效應都被歸因于噪聲,從而導致擴散強度的有效增強;

  2. 邊界動力學與宏觀動力學解耦

    的假設意味著,在缺乏觀測數據的情況下,潛在分配變量會迅速擴散到一個均勻的平穩分布。

我們計劃在未來的工作中解決這些問題,方法是將馬爾可夫毯結構施加于切換線性動力系統模型 (switching linear dynamical systems models)的貝葉斯實例化之上。

這項工作也與通過降維技術對下行因果關系 (downward causality)和涌現現象 (emergent phenomena)進行數學建模的相關研究有關,這也是我們計劃進一步探索的方向 [2, 40]。

原文鏈接: https://arxiv.org/pdf/2502.21217

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
看完報道,差點以為是伊朗贏了,美國投降了

看完報道,差點以為是伊朗贏了,美國投降了

走讀新生
2025-06-24 11:05:42
科技助力,中國有望從能源最大進口國成為世界主要能源出口國。

科技助力,中國有望從能源最大進口國成為世界主要能源出口國。

興史興談
2025-06-25 09:50:49
63歲阿湯哥戀情實錘后,女兒蘇瑞近照曝光,即將進軍好萊塢

63歲阿湯哥戀情實錘后,女兒蘇瑞近照曝光,即將進軍好萊塢

瘋狂影視圈
2025-06-24 23:38:47
以色列防長稱恢復猛烈空襲德黑蘭

以色列防長稱恢復猛烈空襲德黑蘭

魯中晨報
2025-06-24 16:27:02
新華社快訊:伊朗議會通過暫停與國際原子能機構合作的法案

新華社快訊:伊朗議會通過暫停與國際原子能機構合作的法案

新華社
2025-06-25 14:55:04
黃子韜徐藝洋孩子首曝光:徐媽媽溫柔抱著嬰兒,滿臉的寵溺和燦笑

黃子韜徐藝洋孩子首曝光:徐媽媽溫柔抱著嬰兒,滿臉的寵溺和燦笑

素素娛樂
2025-06-25 10:18:47
雷霆奪冠游行:杰威致敬科比 卡皇掛湖人戒指 SGA抱獎杯下車狂歡

雷霆奪冠游行:杰威致敬科比 卡皇掛湖人戒指 SGA抱獎杯下車狂歡

顏小白的籃球夢
2025-06-25 09:09:52
中國股市:未來即將有望乘風破浪的10匹黑馬,值得收藏研究!!

中國股市:未來即將有望乘風破浪的10匹黑馬,值得收藏研究!!

人生宥常
2025-06-25 10:00:10
互動被挖,王楚欽戀情曝光?奧運,孫穎莎喊話想贏,誰注意他舉動

互動被挖,王楚欽戀情曝光?奧運,孫穎莎喊話想贏,誰注意他舉動

樂聊球
2025-06-25 12:29:54
金正恩的喋血上位:母親幫他扳倒異母大哥,他自己一招搞垮親二哥

金正恩的喋血上位:母親幫他扳倒異母大哥,他自己一招搞垮親二哥

阿胡
2024-01-05 13:57:28
“朱雀玄武敕令”公布第三次高考分數為246分:現在叫周景明,保底可以去兩所職業學院,內心很平靜

“朱雀玄武敕令”公布第三次高考分數為246分:現在叫周景明,保底可以去兩所職業學院,內心很平靜

極目新聞
2025-06-25 00:12:47
掘金總裁:會與約基奇談3年2.12億續約 特定條件下會考慮交易他

掘金總裁:會與約基奇談3年2.12億續約 特定條件下會考慮交易他

顏小白的籃球夢
2025-06-25 05:29:50
今年!慢特病無需申請,醫保能報銷95%,門檻費取消了

今年!慢特病無需申請,醫保能報銷95%,門檻費取消了

小劉嘮嗑醫保
2025-06-25 11:20:55
19歲騎手摔死后續:家境被扒太凄慘,高中輟學養家,父母癱病在床

19歲騎手摔死后續:家境被扒太凄慘,高中輟學養家,父母癱病在床

體制內老陳
2025-06-22 14:22:47
王思聰資產被何猷君收購!汪小菲也沒有想到,自己當年的話應驗了

王思聰資產被何猷君收購!汪小菲也沒有想到,自己當年的話應驗了

振華觀史
2025-06-25 09:03:08
鄭爽在美國參加飯局!一直看身邊大佬,發福染黃發全程聊天哈哈笑

鄭爽在美國參加飯局!一直看身邊大佬,發福染黃發全程聊天哈哈笑

扒星人
2025-06-25 11:22:09
2-1!溫網首位贏球中國球員:苦戰三盤險翻車 鄭欽文沖2885萬獎金

2-1!溫網首位贏球中國球員:苦戰三盤險翻車 鄭欽文沖2885萬獎金

侃球熊弟
2025-06-24 21:41:58
女子腰腹部藏匿未申報港幣114.2萬元出境被海關查獲

女子腰腹部藏匿未申報港幣114.2萬元出境被海關查獲

環球網資訊
2025-06-24 14:51:02
344比79:川普因打擊伊朗而被提起彈劾,彈劾案被擱置

344比79:川普因打擊伊朗而被提起彈劾,彈劾案被擱置

寰宇大觀察
2025-06-25 10:17:34
海南17歲高一漂亮女生已找到,曝最后朋友圈,或早有征兆...

海南17歲高一漂亮女生已找到,曝最后朋友圈,或早有征兆...

小人物看盡人間百態
2025-06-24 16:22:16
2025-06-25 15:39:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
639文章數 11關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

特朗普稱中國可以繼續從伊朗購買石油 外交部回應

頭條要聞

特朗普稱中國可以繼續從伊朗購買石油 外交部回應

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

林志穎15歲兒子眉眼間神似易烊千璽!

財經要聞

3000億的泡泡瑪特,漲不動了?

汽車要聞

樂高樂園x比亞迪官配曝光!兒童駕駛學校來了

態度原創

房產
手機
本地
時尚
公開課

房產要聞

三亞頂豪!內部資料曝光!

手機要聞

首發自研Exynos 2500芯片!三星Galaxy Z Flip7全配色外觀揭曉

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

比英國女王還精彩的人生,85歲的前丹麥女王越活越美

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南澳县| 新化县| 潞西市| 通江县| 正安县| 密山市| 突泉县| 甘孜| 当雄县| 吴堡县| 昌邑市| 颍上县| 诸城市| 若尔盖县| 博野县| 青龙| 垫江县| 衡山县| 东城区| 临泉县| 内丘县| 屏边| 台东县| 会理县| 邮箱| 哈密市| 普安县| 宜黄县| 老河口市| 垫江县| 九江市| 平遥县| 郎溪县| 唐海县| 巴塘县| 新化县| 静安区| 福清市| 绥江县| 开封市| 修水县|