Correlated Growth of Causal Networks
因果網絡的關聯增長
https://arxiv.org/pdf/2412.16647
對復雜系統中因果結構的研究日益受到關注,許多近期研究探討了因果網絡在不同領域中所體現的因果關系。盡管越來越多的實證證據表明因果結構與網絡拓撲相關性之間存在聯系,但因果網絡中這些相關性出現的機制仍遠未被理解。在這項研究中,我們提出了一個用于因果網絡增長的通用框架,該框架包含了兩種關鍵類型的關聯:因果關聯和動態關聯。我們通過解析方法證明,度相關性是這些關聯上邊際依賴的結果。我們的理論預測與來自四個大規模創新網絡的實證數據在定量上一致。該理論不僅揭示了拓撲相關性的起源,還為理解因果系統中的關聯增長提供了一個通用框架。
因果網絡在捕捉各種領域中的因果關系方面起著核心作用[1–3]。近年來,隨著對各學科中因果結構理解的不斷深入,包括量子通信[6]、宇宙學[7]、量子引力[8–10]、社會科學[11–13]、計算機科學[14]、技術[1, 15]以及生物科學[16–19]等領域的進展,人們對因果網絡的興趣日益增長[4, 5],其應用范圍也顯著擴大。例如,在科學研究中的引用網絡結構,受思想之間因果依賴性的支配,其中創新往往受到先前知識的啟發[20]。同樣地,在生物進化中,特征的遺傳也遵循已有特征的因果依賴性[18, 19]。
從物理學的角度來看,因果網絡本質上是剛性的,因為過去事件是不可更改的。其中頂點代表事件,有向邊表示固定的因果關系。與一般網絡不同的是,因果網絡不能通過重連或回溯修改而不違反時間一致性和因果一致性。這種剛性可以通過有向無環圖(DAG)來表示,反映出時間的單向箭頭。因此,因果網絡作為時間順序和因果關系的靜態記錄,區別于可動態調整的一般網絡[21–23]。例如,像社交媒體中的關注-被關注關系這樣的通用網絡可以通過重連或刪除動態演化,而因果網絡則提供了“關注”或“取消關注”等交互行為的靜態記錄,保留了動作的歷史流動。在因果網絡中,這類動態通過事件生成機制加以簡化,利用增長網絡的方法[1, 13, 24–26],從而具有更廣泛的應用潛力。
因果網絡的特點在于其包含多種相關性,這些相關性用于量化實體之間的依賴關系。其中特別重要的是拓撲相關性,它揭示了網絡結構的非隨機組織方式[27–30]。這些相關性為因果關系如何塑造網絡架構提供了關鍵見解。越來越多的實證證據表明,拓撲相關性對于因果網絡的發展至關重要[1, 31, 32]。例如,人們認為引用網絡中的拓撲相關性決定了科學影響力的繼承模式[33]。同樣,在生態事件網絡中,反映不同事件之間因果關系的拓撲相關性在塑造微生物群落結構方面發揮著關鍵作用[34]。雖然在量化一般網絡的拓撲相關性方面已取得實質性進展[29, 35–37],但嘗試顯式建模網絡相關性的研究仍相對較少[38–40],而且這些模型主要集中在非因果網絡上。由于因果網絡的基本區別意味著傳統的網絡相關性模型,尤其是那些依賴動態重連機制的模型[21–23],無法完全捕捉因果網絡內部產生的獨特相關性模式。
在這篇論文中,我們提出了一種適用于因果網絡的通用關聯增長框架,該框架包含了兩個關鍵機制:1)動態相關性,用于捕捉個體度數增長過程中的長程時間相關性;2)因果相關性,即個體與其后繼者之間的因果關系跨代傳播。通過解析求解聯合度分布,我們明確展示了度相關性是從對動態相關性和因果相關性的邊緣依賴中產生的。將我們的理論應用于四個不同學科的大規模創新網絡,我們發現理論預測與實證觀察在定量上高度一致。作為一種統一建模因果網絡中關聯增長的方法,我們的框架有望影響廣泛的多個領域。
實證驗證 :為了將我們的理論與實證數據進行對照驗證,我們將其應用于科學創新系統——這一系統可以被理解為一個因果網絡,其中新創新的產生在因果上依賴于已有知識。我們使用了覆蓋1970年至2014年的《科學引文索引》(Web of Science, WOS)數據集,該數據集包含4400萬篇論文和8億條引用關系。為簡化起見,本文中所考慮的因果網絡是引用網絡,關注論文發表事件,并聚焦于一種單一類型的因果關系:sobs = “引用”(cite),它將新知識與其智力前身相連接。
利用WOS數據集,我們提取了四個不同學科領域的引用網絡,分別屬于生物學、化學、數學和物理學,各自包含1300萬、900萬、300萬和700萬個節點(詳見補充材料第2.1節)。
已有研究表明,個體層面的增長過程遵循一種強化泊松過程 (Reinforced Poisson Process, RPP),該過程同時包含了優先連接(preferential attachment)和老化效應(aging)[12, 41]。具體而言,增長速率由下式給出:
討論 :我們的研究表明,因果網絡中的拓撲相關性自然起源于網絡增長過程中存在的基本因果相關性和動態相關性。解析結果明確揭示了這些相關性會引發邊緣依賴關系,進而產生可觀測的度相關性。我們通過將理論框架應用于實證引用圖譜進行了驗證,這些引用圖譜作為具有代表性的現實世界示例,進一步支持了我們的理論發現。
與現有的基于適應度的模型相比——這些模型為每個節點分配一個獨立的適應度值,并對包含 N個節點的網絡需要 O(N)個參數——此類模型常常面臨過擬合并限制預測能力的問題。相比之下,我們的模型引入了適應度值之間的因果依賴關系,并通過一個因果核函數 (causal kernel)加以編碼,將自由參數的數量從 O(N)減少到 O(1)。這種結構化的方法不僅緩解了過擬合問題,還提升了模型的解釋力和預測能力。因此,我們的方法解決了現有模型的一些顯著局限性 [11, 12],并表明因果依賴關系為建模現實世界網絡提供了一個更緊湊且更具泛化能力的框架。
盡管我們的理論成功地捕捉了關鍵的因果依賴關系,但仍存在若干開放性問題。其中一個主要挑戰是如何納入隨時間變化的狀態分布 ,特別是在表現出非平穩增長的因果網絡中。如果方程(4)不存在解,則穩態假設失效。這可能發生在因果核函數具有足夠寬尾分布的情況下,導致網絡出現超指數增長,從而破壞時間平移不變性(TTI)。這種情況與“贏者通吃”(winner-takes-all)相密切相關,在該相中,極少數節點積累了不成比例的影響力,類似于玻色-愛因斯坦凝聚現象 [25]。由于我們在所分析的實證數據中未觀察到這種行為,我們將對其的深入研究留待未來工作。
另一個重要的研究方向是探索超越最近鄰層面的拓撲相關性 。高階結構依賴性可能揭示更多支配網絡形成的因果機制,從而進一步豐富我們對復雜系統中動態相關性的理解。
盡管仍存在上述挑戰,我們的研究成果為理解因果網絡中的相關性提供了堅實的基礎。通過引入因果相關核函數,我們的框架可廣泛適用于包括社交媒體、生物進化和經濟增長在內的多種系統。該方法為理解因果結構與網絡拓撲之間的相互作用提供了新的視角,在物理學、經濟學、社會科學和生物學等多個領域具有廣泛的影響。
原文鏈接:https://arxiv.org/pdf/2412.16647
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.