摘要
進化是生物種群對其生存環境進行最優適應的過程,這一過程通過“適應度”得以體現。適應度被定義為相對的繁殖成功率(reproductive success)。然而,有學者指出,這一定義并不完整,且邏輯上存在循環論證的問題。為解決這一問題,多位研究者呼吁以表型(phenotypes)與環境之間的關系為基礎,重新明確界定適應度。本文提出,將適應度定義為從種群動態映射到貝葉斯學習的似然函數,為這一問題提供了一個通用解決方案。我們展示了如何通過這種方式構建適應度的概率模型,并說明其平均值如何具有意義。此外,我們還展示了這一方法如何為分析多變環境中的進化難題、博弈論以及群體結構中的選擇問題提供強大工具。這一方法具有普適性,并在種群動態、統計學習理論以及新興的人工智能模型之間架起了一座明確的橋梁。
研究領域:適應度,貝葉斯學習,進化博弈論,群體結構選擇(group-structured selection)、互信息,信息最大化
論文題目:Redefining Fitness: Evolution as a Dynamic Learning Process 發表時間:2025年3月12日 論文地址:https://arxiv.org/pdf/2503.09057
達爾文提出的“適應度”概念,百余年來一直是進化生物學的核心——它被定義為個體的相對生殖成功率。然而,這一經典定義長期面臨邏輯循環的困境:適應度既被用來解釋生存優勢,又通過生存結果反向定義。如何將適應度與環境適應性的關系顯式化,成為亟待解決的理論難題。
Luis M. A. Bettencourt團隊在最新研究中提出,適應度的本質是種群動態與貝葉斯學習的數學同構。通過將表型頻率的更新映射為概率推斷過程,研究揭示了適應度可作為環境狀態的似然函數,從而為進化動力學提供了嚴格的統計學習框架。這一發現不僅解決了適應度定義的循環性問題,還為復雜環境中的博弈策略、群體選擇等難題提供了統一分析工具。
從生殖成功到環境似然:適應度的貝葉斯重構
傳統進化模型中,種群動態遵循“復制者方程” (replicator equation) ,即表型頻率的變化與其適應度成正比。研究團隊發現,若將表型頻率視為假設概率,環境事件視為觀測數據,種群動態與貝葉斯定理的更新過程完全等價。
具體而言,每個表型(s)可視為對環境的概率模型(p(e|s)),而適應度(ws)正比于該模型生成真實環境狀態(e)的似然。在迭代過程中,表型頻率的更新如同貝葉斯后驗概率計算,逐步篩選出最匹配環境統計規律的表型組合。這一映射將適應度從生殖結果的被動記錄,轉變為主動的環境預測模型。
圖 1. 不同環境下種群選擇的進化動態機制。A. 作為適應模型的適應度與給定表型的環境狀態的可能性成正比。B. 隨著時間的推移,迭代過程對環境統計進行平均,并選擇使平均對數適應度最大化的種群類型作為種群結構與環境之間的信息。
信息最大化:進化即環境信號的壓縮編碼
研究進一步證明,自然選擇的目標是最大化種群結構與環境之間的互信息。在長期演化中,表型的平均對數適應度 (log-fitness) 趨近于環境熵與模型預測誤差的差值。當表型的條件概率(p(e|s))與環境真實分布(p(e))一致時,互信息達到峰值,此時種群成為環境的“最優編碼器”。
例如,在任務切換 (task switching) 模型中,種群需在兩種環境狀態(e=0/1)下分配資源。貝葉斯動態驅使表型頻率最終與環境概率分布重合,使種群信息與環境熵相等,實現預測誤差的最小化。
進化博弈論新解:合作涌現的條件與相變
基于貝葉斯適應度框架,團隊重新審視了囚徒困境(prisoner's dilemma)等經典博弈問題。在這個問題下,兩個參與者在追求各自利益最大化時,可能因為不信任和背叛而陷入對雙方都不利的局面,盡管選擇合作可以帶來更好的結果。傳統模型中,背叛(defection)是單次博弈的納什均衡,但重復博弈可能催生合作。新模型揭示了更深刻的統計機制:
1.完全混合種群中,合作穩定的條件可表述為漢密爾頓法則(Hamilton's rule)的擴展形式:當協同效應與互惠概率滿足一定條件時,合作策略將突破適應度谷底,引發一級相變。
2.群體結構通過調節內外群互動改變選擇壓力。若群體內互惠足夠強,即使存在外部群體剝削,合作仍可通過信息邊界的建立而穩定 (圖3) 。
研究還發現,混合環境 (如交替出現競爭與合作博弈) 會改變相變臨界點,為現實中的策略多樣性提供了新解釋。
圖 2. 囚徒困境和環境混合博弈的相圖。
圖 3. 結構種群的選擇取決于群體的大小和對外群體的處理。
從個體到多層級:群體選擇的協同信息通道
在結構化種群中,個體的適應度受群內與群間互動的雙重影響。模型顯示:
群內協同:當群體標識可識別時,個體通過條件策略(如“內群合作/外群背叛”)實現局部信息優化,形成多層級的適應度景觀。
群間競爭:群體規模的異質性導致選擇壓力分化,大群體更易維持合作,而小群體可能淪為“信息孤島”。
這種動態解釋了為何血緣關系或文化標簽常成為群體合作的催化劑,它們實質上是降低環境不確定性的信息標記。
理論統一:連接進化生物學與人工智能
這項研究將自然選擇轉化為統計學習的一般原理。適應度作為似然函數的定義,不僅為進化模型提供了可計算的概率框架,還與機器學習中的生成模型 (generative model) 形成鏡像。例如,種群對環境的漸進優化,與神經網絡通過梯度下降逼近數據分布的過程具有數學同構性。
未來,這一理論有望推動跨學科應用:從設計環境適應的基因回路,到優化多智能體協同算法,甚至在元宇宙生態中模擬復雜社會演化。正如作者所言:“生命與機器學習共享同一套數學語法——通過信息最大化,在不確定性中捕捉秩序。”
彭晨| 編譯
生命復雜性讀書會:
生命復雜系統的構成原理
在生物學中心法則的起點,基因作為生命復雜系統的遺傳信息載體,在生命周期內穩定存在;而位于中心法則末端的蛋白質,其組織構成和時空變化的復雜性呈指數式增長。隨著分子生物學數十年來的突飛猛進,尤其是生命組學(基因組學、轉錄組學、蛋白質組學和代謝組學等的集合)等領域的日新月異,當代生命科學臨近爆發的邊緣。如此海量的數據如何幫助我們揭示宇宙中最復雜的物質系統——“人體”的構成原理和設計原理?闡釋人類發育、衰老和重大疾病的發生機制?
集智俱樂部聯合西湖大學理學院及交叉科學中心講席教授湯雷翰,國家蛋白質科學中心(北京)副研究員常乘、李楊,香港浸會大學助理教授唐乾元,北京大學前沿交叉學科研究院研究員林一瀚,中國科學院分子細胞科學卓越創新中心博士后唐詩婕,共同發起,從微觀細胞尺度、介觀組織器官尺度到宏觀人體尺度,梳理生命科學領域中的重要問題及重要數據,由生物學家提問,希望促進統計物理、機器學習方法研究者和生命科學研究者之間的深度交流,建立跨學科合作關系,激發新的研究思路和合作項目。讀書會目前共進行10期,現在報名參與讀書會可以加入讀書會社群,觀看視頻回放,解鎖完整讀書會權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.