摘要
現代技術系統的演化常常源于新舊技術的重組。盡管傳統中藥(TCM)已被使用了數千年,作為以實踐經驗為基礎發展的技術,其演化特征是否與現代技術系統一致呢?最新發表在PNAS的一項研究,通過量化分析兩千多年來59063種記錄在案的中藥方劑,嘗試用網絡科學的方法回答這一問題。研究表明,中藥成分網絡在演化過程中保持了核心-邊緣結構,這與現代技術系統的演化特征一致。但是,與現代技術系統中的核心成分頻繁更替不同,中藥方劑的核心成分在數千年間相當穩定。這一發現為中藥的未來發展提供了寶貴的見解。
關鍵詞:傳統中醫(Traditional Chinese Medicine, TCM)、方劑(Formulas)、網絡科學(Network Science)、重組發明(Recombinant Invention)、核心-邊緣結構(Core–periphery Structures)、演化
論文題目:The evolution of Traditional Chinese Medicine as recombinant inventions 論文鏈接:https://www.pnas.org/doi/10.1073/pnas.2400812121 發表時間:2024年11月7日 論文來源:PNAS
從“經驗”到“建模”:中醫藥研究的新路徑
中醫藥的歷史跨越兩千多年,其知識系統主要依賴文獻積累和師承經驗。然而,這一古老系統究竟是如何隨著時代演進的?為何有些藥方流傳千年而不衰,而有些則沉寂失傳?在2024年發表于PNAS的一項研究中,研究團隊利用59,063張中藥方劑構建成分共現網絡,首次系統揭示了中醫藥如何通過“重組式創新”實現自身演化。這項研究不僅開創性地將網絡科學方法引入傳統知識體系分析,也為我們理解中醫藥未來的發展路徑提供了量化的視角。
隨后,2025年發表于同一刊物的評論文章對該研究進行了深入評析。評論肯定了網絡建模方法的創新意義,但也提醒學界關注“演化”概念的多重維度與方法論透明性。這一系列工作表明,中醫藥的現代研究正逐步從“文本解讀”走向“數據驅動”,從“經驗論述”邁向“結構建模”。
中藥成分加權網絡構建
在中藥的演化過程中,數以千計的方劑被開發出來。每種方劑都由多個成分組合而成,主要是各種草藥。研究團隊利用網絡科學,構建了從公元1年至2016年59063種記錄在案的中藥方劑的成分網絡。其中成分作為節點,成分在同一方劑中的共現關系作為連邊,并以成分的共現頻率作為邊的權重,從而構建出不同歷史時期的中藥成分加權網絡。研究表明,中藥成分網絡在演化過程中保持了核心-邊緣結構,這與現代技術系統的演化特征一致。但是,與現代技術系統中的核心成分頻繁更替不同,中藥方劑的核心成分在數千年間相當穩定。
中藥成分與方劑數量的變化趨勢
研究首先統計了公元1年到2016年間,每100年內中藥方劑與成分的數量變遷。結果發現,盡管累計的中藥成分和方劑數量總體持續上升,但“活躍成分”(即在當期仍被使用的成分)數量在1200年前后達到高峰后趨于穩定,1800年以后出現明顯下降。同時,研究還發現,許多早期常用成分在后期被淘汰,這種“成分消失”現象表明中醫藥系統具有持續自我調整的機制。此外,成分的“度”(參與方劑數量)越低,其被淘汰的概率越高,呈現出典型的“適者生存”網絡演化特征。
圖1. 中藥成分與方劑數量的動態變化。觀察期始于公元1年,每個時間區間為100年(唯一例外是最后一個時間段為1901至2016年,共116年)。圖中用虛線豎線標示了中國各個朝代的分界。紅色虛線配圓點表示截至每個時間段末累計記載的中藥成分總數;紅色虛線配星號表示每個時間段內被記載的活躍中藥成分數量;紅色虛線配叉號表示每個時間段中新出現的中藥成分數量;紅色點虛線配三角符號表示在每個時間段內消失的中藥成分數量,即之后未再被記載的成分。藍色虛線配三角符號表示截至每個時間段末累計記載的中藥方劑總數;藍色點虛線配圓點表示每個時間段中新記載的中藥方劑數量。
中藥成分的網絡共現特征
在構建了中藥成分加權網絡后,研究進一步分析了邊的增長類型及其對網絡擴張的貢獻。實驗識別出六類新邊類型,其中對原有邊的強化(即成分組合被重復使用)是網絡擴張的主要驅動因素;其次是三元閉包(triadic closure),即通過一個新方劑將兩個原有成分與一個共同鄰居連接形成新組合。此外,還有新成分與舊成分的組合,以及完全新成分之間的連接。通過回歸分析,作者確認中藥成分網絡的演化符合“優先連接”機制(preferential attachment),即頻繁出現的成分更容易參與新的組合,從而增強其在網絡中的中心性。
圖2.中藥成分加權網絡擴展過程中的邊的動態變化。圖A展示了不同類型的新邊在中藥成分網絡擴展中的作用。左側部分為時間段 t 與 t+1 的“方劑–成分”二分網絡(其中 F1 至 F9 表示方劑,a 至 g 表示中藥成分),這是構建右側成分網絡的基礎。在 t+1 時期的成分網絡中:類型1(Type 1):如成分 a 和 b 之間的邊,表示已有邊的再次加強;類型2(Type 2):新方劑 F5 含有三個成分(a、b 和 c),通過一個共同鄰居(b)引入了一條新邊 a–c,形成三元閉包;類型3(Type 3):新方劑 F6 引入新邊 a–d,同樣連接了兩個原有成分并通過共同鄰居 b 形成三元閉包,但這三個成分并未出現在同一個方劑中;類型4(Type 4):新方劑 F7 引入邊 d–e,連接兩個沒有共同鄰居的原有成分;類型5(Type 5):新方劑 F8 連接了一個已有成分 e 和一個新出現的成分 f;類型6(Type 6):新方劑 F9 連接兩個新出現的成分 e 與 f。圖B展示了中藥成分網絡擴展過程中上述不同類型新邊的比例(左軸),以及各時間段中網絡中邊的總數(右軸)。由于公元201年之前僅存在兩條邊,圖B的數據從公元301–400年開始統計。
網絡的核心–邊緣結構與嵌套性分析
通過計算不同歷史時期網絡的加權嵌套度指標(weighted NODF),研究發現中藥成分網絡始終保持著明顯的“核心–邊緣結構”(Core–periphery Structures):少數核心成分之間連接緊密,處于網絡中心,其他成分則與核心建立較弱聯系,分布在網絡外圍。這一結構通過與兩個空模型的對比得以驗證。空模型1保留節點度分布,空模型2只保留節點與邊數量;中藥網絡的嵌套度顯著高于空模型2,說明其結構非隨機,體現出歷史選擇與經驗積累的系統性特征。
圖3.中藥成分加權網絡的結構分析。圖A展示了中藥成分加權網絡的最大生成樹(Maximum Spanning Tree)結構,其中每個節點代表一種中藥成分,邊表示它們在全部59,063張中藥方劑中共同出現的頻次。圖中用綠色圓點標出了“核心成分”(core components),右側的圖片展示了排名前九的核心成分。圖B則展示了不同時期中藥成分網絡的加權嵌套度指標(weighted-NODFs),并與兩種對應的空模型(null models)進行了對比。其中,空模型1通過重新洗牌邊權與連接關系,但保留網絡中的度序列;空模型2則僅保留節點數和邊數,不保留具體連接方式。圖C為1901年至2016年期間中藥成分網絡的對數加權鄰接矩陣(logarithmic weighted adjacency matrix),可直觀反映成分之間共同出現的強度。圖D與圖E分別展示了空模型1與空模型2在相同期段下的對數加權鄰接矩陣,用于與真實網絡進行結構性比較。其中,圖C與圖D中的紅線表示“完美嵌套結構”(perfected nestedness)的邊界,用于輔助評估中藥成分系統的嵌套性特征
核心中藥成分的穩定性與組合演化
研究還通過連續核心識別模型,提取了每一時期的“核心成分集合”(PCCS)與全時期的最終核心集合(FCCS),并以回溯比例衡量其穩定性。實驗發現,中藥的核心成分自公元400年起即表現出較高穩定性,至公元900年穩定性提升至88%,與現代技術系統中核心頻繁更替形成鮮明對比。這說明,中醫藥依賴“經典核心”,強調知識傳承與經驗積淀。此外,研究還系統分析了“成分組對”(tuple)的構建路徑,發現大部分大型成分組合都可以追溯到更小的常見組合,表現出復雜結構由簡單組合逐步“生長”的特征。
圖4. 中藥核心成分的動態變化。圖A展示了各個歷史時期中藥核心成分的數量變化(左側縱軸)以及核心成分的穩定性(右側縱軸)。其中,FCCS表示從全部59,063個中藥方劑中識別出的最終“核心成分集合”;PCCS表示在每一歷史時期截止時點所累積的方劑中識別出的“階段性核心成分集合”。圖B展示了核心成分的動態演化過程。圖中白色表示該成分在該時期尚未出現于任何方劑中;黑色表示該成分在該時期被識別為核心成分(屬于PCCS);灰色則表示成分雖已被使用,但不屬于核心集合。紅線以上的成分同時出現在FCCS中,紅線以下的成分僅出現在PCCS中。圖C展示了在三個不同時期中核心成分之間的共同出現關系(即在同一方劑中被同時使用的情況)。圖中左上角被紅色橫縱線劃分出的區域,表示所有FCCS核心成分之間的配伍情況,能夠反映它們之間的緊密程度。
對現代的啟示
與現代技術系統的核心成分經常發生替換不同,中藥的核心成分在數千年的演化中保持了相對的穩定性。這種穩定性不僅源于這些成分能夠應對基本或廣泛的癥狀,還因為經典的成分組合已被廣泛接受并作為新方劑發明的基礎。這一發現為未來中醫藥的發展提供了重要啟示:在新方劑的開發中,可重點考慮這些經過時間驗證的核心成分。
另一方面,中醫藥技術的演化通常基于經驗積累,可能面臨較少的新技術軌跡。因此,引入現代科學探索和工程技術對于保持其活力尤為重要。通過這種方式,中醫藥不僅能夠繼承古代智慧,還能在現代科學的幫助下煥發新的生命力。
批判與建議
近日,一篇評論文章指出該研究的不足之處[1]:
(1)傳統中醫與現代技術的對比過于簡單
中醫藥深深植根于文化、哲學和歷史傳統,與現代技術和科學基礎有顯著不同。盡管研究以網絡科學為工具對中醫藥進行量化分析,但未能充分討論這些傳統差異如何影響中醫藥的演變。這種比較缺乏對中醫藥演變的深入理解,特別是在理論基礎、診斷方法和治療原則的重大改變方面。
(2)數據集的選擇與可信度
研究從899本經典書籍中收集方劑,但未詳細說明文本和方劑的選擇標準,如歷史意義、地區使用或臨床效果等,可能導致數據集的偏倚。透明的框架對于提高數據集的可信度至關重要。同時,無法獲得研究的原始數據也限制了對其結論的嚴格評估。
(3)中藥名稱的標準化問題
中藥有著悠久的術語演變歷史,同一種藥材在不同時期可能有不同的名稱,文章未能清楚說明如何解決這些差異以及使用何種方法標準化藥材名稱。這一點對于整合不同時期的歷史數據尤為重要。
因此,盡管該研究在使用網絡科學分析中醫藥演變上具有創新性,但若能更全面地探討文化、歷史和背景因素,將大大增強其研究的可信度。通過提高方法學透明度、重新定義“中醫藥演變”的內涵、解決藥材名稱的標準化問題以及提供原始數據的訪問,將使得這一研究更具整體性和洞察力,為中醫藥歷史發展的理解提供更豐富的視角。
參考
[1] https://www.pnas.org/doi/abs/10.1073/pnas.2503785122
集智俱樂部生命復雜性讀書會中,香港浸會大學教授田亮老師分享了“生命復雜系統的構成原理與 AI for TCM”。感興趣的可以掃碼查看視頻回放
彭晨| 編譯
生命復雜性讀書會:
生命復雜系統的構成原理
在生物學中心法則的起點,基因作為生命復雜系統的遺傳信息載體,在生命周期內穩定存在;而位于中心法則末端的蛋白質,其組織構成和時空變化的復雜性呈指數式增長。隨著分子生物學數十年來的突飛猛進,尤其是生命組學(基因組學、轉錄組學、蛋白質組學和代謝組學等的集合)等領域的日新月異,當代生命科學臨近爆發的邊緣。如此海量的數據如何幫助我們揭示宇宙中最復雜的物質系統——“人體”的構成原理和設計原理?闡釋人類發育、衰老和重大疾病的發生機制?
集智俱樂部聯合西湖大學理學院及交叉科學中心講席教授湯雷翰,國家蛋白質科學中心(北京)副研究員常乘、李楊,香港浸會大學助理教授唐乾元,北京大學前沿交叉學科研究院研究員林一瀚,中國科學院分子細胞科學卓越創新中心博士后唐詩婕,共同發起,從微觀細胞尺度、介觀組織器官尺度到宏觀人體尺度,梳理生命科學領域中的重要問題及重要數據,由生物學家提問,希望促進統計物理、機器學習方法研究者和生命科學研究者之間的深度交流,建立跨學科合作關系,激發新的研究思路和合作項目。讀書會目前共進行10期,現在報名參與讀書會可以加入讀書會社群,觀看視頻回放,解鎖完整讀書會權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.