病原體遺傳多樣性的動態變化(包括適應度增加的譜系出現)是疾病生態學的一個基本概念,對公共衛生具有重要意義。然而,確定這些譜系和估算相關的適應度仍然具有挑戰性行。近期《Nature》上的研究提出了一種可擴展的方法phylowave,它總結了系統發育樹中種群組成的變化,使基于共享適應性和進化關系的譜系自動檢測成為可能。該方法可用于一系列病毒和細菌(新冠SARS-CoV-2、甲型H3N2流感亞型、百日咳桿菌和結核分枝桿菌)。
計算原理的示意圖及其不同病原體的發育樹推算
Phylowave 建立在基于遺傳距離的指數之上,該指數衡量時間分辨系統發育中每個節點(內部或末端)的流行。即從新的譜系中采樣的節點在系統發育上將比當時其他種群更接近,因為它們都將共享相同的近期祖先。
每個節點的索引來自從該節點到當時循環的所有其他節點的距離分布,由具有設定時間尺度的內核加權。這個權重能夠動態地跟蹤譜系的出現,關注節點之間的短距離(包含有關近期種群動態的信息),而不是長距離(包含有關過去進化的信息)。
時間尺度是根據所研究的特定病原體量身定制的,其選擇將取決于分子信號以及傳播速率。一旦計算了每個序列的索引值,就可以使用廣義加法模型實現一個樹分區算法,該算法可以找到最能解釋觀察到的索引動態的譜系集。
已識別譜系與推算譜系的時間分辨系統發育樹和熱圖比較
將phylowave應用于四種病毒和細菌病原體:SARS-CoV-2、H3N2、百日咳桿菌和結核分枝桿菌進行分析。研究發現,對于所考慮的每種病原體,phylowave 產生了具有明顯適應性差異的譜系證據,具有離散指數動力學的遺傳相關菌株亞群證明了這一點。依次使用每種病原體,將推算譜系與現有的譜系進行了比較,一致性水平很高,如先前定義的 SARS-CoV-2 變體Alpha、Beta、Gamma、Delta和 Omicron 和其他先前定義的亞變體與推算的譜系密切相關,H3N2分支也是如此。此外,phylowave 確定了三個額外的百日咳芽孢桿菌譜系,具有明顯不同的指數動態,這些是之前未被鑒定的。
譜系的適應性估計
phylowave識別離散譜系的限制將取決于潛在的患病率、采樣水平和適應度差異。使用 logistic 增長模型估計每個譜系的適應度,這個模型能夠捕捉到每種病原體的譜系動態。每個新興譜系的潛在適應性都是非零的,這與確定的具有真正不同適應性水平的譜系一致。 盡管該模型為每個譜系估計了一個恒定的適應性參數,但它們隨時間的實際適應性取決于當時正在流通的其他譜系。
對于 SARS-CoV-2,研究發現對應于 Omicron XBB1.5 的譜系 1 具有最佳的最大實時適應性,其次是對應于 Omicron BA.5 和 BA.1 的譜系 5 和 7。 而H3N2 譜系在人群中的適應性更加同質,譜系出現后平均持續 3.9 年。
譜系定義基因突變
接下來,研究通過識別譜系定義突變來探索基因組中的特定變化是否與譜系適應性有關。使用不同譜系之間的序列比較來識別不同的特定突變。對于 SARS-CoV-2,研究發現譜系定義氨基酸取代的最高密度位于刺突蛋白的受體結合域。該分析估計了與 600 萬個 SARS-CoV-2 基因組的適應度變化相關的核苷酸位置,發現譜系定義突變與先前分析中描述的突變一致。H3N2也獲得了的類似結果,其中大多數譜系定義氨基酸取代位于 HA1 結構域。此外,研究也發現了一些以前沒有描述過的其他相關突變。在結核分枝桿菌最新分支相關的突變中發現,與抗菌素耐藥性相關的基因具有最高比例的譜系定義突變。
phylowave關于采樣強度和譜系檢測時間的穩健性
Phylowave能夠跟蹤病原體種群構成隨時間的變化,并與適應性直接相關。為證明這種對采樣偏差隨時間變化的穩健性,研究使用 SARS-CoV-2 數據集進行了敏感性分析,方法是反復刪除基因組子集,然后每次都重新估計了循環譜系。
結果顯示,即使使用嚴重偏差的數據集,仍然能夠檢測到幾乎所有的譜系。最后,研究探索了phylowave 能夠多快地檢測到新出現的譜系。每兩周截斷一次完整的全球 SARS-CoV-2 數據集,并重新運行檢測算法。發現該模型能夠捕獲每個譜系,出現后的中位延遲為 2.2 個月,只需要10 個序列。且該研究中使用的 SARS-CoV-2 數據集來自 NextStrain,使用更大的數據集可以進一步縮短譜系鑒定的時間。
總之,該方法可以在系統發育樹中跟蹤病原體種群組成的變化,即使在序列的可用性存在嚴重偏差的情況下也能實現。在廣泛的病原體中,研究已證明Phylowave可以恢復每種病原體的主要已知循環譜系,并識別以前未知的、適應性發生重大變化的譜系。Phylowave還可量化每個譜系的相對適應性,并識別與新的、更合適的譜系出現相關的遺傳變化。這種方法可能對公共衛生監測產生重要影響。
參考文獻:
Learning the fitness dynamics of pathogens from phylogenies, Nature (2024). DOI: 10.1038/s41586-024-08309-9
主編微信
注:添加微信請備注昵稱+單位+研究
生命科學綜合交流QQ群:681341860
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.