微生物的世界廣闊且繁雜,漫如星海的微生物種類帶來的是龐大的遺傳信息寶庫。其中,稀有生物圈扮演著重要的角色,關乎生態(tài)系統(tǒng)的抵抗力和復原力,它成為宿主相關微生物的共生體來源。
研究稀有生物圈的標準計算方法是在等級豐度曲線(RAC)中進行排序。但倘若采用豐度閾值的方式來定義微生物稀有生物圈并不能適應多種方法中的差異。
為解決相關問題,波爾圖大學(Universidade do Porto)等高校開源了一款開創(chuàng)性的軟件 ulrb,使用無監(jiān)督機器學習將微生物群落劃分至最佳的豐度類別。該研究以「Definition of the microbial rare biosphere through unsupervised machine learning」為題,于 2025 年 4 月 2 日刊登于《Communications Biology》。
論文鏈接:https://www.nature.com/articles/s42003-025-07912-4
ulrb算法與演示
ulrb 使用的無監(jiān)督學習方法是基于 medoids 模型的分區(qū)算法,令同一聚類里的分類單元更加相似。這需要找到聚類中心并最大化函數(shù)來實現(xiàn)。
在這種情況下,算法會隨機選擇兩個候選分類單元作為 medoids,然后計算它們與其他分類單元的距離。隨后在交換階段 medoids 被替換并重新計算。這種交換會重復進行,最終目的是最小化分類單元之間的距離。
圖 1:: k-medoids 的示意圖。(圖源:論文)
ulrb R 包采用 devtools 功能構建,包括準備豐度表和應用 pam 算法的功能,以及用于驗證統(tǒng)計信息和數(shù)據(jù)可視化的輔助功能。其中,PAM 算法的原理是在 ulrb 中將所有分類單元分為預定義數(shù)量的聚類 k。
除了默認參數(shù)外,還可以選擇特定數(shù)量的豐度分類,這點需要使用者自行定義。拋開經(jīng)典的 1234 的等級分層,稀有、普遍等更貼合的術語也許更符合使用需要。
開發(fā)者提醒使用者,如果不同的研究使用不同的分類數(shù)量以適應最佳輪廓系數(shù),那么可比性就會受到限制。
這里團隊貼心的附上了軟件包附加功能的教學,相關教程可通過鏈接進行學習。
教學鏈接:https://pascoalf.github.io/ulrb/index.html
學習統(tǒng)計與數(shù)據(jù)集驗證
軟件包 ulrb 包含三個主要統(tǒng)計指標來評估聚類的質(zhì)量,其中為了評估研究結果,會更依賴于輪廓分數(shù)。這個分數(shù)為每個分類單元計算,可提供特定或所有聚類的信息。因此,平均輪廓分數(shù)提供了聚類方法質(zhì)量的統(tǒng)計指標,可與其他方法進行比較。
圖 2:輪廓分數(shù)可以提供的信息的示意圖。(圖源:論文)
接下來,該工具先后進行了多種數(shù)據(jù)集的驗證,在不同系統(tǒng)發(fā)育單元、不同擴增子測序列、不同樣本大小深度多樣性等區(qū)分環(huán)境下執(zhí)行微生物分類。
根據(jù)豐度分類的變化,種群可以被歸類為稀有性的不同類型。例如,如果一個種群在稀有和豐富之間波動,它可以被認為是條件性稀有。
當前版本的 ulrb 不支持稀有性類型的自動計算,但在獲得定義分類后可以手動檢查特定種群在某些條件下的變化。此項研究在珊瑚微生物數(shù)據(jù)集上進行驗證,并于 97% 的相似性切割點上完成豐度劃分。
在這項研究中,所有數(shù)據(jù)均使用 R 軟件生成。為了可重復性,所有源數(shù)據(jù)和代碼均已公開。
開源鏈接:https://github.com/pascoalf/ulrb
如何定義稀有微生物的工具
CIIMAR(海洋與環(huán)境研究跨學科中心)的博士候選人 Francisco Pascoal 在一次采訪中提及到,他們的研究結果表明,ulrb 不僅可以識別稀有微生物,還可以處理非微生物數(shù)據(jù),例如樹木普查數(shù)據(jù)集。
這種多功能性使其成為生態(tài)應用的強大工具,借助 ulrb,這種精準、適應性強且能夠改進生物多樣性評估的方法將會逐漸普及到生態(tài)學的各項研究中。
與基于閾值的方法相比,ulrb 在不同的測序策略和生物信息學方案中提供了對微生物稀有生物圈的更一致解釋,其還可用于手動監(jiān)測特定分類群。
由于上述特點,ulrb 適用于各種情況下區(qū)分稀有度,顯示出標準化微生物稀有生物圈分析的巨大潛力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.