機器學習的熱度近年來一直飆升。卷來卷去,大家最終都看向了最后的終點:數(shù)據(jù)量夠大+體內體外驗證形成閉環(huán)+想法夠新。今天和大家一起學習這篇抗菌肽機器學習的文章吧!
繼抗生素耐藥后,抗菌肽(AMP)被發(fā)現(xiàn)(通過靜電吸引結合帶負電荷的微生物膜,形成離子通道導致內容物泄漏)。在醫(yī)藥領域,其不易耐藥性被發(fā)現(xiàn)和廣泛應用。打個比方,在抗生素這里,每種抗生素就是一把鑰匙,微生物是一把鎖,如果鎖換了,那么就形成了耐藥;在抗菌肽這里,抗菌肽是一把電鉆,微生物膜是一面墻,即使鎖換了,墻還是會被打孔,微生物仍然會漏液死亡。
那么,機器學習可以輔助抗菌肽什么呢?【新思路】
抗菌肽是由基因編碼的,本質是10-100個氨基酸,傳統(tǒng)技術很難檢測這些微小的短肽,故被稱為垃圾肽。機器學習可以處理大規(guī)模序列,并發(fā)現(xiàn)傳統(tǒng)方法難以識別的潛在AMP。
1.第一步:說明自己建庫的方法。該研究利用來自環(huán)境和宿主棲息地的63,410 個宏基因組和 87,920 個原核基因組的龐大數(shù)據(jù)庫,創(chuàng)建了 AMPSphere,這是一個包含 863,498 個非冗余肽的綜合目錄。
2.第二步:驗證庫的準確性。 AMPSphere 包含來自多個棲息地的近 100 萬 c_AMPs(候選抗菌肽)【實驗檢測+算法交叉驗證確認了數(shù)據(jù)庫的可靠性,同時篩選出高潛力的AMP】【AMPSphere揭示了微生物組中大量新型抗菌肽(92.9%為全新序列),其獨特性和多樣性遠超現(xiàn)有數(shù)據(jù)庫】
3.第三步:AMPs的起源和進化。抗菌肽的稀有性和棲息地特異性,使其分布受生態(tài)位限制。c_AMPs不僅由獨立基因編碼,還可通過基因組突變(如提前終止)或翻譯后剪切從全長蛋白中釋放。追溯基因組的上下源,c_AMPs 更頻繁地在與核糖體基因相關(核糖體基因有抗菌的功能)保守基因組中,推測可能是核糖體基因不恰當?shù)臅r機進行了復制。c_AMPs的產生具有菌株特異性。傳播性更強的物種具有更低的c_AMPs密度,即c_AMPs低傳播性更強。c_AMPs的物理化學特性和二級結構,證明其活性與二級結構無關。
4.第四步:實驗驗證。天然抗菌肽通常不針對微生物群落菌株,合成的抗菌肽在低濃度下對至少一種(腸道)共生菌株表現(xiàn)出抑制作用;c_AMPs抗菌的機制通過優(yōu)先破壞外膜,發(fā)揮抗菌作用;小鼠簡單建模體內驗證AMPs的抗感染效果。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.