編輯丨coisini
正如人體每個器官各司其職,細胞內部的「細胞器」也是協同維持細胞的整體運作。這些膜包被的細胞器為大量核編碼蛋白提供了最適理化環境,使其能夠執行關鍵生物學功能。
為維持細胞組織與進程,細胞內部存在確保蛋白質準確送達的復雜機制 —— 蛋白質通過獨特的氨基酸靶向序列被標記并運往特定細胞器。
線粒體作為為細胞提供能量的特殊細胞器,是基礎研究、代謝工程和疾病治療的主要靶向細胞器。但當前線粒體研究受限于現有線粒體靶向序列(MTS)的可用性。
近期,來自伊利諾伊大學厄巴納 - 香檳分校(University of Illinois Urbana-Champaign,UIUC)的一項新研究展示了生成式人工智能在設計靶向序列方面的實用性。研究成果發表于《Nature Communications》。
論文地址:https://www.nature.com/articles/s41467-025-59499-3
解決 MTS 難題
天然 MTS 的長度從 10 到 120 個氨基酸不等,平均約 35 個氨基酸。目前僅發現并使用了少數 MTS,研究人員不得不重復使用相同序列,但實際上,不同載體蛋白需要不同的最優靶向序列。
MTS 的線粒體靶向能力源于其三維結構特征與化學特征,而非二維氨基酸序列。生成式 AI 能通過識別訓練數據(天然 MTS)中人類難以察覺的復雜模式來解決這一問題。
研究團隊采用「變分自編碼器(VAE)」,識別出 MTS 三大關鍵特征:帶正電荷、兩親性及易形成 α 螺旋結構。
圖示:用于生成線粒體靶向序列 (MTS) 的變分自編碼器。
隨后該研究設計采樣方案優先篩選進行實驗驗證的 MTS,通過共聚焦顯微鏡在四種真核生物體內表征了 41 條自然界不存在的新肽段,獲得 50-100% 的成功率。此外,該研究還在 HEK293 細胞系中證實這些肽段能在體內被成功剪切。
圖示:四種真核生物中人工線粒體靶向序列(AMTS)的特征分析。
進一步分析顯示,部分生成序列可能兼具靶向線粒體和葉綠體的能力。因此,該研究基于植物界 MTS 和葉綠體靶向序列(CTS)訓練了Dual-VAE模型。
圖示:利用 Dual-VAE 設計雙靶向肽。
最后,該研究展示了特征肽在代謝工程與蛋白質遞送中的應用,例如,采用嵌合 MTS 改進 HEM1 的線粒體靶向效率,可提升 4.76 倍。
總的來說,該研究采用的 VAE 模型能高效設計多樣化功能性線粒體靶向序列及自然界未見的雙靶向序列,顯著提升了代謝工程與生物醫學應用中必需物質的遞送能力。
相關報道:https://phys.org/news/2025-05-harnessing-generative-ai-mitochondrial-toolkit.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.