題圖 | Pixabay
蛋白質工程,是基于蛋白質具有的靈活性,通過人工手段改變氨基酸序列,實現對蛋白質結構和功能的修飾和改造。與基因組工程相比,它可直接對蛋白質分子進行操縱,借助突變的迭代積累,快速完成蛋白功能的優化和創新,速度較自然演變實現了指數級提升。
目前,蛋白質工程改造的策略主要包括結構引導的蛋白質理性設計和定向進化,但這些方法往往依賴經驗,且存在實驗周期長、成本高的問題,限制了其規模化應用。理想的蛋白質工程策略,應能以最小的投入實現最優的工程性能。
近年來,人工智能(AI)迅猛發展,在生命科學領域的應用也不斷涌現。通過訓練特定蛋白專有的人工智能模型實現突變模擬和功能改造是蛋白質工程新方向。但這些模型在拓展應用到多種蛋白時存在困難,面臨通用性欠佳的問題;此外,模型訓練和下游驗證需要大量的計算和實驗成本,進一步限制了其廣泛應用(圖1A)。因此,有必要開發一種高效、普適且無需復雜模型訓練的蛋白質工程計算模擬策略,以最大限度地減少計算負荷、實現最大化性能,這對推動蛋白質改造具有重要價值。
2025年7月7日,中國科學院遺傳與發育生物學研究所高彩霞團隊在國際頂尖學術期刊Cell上發表題為:Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints 的研究論文。
這項研究基于整合了結構與進化約束的通用逆折疊模型,開發了一種新型人工智能蛋白質工程計算模擬方法——AiCE。該方法無需訓練專屬 AI 模型,即可實現蛋白質高效進化模擬和功能設計。研究團隊利用 AiCE 對多種基因編輯工具進行進化優化,成功實現了其效率和精度的快速提升。
圖:論文截圖
蛋白質逆折疊(inverse folding)是利用 AI 模型,通過給定三維結構預測可兼容序列的過程。通用的蛋白質逆折疊模型,例如 ESM-IF1 和 ProteinMPNN,通過天然蛋白質結構和序列的訓練,可以隱式學習蛋白質骨架的幾何和物理特性,捕捉由進化動力學塑造的蛋白質序列的復雜分布模式。
研究團隊基于現有通用逆折疊模型開發了 AiCEsingle模塊,具體來說:基于給定的蛋白質三維結構,對逆折疊模型輸出的氨基酸序列開展采樣,來提名高頻出現的氨基酸類型,進一步通過結構約束對氨基酸頻率開展差異篩選,得到最終預測的單個氨基酸替換類型。
研究團隊利用 60 個深度突變掃描(DMS)數據,測試了 AiCEsingle的性能,發現其實現了 16% 的預測準確率;通過消融實驗和邏輯回歸分析,證明結構限制在方法中的必要性,相比于無限制方案性能提升了 37%;進一步的平行比較分析表明 AiCEsingle相比于其它常見 AI 模型實現了 36%-90% 以上的性能提升。從蛋白類型來看,AiCEsingle實現了復雜蛋白和蛋白質-核酸復合物諸如CRISPR蛋白、SARS-CoV-2病毒蛋白等的有效進化,具有廣泛的通用性。
為了克服突變組合廣泛存在的負向上位效應,研究團隊進一步假設存在進化耦合的氨基酸位置可能存在功能協同,構建了通過預測進化耦合性來預測突變組合位置的 AiCEmulti模塊(圖1B)。6 個突變文庫的分析結果表明,AiCEmulti 與蛋白質大模型 SaProt 預測能力相當,但計算成本極低。研究團隊建立的包含兩類模塊的 AiCE 方法,可實現單突和組合突變的快速有效預測。該方法利用了現有的通用逆折疊模型而無需重新/遷移訓練專有蛋白模型,極大降低了計算成本,只需 1.15 個CPU時即可識別 SpCas9 蛋白(>1000個氨基酸)的單突和雙突變體。
圖 1. 常見蛋白質工程方法的示意圖和 AiCE 方法概述(論文截圖)
利用該方法,研究團隊進一步在濕實驗層面實現了包括脫氨酶、核定位序列、核酸酶和逆轉錄酶等 8 種結構和功能多樣蛋白質的 AiCE 功能驗證,證明了其簡單、高效和通用性。借助于優化的脫氨酶,研究團隊深入開發了可用于精準醫療和分子育種的新型堿基編輯器,包括編輯窗口縮小近一半的新型胞嘧啶堿基編輯器 enABE8e、保真度提升 1.3 倍的新型腺嘌呤堿基編輯器 enSdd6-CBE,以及活性提升 13 倍的新型線粒體堿基編輯器 enDdd1-DdCBE。
圖:論文截圖
綜上所述,這項研究開發了一種基于人工智能的新型蛋白質工程計算模擬方法——AiCE。與傳統蛋白質工程方案相比,該方法在效率、可擴展性和通用性方面均展現出顯著優越。通過計算模擬甚至替代濕實驗,是當前生命科學領域的重要發展趨勢和前沿方向,而該研究在此方面開展的探索具有積極意義。
當前,基于 AI 的蛋白質分析工具往往依賴大量計算資源,這對許多實驗室而言難以獲取。而這項工作表明,通過開發更高效的生物信息學工具,能夠最大限度降低計算負荷,從而讓更多生物學家切實享受到 AI 技術帶來的科研便利。
正如審稿專家所評價的:AiCE 將基于 AI 的蛋白質進化提升到了一個全新的水平。
參考文獻:
https://www.cell.com/cell/abstract/S0092-8674(25)00680-4
助力醫學研究高質量發展,推動醫療科技創新轉化!
研究設計|課題申報|數據挖掘|統計分析
生信分析|選題指導|寫作指導|評審指導
選刊投稿指導|研究項目指導|定制化培訓
定制化研究設計|真實世界研究(RWS)實施
聯系醫諾維
醫諾維,一站式科研平臺,科研合作請點擊公眾號菜單“科研合作”。
轉載、進群、宣傳研究成果、新聞稿、課題組招聘、企業宣傳推廣等,請掃碼添加小編,切記注明來意。
(請注明來意)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.