蛋白質工程基于蛋白質具有的靈活性,通過人工手段改變氨基酸序列,實現對蛋白質結構和功能的修飾和改造。與基因組工程相比,它可直接對蛋白質分子進行操縱,借助突變的迭代積累,快速完成蛋白功能的優化和創新,速度較自然演變實現了指數級提升。鑒于蛋白質工程在基礎研究和產業應用的廣泛潛力,預計相關的市場規模超過數百億美元。
目前,蛋白質工程改造的策略主要包括結構引導的蛋白質理性設計和定向進化,但這些方法往往依賴經驗,且存在實驗周期長、成本高的問題,限制了其規模化應用。理想的蛋白質工程策略,應能以最小的投入實現最優的工程性能。近年來,人工智能(Artificial Intelligence, AI)迅猛發展,在生命科學領域的應用也不斷涌現。通過訓練特定蛋白專有的人工智能模型實現突變模擬和功能改造是蛋白質工程新方向。但這些模型在拓展應用到多種蛋白時存在困難,面臨通用性欠佳的問題;此外,模型訓練和下游驗證需要大量的計算和實驗成本,進一步限制了其廣泛應用(圖1A)。因此,有必要開發一種高效、普適且無需復雜模型訓練的蛋白質工程計算模擬策略,以最大限度地減少計算負荷、實現最大化性能,這對推動蛋白質改造具有重要價值。
2025年7月7日,中國科學院遺傳與發育生物學研究所高彩霞團隊在Cell雜志發表題為Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints的研究論文。該研究基于整合了結構與進化約束的通用逆折疊模型,開發了一種新型人工智能蛋白質工程計算模擬方法AiCE(AI-informedConstraints for proteinEngineering)。該方法無需訓練專屬人工智能模型,即可實現蛋白質高效進化模擬和功能設計。研究團隊利用AiCE對多種基因編輯工具進行進化優化,成功實現了其效率和精度的快速提升。
蛋白質逆折疊(inverse folding)是利用AI模型,通過給定三維結構預測可兼容序列的過程。通用的蛋白質逆折疊模型,例如ESM-IF1和ProteinMPNN,通過天然蛋白質結構和序列的訓練,可以隱式學習蛋白質骨架的幾何和物理特性,捕捉由進化動力學塑造的蛋白質序列的復雜分布模式。研究團隊基于現有通用逆折疊模型開發了AiCE
single模塊,具體來說:基于給定的蛋白質三維結構,對逆折疊模型輸出的氨基酸序列開展采樣,來提名高頻出現的氨基酸類型,進一步通過結構約束對氨基酸頻率開展差異篩選,得到最終預測的單個氨基酸替換類型。團隊利用60個深度突變掃描(DMS)數據,測試了AiCE
single的性能,發現 其 實現了16%的預測準確率;通過消融實驗和邏輯回歸分析,證明結構限制在方法中的必要性,相比于無限制方案性能提升了37%;進一步的平行比較分析表明AiCE
single相比于其它常見AI模型實現了36-90%以上的性能提升。從蛋白類型來看,AiCE
single實現了復雜蛋白和蛋白質-核酸復合物諸如CRISPR蛋白、SARS-CoV-2病毒蛋白等的有效進化,具有廣泛的通用性 。 為了克服突變組合廣泛存在的負向上位效應,研究團隊進一步假設存在進化耦合的氨基酸位置可能存在功能協同, 構建 了通過預測進化耦合性來預測突變組合位置的AiCE
multi模塊 (圖1B) 。6個突變文庫的分析結果表明,AiCE
multi與蛋白質大模型SaProt預測能力相當,但計算成本極低。團隊 建立的 包含兩類模塊的AiCE方法,可實現單突和組合突變的快速有效預測。該方法利用了現有的通用逆折疊模型而無需重新/遷移訓練專有蛋白模型,極大降低了計算成本,只需1.15個CPU時即可識別SpCas9蛋白(>1000個氨基酸)的單突和雙突變體 。
利用該方法,研究團隊進一步在濕實驗層面實現了包括脫氨酶、核定位序列、核酸酶和逆轉錄酶等8種結構和功能多樣蛋白質的AiCE功能驗證,證明了其簡單、高效和通用性。借助于優化的脫氨酶,團隊深入開發了可用于精準醫療和分子育種的新型堿基編輯器,包括編輯窗口縮小近一半的新型胞嘧啶堿基編輯器enABE8e、保真度提升1.3倍的新型腺嘌呤堿基編輯器enSdd6-CBE以及活性提升13倍的新型線粒體堿基編輯器enDdd1-DdCBE。
綜上所述,這項研究開發了一種基于人工智能的新型蛋白質工程計算模擬方法AiCE。與傳統蛋白質工程方案相比,該方法在效率、可擴展性和通用性方面均展現出顯著優越。通過計算模擬甚至替代濕實驗,是當前生命科學領域的重要發展趨勢和前沿方向,而本研究在此方面開展的探索具有積極意義。當前,基于人工智能的蛋白質分析工具往往依賴大量計算資源,這對許多實驗室而言難以獲取。而本項工作表明,通過開發更高效的生物信息學工具,能夠最大限度降低計算負荷,從而讓更多生物學家切實享受到人工智能技術帶來的科研便利。正如審稿專家所評價的:“AiCE將基于人工智能的蛋白質進化提升到了一個全新的水平”。
圖1 常見蛋白質工程方法的示意圖和AiCE方法概述
中國科學院遺傳與發育生物學研究所高彩霞研究員為該論文的通訊作者,博士后費宏源、博士生李運嘉為該論文的共同第一作者,已畢業博士生劉怡靜、博士后魏京京和碩士生陳奧捷在課題研究中做出了重要貢獻。中國科學院遺傳與發育生物學研究所王秀杰研究員、西湖大學盧培龍研究員、華中科技大學薛宇教授、荊楚理工學院鄭竹清副教授提供了建設性意見。
https://www.cell.com/cell/abstract/S0092-8674(25)00680-4
制版人: 十一
學術合作組織
(*排名不分先后)
戰略合作伙伴
(*排名不分先后)
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
近期直播推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.