6月6日,麻省理工學院與Recursion共同宣布推出一款突破性的AI+藥物研發模型Boltz-2,用于預測藥物靶標 3D 結構,以及結合親和力。
新聞稿中稱,Boltz-2已經超越現有生物分子結構預測模型,包括之前業界所熟知的AlpphaFold3。
也就是說,Boltz-2是第一個接近基于物理的自由能擾動(FEP)的深度學習模型,在各項測試中預測性能媲美FEP,與此同時預測速度提高了1000倍!
團隊稱,這項工作標志著計算機篩選的新時代,能夠顯著提升分子篩選的速度和規模,直接解決了小分子發現的關鍵瓶頸。
目前,該項目已經開源,包括模型、權重,可不受限制地用于學術和商業用途。
團隊表示,已經迫不及待地看到科學家們發揮出想象力,將其集成到工作流中。
開源模型:github.com/jwohlwend/boltz
預印本:http://jeremywohlwend.com/assets/boltz2.pdf
業界首個媲美物理方法模型
當前小分子藥物研發中,結合親和力決定了藥物能否與靶點相互作用,從而發揮治療作用。
基于物理的FEP預測模型雖然準確,但速度很慢但成本高昂,而長期以來深度學習模型的可靠性和準確度無法匹敵。
因此,業界希望出現能夠精準預測分子之間相互作用的模型。
如今,Boltz-2 作為下一代生物分子基礎模型,被認為是有望解決這一難題的關鍵。
該AI模型由麻省理工學院計算機科學與人工智能實驗室與上市AI制藥公司Recursion一起開發,雙方在Boltz-1的基礎之上,通過改進和拓展性能而來。
簡單來說,Boltz 與 AlphaFold3 一樣,均是一種全原子共折疊模型,它將蛋白質折疊或結構預測的概念擴展到DNA、RNA、配體中。該模型不僅可以預測分子相互作用的 3D 結構,還可用于分子設計等下游任務。
一般而言,結構和親和力被視為單獨的AI模塊,但Boltz-2將親和力預測與結構建模相結合,提高了預測結構的物理真實感。該模型還支持通過接觸約束、模板引導和特定于方法讓用
Boltz-2 模型架構圖
Boltz-2 在一個大型數據集上進行了訓練,該數據集結合了500萬個結合親和力測量值、分子動力學模擬和蒸餾數據,這些方法顯著提高了預測結構的物理真實感。
在標準 FEP+ 親和力基準測試中,Boltz-2 實現了 0.62 的平均 Pearson相關系數,能夠與可開源 FEP 流程 OpenFE 相媲美。但在速度方面,Boltz-2 只需 20 秒即可計算出結合親和值,比當前FEP預測快1000倍!
Boltz-2的測試性能表現
在 CASP16 親和力挑戰測試中,Boltz-2 在預測140種復合物的結合親和力方面優于所有專門方法。在回顧性篩選 (MF-PCBA) 中,Boltz-2 的表現顯著優于機器學習和對接,平均精度提高了一倍。
CASP16 親和力挑戰基準測試
以著名的TYK2靶點為例,通過Boltz-2與AI分子生成模型連用,能夠實現大規模進行篩選。而該組合預測所有排名前10的化合物均能與靶點結合,也證明了Boltz-2可集成到藥物研發工作流中。
預測TKY2結合親和力
此外,它在 DNA-蛋白質、RNA 和抗體-抗原系統上也表現良好,由于Boltz-2 學習了大量分子動力學(MD)數據,它能更有效地捕捉到分子動態。
將達到實驗室級的準確性
目前該項目已經開源,包含模型權重和訓練代碼,研究人員可以自行部署該模型,可廣泛用于學術和科研用途。
盡管雖Boltz-2 目前定位于解決小分子藥物發現,團隊希望隨著該模型的發布,結構生物學預測將不再是科學家們的攔路虎,并且所有人都可以廣泛使用。
第一作者Gabriele Corso甚至表示,該模型只是一個起點,他預計此類AI模型將在一到兩年內達到實驗級準確性的結合親和力預測。
但顯然,Boltz-2依舊無法取代濕實驗,真實的實驗結果仍然是判斷分子親和力的最終標準。
但團隊已經迫不及待地看到,科學家們能夠進一步構建該模型,并將其擴展到工作流中,切實地幫助藥物研發。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.