編輯 | 白菜葉
三維分子生成在藥物設計中至關重要。
然而,目前的方法通常依賴于點云或過于簡化的相互作用模型,限制了其準確表征分子結構的能力。
為了應對這些挑戰,西安電子科技大學(Xidian University)的研究團隊提出了用于三維分子設計的多尺度圖等變擴散模型(multiscale graph equivariant diffusion model for 3D molecule design,MD3MD)。
MD3MD 將分子構象劃分為多尺度圖,并分配不同的權重以捕捉跨尺度的原子相互作用。該框架指導擴散過程,從而實現高質量的 3D 分子生成。
實驗結果表明,MD3MD 在無條件和條件生成任務中均表現出色,能夠生成滿足特定條件的多樣化、穩定且創新的分子。
可視化凸顯了 MD3MD 學習領域特定模式的能力,它能夠在保持分布一致性的同時生成與現有數據集不同的分子。通過有效探索化學空間,MD3MD 在生成創新且化學多樣性的分子方面超越了以往的方法,為分子設計領域帶來了顯著的進步。
該研究以「Multiscale graph equivariant diffusion model for 3D molecule design」為題,于 2025 年 4 月 16 日發布在《Science Advances》。
藥物研發的目的是識別具有最佳特性的候選分子,用于臨床試驗。然而,傳統方法通常耗時費力,成本高昂,且成功率低。
近年來,基于人工智能的深度模型通過數據驅動的方式探索廣闊的化學空間,在分子開發中展現出顯著的潛力,從而加速了藥物研發進程。
其中,三維(3D)分子生成因其能夠直接生成與真實藥物極為相似的三維分子構象,已成為藥物設計中不可或缺的一部分。
受幾何深度學習的啟發,西電的研究團隊提出了一種用于三維分子設計的多尺度圖等變擴散模型(MD3MD)的原創方法,用于解決現有方法在全面表征三維分子結構方面的局限性。
圖示:QM9 上無條件分子生成的可視化。(來源:論文)
首先,本研究通過計算分子中原子間的距離并設定閾值范圍,將分子構象劃分為多個尺度的三維分子圖,從而捕捉分子復雜的內部結構,準確模擬化學鍵的形成。
其次,在生成過程中為不同尺度的圖賦予不同的權重,靈活控制不同原子間相互作用的重要性。
性能評估
研究人員對 MD3MD 在多個基準測試中進行了詳細評估,包括無條件和有條件分子生成任務。
無條件生成任務的結果表明,該方法優于現有方法,能夠生成更具實用性和創新性的分子。它可以生成具有更高原子和分子穩定性的分子。
在基準數據集上進行的條件生成結果表明,與現有方法相比,MD3MD 能夠生成更符合預期特性的分子。
可視化結果顯示,MD3MD 能夠有效地學習領域知識,并生成與現有數據集顯著不同但與其分布一致的創新分子。此外,該方法廣泛探索了化學空間,生成高度多樣化的分子,并避免了模式崩潰。
圖示:生成的分子與 QM9 數據集之間的原子數、鍵數、環數和原子間距離分布的比較。(來源:論文)
值得一提的是,研究人員還嘗試明確納入除共價相互作用之外的所有原子相互作用力,用于指導分子生成過程。他們發現,在某些情況下,這種表示方法比考慮所有化學鍵相互作用能產生更好的分子性能。
當然,MD3MD 也存在一些局限性:該方法沒有深入探索當條件為非標量值時如何實現條件引導的分子生成(例如基于配體的分子生成),這將是未來研究的一個方向。
此外,進一步理解模型如何利用條件信息指導分子生成并提供可解釋的結果,以拓展 MD3MD 方法在分子設計與發現領域的適用性和實用性,提高其應用效果和效率,也是未來深入研究的重要方向。
不過,由于擴散模型的復雜性以及 GEOM 數據集的龐大規模,以及硬件條件的限制,在這項研究中研究人員僅嘗試將 GEOM 數據集的分子圖劃分為三個尺度圖。
在未來的實驗中,研究人員表示將通過知識蒸餾等方法,盡可能降低模型的復雜度并探索數據集中的原子相互作用,這將是一個挑戰。
論文鏈接:https://www.science.org/doi/10.1126/sciadv.adv0778
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.