編輯 | 蘿卜皮
藥物研發在尋找滿足多個嚴格目標(例如結合親和力、蛋白質靶標選擇性和藥物相似性)的新型候選藥物方面面臨越來越大的挑戰。
現有的優化方法難以應對處理眾多目標的復雜性,限制了分子設計的進步,因為大多數算法最多只能對四個優化目標有效。
為了克服這些局限性,浙江大學侯廷軍團隊提出了 PMMG 方法,利用蒙特卡洛樹搜索(MCTS)有效地發現高維目標空間中分子設計任務的帕累托前沿。
PMMG 利用簡化分子輸入系統 (SMILES) 來表示分子,高效地在廣闊的化學空間中探索,發現同時展現多種理想屬性的分子。
在同時優化七個目標時,PMMG 取得了 51.65% 的成功率,比目前最先進的算法高出 2.5 倍。并且,PMMG 能夠生成與目標蛋白具有高對接分數且具有良好預測類藥特性的分子。
該研究以 「A Multi-Objective Molecular Generation Method Based on Pareto Algorithm and Monte Carlo Tree Search」為題,于 2025 年 4 月4 日發布在《Advanced Science》。
傳統的藥物設計方法涵蓋靶點識別、先導化合物發現以及后續優化,但往往受制于高成本和冗長的周期。尤其是在先導化合物發現的初始階段,通常需要投入大量的人力和物力來合成和篩選分子。深度學習技術的出現為藥物開發領域帶來了新的可能性。
雖然潛力巨大,但大多數模型生成的分子往往與訓練數據高度相似,缺乏精準靶向目標分子的能力。因此,科學家迫切需要尋找新方法來開發生成模型,從而實現精準且有針對性的分子優化。
在最新的研究中,浙江大學侯廷軍、潘培辰、康玉、Chang-Yu Hsieh 團隊開發了用于分子生成的 PMMG(Pareto Monte Carlo Tree Search Molecular Generation)算法,該算法利用預訓練的循環神經網絡(RNN)模型作為分子生成器,并以蒙特卡洛樹搜索(MCTS)為指導。MCTS 基于帕累托原則不斷細化和優化搜索方向,探索廣闊的化學空間,從而識別分子設計相關的帕累托前沿(Pareto Front)。
圖示:PMMG 的工作流程。(來源:論文)
具體而言,首先訓練一個 RNN 模型學習分子的 SMILES 表示規則,在擴展和模擬兩個步驟中,通過預測 SMILES 下一個 token 的概率分布來生成分子。在生成過程中,MCTS 會構建搜索樹,并迭代執行選擇、擴展、模擬和反向傳播四個步驟?;谥虚g節點的上置信界限(UCB)分數,MCTS 不斷搜索和選擇節點,直到遇到終止符號。
PMMG 性能評估
為了評估 PMMG 在分子生成過程中的有效性,團隊在基準數據集上進行了廣泛的實驗驗證。研究人員設計了七個評估目標,包括生物活性、溶解度、滲透性、代謝穩定性、毒性、合成可及性 (SAScore) 和藥物相似性定量評估 (QED) 等,這些特性在藥物設計中至關重要。
研究人員選取了幾種當下最先進的方法與 PMMG 進行比較,并將它們分為兩大類。第一類方法基于 SMILES 表示,包括 SMILES-GA、SMILES-LSTM、SMILES-VAE、REINVENT。第二類基于圖的分子生成模型,包括 MARS、Graph-MCTS、Graph-GA。
他們使用每種方法,在相同條件下生成了 10 000 個分子,并基于以下評估指標將所提出的方法與基線方法進行了比較:超容量指標 (HV)、成功率 (SR) 和多樣性 (Div)。除 PMMG 外,其他基線方法的結果均是通過運行Gao以及 Nathan 團隊提供的公開代碼所獲得。
圖示:在同時優化七個目標的情況下,八種不同的分子生成方法的比較。(來源:論文)
總體而言,PMMG 在三個關鍵指標(HV、SR 和 Div)上均優于所有基線。
在 HV 指標方面,PMMG 算法生成的帕累托前沿的 HV 達到了 0.569,比表現最佳的基線高出 31.4%。這表明 PMMG 更深入地探索了化學空間的帕累托前沿,展現出在生成跨多個目標的卓越分子方面更大的潛力。
在 SR 指標方面,PMMG 生成的分子成功率達到了驚人的 51.65%,遠超其他基線的 2.5 倍。
圖示:示例分子的性質預測。(來源:論文)
隨后,研究人員針對 EGFR 和 HER2 進行了雙靶點藥物分子設計(兩個靶點是治療肺癌和乳腺癌等癌癥的關鍵靶點),成功生成了對接得分和預測性質與拉帕替尼相當甚至在某些性質上超越拉帕替尼的分子。
結語
當前版本的 PMMG 在多目標分子生成方面取得了重大進展。通過同時有效地平衡和優化多種分子特性(例如效力、選擇性和 ADMET 譜),PMMG 展現出強大的能力,能夠滿足藥物發現過程中固有的復雜且往往相互沖突的需求。它提供了一個多功能且強大的工具,能夠提高識別潛在候選藥物的效率和準確性。
研究人員在論文里表示:PMMG 為未來藥物設計和發現的進步鋪平了道路,預計將整合更復雜的機器學習技術,并擴展化學空間探索。隨著該模型的不斷發展,它有可能徹底改變分子生成方法,為開發具有優化特性的新療法助力。
論文鏈接:https://advanced.onlinelibrary.wiley.com/doi/full/10.1002/advs.202410640
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.