編輯 | 蘿卜皮
在藥物研發中,識別能夠與靶蛋白相互作用的新型藥物是一項高難度、高耗時、高成本的任務。
近年來,許多機器學習模型正在加速藥物的研發過程。然而,現有方法主要局限于單一任務(預測藥物-靶標相互作用(DTI)、藥物分子生成),無法同時進行多項任務。
在最新的研究中,中南大學、赫爾辛基大學(University of Helsinki)的研究人員開發了一個新的多任務學習框架 DeepDTAGen,該框架可以預測藥物-靶標結合親和力,并同時生成新的靶標感知藥物變體,并利用這兩項任務的共同特征生成新型藥物。
該研究以「DeepDTAGen: a multitask deep learning framework for drug-target affinity prediction and target-aware drugs generation」為題,于 2025 年 5 月 30 日發布在《Nature Communications》。
藥物研發的核心是通過發現、修飾和設計能與靶蛋白相互作用的新藥,但傳統實驗方法成本高、耗時長。
為此,計算數據驅動模型被廣泛應用,分為預測模型(如預測藥物-靶點相互作用 DTI)和生成模型(如生成新藥)。
DTI 不僅能指導新藥研發,還在藥物重定位(即老藥新用)中發揮重要作用;而藥物-靶點結合親和力(DTA)預測近年更受關注,其通過回歸模型(如KronRLS、SimBoost)或深度學習模型(如DeepDTA、GraphDTA)量化相互作用強度,但現有模型在特征提取(如分子結構信息)和任務整合(如CoVAE)方面有局限性。
生成模型(如對抗生成網絡和變分自編碼器)能創造大量新藥組合,但無法有效結合藥物與靶點的結合動力學信息,導致生成結果可能缺乏實際有效性。
為此,中南大學的研究人員提出了一個多任務學習 (MTL) 框架 DeepDTAGen,它通過使用兩個函數的共同特征(如配體-受體相互作用的知識)空間同時執行這兩個任務(預測 DTA 和生成新藥物)。
圖示:模型架構。(來源:論文)
最小化 DTA 預測任務中的損失可確保在潛在空間中學習 DTI 特定特征,但是在藥物生成任務中利用這些特征可確保生成目標感知藥物,從而顯著提高其臨床成功的可能性。
另外,MTL 模型通常容易遇到諸如梯度沖突之類的優化難題。為了在 DeepDTAGen 中解決這些問題,研究人員開發了 Fetter Gradients(FetterGard)算法來緩解梯度沖突。
與現有方法不同,DeepDTAGen 主要具有以下基本創新之處:
(i)所提出的模型使用共享特征空間并在統一模型中執行這些任務。
(ii)FetterGrad 算法在從共享特征空間學習的同時保持兩個任務的梯度保持一致。它通過最小化任務梯度之間的歐幾里得距離(ED)來緩解梯度沖突和偏差學習。
(iii)DeepDTAGen 提供兩個目標函數:它預測藥物-靶標親和力值,同時根據輸入相互作用生成靶標感知藥物。
經過全面的實驗結果表明,DeepDTAGen 不僅可以準確預測藥物與靶標之間的結合親和力,還可以成功生成靶標感知藥物。
性能評估
圖示:在 KIBA、Davis 和 BindingDB 測試集上,預測親和力值與實際親和力值的散點可視化。(來源:論文)
具體來說,研究人員通過 (i) 藥物選擇性、(ii) 定量構效關系分析和 (iii)冷啟動測試評估了 DeepDTAGen 在 DTA 預測中的穩健性。
藥物選擇性分析表明,DeepDTAGen 的親和力預測與藥物和靶標之間的生物學相關行為相一致,其中根據親和力概況從每個數據集中選擇兩種藥物:一種藥物與不同靶標的親和力變化很大,另一種藥物與其靶標的親和力水平一致。該模型成功預測了兩種藥物的準確親和力,表明它具有學習 DTI 生物學模式的能力。
同樣,在另一項測試中,研究人員進行了四次隨機化實驗,破壞了藥物與靶點之間的關聯,從而驗證 DeepDTAGen 學習它們之間真實關系的能力。通過比較標準數據集和置換數據集的結果,表明 DeepDTAGen 成功地學習了藥物與靶點之間的真實關系。
對于生成任務,研究人員對生成的藥物進行了 (i) 化學成藥性分析、(ii) 靶點感知和 (iii) 多藥理學分析。結果證明,DeepDTAGen 能夠成功生成靶標感知藥物。
圖示:所生成藥物的多藥理學用藥性。(來源:論文)
為了評估 DTA 任務是否能夠有效地引導網絡生成這些靶標感知藥物,研究人員進行了一項實驗,分別在有和無 DTA 任務的情況下對模型進行了訓練。結果表明,使用 DTA 任務生成的藥物與其種子靶標的親和力比未使用 DTA 任務生成的藥物更強。
結語
「我們相信,DeepDTAGen 通過預測藥物靶點親和力和新型靶向藥物生成,為藥物發現過程提供了一種靈活的策略。」研究人員在論文里表示。
雖然 DeepDTAGen 在兩個任務上都表現良好,但它仍然存在缺乏 QED、LogP 和 SAS 等化學性質作為條件支持的局限性。其次,該模型忽略了輸入分子的立體化學動力學,而立體化學在藥物開發和發現中起著重要作用。
因此,考慮這些特性,并結合適當的引導機制和嵌入立體化學信息,將是一個有價值的擴展。此外,該模型還可以通過在訓練期間合并非相互作用的數據進行擴展,從而可以增強具有更高選擇性的藥物生成。
論文鏈接:https://www.nature.com/articles/s41467-025-59917-6
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.