編輯丨coisini
藥物研發往往是一個篩選、修飾化學分子并將其開發為治療制劑的過程。發現靶向疾病潛在候選藥物的關鍵在于:識別出能與疾病相關靶蛋白相互作用并結合的化合物,從而理解其治療效應。因此理解化合物 - 蛋白質相互作用對于早期藥物研發至關重要。
通過實驗鑒定化合物 - 蛋白質相互作用(CPI)通常成本高昂且耗時,因此學界開發了計算機模擬預測方法來優化發現流程,包括分子對接和分子動力學模擬。分子對接通過估算化合物與靶蛋白的結合親和力來研究 CPI;分子動力學模擬則通過模擬分子隨時間運動來解析動態相互作用。
但這些方法存在固有局限:從大型化合物庫中篩選候選藥物時計算資源消耗巨大,且依賴高質量分子結構作為輸入 —— 這對于缺乏實驗驗證結構的分子構成顯著挑戰,從而限制了這些計算機方法在大規模分子庫中篩選目標 CPI 及鑒定候選藥物的實用性。
近期,來自曼尼托巴大學(University of Manitoba)等機構的研究者提出了一種專為 CPI 預測設計的歸納式模型 GraphBAN,可處理二分網絡輸入,實現域內 / 跨域測試集的轉導與歸納鏈接預測。研究論文以《GraphBAN: An inductive graph-based approach for enhanced prediction of compound-protein interactions》為題發表在《Nature Communications》上。
論文地址:https://www.nature.com/articles/s41467-025-57536-9
GraphBAN 簡介
GraphBAN 采用知識蒸餾(KD)架構:教師模塊(teacher block)通過圖自編碼器(Graph Autoencoder,GAE)學習網絡拓撲特征以處理鏈接未知的數據集,并通過 KD 損失函數將知識遷移至學生模塊(student block),確保從化合物 / 蛋白質初始特征中有效學習模式(pattern)。
如圖 1a 所示,GraphBAN 接收 SMILES 格式的化合物與氨基酸序列的蛋白質,構建以化合物 / 蛋白質為節點、活性相互作用為邊的二分網絡(含節點特征)。
圖 1:GraphBAN 架構(來源:論文)
如圖 1b 所示,化合物與蛋白質的特征是通過融合四種不同方法(兩種針對化合物,兩種針對蛋白質)生成的:化合物特征采用結構圖卷積網絡(GCN)與預訓練 LLM——ChemBERTa;蛋白質特征通過 CNN 層與 ESM 進行提取,隨后提取教師模塊中的網絡結構特征,并將這些知識蒸餾到學生模塊中。
學生模塊通過雙線性注意力網絡(BAN)學習節點特征的聯合表征及編碼后的局部相互作用,最終引入條件域對抗網絡(CDAN)模塊(圖 1c),增強模型處理跨域化合物 - 蛋白質對的能力。
GraphBAN 通過二元分類(活性 / 非活性)判定相互作用,這種模式對生物醫藥應用至關重要。正如論文第一作者 Hamid Hadipour 所說:「藥物研發中一個行之有效的方法是鎖定在疾病中起關鍵作用或幫助有害微生物存活的蛋白質。若能通過合適的小分子靶向這些蛋白質,我們就能阻斷疾病發展進程?!?/p>
實驗驗證
為了驗證 GraphBAN 在藥物發現實際場景中的實用性,該研究聚焦于一種參與細胞周期調控、發育及信號通路等多種關鍵細胞進程的必需酶 —— 肽基脯氨酰順反式異構酶 NIMA 相互作用蛋白 1(Pin1)。鑒于 Pin1 在細胞周期中的核心作用,它已成為各類癌癥治療的重要靶點。
為預測與 Pin1 相互作用的化合物,該研究使用 ZINC-250K 數據集中的約 25 萬種化合物,通過 GraphBAN 模型篩選潛在結合化合物。由于 ZINC-Pin1 數據集缺乏 CPI 標注值,因此模型采用歸納推理方式預測相互作用。
GraphBAN 通過無監督域適應模塊,在 ZINC-Pin1 數據集無 CPI 標注的條件下實現了 CPI 預測。具體來說,該研究選用三個高質量訓練數據集(BioSNAP、BindingDB 和 KIBA),同時排除小規模數據集以規避欠擬合風險。
如圖 2 所示,經過訓練并部署 Pin1 與 ZINC 化合物配對預測后,GraphBAN 識別出 134 種與 Pin1 相互作用概率高于 0.5 的化合物。
圖 2:過濾和可視化 Pin1 結合位點(來源:論文)
總的來說,GraphBAN 能有效處理未知節點的歸納式鏈接預測,為完全未知的化合物與蛋白質之間相互作用的預測提供了穩健解決方案,從而突破了傳統方法僅適用于已知場景的局限。
相關報道:https://phys.org/news/2025-04-graphban-drug-discovery-faster-artificial.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.