作者 | 論文團(tuán)隊
編輯 | ScienceAI
今天為大家介紹的是來自湖南大學(xué)、電子科技大學(xué)、廈門大學(xué)團(tuán)隊聯(lián)合發(fā)表在Nature Communications期刊上關(guān)于罕見藥物互作預(yù)測的文章。
在現(xiàn)代醫(yī)療和臨床用藥中,大量的藥物組合方式用于治療復(fù)雜疾病,其中一些未被發(fā)現(xiàn)的不良藥物-藥物相互作用事件(DDIEs)嚴(yán)重威脅患者安全,尤其是罕見DDIEs更加難以識別。
在這里,研究人員開展了基于雙粒度結(jié)構(gòu)驅(qū)動的對變分表示預(yù)測罕見DDIEs的研究,能夠在少樣本甚至是零樣本場景下具有優(yōu)異性能,并且驗證了遷移藥物相互作用機(jī)制元知識能夠促進(jìn)藥物協(xié)同預(yù)測任務(wù)的性能以及合理性。
本文將深度解析這一里程碑式突破。
藥物安全問題始終是醫(yī)療領(lǐng)域的核心挑戰(zhàn)
隨著疾病復(fù)雜性的增加和生物醫(yī)藥科學(xué)的快速進(jìn)展,聯(lián)合用藥方案正為癌癥、慢性病等疑難疾病帶來前所未有的治療前景。然而,這背后潛藏著巨大的風(fēng)險——潛在的藥物相互作用事件(Drug-Drug Interaction Events, DDIEs)。
這些互作不僅可能削弱療效,更可能引發(fā)嚴(yán)重的不良反應(yīng),尤其是那些罕見且致命的相互作用事件,對患者健康構(gòu)成巨大威脅。統(tǒng)計數(shù)據(jù)顯示,僅在美國,每年因不良DDI事件導(dǎo)致的急診就診高達(dá)7.4萬例、住院治療19.5萬例。
盡管藥物在獲批前需經(jīng)歷嚴(yán)格的安全評估,但受限于實(shí)驗規(guī)模、樣本覆蓋和成本投入,真正進(jìn)入臨床后,我們依然難以及時識別那些罕見的不良DDIEs。
這些稀有但高風(fēng)險的DDIEs,需要在使用前就被精準(zhǔn)識別與預(yù)警,以最大程度保障患者安全。羥氯喹和阿奇霉素兩種被批準(zhǔn)的藥物曾被用于 COVID-19 的治療,但同時使用這兩種藥物會引起嚴(yán)重的心律不齊,威脅生命健康。
由于傳統(tǒng)實(shí)驗方法費(fèi)時費(fèi)力,并且隨著臨床觀察和藥物開發(fā)的進(jìn)展,新型DDIE不斷出現(xiàn)。數(shù)據(jù)稀缺和不完整導(dǎo)致罕見DDIE的檢測非常具有挑戰(zhàn)性。
而現(xiàn)有的計算方法主要集中在具有足夠訓(xùn)練樣本的相互作用事件預(yù)測任務(wù)上,忽視少樣本數(shù)據(jù)以保證預(yù)測性能,防止過擬合。但同時失去了在新的相互作用事件上泛化能力,并且可擴(kuò)展能力存在局限性。
為破解這一難題,作者基于元學(xué)習(xí)的學(xué)習(xí)范式,將罕見藥物相互作用預(yù)測問題構(gòu)造為小樣本預(yù)測問題,并將其定義為確定給定的藥物對是否會表現(xiàn)出特定事件下的相互作用。
這種學(xué)習(xí)架構(gòu)通過引入新任務(wù)或新事件類別的少量支持集數(shù)據(jù),通過訓(xùn)練形成的樣本學(xué)習(xí)模式生成對這些新任務(wù)樣本的理解,從而擴(kuò)充模型學(xué)習(xí)到的知識庫,進(jìn)而可以對新任務(wù)的查詢集樣本給出預(yù)測,而無需該任務(wù)下大量的標(biāo)記數(shù)據(jù)。
盡管利用該學(xué)習(xí)范式預(yù)測罕見DDIEs理論上是有效的,但在實(shí)際訓(xùn)練過程中研究團(tuán)隊遇到三個重要挑戰(zhàn):
第一個挑戰(zhàn)是如何構(gòu)建可推廣、可泛化的藥物表征,以全面捕獲藥物固有的各種功能信息。模型只有學(xué)習(xí)到真正有效的藥物表征,才能在遇到新藥物或新事件預(yù)測問題時能夠基于模型形成的元知識構(gòu)建相關(guān)特征并給出正確預(yù)測。
第二個挑戰(zhàn)是如何為藥物對創(chuàng)建一個具有語義描述的通用關(guān)系度量空間,從而能夠適應(yīng)各種不同的新事件預(yù)測任務(wù)上。通常預(yù)測模型只是簡單拼接兩個藥物特征,但這種方式不僅人為引入了順序信息,并且拼接特征缺乏有具體含義的描述。因此模型需要構(gòu)建一個統(tǒng)一的、有語義的表示空間,在提升描述能力的同時,能夠有效泛化到新事件上。
第三個挑戰(zhàn)是確保元知識構(gòu)建過程中的可解釋性,以幫助后續(xù)的應(yīng)用和分析。為了解決上述問題和挑戰(zhàn),團(tuán)隊提出了基于度量的元學(xué)習(xí)模型RareDDIE,它使用雙粒度結(jié)構(gòu)信息驅(qū)動的成對藥物變分表示來構(gòu)建學(xué)習(xí)表征,增強(qiáng)罕見相互作用的預(yù)測效果。
除此之外,研究團(tuán)隊還認(rèn)為在實(shí)際臨床用藥中,對新出現(xiàn)的DDIEs預(yù)測本質(zhì)上仍然是小樣本預(yù)測問題,這是因為在臨床實(shí)踐中發(fā)現(xiàn)新的藥物相互相互作用事件時,通常是伴隨著已知的用藥情況。
但考慮到在浩瀚的藥物組合空間中仍然可能存在許多未被出現(xiàn)過的事件,因此研究團(tuán)隊進(jìn)一步擴(kuò)充了RareDDIE,構(gòu)建用于預(yù)測零樣本相互作用事件的變體ZetaDDIE (zero-shot scenarios DDIE)。
模型架構(gòu)技術(shù)縱覽
團(tuán)隊首先針對罕見藥物相互作用預(yù)測問題構(gòu)建了以雙粒度結(jié)構(gòu)驅(qū)動(dual-granularity structural adaptation)和配對變分建模(paired variational representation)為核心的模型RareDDIE,模型主要由五個模塊構(gòu)成:特征初始化模塊(FIN)、化學(xué)結(jié)構(gòu)信息提取模塊(CSE)、任務(wù)引導(dǎo)的鄰域自適應(yīng)聚合模塊(NAI)、對變分表示模塊(PVR)、樣本匹配預(yù)測模塊(Comparator)。
具體來說,為了解決前述如何構(gòu)建有效藥物表征的挑戰(zhàn),研究團(tuán)隊提出使用雙粒度結(jié)構(gòu)建模,學(xué)習(xí)從分子到生物網(wǎng)絡(luò)的完整生化功能特征。
在分子結(jié)構(gòu)粒度層面,作者首先將每個分子建模為分子圖,其中原子作為節(jié)點(diǎn)、化學(xué)鍵作為邊,并分別使用理化性質(zhì)初始化節(jié)點(diǎn)和邊的特征。然后基于多層消息傳遞機(jī)制與注意力機(jī)制在分子圖中擴(kuò)散特征信息,最終通過池化層得到具有分子結(jié)構(gòu)信息的表征。
在生物網(wǎng)絡(luò)結(jié)構(gòu)粒度層面,團(tuán)隊首先收集了藥物-靶蛋白相互作用網(wǎng)絡(luò),并使用從生物醫(yī)學(xué)知識圖中無監(jiān)督學(xué)習(xí)提取的先驗特征來初始化該網(wǎng)絡(luò)的節(jié)點(diǎn)和邊,然后同樣基于多層消息傳遞機(jī)制與注意力機(jī)制來學(xué)習(xí)藥物在生物網(wǎng)絡(luò)中的功能信息。
然而,作者指出,僅用這種簡單的方式無法捕捉到不同事件下藥物的特異性生物功能特征。因為在這種設(shè)計下,無論面對哪種事件,藥物對其鄰域蛋白的關(guān)注程度始終是相同的。而實(shí)際相互作用過程中,不同的事件可能源于藥物觸發(fā)了不同的功能機(jī)制,所以藥物對鄰域蛋白的關(guān)注程度應(yīng)隨不同事件而有所區(qū)別。
研究團(tuán)隊為了建模這一過程,進(jìn)一步提出事件引導(dǎo)的鄰域自適應(yīng)聚合模塊。其首先利用成對藥物的分子結(jié)構(gòu)特征計算一個弱關(guān)系類型表征,然后基于該表征計算出當(dāng)前藥物對不同鄰域蛋白的關(guān)注程度,從而以自適應(yīng)的方式捕捉事件特異性的鄰域信息并融合了藥物化學(xué)結(jié)構(gòu)信息,形成雙粒度結(jié)構(gòu)的單藥表征。
在構(gòu)建藥物對特征時,為了避免引入沒有意義的順序信息并構(gòu)建一個具有語義描述的通用關(guān)系度量空間,團(tuán)隊基于自變分編碼器架構(gòu)構(gòu)建了對變分表示模塊,有效的將每對藥物嵌入轉(zhuǎn)換到一般關(guān)系的度量空間中,團(tuán)隊發(fā)現(xiàn)在訓(xùn)練過程中能夠自主形成與預(yù)測事件相關(guān)的潛在語義描述。
最后,編碼基于支持集構(gòu)建的事件代理特征和每個查詢集樣本特征之間的距離關(guān)系,自適應(yīng)計算閾值給出預(yù)測樣本是否會產(chǎn)生該相互作用事件。
除此之外,針對完全未知的DDIE事件,團(tuán)隊進(jìn)一步通過引入大規(guī)模語句嵌入模型和生物語義遷移模塊,提出ZetaDDIE變體模型。由于零樣本事件沒有任何樣本可以用來構(gòu)建作為知識補(bǔ)充的支持集,因此團(tuán)隊使用大規(guī)模語句嵌入模型提取事件的語句描述特征,并以此作為知識補(bǔ)充。
然后基于對抗學(xué)習(xí)結(jié)構(gòu)將該語義嵌入與通用關(guān)系度量空間對齊,從而即使在沒有支持集的情況下,模型依然能夠計算代理特征,并允許僅使用文本描述信息就可以進(jìn)行預(yù)測。
RareDDIE在少樣本和零樣本場景下更優(yōu)
團(tuán)隊將模型與7種基線方法進(jìn)行比較。為了驗證模型預(yù)測效果,分別在常見、少見、罕見事件上進(jìn)行了評估。然后又將訓(xùn)練好的模型不加微調(diào)直接用在獨(dú)立數(shù)據(jù)集上進(jìn)行測試評估。最后在零樣本場景下進(jìn)行了評估。結(jié)果顯示效果幾乎全面超過基線模型。
除此之外,通過分析對比結(jié)果,作者認(rèn)為支持集樣本數(shù)量占比對模型性能具有重要影響,罕見事件中的樣本相比常見事件的樣本更具有代表性。因此對于具有充足數(shù)據(jù)的預(yù)測問題,推薦增加支持集樣本的數(shù)量以促進(jìn)預(yù)測性能,或者直接應(yīng)用監(jiān)督學(xué)習(xí)方法。
遷移藥物互作機(jī)制元知識能促進(jìn)藥物協(xié)同作用預(yù)測
鑒于藥物相互作用和藥物協(xié)同作用都涉及生物系統(tǒng)內(nèi)多個藥物對蛋白質(zhì)網(wǎng)絡(luò)的調(diào)節(jié)過程,研究團(tuán)隊假設(shè)模型學(xué)習(xí)到的DDIE的機(jī)制元知識也可以有效地轉(zhuǎn)移到藥物協(xié)同作用預(yù)測任務(wù)上,并提高預(yù)測準(zhǔn)確性。
為了驗證這一點(diǎn),團(tuán)隊將藥物協(xié)同作用預(yù)測任務(wù)定義為預(yù)測給定的藥物對是否會在特定的細(xì)胞系中表現(xiàn)出協(xié)同作用的任務(wù)(類比藥物相互作用預(yù)測任務(wù):確定給定的藥物對是否會表現(xiàn)出特定事件下的相互作用),并探索了使用遷移學(xué)習(xí)與否對藥物協(xié)同作用預(yù)測的性能影響。
結(jié)果發(fā)現(xiàn),預(yù)測性能上,使用遷移學(xué)習(xí)效果明顯好于從頭學(xué)習(xí)的方式;訓(xùn)練過程上,使用遷移學(xué)習(xí)的收斂速度也明顯優(yōu)于從頭學(xué)習(xí)的方式。
研究團(tuán)隊還探索了基于遷移學(xué)習(xí)的模型與現(xiàn)有的專門針對藥物協(xié)同作用預(yù)測的基線方法之間的性能差異,發(fā)現(xiàn)模型能夠持平甚至優(yōu)于這些方法。并且模型利用支持集樣本數(shù)據(jù)驅(qū)動的細(xì)胞代理特征取代了細(xì)胞的基因表達(dá)數(shù)據(jù),證明了豐富的藥物相互作用元知識的確可以增強(qiáng)藥物協(xié)同作用預(yù)測的效果。
為了進(jìn)一步說明細(xì)胞代理特征的有效性,作者可視化分析了模型預(yù)測器模塊如何利用距離關(guān)系編碼動態(tài)調(diào)整決策邊界,以區(qū)分同一對藥物組合在不同細(xì)胞下的作用情況。
從雙粒度結(jié)構(gòu)中推理機(jī)制元知識
研究結(jié)果表明,RareDDIE模型有效地提取了藥物作用的機(jī)制元知識,能夠?qū)㈩A(yù)測推廣到新事件,并且還可以有效地將這些知識轉(zhuǎn)移到跨域的藥物協(xié)同預(yù)測任務(wù)。
為了進(jìn)一步研究該模型如何構(gòu)建元知識,以解決前述第三個研究挑戰(zhàn),研究團(tuán)隊從三個角度進(jìn)行了分析:生物鄰域角度、分子結(jié)構(gòu)角度和關(guān)系度量空間角度,實(shí)現(xiàn)從生物化學(xué)性質(zhì)到表征意義的模型可解釋性分析。
以一個重要的罕見藥物相互作用事件為研究對象,可視化其生物鄰域背景圖,發(fā)現(xiàn)不同藥物間存在共享的作用基因,暗示它們可能存在功能重疊或共同作用機(jī)制,并通過鄰域打分找到可能與相互作用發(fā)生相關(guān)的重要功能蛋白。
然后通過分子對接等實(shí)驗發(fā)現(xiàn),模型能夠識別與該蛋白質(zhì)作用相關(guān)的關(guān)鍵分子亞結(jié)構(gòu),并且這些亞結(jié)構(gòu)與蛋白質(zhì)結(jié)合位點(diǎn)相對應(yīng)。此外,通過對變分藥物對特征的分析,發(fā)現(xiàn)模型在沒有事件相似性數(shù)據(jù)監(jiān)督的情況下,能夠自動識別相似的DDI事件,并推斷出潛在的醫(yī)學(xué)語義信息。
案例研究
研究團(tuán)隊在預(yù)測嚴(yán)重罕見DDI事件(如抗血小板活性降低)的案例研究中進(jìn)一步驗證了模型的實(shí)際應(yīng)用價值。模型基于非常有限的已知樣本,成功識別出更多能夠產(chǎn)生該相互作用的藥物組合。更重要的是,支持集樣本中僅有兩種與抗血小板功能相關(guān)的藥物,但模型成功識別出更多數(shù)據(jù)集以外的,與抗血小板功能相關(guān)的藥物。
除此之外,研究團(tuán)隊對非小細(xì)胞肺癌藥物協(xié)同預(yù)測展開案例研究,在無細(xì)胞基因表達(dá)數(shù)據(jù)的情況下,利用支持集構(gòu)建的細(xì)胞代理特征,對多個細(xì)胞系的藥物協(xié)同作用進(jìn)行了準(zhǔn)確預(yù)測,充分展示了模型強(qiáng)大的泛化能力。
總結(jié)與展望
RareDDIE的提出為罕見藥物相互作用事件(DDIE)的預(yù)測開辟了新路徑,不僅在少樣本和零樣本場景下展現(xiàn)出優(yōu)越性能,也為藥物協(xié)同預(yù)測和臨床應(yīng)用提供了重要支撐。
通過雙粒度結(jié)構(gòu)驅(qū)動的對變分表示,模型有效解決了藥物表示、事件關(guān)系建模及可解釋性等核心挑戰(zhàn),并利用大規(guī)模語句嵌入模型和生物語義轉(zhuǎn)移模塊擴(kuò)展到零樣本預(yù)測,形成ZetaDDIE。
大規(guī)模實(shí)驗和多角度可解釋性分析表明,該方法能夠自適應(yīng)聚合化學(xué)和生物鄰域信息、捕捉潛在醫(yī)學(xué)語義,并為藥物機(jī)制探索提供新的視角。此外,藥物協(xié)同遷移實(shí)驗和具體案例研究也驗證了RareDDIE在藥物再利用和聯(lián)合療法設(shè)計中的潛在價值。
未來,RareDDIE仍有重要提升空間。例如,可通過更大規(guī)模、降噪優(yōu)化的生物知識圖譜減少信息偏差,或通過引入細(xì)胞系特異分子與表型特征,增強(qiáng)模型在個性化醫(yī)療和多樣化臨床場景中的泛化能力。隨著模型不斷完善,它有望成為藥物安全性評估、個性化治療推薦及新藥開發(fā)中的關(guān)鍵工具,助力實(shí)現(xiàn)更安全、高效的患者護(hù)理與藥物創(chuàng)新。
Ren, Z., Zeng, X., Lao, Y. et al. Predicting rare drug-drug interaction events with dual-granular structure-adaptive and pair variational representation. Nat Commun 16, 3997 (2025).
原文鏈接:https://doi.org/10.1038/s41467-025-59431-9
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.