原文發表于《科技導報》2025年第12 期 《 人工智能驅動藥物研發進展 》
藥物研發作為現代醫藥產業的核心驅動力,面臨傳統模式“高投入、長周期、低產出”的困境,亟需突破以應對日益復雜的健康需求。人工智能(AI)技術的快速發展為藥物研發帶來了革命性變革。《科技導報》邀請中國科學院上海藥物研究所相關領域專家撰寫此文,文章通過全面剖析AI賦能藥物研發的現狀與問題,為加速新藥創制、提升人類健康福祉提供了科學視角與思考啟示,提供了關于AI賦能藥物研發領域科技問題的全面視角,并激發了對未來發展方向的思考,以期促進AI技術在藥物研發領域的更有效應用,加速新藥創制進程,最終惠及人類健康。
藥物研發是支撐現代醫藥產業發展的核心驅動力,是應對人類疾病挑戰的關鍵環節。然而,傳統的藥物研發模式高投入、長周期、低產出,嚴重制約了新藥的產出。近年來,人工智能(artificial intelligence,AI)技術的發展為破解上述困境帶來了曙光。AI憑借其卓越的數據處理能力、模式識別能力以及泛化預測能力,在藥物研發的各個環節都展現出了巨大的應用潛力。
我們深入分析了AI驅動藥物研發關鍵領域的國內外發展現狀、最新研究成果、現存問題和未來發展方向,力求提供關于AI賦能藥物研發領域科技問題的全面視角,以期促進AI技術在藥物研發領域的更有效應用(圖1)。
圖1 AI技術應用于藥物研發的重點領域
1 AI驅動蛋白質結構預測:
AlphaFold3的突破與應用
蛋白質是生命活動的功能執行者。精確的蛋白質結構是解析疾病機制、設計靶向藥物的基礎。AlphaFold3等AI模型的出現,提高了蛋白質結構預測的精度和速度,被認為是加速藥物發現的關鍵技術。
1.1
AI在蛋白質結構預測中的應用
DeepMind公司開發的AlphaFold系列模型是AI驅動蛋白質結構預測領域的里程碑式突破。2024年,DeepMind發布了AlphaFold3,進一步拓展了結構預測的能力。AlphaFold3不僅能夠預測蛋白質的三維結構,還能預測包括脫氧核糖核酸(DNA)、核糖核酸(RNA)、配體以及修飾在內的生物分子復合物的結構。AlphaFold3在多個評估指標上超越AlphaFold2,尤其是在預測蛋白質?配體等復合物結構方面取得了0到1的突破。除了AlphaFold系列模型,蛋白質結構預測領域還涌現出多種高性能模型,包括Chai,Boltz和Protenix系列模型等。
1.2
結構預測工具在藥物研發中的最新研究成果
首先,在靶點發現與驗證方面,AlphaFold3能夠幫助研究人員快速獲取與疾病相關的蛋白質結構模型。
在虛擬篩選與先導化合物發現方面,AlphaFold3同樣展現了巨大價值。研究人員可以利用AlphaFold3預測的結構來進行篩選。
抗體藥物設計是另一個受益匪淺的領域。AlphaFold3能預測抗體?抗原復合物結構,讓研究人員得以深入理解抗體與抗原的結合機制,并據此初步指導抗體的序列優化、親和力成熟以及人源化改造。
此外,AlphaFold3在酶工程與蛋白質藥物設計中也可以應用。它不僅能預測天然蛋白質的結構,還能用于分析工程化改造后的蛋白質結構。
1.3
AlphaFold3的局限性與挑戰
對于結構復雜的蛋白質,其預測精度可能無法保證。此外,AlphaFold3目前在預測蛋白質的動態行為和構象變化方面能力有限。計算資源需求高是另一個顯著挑戰。結構預測結果的驗證也很重要。AlphaFold3給出的結構只是理論預測,依然需要通過實驗方法加以確認。作為藥物研發的第一步,預測結果只是起點。
2 AI驅動蛋白質設計:
從結構預測到功能創新
AI技術通過深度學習和生成模型,能夠快速生成具有目標功能的蛋白質序列。在AI技術推動下,蛋白質設計正從傳統設計和定向進化邁向高效、智能化的新階段。
2.1
AI在蛋白質設計中的應用
AI在蛋白質設計中的核心優勢在于能夠結合序列生成、結構預測和功能優化,顯著提升效率和成功率,圖2描述AI在蛋白質設計中的常見應用場景。
圖2 AI在蛋白質設計中的應用場景
首先,在序列生成與優化方面,AI通過逆向設計技術,可以從目標結構出發生成相應序列,使用生成模型也可以快速設計具有目標功能的蛋白質序列。
其次,在結構導向的設計方面,AI利用蛋白質結構預測的突破進一步推動了設計能力。
在功能預測與驗證方面,AI模型能夠評估蛋白質的潛在功能,或優化已有蛋白質的功能。
2.2
AI驅動蛋白質設計的成果與挑戰
近年來,AI在蛋白質設計領域取得了顯著進展。David Baker團隊開發的RFdiffusion模型已成功設計出多種新型蛋白質,包括高效催化酶和具有特定結合能力的蛋白質分子。在工業應用方面,AI驅動的蛋白質設計平臺正逐步成熟。AI驅動蛋白質設計面臨的挑戰主要有:
首先,數據依賴性是主要瓶頸。AI模型的性能高度依賴于高質量的訓練數據。然而,當前的實驗數據不夠多樣,這可能導致在新穎蛋白設計時表現下降。
其次,功能預測的準確性仍需提升。此外,實驗成本的高昂是另一大制約因素。這使AI驅動蛋白質設計的廣泛應用受到一定限制。
3 AI賦能抗體藥物設計:
應用加速研發進程,提升藥物療效
AI技術在抗體序列優化、人源化改造、親和力成熟和新型抗體設計等方面的應用,有望加速抗體藥物的研發進程,提高抗體藥物的療效和安全性。
3.1
AI在抗體藥物設計中的應用
首先,在抗體序列優化方面,AI能夠提升抗體療效并降低免疫原性。抗體親和力成熟是另一個AI發揮作用的領域。AI技術可以通過機器學習模型,根據抗體序列和親和力數據預測最佳突變位點和組合,指導定向進化實驗,從而提升親和力成熟的效率和成功率。
在新型抗體設計方面,生成對抗網絡通過生成器和判別器的對抗訓練學習真實數據分布,生成器可從隨機噪聲中采樣并輸出新的抗體序列,從而實現抗體設計的多樣性。近年來興起的擴散模型(diffusion models)通過逐步去噪生成蛋白質三維結構,已被用于精確設計抗體骨架和優化CDR區結構,從而提高抗體與抗原結合的空間匹配度。抗體可開發性預測也是AI的重要應用方向。AI模型通過學習序列與可開發性間的關系,能在早期階段預測這些特性,排除問題分子。
為便于系統比較不同AI模型在抗體藥物設計中的應用特征、技術機制與代表性成果,表1總結了擴散模型、圖神經網絡、生成模型與語言模型的核心原理、主要應用環節、優勢。
表1 AI模型在抗體藥物設計中的應用對比
3.2
AI驅動抗體藥物設計的成果與挑戰
近年來,AI在抗體藥物設計領域的進展令人矚目。其中,Mason等開發的一種端到端序列優化方法,顯示出AI在高通量抗體篩選中的強大能力。在抗體親和力成熟方面,研究人員開發了多種AI驅動技術。這些技術為傳統實驗方法提供了強有力的補充。AI輔助的新型抗體發現平臺也層出不窮。基于生成模型或圖神經網絡的設計平臺能夠生成具有新穎結構和功能的抗體分子,為抗體藥物研發注入更多可能性。在抗體可開發性預測方面,AI工具同樣取得了突破。AI驅動抗體藥物設計面臨的挑戰主要有:
數據質量和數據量是首要挑戰。AI模型依賴大量高質量數據,雖然抗體序列的數據量較大,但其親和力數據相對稀缺,且質量不一。
模型可解釋性也是一個關鍵問題。在抗體藥物設計中,開發更具可解釋性的AI抗體藥物設計模型,從而更具有專家思維地開發抗體,是亟待解決的方向。
實驗驗證的瓶頸同樣不可忽視。開發高效、高通量的實驗驗證方法,并將AI與自動化實驗平臺整合,將是提升抗體設計效率的關鍵。
4 AI助力小分子藥物設計:
加速發現、優化性質、提高效率
小分子藥物是藥物研發領域的核心力量,占據了藥物市場的絕大部分份額。AI技術在小分子藥物的靶點識別、虛擬篩選、先導化合物優化,以及藥物的吸收(absorption)、分布(distribution)、代謝(metabolism)、排泄(excretion)和毒性(toxicity)——即ADMET性質預測等方面,正發揮著日益重要的作用。
4.1
AI在小分子藥物設計中的應用
在靶點識別與驗證方面,AI能夠分析海量生物學數據,包括基因組、轉錄組、蛋白質組和代謝組數據,找出已知產生藥效的小分子的潛在靶點,并評估其可藥性。
虛擬篩選與先導化合物發現是AI的另一大用武之地。AI模型通過學習化合物的結構和活性數據,可以構建更精準的預測模型,加速先導化合物發現;生成模型則能基于口袋設計全新化合物,拓寬候選分子來源。
先導化合物優化同樣受益于AI。先導化合物往往存在活性不足、選擇性差或ADMET性質不佳等問題。AI模型能夠預測這些特性,指導結構修飾,提升成藥性。
小分子藥物的合成路線設計也因AI而更高效。AI可以預測反應產率和選擇性,優化路線。
4.2
AI驅動小分子藥物設計的成果與挑戰
基于深度學習虛擬篩選平臺,如Atomwise和Exscientia可以預測化合物活性,已在多個項目中加速了先導化合物發現。AI驅動的先導化合物優化技術也不斷突破。基于生成模型和強化學習的方法能夠高效探索化合物結構空間,顯著提升成功率。AI驅動的藥物性質預測工具同樣快速發展。基于機器學習的ADMET預測模型和深度學習的毒性預測模型,幫助研究人員在早期評估藥物潛力,提高成藥性。AI驅動小分子藥物設計面臨的挑戰主要有:
數據質量和偏差是首要問題。小分子藥物的活性與性質數據常存在分布不均、標注錯誤等問題,影響模型性能。
模型的泛化能力和魯棒性也有待提升。AI模型在訓練數據上表現良好,但在新數據集上可能失靈,數據集的偏差可能導致模型高性能表現實際上反映了數據偏差,而非物理原理的成功泛化。
模型可解釋性不足也限制了應用。AI預測結果常難以解釋,而在藥物設計中,理解化學和生物學機制至關重要。
化學空間探索的局限性也不容忽視。AI基于已知數據生成化合物,可能局限于現有化學空間。
5 AI驅動藥物研發的未來展望
未來,AI將在藥物研發中扮演更加核心的角色,改變傳統研發范式,加速新藥發現,降低成本,提升成功率,最終造福人類健康,表2總結了目前AI藥物研發的挑戰和進展。
表2 AI驅動藥物研發進展與挑戰總結
5.1
蛋白質結構預測工具的未來發展方向
首先是提高預測精度,可以結合生物學領域內的知識與大語言模型,進一步提升其對復雜蛋白質和生物分子復合物的預測能力。
降低計算資源需求并提升計算效率也是重要方向。通過優化算法和模型,未來的AlphaFold3有望在更普通的計算設備上運行,從而惠及更多研究者。
開發用戶友好的工具和平臺是另一個趨勢。可以推出在線的結構預測平臺、可視化工具以及與其他藥物研發軟件的集成接口,讓非專業用戶也能輕松上手,推動技術普及。
5.2
AI驅動蛋白質設計的未來發展方向
首先,多模態數據整合是提升設計能力的重要途徑。未來的AI模型需要超越單一的序列或結構數據,整合動態變化和細胞層面的多維度信息,以更全面地理解蛋白質的行為。
其次,動態行為預測將成為研究的重點方向。未來的AI工具可能通過結合分子動力學模擬或構象生成模型,預測蛋白質的實時相互作用。
此外,自動化設計平臺的開發將顯著推動技術普及應用。
最后,與抗體藥物設計的協同創新是未來發展的重要趨勢。
5.3
AI驅動抗體藥物設計的未來發展方向
可解釋AI與因果推斷是一個重要方向。未來的研究將致力于開發更透明的模型,并結合因果推斷方法,揭示抗體序列與功能之間的深層關系,為設計提供更可靠的理論支持。
AI驅動的自動化抗體研發平臺也將成為趨勢。通過實現設計、合成、測試和優化的全流程自動化,研發速度將大幅提升。
5.4
AI驅動小分子藥物設計的未來發展方向
通過整合化合物結構、性質、活性及靶點疾病信息,研究者將構建更全面的網絡藥理學模型,從而提升設計精度。發展基于知識的AI模型也是可行的方向。將化學和生物學知識融入模型,如規則系統或知識圖譜,能提高可解釋性和決策支持能力。AI驅動的自動化藥物合成平臺將進一步加速研發。通過集成路線設計、反應優化和自動化合成,整個流程將實現智能化,大幅縮短周期。個性化小分子藥物設計是未來的亮點。結合基因組學、蛋白質組學和代謝組學數據,AI也有可能為不同患者定制藥物,提供更精準的治療方案。
5.5
AI時代下的藥物研發展望
在AI輔助中,藥物研發將更依賴多學科交叉融合,AI技術將與生物學、化學、藥學、醫學和工程學深度結合,構建智能化研發平臺。
圖3 AI在未來藥物設計中可能扮演的角色
隨著個性化醫療技術的進步,AI將助力精準藥物研發,通過分析患者個體化的基因組和臨床數據,預測疾病風險和藥物反應,設計個性化治療方案,實現更精準的治療效果(圖3)。此外,自動化和智能化將成為藥物研發的主流趨勢,高通量篩選、機器人化學合成與AI設計平臺的協同工作,將使研發全流程實現自動化,大幅縮短研發周期,讓藥物研發最終進入一個全新階段。
本文作者:何欣恒,高斯涵,李俊睿,徐華強
作者簡介:何欣恒,中國科學院上海藥物研究所,博士研究生,研究方向為計算生物學與結構生物學;高斯涵,中國科學院上海藥物研究所,實習生,研究方向為計算生物學;李俊睿,中國科學院上海藥物研究所,助理研究員,研究方向為計算生物學;徐華強(通信作者),中國科學院上海藥物研究所,研究員,研究方向為結構生物學與藥物發展。
文章來 源 : 何欣恒, 高斯涵, 李俊睿, 等. 人工智能驅動藥物研發進展[J]. 科技導報, 2025, 43(12): 29?37 .
內容為【科技導報】公眾號原創,歡迎轉載
白名單回復后臺「轉載」
《科技導報》創刊于1980年,中國科協學術會刊,主要刊登科學前沿和技術熱點領域突破性的研究成果、權威性的科學評論、引領性的高端綜述,發表促進經濟社會發展、完善科技管理、優化科研環境、培育科學文化、促進科技創新和科技成果轉化的決策咨詢建議。常設欄目有院士卷首語、科技新聞、科技評論、專稿專題、綜述、論文、政策建議、科技人文等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.