本文來源:時代商學院 作者:文通
東陽光藥AI研發團隊推出了多個自研創新模型應用于藥物分子ADME/T屬性優化,已涵蓋PK曲線預測和CYPs相互作用預測。近日,團隊發布了基于多任務學習策略的藥物透膜/轉運預測模型,內部數據測試的受試者工作曲線下面積(AUROC)達到0.90,顯著優于公共開源模型。
藥物透膜/轉運預測:高成本稀缺數據與小樣本學習的典型應用場景
圖 1. HEC-Transporters的模型結構。
生物膜和轉運體對小分子藥物的口服吸收產生重要影響。具有合適生物膜滲透性的藥物可被腸道充分吸收從而表現出良好的口服生物利用度;藥物與轉運體的相互作用影響其藥理活性,若藥物作為底物被轉運體外排將導致活性減弱而作為轉運體抑制劑則導致活性提升。Caco2細胞系培養是開展藥物腸道吸收與轉運體相互作用體外實驗的關鍵技術,然而其培養周期長、實驗條件敏感且污染風險高,因此測試成本高昂。使用機器學習方法對專有數據建??煽焖偾业统杀镜仡A測藥物與生物膜及轉運體的相互作用,從而在早期開展藥代動屬性優化。研發團隊對內部Caco2細胞滲透性測試實驗記錄進行了數據抽提及標準化,共獲得包含膜滲透、轉運體底物、轉運體抑制三個任務在內的有效數據,為創新模型構建提供了高質量的專有訓練、驗證數據集。
多任務學習策略:挖掘通用任務特征,實現小樣本泛化建模
HEC-Transporters整體架構如圖1所示,該模型創新性在于使用多任務學習策略進行數據及模型層面的透膜與轉運任務聯合建模。首先,數據被劃分為共享型與特異型,前者樣本分子約占總樣本的80%,在三個任務中均出現,因而用于訓練一個通用的消息傳遞網絡以捕捉分子與生物膜作用的共同結構特征;后者則在各自任務中特異出現,因此分別用于訓練獨立的前饋神經網絡以提升模型在專有任務上的表現。研發團隊將HEC-Transporters與當前先進的自動機器學習建模方法進行了比較研究,內部數據集基準測試結果如圖2所示:多任務學習模型平均AUC高達0.90,較單任務模型提升0.33,較基線模型提升0.19;準確率結果顯示,多任務策略在膜滲透性任務上準確率最高,達到93%,而對轉運體底物預測提升效果最佳,較單任務模型提升18.0%,較自動化機器學習模型提升12.2%。
圖 2.HEC-Transporters的模型性能。
(A)曲線下面積;(B)準確率。
技術創新與應用價值
HEC-Transporters是國際上首款使用多任務學習策略建模藥物透膜/轉運的預測系統,其不僅使用參數共享的消息傳遞網絡捕捉通用任務特征以提升性能,而且緩解了專有任務數據量較小的建模局限,相較于自動機器學習和單任務網絡在內部數據上表現出較高的泛化性能。該模型目前已集成于團隊自研ADME/T預測工作流之中,為東陽光藥早期藥物研發提供全流程的藥代動力學性質優化。
研發范式革新:自2023年實施AI+戰略以來,東陽光藥已構建覆蓋靶點預測、苗頭化合物篩選、先導化合物優化、PK建模的全流程AI研發體系。通過AI賦能研發,既降低了新藥開發成本,又以技術協同推動行業整體效能提升,助力中國醫藥產業在全球競爭中搶占創新制高點。
關于東陽光藥
東陽光藥創立于2003年,是一家以自主研發為驅動、植根中國、面向世界的綜合型制藥公司。東陽光藥為全球患者提供創新、優質及可負擔的藥物,以成為世界一流的制藥公司為企業愿景。20多年來,公司堅持“創新”和“國際化”發展戰略,已建成國內領先的藥物研發平臺、符合國際標準的生產設施和覆蓋全球的銷售網絡。公司戰略性聚焦兒童藥、感染、慢病及腫瘤等治療領域,在全球擁有150款獲批藥物,超過100款在研藥物,包括近50款一類創新藥,逐步發展成為中國生物醫藥領軍企業之一。公司連續7年入選由藥智網發布的“中國藥品研發綜合實力排行榜”TOP20,蟬聯“2023中國醫藥創新企業100強”第一梯級,其中專利數位居“2022年全球生物醫藥產業發明專利排行榜TOP 100”全球第44位,中國第4位。根據弗若斯特沙利文報告,以2014年1月1日至2023年12月31日在中國公布的專利數量及授權專利公告數量統計,東陽光藥在中國制藥公司中排名第一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.