本文來源:時代商學院 作者:文通
東陽光藥AI研發(fā)團隊推出了多個自研創(chuàng)新模型應用于藥物分子ADME/T屬性優(yōu)化,已涵蓋PK曲線預測和CYPs相互作用預測。近日,團隊發(fā)布了基于多任務學習策略的藥物透膜/轉運預測模型,內部數(shù)據(jù)測試的受試者工作曲線下面積(AUROC)達到0.90,顯著優(yōu)于公共開源模型。
藥物透膜/轉運預測:高成本稀缺數(shù)據(jù)與小樣本學習的典型應用場景
圖 1. HEC-Transporters的模型結構。
生物膜和轉運體對小分子藥物的口服吸收產生重要影響。具有合適生物膜滲透性的藥物可被腸道充分吸收從而表現(xiàn)出良好的口服生物利用度;藥物與轉運體的相互作用影響其藥理活性,若藥物作為底物被轉運體外排將導致活性減弱而作為轉運體抑制劑則導致活性提升。Caco2細胞系培養(yǎng)是開展藥物腸道吸收與轉運體相互作用體外實驗的關鍵技術,然而其培養(yǎng)周期長、實驗條件敏感且污染風險高,因此測試成本高昂。使用機器學習方法對專有數(shù)據(jù)建??煽焖偾业统杀镜仡A測藥物與生物膜及轉運體的相互作用,從而在早期開展藥代動屬性優(yōu)化。研發(fā)團隊對內部Caco2細胞滲透性測試實驗記錄進行了數(shù)據(jù)抽提及標準化,共獲得包含膜滲透、轉運體底物、轉運體抑制三個任務在內的有效數(shù)據(jù),為創(chuàng)新模型構建提供了高質量的專有訓練、驗證數(shù)據(jù)集。
多任務學習策略:挖掘通用任務特征,實現(xiàn)小樣本泛化建模
HEC-Transporters整體架構如圖1所示,該模型創(chuàng)新性在于使用多任務學習策略進行數(shù)據(jù)及模型層面的透膜與轉運任務聯(lián)合建模。首先,數(shù)據(jù)被劃分為共享型與特異型,前者樣本分子約占總樣本的80%,在三個任務中均出現(xiàn),因而用于訓練一個通用的消息傳遞網(wǎng)絡以捕捉分子與生物膜作用的共同結構特征;后者則在各自任務中特異出現(xiàn),因此分別用于訓練獨立的前饋神經(jīng)網(wǎng)絡以提升模型在專有任務上的表現(xiàn)。研發(fā)團隊將HEC-Transporters與當前先進的自動機器學習建模方法進行了比較研究,內部數(shù)據(jù)集基準測試結果如圖2所示:多任務學習模型平均AUC高達0.90,較單任務模型提升0.33,較基線模型提升0.19;準確率結果顯示,多任務策略在膜滲透性任務上準確率最高,達到93%,而對轉運體底物預測提升效果最佳,較單任務模型提升18.0%,較自動化機器學習模型提升12.2%。
圖 2.HEC-Transporters的模型性能。
(A)曲線下面積;(B)準確率。
技術創(chuàng)新與應用價值
HEC-Transporters是國際上首款使用多任務學習策略建模藥物透膜/轉運的預測系統(tǒng),其不僅使用參數(shù)共享的消息傳遞網(wǎng)絡捕捉通用任務特征以提升性能,而且緩解了專有任務數(shù)據(jù)量較小的建模局限,相較于自動機器學習和單任務網(wǎng)絡在內部數(shù)據(jù)上表現(xiàn)出較高的泛化性能。該模型目前已集成于團隊自研ADME/T預測工作流之中,為東陽光藥早期藥物研發(fā)提供全流程的藥代動力學性質優(yōu)化。
研發(fā)范式革新:自2023年實施AI+戰(zhàn)略以來,東陽光藥已構建覆蓋靶點預測、苗頭化合物篩選、先導化合物優(yōu)化、PK建模的全流程AI研發(fā)體系。通過AI賦能研發(fā),既降低了新藥開發(fā)成本,又以技術協(xié)同推動行業(yè)整體效能提升,助力中國醫(yī)藥產業(yè)在全球競爭中搶占創(chuàng)新制高點。
關于東陽光藥
東陽光藥創(chuàng)立于2003年,是一家以自主研發(fā)為驅動、植根中國、面向世界的綜合型制藥公司。東陽光藥為全球患者提供創(chuàng)新、優(yōu)質及可負擔的藥物,以成為世界一流的制藥公司為企業(yè)愿景。20多年來,公司堅持“創(chuàng)新”和“國際化”發(fā)展戰(zhàn)略,已建成國內領先的藥物研發(fā)平臺、符合國際標準的生產設施和覆蓋全球的銷售網(wǎng)絡。公司戰(zhàn)略性聚焦兒童藥、感染、慢病及腫瘤等治療領域,在全球擁有150款獲批藥物,超過100款在研藥物,包括近50款一類創(chuàng)新藥,逐步發(fā)展成為中國生物醫(yī)藥領軍企業(yè)之一。公司連續(xù)7年入選由藥智網(wǎng)發(fā)布的“中國藥品研發(fā)綜合實力排行榜”TOP20,蟬聯(lián)“2023中國醫(yī)藥創(chuàng)新企業(yè)100強”第一梯級,其中專利數(shù)位居“2022年全球生物醫(yī)藥產業(yè)發(fā)明專利排行榜TOP 100”全球第44位,中國第4位。根據(jù)弗若斯特沙利文報告,以2014年1月1日至2023年12月31日在中國公布的專利數(shù)量及授權專利公告數(shù)量統(tǒng)計,東陽光藥在中國制藥公司中排名第一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.