當前,AI正以前所未有的速度席卷全球,醫療是這波浪潮中最耀眼的明星。
被譽為“女版巴菲特”的Cathie Wood(木頭姐)發布的報告中提到,醫療保健是AI最被低估的應用領域,引發市場的強烈討論,海內外AI醫療股暴漲。
當AI最終將深度重塑醫療行業,什么樣的企業能夠在這場變革中真正受益?
近期一個明顯的趨勢是,跨國藥企們,正成批從中國AI制藥身上尋找未來。
技術上,6月30日,晶泰科技宣布與輝瑞擴大戰略合作,基于已有的研發成果,共同開發全新一代的分子模擬平臺以驅動新藥研發,以應對輝瑞快速拓展的小分子化學空間與持續升級的研發需求。
管線資產上,同月,石藥集團宣布已與阿斯利康訂立戰略研發合作協議,利用其AI引擎雙輪驅動的高效藥物發現平臺,開發新型口服小分子候選藥物,總交易金額超過53億美元。
跨國藥企的真金白銀,代表了國際對中國AI制藥技術實力與管線價值上的認可,有力印證了本土企業在AI藥物研發領域的落地能力與創新價值。
而觀察上述合作不難發現,巨頭青睞的并非僅僅是AI能力,而是出色的實際成果,這背后是圍繞數據積累、臨床轉化、團隊背景等要素的綜合優勢。
AI技術正在深度變革生物醫藥,而中國AI制藥之所以成為跨國藥企爭相合作的對象,標志著一個以新技術為代表、重新定價中國創新的藥物研發時代或許已經掀起帷幕。
AI+生物醫藥,數據成為最大瓶頸
一個顯而易見的事實是,當下模型的性能瓶頸在于數據,高質量的海量數據在制藥和醫療尤為稀缺。
一方面,獲取高質量的生物醫學數據需要更高的成本和門檻。另一方面,有價值的數據往往分散在各個機構和企業中,形成了嚴重的“孤島”現象。
正如Recursion聯合創始人兼CEO所說:“要構建生物學中的基礎模型,需要大量高質量的數據。除了少數問題(例如蛋白質折疊)之外,這些數據目前不存在于公共領域”。
尤其是,Evo2的橫空出世,標志著AI生命科學領域已經進入了大模型時代,對高質量數據的需求日益增長。
然而,目前學術界可用的公開訓練集體量極為有限。對新化學空間的覆蓋精度不夠且迭代周期長;以PDB為代表的公共數據庫則存在規模增長速率停滯、多樣性匱乏等局限;廣泛被購買的同質化的數據庫,更難拉開算法的差距,難以催生出獨具創新性的分子。
木頭姐重倉的TempusAI,就是一家深耕AI醫療數據的公司,核心投資邏輯在于,其擁有目前世界上最大、最全面的癌癥患者分子數據庫,包含250PB多模態數據。
此前Nature發表的文章指出,為了應對AlphaFold在公開蛋白質數據上的不足,艾伯維、賽諾菲、強生、武田多家制藥巨頭合作利用內部專有數據開發私有AI模型,以提升藥物研發能力。
Nature發文:大型制藥公司正在構建私有數據
如何解決數據挑戰已成為AI賦能生物醫藥的關鍵。為此,一些代表企業正在積極探索解決方案。從長遠來看,生物醫藥的智能化進程背后,一場圍繞數據進行的深刻變革正在徐徐展開。
盡管中國生物科技產業起步較晚,導致數據曾是巨大短板,但這也催生了一系列創新性的數據策略。
面向未來,中國因其工業體量的龐大,仍然有機會在專業領域數據中積累出優勢,推動AI應用在全球范圍內率先實現“從量變到質變”,釋放巨大發展潛力。
誰能更早解決數據挑戰,帶來標桿解決方案,誰便更有機會兌現 AI 在醫藥領域的價值和想象空間。
路徑一:量子物理+AI,打破數據桎梏
傳統機器學習方法高度依賴歷史實驗數據,但在小分子藥物發現中,可用的高質量數據難以獲得,且覆蓋的化學空間極為有限。
學術界和產業界不僅需要更高精度的預測,還需要更經濟高效的研發方法。
面對這一數據困境,經典的計算化學、量子物理方法,仍然占據市場主導,只需要知道分子的基本結構就可以進行預測,為數據“拓荒”邁出第一步。
量子計算賦能生命科學
這套經典方法,曾一度將全球第一家計算藥物研發上市公司送上70億美元市值。薛定諤(Schrodinger)推出了一系列的量子物理、計算化學創新算法工具,廣泛受到制藥產業信賴,已經成為市場的主流選擇。
其拳頭產品,FEP(自由能微擾)技術尤其具有代表性,其價值已在頂級藥企的重磅交易中得到驗證。
FEP計算在藥物研發中有非常重要的地位,能實現對活性、選擇性、耐藥性、穩定性等關鍵藥物候選指標的高精度預測。該技術可以直接生成高精度的研發數據,解決新靶點、新體系無初始數據的挑戰;還能顯著減少進入實驗階段的化合物數量,從而節省大量的時間和資源。
2022年末,武田制藥以高達60億美元的交易總額引進TYK2抑制劑NDI-034858,預付款為40億美元,引發了行業的巨大震動。其核心價值不僅在于藥物本身潛力,它還是藥物發現歷史上首個大規模成功應用先進自由能微擾計算技術(FEP+)的里程碑項目,也驗證了計算驅動藥物研發的廣闊前景。
該項目基于薛定諤的FEP+技術,通過模擬分子間的原子級相互作用,從4000個可能的活性虛擬化合物中,精準地篩選出僅46個最有希望的分子進行實際合成,最終得到9個指標優秀的分子,極大縮短了研發進程,精確篩選出最有潛力的分子。這個案例也成為基于第一性原理的研發方法在產業價值與重要性的最有利佐證。
薛定諤使用FEP+設計和篩選靶向TYK2的化合物
再看最近的中國案例,晶泰科技自2018年與輝瑞簽約的戰略合作后,再次拿到輝瑞的研發訂單,以AI+量子物理來打造新一代藥物模擬平臺,與經典方法一爭高下。
根據晶泰與輝瑞在2024年初聯合發布的論文展示,兩家共研的XFF與XFEP平臺自有底氣,對標市場占有率第一的FEP 算法,XFEP仍展現出更加優越的性能、通量和化學空間覆蓋。
這也意味著,輝瑞在晶泰的賦能之下,能比同行更精確地預測關鍵成藥性質。同時,晶泰科技AI+物理模型的解決方案可以讓輝瑞以更低的成本、在研發更早期用上更加精確的預測工具,兼顧精度與泛化能力這樣傳統上“魚與熊掌不可兼得”的重要指標,因此贏得輝瑞的研發復購。
此外,晶泰還將為輝瑞本地化部署XFEP平臺,提供從參數定制到FEP計算的全流程支持。這種深度集成使輝瑞科學家能直接應用高精度工具,減少外部依賴,提升研發敏捷性。
來自制藥大廠的驗證與堅定買單也展示著,量子物理+AI算法的深入融合是大藥企真金白銀選擇的發展方向,為破局藥物研發數據瓶頸邁出關鍵一步。
路徑二:自動化實驗室破局數據難題
盡管,物理學模型通過先驗知識降低對數據量的需求,減少算法黑箱問題,擴大了分子搜索空間,但依舊沒能繞開數據供給的根本問題。
數據供給不足的背后,是傳統實驗方式的桎梏。科學家在近乎兩個世紀未曾根本改變的實驗環境下,依靠繁瑣的手工操作,不僅效率低下,更無法避免人為失誤帶來的誤差,嚴重影響著數據的可靠性與研發的效率。蘊含大量噪音、難以重現的人類實驗數據,無法直接滿足AI模型訓練的高質量需求。
面對手工實驗的諸多弊端,自動化實驗室帶來了立竿見影的效果,以藥物研發DMTA(Design、Make、Test、Analyze)流程為例,人工方法每一輪大約需要一名化學家花費3到6周的時間,而自動化實驗室將這一過程縮短到3到10天。
阿斯利康于2017年啟動iLab項目,這個全自動藥物化學實驗室成立之初的愿景是將識別藥物候選物的效率提升50%,目前iLab可以實現DMTA的完全自動化。
行至當下,機器人和AI的興起讓自動化實驗室進入新的發展階段,自動化實驗室不再僅僅是一個獨立工具,而是成為驅動整個研發流程的關鍵基礎設施。
在Nature盤點的2025年值得關注的全球七大突破性技術中,「自動駕駛實驗室」在列,文章指出:自動化實驗室結合現代機器人和 AI 算法,能夠規劃和執行復雜的高通量實驗,極大地拓展了化學研究的邊界。
木頭姐的《Big Ideas 2025》也指出,「自動駕駛實驗室」正在使用可擴展生物學和人工智能來徹底改變藥物發現。
在一些關鍵領域,如化合物合成,這是整個藥物研發過程中最耗時及代價最高的部分之一,應用了AI和機器人技術的自動化濕實驗室,能夠實現可擴展、靈活、多項目、更快且更具成本效益的執行流程。
2024年1月,荷蘭阿姆斯特丹大學團隊在Science發文,他們開發了一個名為“RoboChem”的自主化學合成AI機器人,能夠在一周之內優化合成 10-20 個分子,而這項任務此前需要一個博士生花費幾個月來完成。
RoboChem
更重要的是,自動化實驗正成為AI科學研發范式中承擔起數據收集重任的關鍵基礎設施。AI 指導下的機器人技術,將以更精確、更高效、可擴展的方式提供穩定可重現的實驗數據,并進一步提供有價值的見解并支持數據驅動的決策,推動自動化實驗室邁向智慧化階段。
一些前沿企業,如Recursion和晶泰科技,正在大力投資基于AI和機器人的自動化實驗室設施以大規模獲取獨特的生物數據和見解。
Recursion的自動化高通量實驗室每周最多可以處理超過220萬個樣本,公司在表型組學、轉錄組學、蛋白質組學等領域生成了約36 PB的專有數據。
晶泰科技則在深圳、上海、波士頓建有超過10000平方米機器人實驗室,部署超200臺自動化工作站,每月積累20+萬條反應過程數據,收集效率是傳統數據收集方式的40倍;一次構建的AI 預測算法已經超越人類科學家,可以對 DMTA 周期中的關鍵環節更準確的預測,供人類科學家決策。
晶泰科技自動化實驗平臺
這些新型自動化設施的意義不僅在于提高實驗流程效率和質量,而且還通過生成和分析真實世界實驗數據來訓練和改進AI模型。從中產生的大規模、高質量的結構化數據,為形成包含感知、生成、預測、決策、計劃和執行的閉環大模型提供了基礎,對算法的迭代、化合物篩選以及工藝優化至關重要。
更進一步地,以“AI+機器人” 的深度融合為支點,自動化實驗平臺加速算法從經驗學習向因果推理進化,為智能時代的科研范式提供基礎。
生命科學進入AI時代,誕生新“賣水人”
生命科學的旺盛的研發需求決定,數據的生產和整合只是第一步。
在靶點發現、化合物篩選、分子合成等核心環節,單純的數據積累已無法滿足創新需求,行業焦點在于深度解析數據與預測能力。
換句話說,藥企公司更看重有價值的洞察。因此,高質量數據深度整合領域知識,對于打造垂直領域AI for Life Science模型而言不可或缺。
從通用AI領域的樣本來看,掌握數據這一核心環節后,圍繞數據構建服務和壁壘則是企業發展的必經之路。
例如Scale AI,公司從自動駕駛數據標注業務切入,逐步構建起涵蓋數據標記與管理、模型訓練與評估,以及AI應用開發與部署的全鏈條解決方案,最終拿下OpenAI、微軟、谷歌、Meta等關鍵客戶,晉升為大模型“賣水人”。
近日,Meta同意以約140億美元收購Scale AI 49%的股份,足以證明數據在AI時代的關鍵價值。
生命科學領域,類似Scale AI的新型數據基建正迎來爆發機遇。其關鍵價值在于:通過自動化實驗室產生高純度結構化數據,形成跨藥物發現、精準醫療、合成生物學的多模態引擎,并最終轉化為研發效率優勢。
例如Recursion通過自動化積累了超過50PB的生物、化學和患者數據庫,開發了多款可加速藥物發現AI 模型。Phenom-1作為35億張細胞圖像訓練而來,用來尋找治療癌癥的分子。
AI加持下,Recursion正在快于行業平均速度將藥物分子推進至臨床。同時公司還和拜耳、羅氏等跨國藥企合作開發新藥,足以證明其數據驅動平臺的有效價值創造。
晶泰科技則依托自動化實驗室產生的PB級標準化數據,構建了超200個垂直AI模型矩陣,包括分子生成、靶標可開發性研究、分子性質預測、合成策略、晶型篩選等環節。
同樣,模型預測精度越高,晶泰進而吸引更多合作伙伴,其反饋也在改進濕實驗,再以實驗結果反哺模型優化,形成指數級增強的循環進化。
2024年,晶泰科技總收入達到2.66億元,首次達成港交所對商業化公司的收入門檻(2.5億港元),營收指標是公司商業化的最有效的證明,昭示晶泰進入規模化發展階段。
AI正在重塑生命科學行業的價值鏈條,從"人工經驗"進化到"數據智能",Recursion、晶泰科技等先行者已提前實現生態占位,重要性日益凸顯。
當前AI正以驚人的速度發展,生物醫藥正在迎來歷史性機遇。然而相關數據的稀缺,成為橫亙在技術理想與落地應用之間的關鍵障礙。
對此,晶泰科技勾勒出一條破局之路:打造可解釋的物理+AI+機器人引擎,一方面卷底層物理學算法,在藥企的內部需求推動下持續升級高精度物理模擬方法,降低數據依賴與訓練門檻;另一方面將實驗室轉化為數據礦山,在廣泛的藥企合作中持續高通量產出高精度、可重復的領域數據,解決AI 發展的瓶頸問題。
這一實踐代表生命科學正加速擺脫傳統路徑的束縛,一個由數據和計算驅動的更理性、更高效、更精準的研發范式正在到來。
—The End—
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.