作為典型的依賴于行業know-how(專業技能)、市場價值巨大的行業,醫療一直是AI公司們試圖顛覆的領域,這一趨勢在當前大模型浪潮下表現得尤為顯著。
OpenAI、Anthropic、谷歌等巨頭都將醫療視為重要落地領域,不久前,月之暗面被曝正在布局AI醫療產品,成為繼百川智能之后又一押注醫療的大模型六小龍。
如果我們認同這樣一個基本判斷:大模型最終會通向AGI并深度重塑醫療行業,那么什么樣的企業能夠在這場變革中真正受益?
答案將是那些掌握數據的企業,AI在制藥/醫療領域的核心競爭力正在從算法本身轉向高質量數據的獲取、整合與應用能力。
進一步地,數據能力的背后,凝結著企業在細分賽道的資源網絡構建、行業認知深度以及業務場景的長期打磨,正是這種"苦活"和"累活"才能構筑起真正的競爭壁壘。
而在數據領域,Owkin是最具代表性的公司之一。經過近9年的積累,公司擁有行業中最為龐大的多模態數據集之一,并基于此構建多元業務。
近年來,得益于大模型在生物醫藥領域的滲透,Owkin的價值愈加顯著,與賽諾菲、BMS、默沙東、阿斯利康、安進、ADC Therapeutics、Absci等公司達成合作,被法國總統馬克龍在人工智能行動峰會上提及。
Owkin商業化進程穩步推進,據創始人透露,公司當前收入規模已位居行業首位,盡管支出巨大(僅建設數據庫就累計投入近1億歐元),公司仍保持充裕的現金流,現有資金儲備可支持未來三年運營發展。
在我看來,Owkin對于AI醫療的價值,就像Scale AI之于人工智能一樣,公司為藥企和醫生收集、標記和定制數據,配合源源不斷的開源模型,任何組織都可以便捷地建立AI產品來賦能業務。
就如同2016年成立的Scale AI以自動駕駛數據標注起家,但真正迎來騰飛是因為大模型熱潮一樣,我們認為Owkin也正處在價值重估時刻。
在AI變革醫療保健的這場“淘金熱”中,以Owkin為代表的企業將成長為具有獨特價值的“賣水人”,進入爆發期。
數據,數據,還是數據!
當我們談論AI將如何變革醫療保健時,基礎模型(Foundation Models)是如今最為核心的話題之一。
與僅針對特定任務的小模型不同,基礎模型在大型數據集上進行訓練,并支持跨領域的應用,如預測蛋白質結構、表征細胞狀態或預測基因功能等。
據統計,僅在2024 年,生物技術領域至少出現了5個參數量超過10億的基礎模型,這些模型在接近100萬億個DNA堿基和上百萬張病理切片的數據集上訓練。
我們認為,不同于前幾次AI制藥浪潮中興起的分子動力學模擬、虛擬篩選等技術,基礎模型才是真正的游戲改變者,其影響將遠超單一環節的效率提升,將重構制藥業。
圖:基礎模型在生物醫學發揮的作用
可以說,基礎模型正改變我們對生物學、醫學的認知,其帶來的沖擊可以類比為GPT出現對AI領域產生的顛覆性影響。
擁有龐大參數的基礎模型的快速發展(如11億參數的H-optimus-0、400億參數的Evo2、2100億參數的的xTrimo V3),背后是對海量高質量數據的剛性需求。
當我們復盤GPT引爆的AI產業變革時會發現,雖然大模型初創公司點燃了這場技術革命,但市場絕大部分利潤卻在向算力和數據傾斜,掌握這些關鍵要素的企業在這波浪潮中構筑了更深的護城河。
以Scale AI為例,其為AI公司提供數據標注服務,成為此次AI熱潮中受益最多的企業之一,公司年度經常性收入(ARR)從2018年的1700萬美元增長至2024年的10億美元,公司最新估值達250億美元。
圖:數據標注公司Scale AI的業績增長
而在生物醫藥領域,對數據的渴求有增無減,不同于通用大模型使用公開網絡數據進行訓練,生物學、醫學的數據面臨更加嚴重的困境:
一方面,獲取高質量的生物醫學數據需要更高的成本和門檻
另一方面,有價值的數據往往分散在各個醫療機構和藥企中,形成了嚴重的“孤島”現象。
正如Recursion的聯合創始人兼CEO所說:“要構建生物學中的基礎模型,您將需要大量高質量的數據。除了少數問題(例如蛋白質折疊)之外,這些數據目前不存在于公共領域……只有那些能夠在規模和質量上生成數據的人才能達到大多數藥物發現和開發問題的那個點”。
鑒于此,專注于人工智能的藥物研發/醫療保健公司顯然必須優先關注數據,以實現真正的差異化。
Owkin:二代創業,重塑醫藥數據利用方式
Owkin聯合創始人Thomas Clozel出生在一個顯赫的生物醫藥家庭,其父母創立的罕見病療法公司Actelion不僅成功上市,還開發出三款重磅藥物,最終在2017年以創紀錄的300億美元被強生收購——這一交易至今仍是歐洲生物科技領域最大規模的并購案例。
也許是受到父母的影響,Clozel同樣選擇了醫學道路,他于法國巴黎內克爾兒童醫院接受了6年的住院醫師培訓,專攻臨床血液學,之后他在巴黎的亨利·蒙多爾醫院擔任臨床助理教授。
基于多年治療血液癌的實踐,Thomas Clozel深刻認識到現有治療體系存在包括診斷工具不足、藥物與患者匹配不精準等缺陷。
為此,他提出構建一個完整的端到端制藥生態系統,將生物標志物發現、診斷技術開發、靶向藥物研發和患者分層治療有機整合,從而徹底改變傳統模式。
之后,Thomas Clozel通過朋友結識了巴黎高等師范學院助理教授Gilles Wainrib,這位專注于醫學領域AI應用的學者與Clozel理念一拍即合,兩人隨即共同創立了Owkin。
圖: Thomas Clozel(左)和Gilles Wainrib(右)
面對醫療數據孤島這一核心痛點,Owkin創新性地提出以聯邦學習結合遷移學習構建解決方案。
聯邦學習是谷歌提出的一種分布式機器學習技術,允許多個設備或服務器在不共享原始數據的情況下協同訓練模型。
這一技術的核心在于“數據不動,模型動”,僅共享模型參數而不是數據本身,從而解決了醫療領域尤為重要的數據隱私問題。
進一步地,通過遷移學習,將在源任務(如自然圖像分類)中學習到的通用特征表示或模型參數,遷移到目標任務(如醫學影像分析)中,從而在數據稀缺的場景下顯著提升模型性能。
一個典型的策略是,先在大型通用數據集(如ImageNet)上預訓練深度神經網絡(如ResNet),隨后將模型遷移到醫學領域(如CT圖像),僅需少量數據(幾百張甚至更少)進行微調即可。
這樣,Owkin做到了在保證數據隱私的前提下實現共享協同,同時降低了機構應用AI的門檻,推動數據更加高效、安全地利用。
贏得行業信任,構建全球最大網絡
具體來看,Owkin圍繞藥企和醫院構建了一個聯邦研究生態系統,包括四個關鍵組件:Owkin Loop(網絡,提供數據互聯互通)、Owkin Connect(聯邦學習框架)、Owkin Studio(AI軟件工具開發平臺)和 Owkin Lab(專業知識)。
圖: Owkin的聯邦研究系統
其中Owkin Connect是核心,Owkin 投入了三年時間來開發,使之成為一項保護隱私、可追溯、安全的技術框架,確保網絡中的數據在確保隱私和合規的條件下被使用。
之后,公司還開發了Owkin Connect的開源版本Substra,這是一個即用型聯邦學習軟件,提供靈活的Python接口和一個用于大規模運行聯邦學習訓練的Web應用程序。
參與Owkin Loop 的研究人員可以使用Owkin Studio來標注多模態數據集,訪問、構建和解釋機器學習模型,通過Owkin Lab(包括濕實驗室)還可以尋求專家團隊的幫助。
為應對網絡安全威脅的快速增長,Owkin特別組建了由數十名專家組成的專職信息安全團隊,以保障數據系統的安全性,鞏固合作的信任基礎。
目前,這個系統吸引了諸多醫學研究機構加入,已成為全球最大的人工智能醫療研究網絡,全球合作伙伴超過83家,覆蓋全球排名前二十醫療機構中的一半。
藥企同樣對此相當熱情,2019年阿斯利康、拜耳、勃林格殷格翰、葛蘭素史克、強生、默克、諾華等10家頂級制藥公司共同啟動MELLODDY項目,目標是在不犧牲隱私的情況下利用大規模數據庫進行AI訓練,作為該項目的技術協調方,Owkin為其提供了關鍵的聯邦學習解決方案。
如今,依托其構建的全球醫療數據協作網絡和沉淀的模型開發能力,Owkin與合作伙伴共同推動了多項突破性成果,如:
MesoNet
通過數字病理切片精準預測惡性胸膜間皮瘤患者的治療反應和預后
更好地預測和解釋間皮瘤患者總生存期
HE2RNA
:通過組織病理學圖像直接預測基因表達水平,更高效地識別和解析腫瘤微環境中的分子特征
Histomics
:通過高分辨率病理圖像智能分析腫瘤微環境特征,更精準地量化評估腫瘤異質性和免疫細胞浸潤狀態
在數據資源建設方面,Owkin通過與全球頂尖醫學機構開展合作,依托7000例患者數據打造了目前腫瘤學領域規模最大的空間組學數據庫MOSAIC,涵蓋7種癌癥類型。
布局三大業務,頂級藥企當客戶
Owkin的商業模式較為清晰:管線、服務與工具,瞄準藥物發現、臨床試驗和生物標志物診斷三大領域。
公司開創了兩種新的藥物發現引擎,用于提供新的藥物靶點并優化藥物定位:
TargetMATCH
:它使用多模態患者數據作為輸入,并輸出識別最佳治療靶點和匹配的患者亞組
DrugMATCH
:利用知識圖譜、生物醫學文獻和多模態患者數據來識別現有藥物的新適應癥和相關亞組,并提高治療效果
基于此,Owkin在內部開發了多個管線,其中OKN4395是公司從Idorsia授權而來,作為一款用于治療實體瘤的EP2/EP4/DP1三重抑制劑,這款分子具有潛在FIC(同類首創)屬性,目前正在開展國際多中心la/lb期臨床試驗。
圖:Owkin的管線
同時,Owkin也將AI藥物發現平臺以服務的形式賦能藥企,典型案例包括其2021年與賽諾菲達成的戰略合作,涵蓋四種癌癥類型的藥物發現與開發計劃,協議總價值達9000萬美元;之后雙方于2024年進一步將合作范圍拓展至免疫學領域。
而除了早期的藥物發現,得益于醫療機構沉淀的多模態患者數據與臨床研究需求具有天然的契合度,Owkin在加速臨床試驗方面也可圈可點。
針對臨床試驗的不同時期,公司提供相應的優化手段:
Ⅰ/Ⅱ期
:通過
AI
外部對照組為單臂
I/II
期臨床試驗提供早期療效估計
Ⅱ/Ⅲ期
:開發生物標志物模型以指導試驗招募,匹配更精準的患者群體
Ⅲ期
:使用預后生物標志物模型分析外部數據識別關鍵預后因素,從而提升統計效力并優化患者入組標準。
2022年,BMS宣布與Owkin合作,共同設計和優化心血管藥物試驗,雙方利用機器學習來增強臨床試驗的設計和執行,包括優化終點定義、患者亞組識別和療效評估。
此外,Owkin持續推進AI驅動的數字病理診斷創新,其核心產品MSIntuit? CRC代表了人工智能在腫瘤診斷中的重要突破。
Owkin開發的MSIntuit? CRC是全球首個獲得歐盟CE認證的AI輔助MSI預篩查工具,僅需常規蘇木精-伊紅 (H&E) 染色切片即可高效識別MSI高風險患者。
圖:MSIntuit? CRC
其訓練數據來自美國24家醫療中心的859張全切片圖像,并在600例真實臨床病例中驗證了其可靠性——作為預篩查工具,MSIntuit可以排除幾乎一半的非MSI人群,同時正確分類超過96%的dMMR/MSI患者,與目前的金標準方法相當,能夠減輕臨床實踐中的MSI檢測負擔。
2023年,Owkin牽頭啟動了PortrAIt項目,這項價值3300萬歐元、為期五年的研究計劃,匯聚了法國古斯塔夫?魯西癌癥研究中心等國際頂尖癌癥研究機構,致力于在癌癥診斷、新型生物標志物發現和患者預后預測領域開發不少于15個AI工具。
圖:Owkin正在開發的診斷工具
隨著與默沙東、阿斯利康等企業的合作深化,Owkin正將這AI工具拓展至更多癌種,推動數字病理與AI的融合,讓精準診斷更高效、更可及。
大模型風起,Owkin再進化
在大模型在醫療領域狂飆突進的背景下,Owkin近期密集推出一系列舉措,以快速響應這場顛覆性的行業變革。
今年5月,Owkin推出K Navigator,這是一個AI驅動的生物醫學科研助手,為研究人員免費開放以加速科學發現。
K Navigator通過自然語言交互,高效梳理2650萬篇科學文獻,挖掘潛在研究方向,并基于19個生物醫學數據庫的數以千計患者數據提供精準分析,幫助研究者快速分析數據、優化研究問題并獲取洞見。
公司計劃今年晚些時候推出K Pro,這將是擁有具有一系列Agent的平臺,可用于解決藥物發現等復雜挑戰。
今年1月,Owkin推出操作系統Owkin K 1.0,該系統整合了公司成立八年來的技術沉淀,可以訪問聯邦網絡中超過一百萬名患者的精選數據,通過先進的模型進行分析,并通過濕實驗室進行驗證迭代,實現“數據—模型—實驗”飛輪。
在公司的愿景中,Owkin K 2.0將使得AI驅動的自動化實驗室成為可能,屆時AI Agent將具備自主設計、執行和優化研究項目的能力,路徑指向一個更宏大的目標——構建生物學領域的通用人工智能(AGI)。
去年,Owkin還參與投資孵化了Bioptimus,該公司由來自Google DeepMind和Owkin的專家組成,將創建首個覆蓋基因組學、蛋白質序列、細胞結構、表觀遺傳狀態、細胞圖像、質譜、空間轉錄組學等多模態生物學基礎模型,種子輪融資3500萬美元。
圖:Bioptimus推出的H-OPTIMUS-1模型,在超過100萬張數字病理圖像上訓練而成
Bioptimus聯合創始人兼CEO Jean-Philippe Vert也是Owkin的首席研發官,從某種意義上說,這更像是從Owkin分拆出的一家公司,這樣的架構設計方便專業化運作和管理,又有利于吸引外部資源和頂尖人才。
憑借其獨特的醫療數據資產,Owkin進軍生物基礎模型領域可謂水到渠成,相較于大多數團隊依賴于公開且模態單一的數據集,公司具有天然優勢。
以上動作,揭示出Owkin的一個更大的戰略布局:借助大模型浪潮,公司正在將過去積累的行業經驗沉淀為自動化的解決方案,同時通過構建垂直領域基礎模型,進一步鞏固其在行業的領先地位。
當行業太多注意力放在了算法性能之時,數據的重要性值得被重估,尤其是在Scaling Law(擴展定律)的作用下,數據往往能帶來比單純優化算法架構更顯著的邊際收益。
從商業邏輯來看,開源算法的涌現正在顛覆模型的價值標準,而在數據層面上,一些基本的經濟規律依然奏效:規模經濟帶來邊際成本遞減,轉化成本構建用戶黏性,稀缺的醫療數據形成天然的資源壟斷優勢,這一切都有利于Owkin。
從長遠來看,Owkin正在構建一個日益壯大的AI生態系統——整合跨國藥企、生物科技公司和頂尖醫療機構的資源,并形成強大的協同效應。
而作為這個生態系統的核心樞紐,Owkin不僅將持續享受網絡效應帶來的價值增長紅利,更將在每次技術范式中占據獨特的戰略卡位,保持在AI醫療變革過程中的優勢地位。
—The End—
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.