* 本文原創發布于差評孵化的商業財經類帳號 “ 知危 ”
在中國,醫療 AI 主要有三種類型:醫療影像、醫學基因編譯以及智慧診療。
對于智慧診療類型,許多公司都有較強的互聯網醫療基因,比如京東健康、阿里健康、平安好醫生等。過去多年來,這類公司主要依靠互聯網賣藥模式盈利。
在疫情期間,互聯網賣藥營收全面大增。但如今這個市場已成紅海,同質化競爭嚴重,由疫情特殊時期帶來的營收機會也早已消失,相關公司在這方面的收入都進入了瓶頸期。
那么,智慧診療公司今后將如何構建新的競爭優勢?
這回,競爭要素終于聚焦到了 AI 上。
近年來國家也密集出臺政策推動智慧診療的發展,比如2024年11月,國家醫保局將AI輔助診斷技術納入醫療服務價格項目立項指南。
為深入了解智慧診療公司如何在 AI 上建立新的優勢,知危編輯部和京東健康智能算法部負責人、京東健康探索研究院首席科學家王國鑫進行了對話。
京東健康自 2014 年開始運營,以線上醫藥零售業務為基礎,并擴展到在線診療,近年基于 AI 技術開發了一系列 AI 診療助手產品。
在王國鑫看來,用 AI 去解決醫療的業務問題,是一個很自然的選擇,“ 醫療和別的行業相比并沒有更加特殊,只要是人工智能跟行業結合,都會有巨大的想象力,以及面臨現實中逐步演進的漫長過程。”
但 ChatGPT 的出現確實帶來了全新的機會,“ ChatGPT 不僅是優秀的技術,也是優秀的產品,根本在于改變了人和機器的交互模式,實現了從鼠標到觸摸屏再到自然語言、圖像、聲音的飛躍。”
而 DeepSeek 的發布對中國醫療 AI 也有很大的推動作用,“ DeepSeek 的意義在于,中國人的 AI 技術終于達到了國際認可的接近全球最領先的水平。而且 AI 還沒有面臨智能墻的限制,還能繼續提升。DeepSeek 這樣的國產優秀團隊,極大地刺激了各行各業對于中國技術團隊的認知,以及國家對于 AI 領域的技術戰略的投入,當然,醫療行業也不例外。”
從互聯網賣藥到智慧診療,這樣的模式變遷是一種質的變化,因為這意味著醫療 AI 企業要實際與醫院一起參與到患者的診療過程中,因此要做出好的醫療 AI 產品,必須對醫療行業本身有非常深刻的理解。
王國鑫向知危介紹道,“ 醫療、法律、金融是人類專家參與最多,交互最頻繁、信息密度最大的三個重要行業。一些行業更強調 AI 的半自動化或全自動化,比如交通、物流、電廠、制造業、農業等,但 AI 醫療需要人類和機器的共同配合。”
“ 這也是醫療、法律、金融這三個行業率先應用大模型或者大模型更適用的原因。具體而言,判斷一個行業是否適用大模型,以及應用大模型具有高價值,就看是不是有高知識密度,專家型人才聚集,以及高服務成本。”
醫療行業的高服務成本體現在必須有龐大機構作為支付方,“ 我們國家對大部分國民提供了醫保兜底,今天如果一個患者需要看專家,絕大部分醫院都能提供半小時以內到位的醫療服務,這在另一個國家是不可能的。”
而且,相比法律、金融,醫療行業還有其特殊性和復雜性,“ 醫療行業幾乎是人類所有職業中,細分程度最高,規則最復雜,出錯后果最嚴重的行業。所以醫療 AI 商業化中最大的困難,就在于它解決的是人類生命健康上的問題,這也是幾乎所有復雜性的來源。”
但醫療行業存在一個不可能三角,即可及性、成本和質量不能同時擁有,“ 比如我們的醫療總體上是普惠化的,但如果今天想看一個超級牛的專家,一般來說就需要支付很高的成本,這個成本支付的是占用專家的時間,這個時間如此寶貴源于培養高水平專家需要付出的巨大成本。”
因此,結合醫療本身的行業特點和中國醫療現狀,構成了獨特的發展驅動力,“ 像我們這么大的國家,無論是醫療成本問題、衛生經濟學問題、地區差異問題,都導致對通過使用類人服務來提升整個醫療行業、醫院、患者的體驗,和降低成本上,有巨大的動力。”
具體到 AI 層面,就是利用 AI 技術吸收全國頂級醫院、頂級醫生的醫療知識和技術,降低服務成本,從而普及到各級醫院中去,以惠及全國所有患者。
要實現這種普惠化,并考慮到數據安全性,私有化部署大模型是一種可行的路徑。據了解,目前國內已有近百家醫院完成 DeepSeek 本地化部署,主要為知名大型三甲醫院,比如復旦大學附屬華山醫院、深圳大學附屬華南醫院等,本地化部署主要是為了支持臨床決策、病歷質控、影像分析、科研輔助、醫院管理等場景應用。
但這種方式本身并不夠普惠,私有化部署成本比云服務高得多,滿血版 DeepSeek 一體機價格基本都是百萬級別,不是普通醫院負擔得起的,這還不算實際運行中產生的運維和人力成本。
王國鑫解釋道,“ 是不是所有醫院都具備訓練醫療模型的能力,能夠支付招聘優秀工程師的成本,并具備足夠優質的訓練數據,是存在疑問的。實際上,在中國,大部分專病療法相關 AI 課題都需要多中心的聯合訓練。多中心就是大量的優秀的醫院聯合在一起研發。所以我很懷疑是否所有單個醫院都有足夠的能力去做這件事。所以醫療大模型的研發,需要像我們這樣的垂域領域企業同步支持多家醫院,來推動大型課題研發,以解決數據共通性的問題。”
但要實現多中心聯合訓練,最核心的難題是醫療數據共享,技術層面的難題比如數據標準、數據質量等都還是其次,根本還是在于權利上,“ 這里面涉及到數據確權的問題,目前醫療數據的特點是權利不清晰,我們并不知道它屬于患者、醫院或科室,甚至廠商。比如說一個患者今天做 X 光檢查,影像是不是屬于廠商并沒有確定的答案。有政策面的問題,也有敏感性的問題,人們對于關乎切身利益的東西都是極其關注的。所以任何醫療數據的共享,都是重要的法律和倫理問題。”
那么,如何推動這個問題的解決呢?
王國鑫表示:“ 從政策方面看,過去幾年國家一直在研究數據要素流通。我們的優勢是能集中力量干大事,所以數據要素流通的研究其實是全國性的。北京如今也有很多先行試點,推動醫院進行脫敏數據的資產化,只不過目前案例還比較少。從過去幾年我們工作的實際情況來看,總體還是走課題加科研轉化。”
“ 比如說我們可以跟醫院進行聯合課題的申報,在一個單獨課題的情況下,可以進行脫敏科研數據的一定程度的共享,當然這不涉及到數據的轉移,更多是以更合規數據處理的方式來進行,比如說就在院內完成模型的訓練。理論上,醫院不可能把醫療數據轉移給任何一家公司。”
“ 所以,對于第三方而言,醫療數據的使用只能是點對點的。坦誠地說,這其實阻礙了純技術的發展。但醫療領域的特殊性就在于,我們不能完全用一個純技術發展的視角來看待人類倫理的問題。”
因此,王國鑫認為,要解決醫療數據資源難題,一方面需要推動醫療數據的資產化,另一方面醫療 AI 公司必須要做好未來廣泛依賴合成數據的準備,以及更好地挖掘醫療現有開放數據的準備,“ 比如,其實有很多疾病案例數據是存在于醫療論文之中的,它們可開放獲取,而且不涉及到敏感信息。我們可以基于這些數據進一步模擬醫生或者患者的情況,從而產生更高價值的數據。”
在近期發表的論文 “ Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support ” 中,王國鑫的團隊就提出了這樣的方法。( 注:Citrus 指京東健康的醫療大模型京醫千詢 )
https://arxiv.org/pdf/2502.18274
論文中提到,醫學專業知識是通過臨床實踐培養獲取的,臨床實踐需要高度復雜的醫學推理技能,涵蓋患者咨詢、診斷、鑒別診斷和治療等。
因此,用于智慧診療的醫學語言模型要想成功地輔助臨床決策,不僅要處理海量醫療數據,還要模擬專業醫療人員復雜的認知過程。
臨床實踐中的醫學推理涉及兩種推理方法:“ 模式識別法 ” 和 “ 假設-演繹法 ”。前者基于臨床觀察和經驗總結來發現模式,更加直觀,后者根據已知的醫學理論,基于癥狀組合來確定疾病。
模式識別能力通常接觸大規模、高質量的醫學數據集學習得到,假設-演繹推理能力則需要通過合成的思維鏈數據訓練得到,思維鏈數據通過模擬專家的推理過程獲得。
模型生成推理思維鏈的過程如下,對一個推理起點和多個診斷終點,其能夠生成大量的備選思維鏈,并結合外部知識保證診斷能力:
模型列出現有臨床信息,作為推理的起點。
基于現有信息,提出可能的診斷,作為推理的終點。
進行正向推理,建立從起點到終點的邏輯路徑。
使用另一個模型評估推理的有效性。
重復步驟 3-4,模型將嘗試建立更多不同的邏輯路徑。最后對可能的診斷進行排序,確定是否可以做出診斷。
如果做出診斷,則輸出結果并結束推理。
如果無法做出診斷,則返回步驟 1,并嘗試請求外部知識以收集更多信息。
該方法在多個開源基礎模型中,在各種醫學基準測試中實現了顯著的性能提升。Citrus 模型( 京醫千詢 )及其訓練數據都已經開源。
王國鑫再次強調,“ 所有做醫療 AI 或者做行業AI 的團隊,都需要有這樣的覺悟,就是在未來漫長的幾年里,需要有不同的模型團隊來廣泛地合成類真實數據,從而進一步降低對患者數據、醫院數據或行業數據的使用。這是一個很重要的方向,我們也在持續探索。”
在獲取合成數據的好處時,也要面臨相應的風險,比如它可能讓生成的多樣性不夠,甚至讓模型退化或訓練直接崩潰。
Nature 曾經發表一篇封面論文《 AI models collapse when trained on recursively generated data 》,表明隨著大模型循環用自己生成的數據訓練自身,到最后模型會完全偏離原來的數據分布,要么生成內容范圍很狹窄,要么干脆在胡言亂語。
圖源:Nature volume 631, pages755–759 (2024)
王國鑫認為,合成數據導致模型退化這是有可能的,但合成數據這條路仍然必須走下去。
“ 我們當然希望數據的多樣性很強,真實性又很高,但在醫療領域這不現實。舉一個醫療影像的例子,如果只在北京做醫療影像,那就幾乎沒有南方患者的影像數據。人和動物都有很強的地域性特征,包括身體狀況、疾病甚至影像表現等。”
但正如之前提到的,得到多中心的具有廣泛代表意義的數據是醫療 AI 領域中最難、最痛苦的部分。
“ 合成數據確實存在造成模型退化的可能,因為需要從一個強模型或者通過強化學習的方式不斷去合成新數據。那么這批數據的應用或者監控,就變得比較困難。其實基于強化學習的范式,不斷地推動數據合成,應該是能夠把模型的水平再抬高一定水平的,然后再配合一部分真實數據進行校準。”
相比痛苦地尋找真實數據,這個方法的效率高得多。
“ 強化學習跟監督學習相比最大的特點,就是它具有一定的數據探索能力。只是強化學習需要很好的環境設置,從而讓它的探索方向更能被評估。比如 DeepSeek-R1-Zero 就是完全基于強化學習的,它讓模型通過自由的探索找到正確的發展路徑。未來在很多端到端的智能體研究都會走這個方向。這其實很像 AlphaGo 的發展過程,AlphaGo 后期的版本 AlphaZero 是不需要棋譜的,而是靠兩個 AlphaGo 的智能體不斷的下國際象棋、圍棋和日本將棋,從而從零提升模型能力的。當然,強化學習本身的難點也不少,探索很容易,但是訓練方法、獎勵模型設計、超參數都是比較難調試的,訓練也不太穩定。”
王國鑫補充道,除了真實數據、數據合成,其它數據獲取方法還包括真實數據的改寫等。
醫療數據除了難獲取,其領域知識上的特點即細分性和動態性,也帶來了另一個層面的難題。
王國鑫表示,“ 醫療行業的細分程度非常高。即便是從患者的角度來看,目前去任何醫院,對患者來說最大的難題就是掛什么科室的號。常用的疾病編碼少說得有一兩千個,而且不同的專科醫院、不同的專家所擅長的疾病差異很大。每一個疾病或每一個專科背后,都有一個巨大的學術機構來支撐,有很多優秀的專家甚至院士對其進行研究。”
“ 并且,醫療也是一個快速發展中的行業,人類今天對于很多疾病其實還沒有形成正確的認識,比如最受關注的腫瘤疾病。所以,醫療AI不僅僅是對過去知識的學習,而是持續學習、持續應用的。縱觀整個生物學、基因學、生化組學、制藥學的發展,其實它們的發展速度并不比 AI、計算機技術慢,尤其在美國這樣的高成本醫療的社會。AI 甚至還增大了醫療的發展速度,比如最近獲得諾貝爾生理學獎的就是 AlphaFold。”
“ 甚至,作為醫生其職業生涯是很漫長的,需要持續學習。在這個過程中,大模型也需要深度參與進來,這屬于 AI 醫療教育的問題。”
“ 最后,包括數學推理、代碼推理等推理模型都有一個特點,就是它有正確答案。我可以通過問題-正確答案配對的方式不斷地校正模型,但坦誠地講,醫療領域的一大特點就是開放性,很多問題不見得真的有正確答案。患者同樣的癥狀可能指向多種不同的疾病。”
綜上,知識密度高,專家型人才聚集,隱私屬性強,細分程度高,知識更新快,以及開放性或不確定性,這幾個特點闡釋了醫療大模型落地時面臨的主要困難,“ 這導致在落地醫療大模型時,我們希望AI能夠做到既通用又專用,但這是非常困難的。”
“ 所以,醫療大模型不能僅僅是在某些通用基準上刷了榜單,拿到好成績就行了。更重要的是能夠逐步地掌握回答專科專病甚至重大專科專病問題的能力。同時,醫療大模型還要能跟上知識的快速更新。”
對于模型本身而言,由于醫療必須是專家決策,或者說所有決策必須有專家認可,那么醫療大模型就需要有比較強的可解釋性,“ 我不認為純黑盒的醫療大模型在醫療領域有任何應用價值,這也是和很多行業所不同的地方。”
“ 對于醫療領域,很長的一段時間內,通用大模型是比不上垂域大模型的。當然通用大模型所沉淀的訓練方法以及優秀經驗,垂域大模型也需要快速吸收。通用大模型探索的是 AGI,而醫療大模型探索的是如何讓具體醫療場景符合醫療規范的問題。”
“ 其實,隨著模型越做越深,向專病發展的時候,也能自然地推動和擁有這類核心數據的醫院進行科研合作。”
但直接適應醫療的碎片化特點去獨立地逐個落地 AI,則是不夠經濟的做法,也不適合這一代的AI。“ 數據稀缺、信息個體化是個長期存在的問題,需要解決如何像人類醫生那樣快速地進行小數據學習( 比如 In-context Learning ),并實現強推理能力。比如 Figure AI 機器人公司,據稱其 Helix 模型的第一個場景在寶馬公司訓練了 12 個月,但第二個場景只用 30 天就做出來了。對于醫療 AI,也希望能實現類似的路徑,利用沉淀的經驗或者說預訓練、遷移學習去越來越快地攻破越來越多的醫療細分領域。”
“ 所以,合成數據、知識更新、預訓練,這三條路對于醫療大模型是必然的,通用數據領域中存在的很多花里胡哨的技巧,在行業 AI 面前都沒什么用。”
通過克服上述各個難題,并攻破所有醫療細分領域,就能實現醫療大模型的 ChatGPT 時刻嗎?醫療大模型最終能夠取代人類醫生嗎?
王國鑫表示,“ ChatGPT 沒有取代人類,它是一個交互式的模型。醫療大模型的 ChatGPT 時刻也不是其在某種程度上替代了醫生。而是在很剛性的醫療場景下, AI 和醫生共同服務患者,形成標準化的服務,甚至能夠寫到指南里。所以醫療大模型落地的方向應該是,一方面對患者的健康管理有更廣泛普適的服務模式,比如隨時隨地的醫療健康咨詢或個人健康助手。
“ 這個需求實際上并不只是醫療問題,而是源于人們內心對健康的焦慮。你可以看到,互聯網上充斥著多種不同的醫療 ‘ 權威 ’,就源于這種焦慮,但大眾很難判斷這些信息的真實性。雖然大模型也有幻覺,但一個普適的醫療大模型一定是沒有商業化利益且能提供最安全的醫療服務。”
“ 最后,在所有醫院的實踐環節中,都需要持續地去探索哪些環節可以利用 AI 帶來效率提升,以及對最終的醫療服務是否帶來增益。如果在這個過程中,患者受益,醫生、醫院的成本也降低,那么就應該把它進一步的推向指南,甚至推向醫療管理的要求。對于這多方面的要求的滿足即流程效率提升、服務增益、成本降低等,電子病歷就是很好的例子。”
“ 換個角度來說,醫療大模型的 ChatGPT 時刻無非就是在醫療服務的這幾個方面有旗艦型產品出現。”
最后,王國鑫向知危介紹了京東健康如何踐行上述理念。
京東健康從 2017 年開始,就開始做互聯網醫療,如今每天有 49 萬人在京東健康完成線上問診,“ 要達成這一成就,沒有 AI 就實現不了,在這個過程中我們也積累了大量數據。”
就在近日,京東健康還將醫療大模型 “ 京醫千詢 ” 升級為 2.0 版本,重點提升了 AI 輔助重大專科專病診療的能力。傳統 AI 依賴靜態數據,而 “ 京醫千詢 ” 2.0 強調臨床診斷的動態推理,避免過度羅列所有可能性,利用患者數據結合循證數據庫和臨床案例庫,直接給出有效的答案,提高了臨床實用性。目前,“ 京醫千詢 ” 2.0 已經能針對惡性腫瘤、心腦血管等疾病為臨床醫生提供個性化診療建議。
“ 只靠 AI 也無法解決問題,我們還必須要依靠供應鏈,比如說我們合作的醫院、藥店、服務機構,用京東的話講叫實物供應鏈和服務供應鏈。否則它和其它互聯網產品沒有什么區別。”
“ 所以,我們認為京東健康是在互聯網醫療領域或者健康領域掌握的實體機構和細分領域最多的一個公司。醫療 AI 的商業化才剛剛開始。與其講護城河,不如講跑得快不快。護城河是防守思維,AI 競爭拼的是進攻思維。比如到現在很難講 OpenAI 的護城河是什么,Claude、Google 甚至 DeepSeek 離 OpenAI 并不遙遠,所以在 AI 這個領域到最后拼的是持久力和快速迭代的能力。在醫療行業競爭拼的則是戰略定位、資源投入和對行業的理解。”
對任何做行業大模型的公司,行業理解都是永遠不可忽視的,“ 對于做醫療 AI 的公司,有些偏向技術,有些偏向行業。對于前者,在國內是很珍貴的力量,目前還是太少了。只是重技術的可能更希望快速商業化,這在醫療行業是很困難的。但不管是哪種傾向,哪怕是競爭關系,我們也希望能夠共同去推進醫療 AI 的發展。”
外部環境的變化,讓王國鑫看到醫療 AI 正重啟快速發展的腳步,“ 目前最大的變化,其實是在于醫院、醫生、專家對人工智能的認識上。相較于之前的保守態度,如今這個群體對于 AI 的引入持更加開放的態度,對于我們是一個很大的鼓舞,畢竟我們和醫療行業是需要共同研發和推進醫療 AI 的。當然,這個變化必然是由國家自上而下的政策導向和推進才能實現。”
“ 用實在的話來說,每一個人,包括我,也都希望到老的那一天,可以得到更加體面、有尊嚴的醫療服務。”
撰文:流大古
編輯:大餅
歡迎關注差評孵化的商業財經類賬號:知危( ID:BusinessAlert )
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.