從未有創(chuàng)新技術(shù)能如大語言模型一般,能在短短數(shù)月穿透醫(yī)療體系,引得醫(yī)院主動、迅速、成規(guī)模地引入。
截至2025年4月30日,統(tǒng)計第三方榜單中國內(nèi)排名前100的醫(yī)院,已有98家對外宣稱完成了大模型部署。
在這之中,有38家醫(yī)院在通用模型的基礎(chǔ)上進(jìn)一步展開研發(fā),打造出55個符合自身需求的垂直醫(yī)療模型。
從“買方”轉(zhuǎn)變?yōu)椤把邪l(fā)方”,醫(yī)生已成為“AI制造”群體中至關(guān)重要的一員。
百強醫(yī)院公開發(fā)布的垂直大模型
(截至2025年4月30日,醫(yī)院排名來源于“2022屆中國醫(yī)院競爭力春季榜”)
01
大模型進(jìn)入專科專病時代
2022年末,OpenAI憑借GPT3.5點燃大模型的戰(zhàn)火后,國內(nèi)醫(yī)療領(lǐng)域已經(jīng)掀起多輪“百模大戰(zhàn)”。
但由于GPT時代高昂的部署成本及調(diào)用成本,國內(nèi)只有少數(shù)頂級醫(yī)院完成了大模型的本地化部署,絕大多數(shù)模型均由企業(yè)開發(fā),訓(xùn)練數(shù)據(jù)主要為醫(yī)療相關(guān)的文本數(shù)據(jù),沒有觸及醫(yī)院多模態(tài)臨床數(shù)據(jù)的內(nèi)核。
因此,這個時代誕生的大量大模型具備同質(zhì)化高、臨床相關(guān)弱的缺點,鮮有模型能夠為醫(yī)院帶來增量價值,因而未能在醫(yī)療領(lǐng)域掀起太大漣漪。
DeepSeek-R1的橫空出世可以視作醫(yī)療大模型發(fā)展的關(guān)鍵轉(zhuǎn)折點。創(chuàng)新架構(gòu)下,DeepSeek大幅降低了大模型的使用門檻。醫(yī)院只需支付數(shù)十萬元的費用便能本地部署大模型,并對此進(jìn)行個性化定制,即便是未曾接觸過大模型的醫(yī)院,也不愿錯過這一機(jī)遇。
醫(yī)院垂直模型開發(fā)時間分布(單位:個;截至2025年4月30日)
相較于企業(yè),醫(yī)院能夠調(diào)用的醫(yī)療數(shù)據(jù)體量更龐大,模態(tài)更多元,模型的功能也能更貼近臨床的真實需求。因此,誕生于DeepSeek流行后的醫(yī)院主導(dǎo)的大模型(部署的通用模型可能是DeepSeek外的其他模型)開始朝專病專科發(fā)展,能夠處理的多模態(tài)的醫(yī)學(xué)數(shù)據(jù),直切臨床問題。
譬如,北京協(xié)和醫(yī)院今年2月發(fā)布的“協(xié)和·太初”便是首個罕見病領(lǐng)域的人工智能大模型,可用于輔助醫(yī)生快速準(zhǔn)確地識別診斷罕見病,破解罕見病診療全國范圍內(nèi)同質(zhì)性差的難題。
該大模型基于我國罕見病知識庫的多年積累和中國人群基因檢測數(shù)據(jù)建立,醫(yī)生向模型輸入“發(fā)現(xiàn)孩子從2歲起發(fā)育、語言和動作都明顯落后,交流也無法完成”等癥狀后,僅需數(shù)秒AI便會給出“需警惕罕見遺傳性疾病(如雷特綜合征、天使綜合征等)或復(fù)雜神經(jīng)發(fā)育障礙”的判斷,并給出就診科室、補充檢查等醫(yī)學(xué)建議。
中山大學(xué)附屬第一醫(yī)院與神州醫(yī)療共同研發(fā)的全球首個腹膜透析大模型則是聚焦腹膜透析這一細(xì)分場景。該模型采用DHC+DeepSeek雙引擎架構(gòu),能對臨床文本、影像、病理、基因、時序數(shù)據(jù)等進(jìn)行深度理解和融合分析捕捉腹膜透析的相關(guān)信息,為醫(yī)生提供診斷分析、治療方案推薦、隨訪建議和風(fēng)險預(yù)測等功能,進(jìn)而為尿毒癥等患者緩解治療比例低、社會回歸率低等問題。
類似的垂直模型還有很多。動脈網(wǎng)據(jù)公開資料統(tǒng)計,國內(nèi)目前已有專病專科垂直模型22個,覆蓋心血管病、腎病、胸痛、咽喉病變、皮膚病、肝癌等病種,骨科、放射科、病理科、眼科、麻醉科等科室,甚至還專為消化內(nèi)鏡、心超等設(shè)備,以及手術(shù)風(fēng)險評估、感染控制等環(huán)節(jié)訓(xùn)練大模型。
國內(nèi)專病專科垂直模型匯總(截至2025年4月30日)
同時,垂直大模型的功能也隨醫(yī)生的加入不斷擴(kuò)展。最初的大模型應(yīng)用主要以患者服務(wù)為主,用生成式AI的多輪對話能力為患者提供更好的診前、診后服務(wù)。常見于智能預(yù)問診、智能導(dǎo)診、智能隨訪等應(yīng)用中,是對過去AI的一次升級。
而如今,醫(yī)院在采用大模型優(yōu)化患者就醫(yī)體驗的同時,也希望大模型能夠更好地服務(wù)于醫(yī)生群體,實現(xiàn)輔助決策、輔助診斷等功能,提供更為優(yōu)質(zhì)、更為高效的醫(yī)療服務(wù)。亦有少量醫(yī)院在探索大模型在醫(yī)學(xué)教育、醫(yī)院管理、科學(xué)研究中的應(yīng)用可能,期望能夠由數(shù)字化醫(yī)院轉(zhuǎn)變?yōu)橹悄芑t(yī)院,從源頭上解決醫(yī)療資源缺失、科研產(chǎn)出有限等問題。
醫(yī)院垂直模型職能分布(截至2025年4月30日)
需要注意的是,雖然百強醫(yī)院都完成了通用模型的部署,但上文展示的垂直模型主要由排名前50的醫(yī)院開發(fā)。換句話說,垂直大模型的研發(fā)非常考驗醫(yī)院的整體實力,不僅需要在研發(fā)過程中保證深度的醫(yī)工融合,還得有能力承擔(dān)研發(fā)過程中的精力與費用,這筆費用算下來相當(dāng)昂貴。
醫(yī)療大模型最為花錢的部分在于算力與數(shù)據(jù)。同深度學(xué)習(xí)時代輔助診斷類AI的訓(xùn)練邏輯相似,好的醫(yī)療大模型需要做好醫(yī)療數(shù)據(jù)方面的工作,有效整合電子健康記錄(EHR)、影像數(shù)據(jù)(DICOM)、實驗室報告等數(shù)據(jù),確保數(shù)據(jù)多樣性。
此外,數(shù)據(jù)的清洗與標(biāo)注也同樣重要。要確保大模型在后續(xù)使用中具備客觀的生成結(jié)果質(zhì)量,開發(fā)者們必須在前期數(shù)據(jù)治理工作,剔除異常實驗室值、錯誤電子病歷等重復(fù)、缺失或錯誤數(shù)據(jù)。
以影像大模型為例,訓(xùn)練一個某垂直領(lǐng)域的影像大模型理論上至少需要數(shù)千張經(jīng)過分類和標(biāo)注的影像,且影像來源需要多元,盡可能收集不同分期、不同年齡的患者影像數(shù)據(jù),保證大模型的魯棒性。
如果訓(xùn)練模型使用的影像太少,大模型在實際使用時就容易出現(xiàn)幻覺,為了回答問題去編造一些不存在的東西。臨床之中,這樣的模型無法成規(guī)模地應(yīng)用下去。
02
醫(yī)院主導(dǎo)開發(fā),垂直模型仍需企業(yè)助力
除了醫(yī)療大模型功能與價值產(chǎn)生路徑上的變化,醫(yī)院的開發(fā)模型也在不斷擴(kuò)展。
上述提及的55個大模型中,醫(yī)院合作企業(yè)一起研發(fā)依然是主流,有超過一半的項目采用這一模式進(jìn)行開發(fā)。
但從數(shù)據(jù)可以看出,2025年2月開始,醫(yī)院合作學(xué)校、科研機(jī)構(gòu)的項目數(shù)量開始激增。尤其是醫(yī)院獨立開發(fā)這一模式(包括醫(yī)院間的合作),已占比接近25%,成為僅次于合作企業(yè)開發(fā)的重要模式。
這意味著:醫(yī)院正在醫(yī)療大模型的能力躍遷中發(fā)揮愈發(fā)重要的作用。
醫(yī)療垂直模型開發(fā)模式分布(截至2025年4月30日)
不過,由于大多數(shù)醫(yī)院缺乏兼具工程與醫(yī)學(xué)能力的跨專業(yè)人才,醫(yī)院與企業(yè)的聯(lián)合開發(fā)模型依然會是未來的主流。
畢竟,訓(xùn)練模型需要以此完成數(shù)據(jù)準(zhǔn)備與處理、模型選擇與配置、模型訓(xùn)練、模型評估與調(diào)優(yōu)、模型部署與集成五個步驟。相較于獨立開發(fā),醫(yī)生提供領(lǐng)域知識與標(biāo)注數(shù)據(jù)、AI工程師則負(fù)責(zé)技術(shù)實現(xiàn)的分工形式或許更能契合當(dāng)下醫(yī)院的需求。
此外,企業(yè)的介入還能幫助醫(yī)院更好地從商業(yè)化的角度規(guī)劃大模型的未來迭代路徑,推動相關(guān)科研轉(zhuǎn)化的實現(xiàn)。畢竟,當(dāng)這些成果得到充分地共享,它的價值才能最大化地展示出來。
現(xiàn)階段,華為、中國電信、訊飛醫(yī)療、衛(wèi)寧健康、福鑫科創(chuàng)、神州醫(yī)療等企業(yè)已經(jīng)廣泛參與到了醫(yī)療垂直大模型的開發(fā)中,取得了一定成果。伴隨醫(yī)院大模型應(yīng)用場景的進(jìn)一步擴(kuò)大,更多中小企業(yè)亦可與醫(yī)院達(dá)成合作,共同開發(fā)細(xì)分場景下的醫(yī)療垂直大模型。
03
邁向下一個時代,醫(yī)療大模型還需邁過三道坎
雖說醫(yī)院這一角色的介入已為醫(yī)療大模型帶來長足的發(fā)展,但要跨越時代,更深入地應(yīng)用大模型,這一行業(yè)至少還需邁過三道坎。
■ 醫(yī)院大模型訓(xùn)練集的局限性
現(xiàn)階段醫(yī)院開發(fā)大模型采用的多是醫(yī)院自身長期積累的數(shù)據(jù)集。吸納這些數(shù)據(jù)后的大模型能夠較好地處理常見的患者,但面對一些復(fù)雜、少見的病灶,大模型很容易因為數(shù)據(jù)的缺失而產(chǎn)生幻覺。要解決這一問題,醫(yī)院在培育大模型時應(yīng)盡可能采用多個地域、多家醫(yī)院的數(shù)據(jù)組成訓(xùn)練集。
目前,已有不少醫(yī)院開始組建專病聯(lián)盟,共同開發(fā)醫(yī)療垂直大模型。這種模式不僅可以保障大模型的準(zhǔn)確率和魯棒性,還能提高醫(yī)療數(shù)據(jù)的復(fù)用率,讓這些治理后的數(shù)據(jù)能夠充分發(fā)揮價值。
■ 大模型的形態(tài)暫無定論
到目前為止,行業(yè)圍繞大模型的討論主要集于它的功能,鮮有人去探討它的形態(tài)。當(dāng)垂直大模型作為一個商業(yè)產(chǎn)品走出醫(yī)院時,我們必須確定它的形態(tài),是單純的軟件應(yīng)用,還是需要經(jīng)歷審評審批的醫(yī)療器械。
今年3月31日,國家藥監(jiān)局發(fā)布了《關(guān)于優(yōu)化全生命周期監(jiān)管 支持高端醫(yī)療器械創(chuàng)新發(fā)展的舉措(征求意見稿)》,公開征求多病種AI、大模型等新興技術(shù)準(zhǔn)入方式的意見,先行一步為大模型的發(fā)展樹立道標(biāo)。
文件提到要研究制定多病種、大模型人工智能領(lǐng)域相關(guān)技術(shù)指導(dǎo)原則或者審評要點;簡化核心算法不變而算法性能優(yōu)化人工智能醫(yī)療器械產(chǎn)品變更注冊要求;探索完善采用測評數(shù)據(jù)庫開展人工智能醫(yī)療器械性能評價要求。
這或許意味著,醫(yī)院這波新興的輔助診斷、輔助決策模型未來將被視作醫(yī)療器械,經(jīng)過嚴(yán)苛的準(zhǔn)入審查方能進(jìn)入市場進(jìn)行流通。
■ 潛在的安全性問題
到目前為止醫(yī)療行業(yè)尚未曝出大模型相關(guān)的數(shù)據(jù)安全問題,但風(fēng)險從未遠(yuǎn)離過這一領(lǐng)域。
醫(yī)療數(shù)據(jù)承載著患者的基因信息、病史記錄等高度敏感內(nèi)容,一旦泄露,將對個人隱私構(gòu)成嚴(yán)重威脅,甚至可能引發(fā)基因歧視、保險欺詐等連鎖風(fēng)險。
由于現(xiàn)階段醫(yī)院部署的大模型大多來自開源項目,相關(guān)代碼的修改可能會引入后門程序或者安全漏洞。如果醫(yī)院系統(tǒng)架構(gòu)缺陷或數(shù)據(jù)傳輸加密不足,那么這些數(shù)據(jù)便會被暴露于網(wǎng)絡(luò)攻擊之下,面臨非法獲取和濫用的風(fēng)險。
因此,在醫(yī)療領(lǐng)域應(yīng)用開源AI系統(tǒng)時,醫(yī)院及企業(yè)最好對這些風(fēng)險進(jìn)行全面評估,采取嚴(yán)格的安全措施,確保系統(tǒng)的安全性和數(shù)據(jù)的保密性。只有做好醫(yī)療數(shù)據(jù)安全方面的保障,醫(yī)療大模型才存在持續(xù)發(fā)展下去的可能。
*封面圖片來源:神筆PRO
如果您認(rèn)同文章中的觀點、信息,或想進(jìn)一步討論,請與我們聯(lián)系;也可加入動脈網(wǎng)行業(yè)社群,結(jié)交更多志同道合的好友。
聲明:動脈網(wǎng)所刊載內(nèi)容之知識產(chǎn)權(quán)為動脈網(wǎng)及相關(guān)權(quán)利人專屬所有或持有。未經(jīng)許可,禁止進(jìn)行轉(zhuǎn)載、摘編、復(fù)制及建立鏡像等任何使用。文中如果涉及企業(yè)信息和數(shù)據(jù),均由受訪者向分析師提供并確認(rèn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.