智能體上線8個月,覆蓋了98%的常見泌尿系統疾病,服務30萬患者,相當于再造一個仁濟泌尿科……4月22日,上海交通大學醫學院附屬仁濟醫院(以下簡稱“仁濟醫院”)公布了和螞蟻集團合作AI醫療的最新進展。
作為全國首個??浦悄荏w,仁濟醫院泌尿外科智能體(以下簡稱“RJUA智能體”)于去年9月正式在支付寶AI健康管家平臺上線,為用戶提供診前咨詢、多輪問診、多報告解讀、腫瘤分期診斷及預約掛號等服務。
通俗來理解,現在市面上流行的通用大模型,就像是社區里的全科醫生,它的知識面很廣,能夠應對一些常見病的診斷和治療。而RJUA智能體就相當于三級醫院里的泌尿外科醫生,當患者明確有泌尿系統相關問題時,它能夠給出最專業的診療意見。
一個有意思的數據是,在RJUA智能體所服務的30萬患者中,僅有3000人轉到了醫療掛號服務,這意味著,有將近99%的用戶需求在RJUA智能體這一層得到了滿足。
和通用大模型的“導流”屬性截然相反,垂直醫療大模型似乎是真的在靠AI技術獨立解決一部分精確導診問題。
診斷準確率70%
遠超DeepSeek,堪比??漆t生
姚悅(化名)是RJUA智能體的真實受益者之一。
去年底,他的父親在上海市某三甲醫院做例行體檢,體檢結果提示有兩項明顯異常,分別是冠狀動脈狹窄和前列腺特異性抗原過高。相比于前列腺的相關指標,有心梗風險的冠狀動脈狹窄顯然更容易引起姚悅的警惕。在醫院的進一步檢查后,他的父親被確診為冠心病,需要接受支架植入手術。
為了這個手術,全家忙前忙后,前列腺異常的事被他拋諸腦后。一直到今年春節后,父親尿頻得厲害,姚悅才開始在網上查找相關信息。
一圈搜索下來,他在支付寶AI健康管家的頁面下找到了仁濟醫院“泌尿外科”智能體,并上傳了父親的體檢報告。經過多輪的對話交流后,RJUA智能體給出了高危提示,“它給我的回復是,有兩個抗原指標非常高,有前列腺癌的可能,讓我們盡快去醫院就診?!蓖ㄟ^智能體的跳轉鏈接,姚悅還順利掛到了仁濟醫院泌尿外科的專家號。一系列檢查后,他的父親被確診為早期前列腺癌。
“它不能確診,不能做手術,但這個提醒,相當于救了我父親的命?!币倧捅P道。
大模型雖然不是新鮮事物,但它在醫療上的應用尚處于早期階段。目前向C端免費開放的醫療大模型應用,多數還停留在初級問答、搜集信息的健康咨詢階段。而RJUA智能體的不同之處在于,它是國內首個用疾病結構化數據訓練,并在真實醫療場景運行的??浦悄荏w,其在泌尿外科相關疾病上的獨立診斷能力已在真實世界中獲得驗證。
仁濟醫院泌尿外科主治醫生、RJUA智能體項目的主要參與者遲辰斐告訴《健聞咨詢》,為了驗證RJUA智能體在真實環境下的診斷能力,他們曾在內部設計了一項研究——50位仁濟醫院的實習醫生(平均年齡21歲)、50位上海各個社區衛生服務中心的全科醫生(平均年齡49歲)和50位來仁濟進修的區縣級三級醫院的泌尿外科專科醫生(平均年齡39歲)對1000名真實患者進行問診,并和RJUA的診斷結果進行比對。
“最后的結果顯示,RJUA診斷準確率為69.81%,略低于??漆t生的73.65%,而實習醫生和社區醫生的診斷準確率都不到50%?!边t辰斐說,后來他們也拿市面上的其它醫療大模型來跑了一遍,包括DeepSeek,準確率都在40-50%之間,只相當于全科醫生的水平。
70%和50%的數據差異,對于醫生來說,體現的是教育背景、知識結構和行醫經驗的不同,但對于大模型這項通用的底層技術而言,最核心的區別在于語料和訓練的質量。大多數醫療大模型的“養料”來自臨床指南、科研文獻及少量的真實診療數據,而RJUA的知識庫則完全由仁濟醫院醫生團隊共同操刀。
最有說服力的證據就是RJUA-QA,這是仁濟醫院和螞蟻集團共同發布的國內首個臨床專科推理數據集,總共包含2132個問答對,對應25000多條診療依據和臨床數據,涉及67個泌尿系統常見疾病,病種覆蓋人群超過泌尿科就醫人群的97.6%。
“在醫生深度參與以后,??拼竽P湍軌蚋诱鎸嵉啬M診療路徑。”仁濟醫院泌尿科主任潘家驊表示,舉個例子,一個通用的醫療大模型會告訴你前列腺癌有多少種治療方法,可以吃什么藥。但是一個泌尿專科的大模型,它能從病人描述的癥狀,比如尿頻尿急、骨疼來判斷,你有多大概率是得了前列腺癌,“這種方式更接近醫生為患者提供醫療服務的真實場景?!?/p>
會做題到會看病
要給大模型找最好的老師
2023年3月,螞蟻大模型技術團隊第一次來到仁濟醫院泌尿科會議廳,商討大模型在醫療場景中的落地可能。
螞蟻集團仁濟合作項目核心技術成員申月回憶說,雙方討論很久,最后把焦點投向了如何將仁濟泌尿外科專家的診療水平封裝進大模型里,交付給基層的醫療機構使用。
仁濟醫院泌尿科和螞蟻集團迅速立項,醫院成立了7個人的項目組,螞蟻則有了一只10人的小組。
“醫院擁抱AI的決心很大,也知道這會是一個挑戰極大的事情。”申月告訴《健聞咨詢》,技術人的本能反應是大模型學好醫學指南、權威期刊研究論文等,再用真實病例數據訓練,但交流發現,頂尖醫生看病靠的不止是這些,也會基于臨床經驗形成決策判斷,每位醫生還都有差異。
如果想要讓大模型像專家一樣看病,就必須把這些經驗和能力提煉出來,讓模型去學習,而不是僅僅依賴于規?;巴段埂辟Y料。
為了實現這一目標,螞蟻集團的工程師們確立了兩條路徑,第一步是從近5年泌尿專科的相關文獻入手,搭建一個相對簡單的模型底座。第二步,通過仁濟醫院龐大的病例庫,構建出一個代表泌尿專科診療水平的??茢祿?,來對模型進行訓練。顯然,難的是第二步,如何把醫生的主觀經驗變成模型能夠理解的語料,并無先例可借鑒。
在仁濟醫生團隊和螞蟻技術專家的碰撞下,一個奇妙的構想浮出水面——虛擬化問答。他們翻出了2019到2023年五年間仁濟醫院的所有病例資料,涵蓋門診診療、急診搶救、住院手術和操作及日??破盏榷喾N形式,并在此基礎上模擬設計出各種各樣的虛擬患者,讓醫生對他們進行問診,再將問答過程投喂給模型。
仁濟醫院的醫生為此投入了巨大的精力。遲辰斐回憶說,光是構建專業語料庫,前后就耗時數月。以前列腺增生這一個病種為例,就需要參考上萬條病例信息,把可能涉及的癥狀,影像資料、化驗指標全都編出來,再在模型給出的診斷結果上進行標注,“這件事沒法偷懶,因為AI的巔峰就是訓練者的水平,這是提升模型能力的關鍵。”
與此同時,螞蟻團隊的工程師們也在不斷加深對醫學知識的理解。申月坦言,在項目啟動的頭幾個月里,他們有80%以上的時間都花在學習泌尿相關專業知識上,甚至會穿著白大褂和醫生一塊出門診,小伙伴在辦公室里聊的最多的也不是AI,而是諸如PSA值之類的臨床術語,“只有這樣,我們才能更好地理解醫生端的訴求。我現在可以很自信地說,你給我任何一個泌尿科的癥狀,我能馬上告訴你,往下要怎么做追問?!?/p>
幾個細節可以佐證雙方融合的深度。從2023年5月立項到2024年產品上線,雙方累計開了不止40次周會,小會的頻次更高,差不多是一周兩次。作為仁濟醫院的一線代表,遲辰斐說,“遇到問題就拉線上會討論,每次去螞蟻,就像是去上班一樣”,在他的辦公室里還留著螞蟻集團60多張訪客證。而算法專家申月則利用業余時間,開始了在職醫學博士課程的研讀,今年已是二年級。
在這種深度綁定的合作形態中,突破性成果也逐一到來。2023年12月,首個基于中文語料的??茊柎饠祿疪JUA-QA發布;2024年4月,基于醫療真實場景的場景AI專科測評體系——RJUA測評體系面世;2024年9月,國內首個由醫生深度參與開發的??浦悄荏w——RJUA智能體在支付寶AI健康管家上線。
“我認為,??浦悄荏w是所有醫療智能體中最有價值的。因為它要做得足夠深,深了以后就能切實解決醫療上的一些問題。在??浦悄荏w的基礎上,再去演化做醫生個人的智能體,這也是從當醫學生到當醫生的爬坡過程。”遲辰斐表示。
隨著AI在醫學能力上逐步精進,螞蟻技術團隊還會同步研究未來人機協同模式,即大模型產品如何在臨床上和醫生搭檔,幫助醫生、解放醫生,讓有AI的治療旅程真正走入醫療本質——“偶爾治愈、常常幫助、總是安慰”。
而在申月看來,醫學和人工智能的結合尚處于萌芽階段,未來能進化到什么程度誰也無法預測,但她也總是記得第一次拜訪仁濟醫院時,老教授黃翼然分享自己在陜西農村義診的經歷,她痛心那些基層患者因為得不到及時和專業的救治最終走向生命的終點,而人工智能是最有機會改變這些人境遇的工具。
這或許是“醫療智能體”們最有價值的部分。就像螞蟻集團醫療大模型算法負責人王劍說的那樣,“推動醫療大模型進醫院最大價值是向下扎根,通過‘封裝’三甲醫院的診療能力,廣泛服務基層醫療機構,使有限醫療資源以技術的方式得到擴容?!?/p>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.