ChatGPT,比大多數醫生更強!
這是OpenAI首席執行官Sam Altman(山姆·奧特曼)的最新觀點。
在本周二美聯儲的一場會議上,奧特曼語出驚人,稱如今的ChatGPT能在大多數情況下提供比世界上大多數醫生更好的診斷。
ChatGPT是一個比大多數醫生更為優秀的專家,奧特曼表示。
話音未落,OpenAI就拿出重磅證據,展示出AI為人類醫生糾錯的強大能力。
一份來自OpenAI和Penda Health的聯合研究于近日發布,涉及39849名患者,是迄今為止規模最大的真實世界大語言模型臨床研究。
結果顯示,使用GPT-4o的醫生相比未使用的醫生,其診斷錯誤減少了16%,治療錯誤減少了13%,病史采集錯誤更是大幅下降了32%。
AI對醫療行業的重大價值,正在被越來越多地強調。
不久前,比爾·蓋茨在一檔節目中表示,未來十年內,借助AI,優秀的醫療建議將變得免費、普遍,醫生將可能會被取代。
但是,奧特曼也補充道,他不會將生命托付給沒有人類醫生在場的ChatGPT。
這表明,即便AI的診斷能力已經超過人類,但信任仍是阻擋在患者接受AI醫生的最大挑戰。
OpenAI下場測試,最強AI超越人類醫生
盡管奧特曼經常發表夸張言論,但這次他的說法并非聳人聽聞。
今年5月,OpenAI聯手全球60個國家,262名執業醫生,打造出專為醫療大模型設計的AI醫療大模型評估標準——HealthBench。
根據測試,OpenAI的GPT-o3,力壓Grok 3和Gemini 2.5 Pro,并比人類醫生的回答率高出4倍。
具體來看,OpenAI特意找來了262名醫生參與測試,以比較AI 模型性能與專家臨床判斷。
研究人員把參與測試的262位人類醫生分為兩組,并和AI回答進行比較。
1、第一組醫生可以使用互聯網進行回復,但不能使用AI工具
2、第二組醫生能夠使用OpenAI的模型,醫生能夠對生成的答案進行改編,以及編寫新的答案
結果發現隨著時間的推移,AI模型性能進化迅速,人類醫生也甘拜下風。
2024年9月,OpenAI測試了GPT-o1-preview和GPT-4o。結果發現,AI輔助的醫生答案>AI的參考回答>沒有AI輔助的醫生答案。
也就是說人類醫生對進行編輯后,明顯提升了AI的回答質量。而到了2025年4月測試GPT-o3 和 GPT-4.1 ,情況有了巨大改變。
AI輔助的醫生答案=AI的參考回答>>沒有AI輔助的醫生答案。
換句話說,人類的參與已經不能為AI帶來優化,僅憑AI就可以達到最佳水平!
難道人類醫生,真的要被取代了嗎?
近4萬名患者真實調查,AI幫醫生“開掛”
不滿足于紙面測評的OpenAI,拉來Penda Health一起,想看看AI在診療中的實際作用。
Penda Health是一家位于非洲肯尼亞的醫療保健組織,其擁有16個診所,每年接待近50萬名患者就診。
Penda Health的宗旨是提供高質量且負擔得起的護理,有點類似我們國家的公立醫院,如何降本增效是他們一直關心的問題。
早在ChatGPT發布之后,Penda Health就敏銳捕捉到了這一機遇,開發出基于大語言模型的臨床Copilot(副駕駛)——AI Consult,幫助醫生提高決策效率。
今年年初,Penda Health推出最新版本的AI Consult,這一工具集成了GPT-4o,并被完全融入到其醫生的工作流程中,提供任何必要的反饋。
OpenAI選擇與Penda Health合作,調查了39849名患者就診記錄,其中AI組有20859人,非AI組為18990人。
研究團隊邀請108名獨立醫生進行評級,包括四個維度:病史、調查、診斷和治療。
結果顯示,AI組的所有四個類別的錯誤都明顯低于非AI組。
其中,病史記錄錯誤減少了32%,調查錯誤減少了10%,診斷錯誤減少了16%,治療錯誤減少了13%。
這意味著,僅在Penda Health內部,AI Consult每年就能避免約22000次診斷錯誤和29000次治療錯誤的發生。
AI組的每一位醫生都表示,AI Consult幫助他們提高了服務質量,其中75%的醫生表示這種效果“是實質性的”。
不僅如此,研究還發現,AI Consult還帶來了醫生技能的提升。
臨床醫生將其描述為一種“學習工具”,可以幫助他們拓寬醫學知識,提高臨床技能。
隨著時間的推移,AI組的臨床醫生觸發的紅色警報更少(從研究開始時的45%訪問量到研究結束時的35%),這意味著AI幫助他們學會了避免常見的陷阱。
OpenAI與Penda Health的重磅研究表明,醫療領域,大模型的能力與實際應用的差距正在逐步縮小,AI臨床“副駕駛”已經展現出強大性能。
越來越多的證據顯示,AI在醫療領域的潛力日益增加,并且已經在真實世界中發揮作用。
無論是奧特曼,還是比爾蓋茨,大佬各種言論的背后,都是對AI重塑醫療行業的堅定信念,而這一愿景,正在逐步成為現實。
與其糾結未來人類醫生是否會被AI淘汰,一個更具現實意義的趨勢是:熟練使用AI的醫生將取代不用AI的醫生。
—The End—
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.