網易首頁 > 網易號 > 正文申請入駐

AI醫生來了？AMIE刷新診斷對話上限，超越人類醫生的背后是什么？

2025-04-10 20:30:04　來源: 醫工學人

上海舉報

分享至

醫工學人評論

AMIE代表著醫療AI從“信息解答”邁向“人機對話協作”的關鍵一步，具備顯著創新性和廣闊的臨床潛力，但仍需在真實場景適應性、安全性和公平性上開展更深入研究。

在醫學界，有一句廣為流傳的話：“60%的診斷靠問出來。”

對醫生而言，一次高質量的“問診對話”不僅是診斷疾病的起點，更是建立信任、理解患者、制定方案的關鍵。而如今，這項人類專屬的復雜技能，正被人工智能所挑戰。

4月9日，Nature在線發表了一項由谷歌研究院與DeepMind團隊聯合推出的研究成果，展示了一個令人矚目的醫療AI系統——AMIE（Articulate Medical Intelligence Explorer）。研究顯示，在模擬診斷場景中，AMIE的整體表現全面超越了初級保健醫生（PCPs），被譽為“對話式醫療AI的里程碑”。

那么，這個系統究竟“聰明”在哪？它真的能代替醫生問診嗎？本文將為你專業解讀。

重新定義“AI問診”：什么是AMIE？

AMIE并不是一個普通的聊天機器人，而是一個以大型語言模型為核心，專為臨床問診與診斷推理而優化的智能系統。相比傳統的醫療問答工具，AMIE最大創新在于其能進行多輪自然語言對話，主動引導、追問并進行差異性診斷，真正模擬醫生的思維與對話流程。

為了訓練AMIE，研究團隊構建了一個獨特的“自我對話”系統：AI醫生與AI患者展開問診，并引入“AI評審”給予實時反饋，形成一個不斷優化的閉環。這一機制不僅大大擴展了訓練數據的豐富性，還提升了系統對復雜、多變臨床情境的適應能力。

圖1 該研究的主要貢獻

實驗怎么做？讓AI和醫生同臺競技

研究采用了醫學教育中常見的"OSCE（客觀結構化臨床考試）"模式，通過文字聊天的方式模擬真實問診。共設159個病例場景，由訓練有素的模擬病人分別與AMIE和真實醫生進行對話。

每一次對話后，模擬患者和專業醫生會從多個維度進行評分，涵蓋診斷準確性、溝通技巧、共情能力等。

結果顯示，AMIE在30/32個醫生維度和25/26個患者維度上表現優于人類醫生。不僅診斷更準確，溝通也更結構化、同理心更強。比如，在“解釋病情”“緩解患者焦慮”“共同制定方案”等方面，AMIE均獲得更高評價。

圖2 隨機研究框架。

AI真的更“懂人”了嗎？

1. 更全面的信息采集：

雖然AMIE的回答比醫生更長，但其對關鍵信息的獲取效率幾乎相當，說明其溝通冗余少、抓重點強。

2. 更高質量的診斷推理：

實驗發現，AMIE即便用人類醫生的問診內容，也能得出更完整、精準的診斷建議。這說明其強大的醫學推理能力是關鍵優勢。

3. 更有“溫度”的溝通：

無論是“讓患者感到安心”，還是“展現專業可信賴”，AMIE在“軟技能”評分中同樣出色。這也從側面反映，AI系統可以通過訓練獲得更穩定的人文表達。

然而即使AMIE的表現驚艷，但研究團隊也坦言：它還遠未準備好走進真實臨床！！！

首先，實驗基于文字聊天，與現實中的面對面、視頻、電話等形式存在明顯差異；其次，醫生們可能不熟悉這種溝通方式，實際能力未被充分發揮。此外，當前模型尚未充分覆蓋“無病情”場景，對語言能力弱或背景復雜的患者處理能力仍有限。更重要的是，公平性、偏見與數據安全問題仍是懸而未解的挑戰。

AMIE的出現，并不意味著醫生將被取代。恰恰相反，它展現了AI與醫生之間的協作潛力：對醫生而言，它是決策輔助工具，能提醒遺漏、優化診斷；對醫療教育，它是訓練平臺，標準化問診流程與語言表達；對邊遠地區，它是初篩助手，提升醫療可及性。

正如研究最后所言：“如果按照預期實現，AI對話系統將成為下一代學習型健康系統的核心力量。”

總而言之，從語義理解到推理判斷，從技術硬實力到溝通軟實力，這項研究為AI在臨床對話中的應用提供了全新范式。同時，面向真實臨床的挑戰，并非來自技術本身，而是如何將其“安全、可靠、公平”地融入到真實醫療生態中。幸運的是，“AI賦能醫療”的變革已出現并且正在加速發展，我們每一個人，既是觀察者，也是未來的受益者。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.