心臟是人體重要器官,心電圖(ECG)是現(xiàn)代醫(yī)學(xué)中最重要的工具之一,用于檢測各類心臟問題。在 AI 急速發(fā)展的當(dāng)下,這種與生命健康強關(guān)聯(lián)的系統(tǒng)也迎來了對應(yīng)的升級。
雖然 AI 驅(qū)動的心電圖分析可以實現(xiàn)高精度,但它通常像「黑匣子」一樣工作,在不解釋推理的情況下給出結(jié)果。故而,需要讓醫(yī)生理解 AI 下診斷的理由。
為了彌合這一差距,以色列理工學(xué)院(Technion-IIT)的研究人員正在努力使 AI 更具可解釋性,能以符合醫(yī)學(xué)知識的方式解釋其結(jié)論。
他們所展示的模型及其成果以「Clinically meaningful interpretability of an AI model for ECG classification」為題,于 2025 年 2 月 17 日刊登于《npj Digital Medicine》。
論文鏈接:https://www.nature.com/articles/s41746-025-01467-8
建立和 AI 的醫(yī)學(xué)信任
在美國,2020 年急診室的 1.31 億次病例中,有超過 3200 萬次心電圖檢查,10 億次的社區(qū)健康檢查中,這個數(shù)字來到了 4700 萬。在這種社會環(huán)境下,即使該團隊和其他人已經(jīng)開發(fā)了從 ECG 中檢測心臟條件的算法,但這個算法還是面臨著讓醫(yī)生理解不易的困境。
為了增強直觀性,這類系統(tǒng)應(yīng)該向醫(yī)生提供心臟病模型分類的解釋,這就需要使用輸入數(shù)據(jù)中對最終診斷影響最大的 ECG 特征形式。
理想情況下,這些特征應(yīng)與現(xiàn)有文獻中記錄的、醫(yī)生在臨床實踐中使用的已確定心臟病特征相關(guān)聯(lián)。但目前關(guān)于心臟病的生物標(biāo)志物尚缺乏共識。
圖 1:工作中的實驗示意圖。
為了建立在臨床上可接受的解釋方法,團隊在之前發(fā)表的 ECG-Adversarial 網(wǎng)絡(luò)上進行了測試,僅使用標(biāo)簽預(yù)測器。
ECG-Adversarial 網(wǎng)絡(luò)采用領(lǐng)域?qū)褂?xùn)練方法,提取出在源域和目標(biāo)域上表現(xiàn)良好的領(lǐng)域無關(guān)特征,這種方法增強了模型的穩(wěn)健性和適應(yīng)性,特別是在臨床實踐中處理圖像方面。
而為了解決移動設(shè)備拍攝圖像的質(zhì)量問題,團隊還擴展了網(wǎng)絡(luò)架構(gòu),不僅包含標(biāo)簽預(yù)測器,還包含一個信號解碼器,用于從 12 導(dǎo)聯(lián)心電圖圖像中提取信號。這一處理可以從 ECG 中提取相關(guān)特征,減少復(fù)雜區(qū)域處的信息損失。
為了證明方法的通用性, ECG-AIO 網(wǎng)絡(luò)的編碼器(特征提取器)網(wǎng)絡(luò)被 ResNet18 代替。最終的結(jié)果代表了該模型在開發(fā)階段成為一款集合型通用方法。
解釋數(shù)據(jù)集的標(biāo)注
方法需要投入使用,這也意味著需要更多的臨床經(jīng)驗。
在這個部分中,該使用方法將會對未訓(xùn)練的 NYU 數(shù)據(jù)集上進行標(biāo)注解釋。可解釋標(biāo)記以紫色覆蓋在原始圖像上,并突出顯示了對各種心臟狀況診斷應(yīng)用至關(guān)重要的臨床相關(guān)特征。
圖 2:在高質(zhì)量掃描的 NYU 數(shù)據(jù)集中訓(xùn)練和測試的神經(jīng)網(wǎng)絡(luò)。
這種細膩的方法確保了臨床顯著特征的清晰性和相關(guān)性,而不會在方法中強加不必要的突出部分,從而確保其在不同網(wǎng)絡(luò)和 ECG 布局上的泛化能力。
可解釋性機制強調(diào)了不規(guī)則節(jié)律、后續(xù)峰之間的長時間平坦期;檢測并標(biāo)記了一段與其他圖像不一致的波形變化。這是該方法在實驗室級別的圖像判斷中所表現(xiàn)的精準(zhǔn)性。
圖 3:在添加了陰影的 NYU 數(shù)據(jù)集中訓(xùn)練和測試的神經(jīng)網(wǎng)絡(luò)。
前文中提到為了在圖像干擾下繼續(xù)完成任務(wù),該系統(tǒng)添加了信號解碼器,用以重建圖像,迫使神經(jīng)網(wǎng)絡(luò)考慮圖像的明亮和暗淡區(qū)域。
即使在飽和度很高的圖像中,特定的心臟狀況下臨床相關(guān)的特征仍然可以被檢測到。在這里,解釋方法(雅可比矩陣)保持不變,僅網(wǎng)絡(luò)得到了改進。
圖 4:在移動設(shè)備拍攝的 NYU 數(shù)據(jù)集中訓(xùn)練和測試。
在應(yīng)用于拍攝圖像時,對于標(biāo)注的解釋仍表現(xiàn)出一定程度的模糊。團隊將此歸因于增強方法未能模仿的偽影,以及格式和布局的變化。
為了解決問題,網(wǎng)絡(luò)中加入了信號解碼器和領(lǐng)域分類器,最終的架構(gòu)被稱為 ECG-AIO(ECGall-in-one)。ECG-AIO 經(jīng)過了一種特殊的訓(xùn)練程序,稱為領(lǐng)域?qū)褂?xùn)練。
這種訓(xùn)練使用了帶與不帶疊加陰影和偽影的 NYU 圖像,以及少量拍攝標(biāo)記圖像和大量未標(biāo)記圖像。經(jīng)過這種訓(xùn)練后,未訓(xùn)練圖像的可解釋性性能顯示出了增強的穩(wěn)健性和清晰度,符合各類實際情況下的測試結(jié)果。
一套臨床評估為好用的系統(tǒng)
為了評估臨床性能,團隊對「電生理學(xué)家實現(xiàn)的可解釋性」與「算法實現(xiàn)的可解釋性」進行了比較,重點關(guān)注兩種心臟狀況——房撲,這是一種心律失常性和形態(tài)學(xué)性狀況;以及室性期前收縮。
算法結(jié)果與電生理專家給出的解釋相關(guān)性分別在 0.96±0.1 與 0.94±0.03。這些值表明方法在捕捉和解釋與這些心臟狀況相關(guān)的特征方面與專家解釋有很強的一致性,體現(xiàn)了方法的可靠。
通過開發(fā)允許 AI 以符合醫(yī)學(xué)專業(yè)知識的方式傳達其發(fā)現(xiàn)的方法,研究人員正在幫助為心臟病學(xué)領(lǐng)域更智能、更可靠和更廣泛接受的 AI 工具鋪平道路。
隨著這些進步,醫(yī)生可能很快就會擁有人工智能助手,不僅可以檢測心臟問題,還可以清楚地解釋他們的原因,從而帶來更好、更快、更智能的患者護理。
*圖注:標(biāo)注圖片均來自論文內(nèi)容。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.