99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

探索概率與非概率方法的優劣與應用前景

0
分享至

醫學AI模型為何在實驗室中表現出色,卻難以在臨床實踐中獲得醫生信任?答案隱藏在"不確定性"這一關鍵問題中。當醫學影像分析模型面對模糊邊界、罕見病例或質量不佳的圖像時,它能夠意識到自己判斷的局限性嗎?近年來,不確定性量化技術正成為彌合AI與臨床應用之間鴻溝的關鍵。這些技術不僅能告訴我們模型預測的結果,更能揭示這些預測背后的可信度。從貝葉斯推理到證據理論,從概率方法到非概率框架,研究人員正在構建能夠"知道自己不知道什么"的AI系統,為醫療決策提供更全面、更透明的支持。


認清不確定

醫學影像中的不確定性就像霧中看山,有時是因為山本身變幻莫測(病灶邊界不清晰),有時是因為霧太濃(圖像質量不佳)。研究人員把這些不確定性分為兩大類:偶然不確定性和認知不確定性。

偶然不確定性是指那些完全隨機的變化,是醫學數據本身固有的隨機性。比如同一個患者在不同時間拍攝的核磁共振圖像,會因為呼吸、心跳等因素產生微小的差異。這種不確定性即使有再多的信息也無法消除。在2023年的一項研究中,Huang等人指出,當分析腫瘤邊界時,邊緣區域常表現出高度的偶然不確定性,因為這些區域在不同觀察者之間存在天然的判斷差異。

認知不確定性則是因為我們知識不足或模型局限導致的。這就像醫學生剛開始學習識別X光片時的困惑——不是因為X光片有問題,而是因為經驗不足。當AI模型訓練數據有限,或者碰到從未見過的病例類型時,就會出現認知不確定性。2021年的一項研究表明,在少見病例上,即使是性能優秀的深度學習模型也表現出較高的認知不確定性。好消息是,通過增加數據或改進模型,這類不確定性是可以減少的。

不確定性對臨床決策的影響不容小覷。在癌癥篩查中,一個沒有量化不確定性的AI系統可能會做出看似自信但實際上錯誤的判斷。假設系統對一個肺部小結節給出"良性"的判斷,但沒有告訴醫生這個判斷的可信度僅有60%。醫生如果完全依賴這個判斷,可能會錯過早期干預的機會。

反之,具備不確定性量化能力的系統會明確告訴醫生:"這個結節有60%的可能性是良性,40%的可能性是惡性,建議進一步檢查。"這樣的信息對醫生制定下一步檢查計劃至關重要。

量化不確定性還有助于提高模型的可解釋性。傳統的深度學習模型常被批評為"黑盒",醫生難以理解其決策過程。但通過可視化不確定性,比如用熱力圖標識圖像中高不確定性區域,可以讓醫生直觀了解模型在哪些地方"不太確定",從而增強醫生對系統的信任。

實際醫學場景中,不確定性量化已經展現出實際價值。在腦腫瘤分割任務中,Jungo和Reyes在2019年的研究顯示,加入不確定性評估的模型可以將假陽性率降低17%。在放射治療計劃設計中,帶有不確定性量化的靶區勾畫輔助系統能夠幫助放射治療師關注那些需要人工審核的高不確定性區域,提高治療精準度。

此外,不確定性量化還為醫學影像分析引入了"知道自己不知道"的能力。面對訓練數據中未見過的罕見病例,傳統模型可能會給出錯誤但"自信"的判斷,而具備不確定性量化能力的模型會表明自己的判斷存在高度不確定性,提醒醫生需要更謹慎決策或尋求專家意見。

概率法探秘

在不確定性量化的眾多方法中,基于概率論的技術最為成熟和廣泛應用。這些方法就像測量體溫計的精度——通過反復測量來估計結果的可靠性。


貝葉斯推理是概率方法中的基礎,它將不確定性表示為概率分布而非單一數值。在醫學影像分析中,有三種主要的貝葉斯推理方法:概率分布法、高斯過程和貝葉斯神經網絡。

概率分布法通過估計參數的概率分布來量化不確定性。例如,在2014年Wallman等人的研究中,他們利用概率分布來推斷心臟電傳導特性,并量化相關不確定性。這種方法可以同時描述臨床相關的電生理傳導特性及其不確定性,即使在有噪聲的情況下也能表現良好。

高斯過程則是一種非參數方法,用于將函數建模為可能函數的概率分布。Wachinger等人在2014年的醫學圖像配準研究中應用高斯過程來量化配準不確定性。通過協方差矩陣,他們能夠直觀顯示配準過程中哪些區域存在較高不確定性,為醫生提供更全面的信息。

貝葉斯神經網絡(BNN)則是將貝葉斯推理與神經網絡結合,對網絡權重應用概率分布而非固定值。Blundell等人在2015年首次提出這一方法,之后在醫學影像領域得到廣泛應用。例如,Bian等人在2020年的視網膜OCT圖像分割研究中使用BNN,不僅提高了分割精度,還能量化模型預測的不確定性。

蒙特卡洛方法是另一類主流的概率不確定性量化技術,通過生成隨機樣本來估計不確定性。其中最受歡迎的是蒙特卡洛dropout(MCD),由Gal和Ghahramani在2016年提出。MCD在網絡訓練和測試階段都應用dropout操作,每次前向傳播會產生不同的預測結果。通過多次前向傳播,MCD能收集一系列預測,計算它們的方差或熵來估計不確定性。

MCD因其實現簡單且效果可靠而成為醫學影像分析中最流行的不確定性量化方法。據統計,在2023年發表的相關論文中,約有45%采用了MCD技術。Leibig等人在2017年的糖尿病視網膜病變診斷研究中證明,基于MCD的不確定性測量可以明顯改善診斷性能。通過將高不確定性的樣本轉介給專家,這種方法可以在保持高準確率的同時減少34%的專家工作量。

馬爾可夫鏈蒙特卡洛(MCMC)是另一種蒙特卡洛方法,適用于從復雜概率分布中采樣。在2013年,Risholm等人將MCMC應用于非剛性腦部圖像配準,以處理腦瘤切除手術導致的大幅變形。通過MCMC采樣,他們能夠估計配準參數的后驗分布,為每個體素提供配準不確定性的定量度量。

測試時刪除(TTD)也是蒙特卡洛方法的變種。2021年,Redekop和Chernyavskiy將TTD應用于皮膚病變和肝臟分割任務,顯著提高了模型在不可靠標注數據上的性能。他們的研究表明,通過TTD量化的不確定性可以幫助識別訓練標簽中的錯誤,提高分割精度。

模型集成是第三類概率方法,通過訓練多個獨立模型并分析它們預測的變異性來量化不確定性。在2022年,Guo等人將集成方法應用于心臟分割任務,通過分析8個獨立訓練模型的預測差異來估計分割不確定性。他們的研究顯示,集成模型不僅提高了分割精度,還能可靠地識別出高不確定性區域,如心臟瓣膜等復雜結構。


深度集成是模型集成的變種,由Lakshminarayanan等人在2017年提出。這種方法通過不同的參數初始化和數據增強策略訓練多個深度網絡,在每個網絡的輸出層添加高斯噪聲來模擬不確定性。2022年,Kushibar等人將深度集成應用于乳腺癌和心臟分割任務,結果表明這種方法能有效區分模型的認知不確定性和數據固有的偶然不確定性。

概率方法雖然理論基礎扎實,但也存在局限。首先,它們對真實數據分布的假設過強,當實際分布與假設不符時,會導致不確定性估計錯誤。其次,這些方法計算復雜度高,尤其是BNN和深度集成,這限制了它們在需要實時分析的臨床場景中的應用。此外,傳統概率方法難以區分偶然不確定性和認知不確定性,這對醫學決策支持系統而言是個明顯缺陷。

盡管如此,概率方法仍是現階段醫學影像不確定性量化的主流技術,其豐富的理論基礎和實踐經驗為醫學AI系統的可靠性和透明度提供了重要保障。

非概率新思路

概率方法固然強大,但就像只帶放大鏡出門的探險者,總有些風景看不全。在醫學影像分析領域,非概率方法正在嶄露頭角,它們不需要對數據分布做強假設,更適合處理復雜場景下的不確定性。

Dempster-Shafer理論(DST)是非概率方法中的佼佼者。這一理論由Dempster在1967年首創,后由Shafer在1976年完善,被稱為證據理論。與概率方法不同,DST不僅考慮了單個假設的可能性,還考慮了多個假設共存的情況。比如在腫瘤診斷中,它不只是給出"良性"或"惡性"的概率,還能評估"無法確定"的程度。

DST的核心概念是基本概率分配和證據融合。基本概率分配是對各種假設的信任分配,而證據融合則是把來自不同源的信息結合起來得到更可靠的結論。在實際應用中,DST派生出多種實用算法,如證據K近鄰(EKNN)、證據C均值(ECM)和證據神經網絡(ENN)。

2013年,Ghasemi等人將DST應用于腦部MRI分割,通過融合多個專家意見,既減少了誤判,又保留了各方觀點中有價值的部分。在2017年,Lian團隊進一步將DST與ECM結合用于肺癌分割,在保證分割準確性的同時,清晰標識出高不確定性區域供醫生參考。

Huang等人在2021年的研究更進一步,他們開發了一種基于ENN的腦腫瘤分割方法。這種方法可以在單次前饋過程中量化不確定性,比傳統的蒙特卡洛方法快10倍以上,同時保持相當的不確定性估計質量。這對臨床實時分析至關重要。

主觀邏輯(SL)是DST的另一種變體,由Jsang在2016年提出。SL引入信任度、不信任度和不確定性三個維度來描述判斷的可靠性。在2021年,Ghesu等人利用SL開發了一種胸部X光片異常檢測系統,該系統不僅能識別肺炎等異常,還能表明其判斷的可靠程度,幫助放射科醫生優先處理高確定性的簡單案例,將更多時間留給復雜案例。


模糊集理論是另一種重要的非概率方法,由Zadeh在1965年提出。不同于傳統的二元邏輯(非黑即白),模糊邏輯允許判斷存在中間狀態(灰色地帶)。在醫學影像中,這非常符合實際情況——很多結構的邊界是漸變的,而非截然分明的。

2020年,Zheng等人將模糊集理論應用于胰腺分割任務。他們使用模糊成員函數表示每個像素屬于胰腺的程度,而不是簡單的是/否判斷。實驗結果表明,這種方法在處理胰腺邊緣等模糊區域時,比傳統方法準確度提高了7%。

2022年,Huang等人進一步將模糊邏輯理論與深度學習結合,開發了一種乳腺超聲圖像分割系統。該系統不僅能準確分割乳腺組織,還能通過模糊成員函數映射顯示分割的不確定性,為醫生提供更豐富的決策依據。

區間分析是第三類非概率方法,它通過區間而非單一數值表示不確定性。2018年,Eaton-Rosen等人使用置信區間來量化腦腫瘤分割的不確定性,為每個分割結果提供上下界,直觀顯示預測的可變范圍。

測試時增強(TTA)是近年來興起的簡單而有效的非概率方法。它的基本思想是在測試階段對輸入圖像做多種變換(如旋轉、縮放、調整對比度等),觀察模型輸出的變化來評估不確定性。2019年,Wang等人將TTA應用于胎兒腦MRI分割,通過分析20種不同圖像變換下的分割結果變異性,成功識別出高不確定性區域,準確率比傳統方法提高了15%。

與概率方法相比,非概率方法在醫學影像分析中具有明顯優勢。它們不需要對數據分布做強假設,更適合處理認知不確定性;計算效率普遍較高,多數方法只需單次前饋就能估計不確定性;且能更清晰地區分偶然不確定性和認知不確定性,為臨床決策提供更細致的信息。


值得一提的是,越來越多的研究開始嘗試混合方法,結合概率與非概率技術的優勢。2022年,Lin等人將模糊集理論與TTA結合用于皮膚病變分割,既保留了模糊集理論處理模糊邊界的優勢,又利用TTA增強了對圖像變化的魯棒性,分割性能和不確定性估計都優于單一方法。

前景與挑戰

醫學影像分析中的不確定性量化雖有長足進步,但仍面臨諸多挑戰和發展機遇。未來發展關鍵在于解決評估標準化、提高可解釋性、平衡計算效率與實用性,以及探索在半監督學習與跨模態融合中的應用。

評估標準化是目前最迫切的挑戰。由于缺乏不確定性的真實標注,研究者不得不依賴間接指標來評估不確定性量化的質量。2019年,Jungo和Reyes比較了多種評估方法,發現不同指標下各算法的表現排名可能完全不同。這種不一致性嚴重阻礙了該領域的發展。

現有的評估標準主要分為五類:覆蓋指標、預測熵、校準指標、誤分類檢測和評分函數。覆蓋指標測量預測不確定性區間包含真實值的比例;預測熵衡量預測分布的分散程度;校準指標檢驗預測概率與實際概率的一致性;誤分類檢測評估不確定性與錯誤預測的相關性;評分函數如Brier分數綜合考慮準確性和校準性。

但這些指標都存在局限。Judge等人在2022年的研究表明,高覆蓋率可能伴隨著過寬的預測區間,實用性不足;Thagaard等人在2020年指出,校準指標難以區分系統性錯誤和隨機誤差。因此,開發全面且標準化的評估體系是未來研究的重點。

一個理想的解決方案是構建帶有不確定性真實標注的醫學影像數據集。這需要多位專家對同一圖像進行獨立標注,并記錄他們的不確定性判斷。Irvin等人在2019年發布的CheXpert數據集邁出了第一步,它包含多位放射科醫生對胸部X光片的解讀以及不確定性標記。

不確定性與可解釋性的結合研究是另一個重要方向。傳統上,這兩個領域相對獨立發展,但它們實際上緊密相關——了解模型為何不確定,是增強醫生信任的關鍵。

Huang等人在2023年提出了一種深度證據融合框架,不僅量化分割不確定性,還解釋了不確定性的來源和形成過程。這種方法讓醫生不只知道"模型不確定",還知道"為什么不確定",大大提高了系統的透明度和可接受度。

Gillmann等人在2021年的研究進一步探索了不確定性可視化方法,開發了一套復合可視化系統,能同時顯示分割結果、不確定性分布及其與解剖結構的關系。用戶研究表明,這種直觀可視化大幅提高了醫生對AI系統的理解和信任。

計算效率與臨床實用性的平衡是第三個挑戰。目前最準確的不確定性量化方法往往計算復雜度高,難以滿足臨床實時分析需求。例如,深度集成方法需要訓練和推理多個獨立模型,計算時間和資源消耗是單一模型的數倍。

為解決這個問題,研究者正在多方面努力。Narnhofer等人在2021年提出了一種基于變分推理的快速不確定性估計方法,將傳統MCD方法的計算時間減少了80%,同時保持相當的不確定性估計質量。Liu等人在2023年開發的基于DST的融合框架只需單次前饋即可估計不確定性,計算效率比概率方法提高了一個數量級。

硬件優化也是提高效率的重要途徑。NVIDIA在2022年推出的用于醫學影像分析的CUDA-X AI庫,專門優化了不確定性量化算法的GPU加速,使蒙特卡洛方法的推理速度提高了3倍。隨著專用硬件和算法優化的進步,實時不確定性量化有望在臨床環境中實現。

半監督學習與不確定性量化的結合是第四個發展方向。醫學影像標注昂貴且耗時,大量圖像缺乏標注。半監督學習通過少量標注數據和大量無標注數據聯合訓練,是解決這一困境的有效途徑。

Sedai等人在2019年提出的不確定性引導半監督學習網絡,利用教師-學生框架,從標記樣本訓練教師模型,生成無標記樣本的軟分割標簽和不確定性圖,然后更新學生模型。這種方法只使用30%的標記數據就達到了全監督學習90%的性能。

Xia等人在2020年進一步提出了不確定性感知多視圖協同訓練框架,利用3D醫學圖像的多視角一致性。他們應用蒙特卡洛方法估計每個視圖的不確定性,協同訓練效果優于傳統半監督方法,尤其在胰腺邊緣等高變異性區域。

倫理與法律考量也日益重要。隨著醫療AI系統越來越多地參與臨床決策,不確定性報告的倫理和法律影響變得不可忽視。當AI系統和醫生判斷不一致時,不確定性信息將成為責任歸屬的重要依據。


美國食品藥品監督管理局(FDA)在2023年發布的醫療AI監管框架中,專門提到了不確定性量化的重要性,要求高風險醫療AI系統必須提供可靠的不確定性估計,并以醫生可理解的方式呈現。歐盟的《人工智能法案》也有類似要求,表明不確定性量化已成為醫療AI系統的法規必備條件。

綜上,醫學影像分析中的不確定性量化既面臨挑戰,也蘊含巨大機遇。通過解決評估標準化、增強可解釋性、提高計算效率,以及探索半監督學習和跨模態融合應用,不確定性量化技術有望為醫學AI系統帶來質的飛躍,真正贏得臨床信任并造福患者。

參考資料

  1. Huang, L., Ruan, S., Xing, Y., &; Feng, M. (2023). A review of uncertainty quantification in medical image analysis: probabilistic and non-probabilistic methods. Medical Image Analysis.

  2. Abdar, M., et al. (2021). A review of uncertainty quantification in deep learning: Techniques, applications and challenges. Information Fusion.

  3. Hullermeier, E., &; Waegeman, W. (2021). Aleatoric and epistemic uncertainty in machine learning: An introduction to concepts and methods. Machine Learning.

  4. Jungo, A., &; Reyes, M. (2019). Assessing reliability and challenges of uncertainty estimations for medical image segmentation. Medical Image Computing and Computer Assisted Intervention.

  5. Ghesu, F.C., et al. (2021). Quantifying and leveraging classification uncertainty for chest radiograph assessment. Medical Image Analysis.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
杭州濱江社工400比1,沒有編制薪資瞠目,網友直呼余杭更離譜!

杭州濱江社工400比1,沒有編制薪資瞠目,網友直呼余杭更離譜!

古希臘掌管松餅的神
2025-06-03 16:08:37
Shams:我的電話快被打爆了 聯盟高管對錫伯杜被炒都非常震驚

Shams:我的電話快被打爆了 聯盟高管對錫伯杜被炒都非常震驚

直播吧
2025-06-04 09:26:02
破防了!一家長張貼高考標語:閨女,考不好爸養你,考得好你養爸

破防了!一家長張貼高考標語:閨女,考不好爸養你,考得好你養爸

火山詩話
2025-06-04 07:27:45
克里米亞大橋被炸細節曝光!無人機佯攻,1100公斤TNT直接爆破!

克里米亞大橋被炸細節曝光!無人機佯攻,1100公斤TNT直接爆破!

鐵血米爾
2025-06-04 09:16:47
央視曝光:都是假的!價格不菲卻銷量驚人,很多人每天吃

央視曝光:都是假的!價格不菲卻銷量驚人,很多人每天吃

素衣讀史
2025-06-03 15:24:51
玩不起了?新疆1000元燒烤當自助,吃太多老板翻臉,付2000才走人

玩不起了?新疆1000元燒烤當自助,吃太多老板翻臉,付2000才走人

娛樂看阿敞
2025-06-03 10:05:07
生氣了!確認斷供!

生氣了!確認斷供!

販財局
2025-06-03 13:09:14
71歲成龍四川買房!一直盯裝修蒼老許多,兒子近照曝光卻像大學生

71歲成龍四川買房!一直盯裝修蒼老許多,兒子近照曝光卻像大學生

小洋家的大狼狗們
2025-04-25 15:10:36
薩巴倫卡:我覺得我從來沒遇到過比我更有力量的選手

薩巴倫卡:我覺得我從來沒遇到過比我更有力量的選手

懂球帝
2025-06-04 02:03:20
烏軍用1100kg炸藥引爆克里米亞大橋,破壞有多大?還能被修復嗎?

烏軍用1100kg炸藥引爆克里米亞大橋,破壞有多大?還能被修復嗎?

之乎者也小魚兒
2025-06-04 08:36:43
當選韓國總統的李在明,兩周后就要走進法院,他會被判有罪嗎?

當選韓國總統的李在明,兩周后就要走進法院,他會被判有罪嗎?

極目新聞
2025-06-04 11:10:17
亞朵酒店出現醫院枕套,酒店道歉并全面排查:系洗滌供應商嚴重失誤,已終止合作

亞朵酒店出現醫院枕套,酒店道歉并全面排查:系洗滌供應商嚴重失誤,已終止合作

界面新聞
2025-06-04 11:43:44
薩巴倫卡炮轟組委會:我們應該得到平等的待遇,鄭欽文高情商回應

薩巴倫卡炮轟組委會:我們應該得到平等的待遇,鄭欽文高情商回應

體育就你秀
2025-06-04 05:55:03
活久見!家長超時不接孩子,老師等20分鐘后放門衛,家長立馬發飆

活久見!家長超時不接孩子,老師等20分鐘后放門衛,家長立馬發飆

火山詩話
2025-06-04 06:17:57
啊這美媒殺人誅心:唐斯讓錫伯杜被解雇了兩次

啊這美媒殺人誅心:唐斯讓錫伯杜被解雇了兩次

直播吧
2025-06-04 09:02:20
中紀委再劃紅線!公務員下班后吃飯,這4種行為將被嚴肅追咎!

中紀委再劃紅線!公務員下班后吃飯,這4種行為將被嚴肅追咎!

漣漪讀史
2025-06-04 09:00:16
曝孫儷全家將移民英國, 臺媒稱鋪路10年,網友:不原諒

曝孫儷全家將移民英國, 臺媒稱鋪路10年,網友:不原諒

吐不滿的痰娛
2025-06-03 19:35:38
鄭欽文淚灑發布會:這次對薩巴只發揮六成實力 我本來是可以贏的

鄭欽文淚灑發布會:這次對薩巴只發揮六成實力 我本來是可以贏的

風過鄉
2025-06-04 00:34:10
內部人士:歐冠奪冠后,大巴黎尚未決定是否在球衣上加一顆星

內部人士:歐冠奪冠后,大巴黎尚未決定是否在球衣上加一顆星

懂球帝
2025-06-04 11:08:24
老肩巨滑的采訪,難怪人氣爆棚!

老肩巨滑的采訪,難怪人氣爆棚!

貴圈真亂
2025-06-04 08:57:43
2025-06-04 12:20:49
寄史言志 incentive-icons
寄史言志
作有深度的歷史解讀
219文章數 1596關注度
往期回顧 全部

科技要聞

馬斯克放話:SpaceX明年營收超NASA全年預算

頭條要聞

牛彈琴:韓國又創造了歷史 結果對中國是一個小小驚喜

頭條要聞

牛彈琴:韓國又創造了歷史 結果對中國是一個小小驚喜

體育要聞

帶著6冠告別國米,他已不僅是“皮波的弟弟”

娛樂要聞

彭于晏爆和Jolin復合6年?工作室否認

財經要聞

清流|中國車企到底有沒有“恒大”?

汽車要聞

新一代奧迪Q3將至!外觀大改、尺寸加長

態度原創

教育
數碼
親子
時尚
軍事航空

教育要聞

這個方程的解有很多種可能,大多數同學可能考慮的不全面

數碼要聞

雷克沙杯蘭州站英雄對戰,技嘉AORUS硬核裝備賦能年輕夢想

親子要聞

混血三姐弟送祝福啦!哥哥姐姐們高考加油!上岸成功

夏天最好看的4件T恤,減齡又百搭

軍事要聞

克里米亞大橋又被烏軍"盯上":三年三炸

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 仪陇县| 鹤山市| 上高县| 长岭县| 玉溪市| 南开区| 洮南市| 新晃| 南涧| 沙坪坝区| 陆丰市| 桂林市| 韶山市| 开平市| 抚远县| 凌源市| 元氏县| 宝鸡市| 绵竹市| 宜昌市| 拜泉县| 富裕县| 正安县| 廉江市| 峨眉山市| 麻城市| 邢台市| 谢通门县| 云梦县| 汉阴县| 五指山市| 宜都市| 广宗县| 新安县| 关岭| 巫溪县| 景德镇市| 涡阳县| 石柱| 抚松县| 丰宁|