99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Nature子刊:破除個性化AI「信任危機」的八大挑戰

0
分享至


摘要

人工智能(AI)工具越來越多地被用于幫助對個人做出重大決策。雖然 AI 模型在總體上可能準確,但它們對于特定個人或個體層面相關的結果可能同時具有高度不確定性。對于高風險應用(如醫療保健和醫學、國防和安全、銀行和金融),AI 決策支持系統必須能夠以嚴謹的方式對不確定性進行個性化評估。然而,目前用于實現這一目標的統計框架尚不完善。在此,我們概述了當前個性化不確定性量化(PUQ)的方法,并定義了一系列與 PUQ 在多模態 AI、可解釋 AI、生成式 AI 和 AI 公平性等不同領域的發展和使用相關的重大挑戰。

關鍵詞:個性化不確定性量化(PUQ),保形預測(Conformal Prediction),多模態AI(Multimodal AI),可解釋AI(XAI),AI公平性(AI Fairness)


論文題目:Personalized uncertainty quantification in artificial intelligence 發表時間:2025年4月23日 論文地址:https://www.nature.com/articles/s42256-025-01024-8 發表期刊:Nature Machine Intelligence

在醫療診斷、金融風控、司法評估等高風險領域,AI的預測結果通常會對個體產生直接的影響。盡管模型在群體層面可能表現優異,但針對特定個體或少數群體的預測可能隱藏巨大不確定性。傳統方法(如置信區間)難以捕捉個性化差異,而忽視這種不確定性可能導致災難性后果。例如,醫療AI若對患者的癌癥風險預測結果存在高不確定性,卻未明示,可能延誤治療。為此,Nature Machine Intelligence最新觀點文章提出個性化不確定性量化(PUQ)的框架與挑戰,旨在為AI決策注入可解釋的“風險預警系統”。

保形預測:為每個個體評估「不確定性」

保形預測(Conformal Prediction, CP)是當前最受關注的PUQ方法,該方法讓AI算法為每個待預測的樣本,生成一個覆蓋真實值的最小預測集合 ,保證真實值覆蓋率高于用戶指定的水平1-α。通過使用一個固定的數據校準集(沒有用于模型訓練),用來嚴格評估模型預測的不確定性。

CP的優勢在于無需假設數據分布或模型結構,需滿足“數據可交換性”(即樣本順序不影響統計性質)。其關鍵步驟包括(圖 1):

  • 非共形評分(non-conformity score):在訓練模型的基礎上,衡量預測值與真實值的偏離程度;

  • 校準集排序:根據校準數據的評分分布確定閾值;

  • 動態調整:在線學習場景中,通過實時反饋修正閾值以應對數據漂移問題。

然而,CP滿足覆蓋率要求只是“邊際性”的,它只保證平均覆蓋率高于置信水平,但無法保證在不同特征空間和結果空間的覆蓋率都相同,可能對某些亞群(如罕見病患者)覆蓋不足,這引出了首個挑戰。


圖 1. 保形預測(CP)方法。CP 生成了一個預測集,該預測集能保證對每個預測的真值具有指定概率的覆蓋。



八大挑戰:

從數據缺失到生成式AI的「幻覺」困境

1. 個體化覆蓋難題:傳統的CP方法僅能提供總體層面或子群層面的“邊際”覆蓋保證,但在高風險應用場景中,需要對每個個體都給出條件化的置信區間。嚴格意義上的個體條件覆蓋在無分布假設下不可實現,然而臨床或金融決策支持系統必須確保每位用戶都獲得同等可靠的不確定性評估。現有的啟發式方法(如針對不同群體分組校準的 Mondrian CP 或調整非一致性分數)雖可在一定程度上應對,但往往犧牲樣本利用效率,無法真正滿足個體級別的置信需求。未來需要開發無需強分布前提、可在單個樣本水平上給出嚴格置信保證的新范式。

2. 多尺度建模的復雜性:從微觀(如單細胞組學)到宏觀(如流行病學)的多尺度數據融合,顯著增加了模型復雜度和不確定性來源。構造一個統一的非一致性分數以同時反映各尺度特征的非線性相互作用,既不可行也難以解釋;僅將各尺度分數簡單拼接,則忽視了尺度間的依賴關系。此外,不同尺度的數據在質量與缺失模式上差異巨大,使得統計與模型不確定性交織難解。PUQ 框架亟需在兼顧跨尺度耦合、數據質量異質性與計算可擴展性的前提下,提供穩健且可解釋的多尺度不確定性度量。

3. 多模態AI的「信息悖論」:現代 AI 系統往往同時利用基因組、醫學影像、可穿戴設備和電子病歷等多種模態信息,各自的噪聲特性和缺失模式各異。雖然額外數據可降低部分馀升(aleatoric)不確定性,卻可能引入新的混淆變量,從而反而降低整體模型可靠性。挑戰在于如何在信息增益與噪聲干擾之間實現平衡,并在模型生命周期中動態整合新興模態,同時量化每種模態對預測不確定性的貢獻。借鑒信息價值理論與多模態共學習方法,PUQ 應當基于上下文自適應地融合各模態,生成一致且個性化的置信區間。

4. 可解釋AI的「不確定性敘事」:可解釋 AI(XAI)旨在揭示模型決策背后的邏輯,而 PUQ 則評估預測的不確定性,二者融合需構建既能說明“為什么”又能度量“有多確定”的框架。例如,可將概念瓶頸或原型模型等自解釋架構與 CP 方法結合,為每個解釋成分附加置信區間,使終端用戶既能理解決定因素,又能掌握對應的置信度。這種協同將極大提高 AI 系統在醫療、金融等領域的可信度和透明度。

5. 模型監控的「時間陷阱」:隨著時間推移,數據漂移或概念漂移會導致模型性能下降,但現有漂移檢測方法多關注總體指標,或需依賴標簽反饋。高風險場景要求實時、個體級別的不確定性監控,以及時發現特定用戶預測何時不再可靠。在線 CP 等初步方法雖提供持續校準機制,但尚處早期發展階段。理想的監控流水線應結合流數據分析、自適應重校準和不確定性預警,確保決策系統在性能退化前主動報警并進行糾正。

6. 缺失數據的「結構化問題」:隨著大規模數據庫的積累,結構化缺失(與人群特征或疾病嚴重度相關)日益普遍。標準 PUQ 方法往往假定協變量完備,無從刻畫缺失帶來的附加不確定性。可借助網絡嵌入或高階網絡分析等方式揭示缺失模式的幾何與拓撲結構,并據此對預測集進行適當擴展,既反映數據稀疏引起的信心水平下降,又能標示出因數據貧乏而面臨高風險的子群,為后續的填補或針對性采樣提供指引。

7. 公平性困境:訓練數據中弱勢群體樣本稀少,將導致該群體在模型擬合和參數估計時存在更高的系統性不確定性。PUQ 框架必須確保不確定性度量不會進一步加劇社會不平等,反而能主動檢測并糾正因人群代表性不足帶來的偏差。可通過分層建模、目標數據補采和不確定性報告機制,明確弱勢群體的高風險區間,從而為公平合規(如遵循歐盟 AI 法案)提供技術支持。

8. 生成式AI的「確定性幻覺」:生成模型輸出(文本、圖像、音頻)維度極高,且常常缺乏自然的區間表示方式。不同應用場景對不確定性的容忍度也大相徑庭:創意領域可能偏好多樣性(高方差),而醫學或法律場景則要求嚴格準確。PUQ 在此領域需首先識別出具有語義意義的生成內容特征(如事實性斷言 vs. 風格元素),并對每一特征賦予相應置信范圍。未來研究應在符合性預測思路基礎上,擴展至結構化、序列化或流形化輸出,以構建適用于生成式 AI 的個性化不確定性度量方法。


圖 2.PUQ面臨的主要挑戰:從經典預測任務到新興應用場景。



結語

文章強調,PUQ的價值不僅在于技術突破,更需轉化為用戶可感知的交互設計。例如,醫療AI界面可用“溫度條”顯示風險置信度,紅色高亮低確定性建議,供醫生二次審核;司法系統則需避免直接用數值呈現“犯罪概率”,轉而提供風險等級與法律依據。如何平衡不確定性傳達的透明性與決策效率,不僅需要AI工作者的努力,也需要社會多方共同參與獻策。

集智俱樂部計算社會科學讀書會中,密西根大學博士研究生謝雨桐分享了“AI如何理解我們?我們如何信任AI?”聚焦兩個代表性的研究項目:一個是發表在頂級期刊PNAS上的“AI聊天機器人與人類行為的相似性圖靈測試”(A Turing test of whether AI chatbots are behaviorally similar to humans),另一個是發表在The ACM Web Conference上的“圖像生成AI中的提示詞分析”(A Prompt Log Analysis of Text-to-Image Generation Systems)進行分享。感興趣的可以掃碼查看視頻回放

彭晨| 編譯

大模型安全與對齊讀書會

大模型的狂飆突進喚醒了人們對AI技術的熱情和憧憬,也引發了對AI技術本身存在的社會倫理風險及其對人類生存構成的潛在威脅的普遍擔憂。在此背景下,AI安全與對齊得到廣泛關注,這是一個致力于讓AI造福人類,避免AI模型失控或被濫用而導致災難性后果的研究方向。集智俱樂部和安遠AI聯合舉辦,由多位海內外一線研究者聯合發起,旨在深入探討AI安全與對齊所涉及的核心技術、理論架構、解決路徑以及安全治理等交叉課題。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。

詳情請見:

1.

2.

3.

4.

5.

6.

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
俄羅斯軍事專家:“中國綜合國力遠超漢唐時期,美國毫無勝算”

俄羅斯軍事專家:“中國綜合國力遠超漢唐時期,美國毫無勝算”

農夫史記
2025-05-31 20:20:43
著名港星方剛去世享年78歲,一生未婚無子女,最后露面瘦骨嶙峋

著名港星方剛去世享年78歲,一生未婚無子女,最后露面瘦骨嶙峋

開開森森
2025-05-31 15:08:45
暴雨增強!上海人今天請減少出門,這些活動已取消、延期!緊急通知

暴雨增強!上海人今天請減少出門,這些活動已取消、延期!緊急通知

環球網資訊
2025-06-01 07:47:23
直擊廣東疊滘龍船賽:300元的觀賽陽臺位一位難求,千元的龍船飯預訂一空

直擊廣東疊滘龍船賽:300元的觀賽陽臺位一位難求,千元的龍船飯預訂一空

紅星新聞
2025-05-31 15:16:17
這三種老人是禍害,誰攤上誰倒霉,真的希望你家里沒有

這三種老人是禍害,誰攤上誰倒霉,真的希望你家里沒有

小鬼頭體育
2025-05-25 21:19:18
每天至少一包,寧波男子同時查出三種癌癥!最終放棄治療

每天至少一包,寧波男子同時查出三種癌癥!最終放棄治療

魯中晨報
2025-05-31 14:05:36
最后24小時,三國對華下戰書,美航母殺個回馬槍,中方劃下落彈區

最后24小時,三國對華下戰書,美航母殺個回馬槍,中方劃下落彈區

說天說地說實事
2025-05-30 12:36:48
抵制二手煙,我成了戴防毒面具上班的“怪人”

抵制二手煙,我成了戴防毒面具上班的“怪人”

新京報
2025-05-31 09:47:41
陳妍希曬母子合照慶生,大秀美背,8歲小星星長勢喜人,體態像爸

陳妍希曬母子合照慶生,大秀美背,8歲小星星長勢喜人,體態像爸

西瓜愛娛娛
2025-06-01 11:25:53
美軍發力,鐵了心阻止大陸收臺!解放軍擺好戰斗姿態,發出最強音

美軍發力,鐵了心阻止大陸收臺!解放軍擺好戰斗姿態,發出最強音

兵器雜志
2025-06-01 10:51:21
玩不起中超的江蘇足球,玩玩“蘇超”也不錯,干凈純潔有奶香味

玩不起中超的江蘇足球,玩玩“蘇超”也不錯,干凈純潔有奶香味

譚浩俊
2025-06-01 07:38:19
加沙的孩子沒有兒童節:每45分鐘有一名孩子死去

加沙的孩子沒有兒童節:每45分鐘有一名孩子死去

環球網資訊
2025-05-31 11:01:23
前腳剛去莫斯科捧場,后腳就被克宮問罪:塞爾維亞的幾十萬發炮彈

前腳剛去莫斯科捧場,后腳就被克宮問罪:塞爾維亞的幾十萬發炮彈

鷹眼Defence
2025-05-30 18:17:32
華為余承東:我先把牛吹在這里,鴻蒙智行不是第一陣營就是第一名

華為余承東:我先把牛吹在這里,鴻蒙智行不是第一陣營就是第一名

叮當當科技
2025-06-01 11:05:37
王楚欽回應緋聞:希望大家給予理解與空間。

王楚欽回應緋聞:希望大家給予理解與空間。

大嘴說臺球
2025-05-29 13:29:43
曝圖赫爾報復曼聯,建議德拉普選擇切爾西!拉爵或從大巴黎租前鋒

曝圖赫爾報復曼聯,建議德拉普選擇切爾西!拉爵或從大巴黎租前鋒

羅米的曼聯博客
2025-05-31 10:12:06
他被張衛健謝霆鋒打成重傷,發妻流產6次,如今靠鹵肉攤維持生計

他被張衛健謝霆鋒打成重傷,發妻流產6次,如今靠鹵肉攤維持生計

新語愛八卦
2025-05-22 15:03:39
阿斯:皇馬今夏簽中場只是過渡選項,終極目標是明年簽羅德里

阿斯:皇馬今夏簽中場只是過渡選項,終極目標是明年簽羅德里

懂球帝
2025-05-31 21:25:15
最新情報傳來,朝鮮利用烏克蘭戰爭,與俄羅斯做了一筆大交易

最新情報傳來,朝鮮利用烏克蘭戰爭,與俄羅斯做了一筆大交易

張牧之
2025-05-31 12:05:06
美防長:這是我們的優先戰區!中國專家:要錢?

美防長:這是我們的優先戰區!中國專家:要錢?

環球時報新聞
2025-05-31 16:25:29
2025-06-01 12:20:50
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5132文章數 4634關注度
往期回顧 全部

科技要聞

特朗普突然炒掉NASA準局長,嫌他不"忠誠"?

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

頭條要聞

玩滑翔傘被“吸”至8000米高空 當事人親述逃生細節

體育要聞

亞錦賽女子200米:16歲陳妤頡22秒97奪金

娛樂要聞

張若昀夫婦國外遛娃 男方推平價兒童車

財經要聞

油價繼續下跌?歐佩克宣布將再度增產

汽車要聞

零跑汽車5月交付量達45,067臺 穩居新勢力前三

態度原創

教育
旅游
數碼
本地
公開課

教育要聞

民生政策 落地有聲|課間15分鐘 讓孩子們動起來的N種可能

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數碼要聞

榮耀Magic V5或六月發,多款新品待發布

本地新聞

云游中國 |來仰天湖大草原,一起策馬奔騰

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 湘潭县| 美姑县| 阿勒泰市| 峨山| 南江县| 新乡市| 兖州市| 武邑县| 大丰市| 顺昌县| 清水县| 淮北市| 攀枝花市| 宜城市| 咸阳市| 满洲里市| 岑溪市| 公主岭市| 峡江县| 静安区| 兴业县| 浪卡子县| 报价| 鸡东县| 沂南县| 遂川县| 海门市| 绩溪县| 衢州市| 鄂尔多斯市| 双柏县| 彭泽县| 红河县| 贵港市| 永济市| 绥中县| 邓州市| 兴海县| 谢通门县| 临西县| 海南省|