99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

看似無害的提問偷走RAG記憶,IKEA:隱蔽高效數據提取攻擊新范式

0
分享至



本文作者分別來自新加坡國立大學、北京大學與清華大學。第一作者王宇豪與共同第一作者屈文杰來自新加坡國立大學,研究方向聚焦于大語言模型中的安全與隱私風險。共同通訊作者為北京大學翟勝方博士,指導教師為新加坡國立大學張嘉恒助理教授。

本研究聚焦于當前廣泛應用的 RAG (Retrieval-Augmented Generation) 系統,提出了一種全新的黑盒攻擊方法:隱式知識提取攻擊 (IKEA)。不同于以往依賴提示注入 (Prompt Injection) 或越獄操作 (Jailbreak) 的 RAG 提取攻擊手段,IKEA 不依賴任何異常指令,完全通過自然、常規的查詢,即可高效引導系統暴露其知識庫中的私有信息。

在基于多個真實數據集與真實防御場景下的評估中,IKEA 展現出超過 91% 的提取效率與 96% 的攻擊成功率,遠超現有攻擊基線;此外,本文通過多項實驗證實了隱式提取的 RAG 數據的有效性。本研究揭示了 RAG 系統在表面「無異常」交互下潛在的嚴重隱私風險。

本研究的論文與代碼已開源。



  • 論文題目:Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries
  • 論文鏈接:https://arxiv.org/pdf/2505.15420
  • 代碼鏈接:https://github.com/Wangyuhao06/IKEA.git

總述

大語言模型 (LLMs) 近年來在各類任務中展現出強大能力,但它們也面臨一個核心問題:無法直接訪問最新或領域特定的信息。為此,RAG (Retrieval-Augmented Generation) 系統應運而生——它為大模型接入外部知識庫,讓生成內容更準確、更實時。

然而,這些知識庫中往往包含私有或敏感信息。一旦被惡意利用,可能導致嚴重的數據泄露。以往的攻擊方式多依賴明顯的「惡意輸入」,比如提示注入或越獄攻擊。這類攻擊雖然有效,但也有著輸入異常、輸出重復等典型特征,容易被防御系統識別和攔截。



圖1: 使用惡意查詢進行逐字信息提取與使用良性查詢進行知識提取 (IKEA) 之間的對比

為突破防御機制對現有提取攻擊的限制,本文提出了一種全新的隱式知識抽取框架:IKEA (Implicit Knowledge Extraction Attack)。該方法不依賴任何越權指令或特異化提示語,而是通過自然、常規的查詢輸入,逐步引導 RAG 系統暴露其內部知識庫中的私有或敏感信息。IKEA 的攻擊流程具備高度自然性與隱蔽性。

其核心步驟包括:首先,基于已知的系統主題構建一組語義相關的錨點概念 (Anchor concepts);隨后,圍繞這些概念生成符合自然語言習慣的問題,用于觸發系統檢索相關文檔;最終,通過兩項關鍵機制對攻擊路徑進行優化與擴展:

  • 經驗反思采樣 (Experience Reflection Sampling):依據歷史查詢與響應記錄,動態評估并篩選出更可能產生有效響應的錨點概念,從而提升查詢的相關性與信息提取率;
  • 可信域有向變異 (Trust Region Directed Mutation):在錨點語義鄰域中進行定向概念擴展,通過控制語義相似度與突進性,實現對尚未覆蓋知識區域的持續探索。

上述機制協同工作,使得攻擊過程在保持輸入自然性的同時,能夠在多輪交互中高效提取 RAG 系統所依賴的外部知識內容。實驗證明,IKEA 可在常規輸入檢測與輸出過濾等防御機制下維持高成功率與提取效率,展現出強大的魯棒性與現實威脅潛力。

方法概覽:如何實現「看似正常」的提問?

具體而言,IKEA 首先從與系統主題相關的概念詞中篩選出可能有效的錨點概念,并結合歷史響應信息過濾無關或無效的概念。

錨點概念數據庫的初始化如下:



隨后,系統圍繞這些錨點概念自動生成語義自然、表達通順的問題,引導 RAG 返回內容豐富的答案,從而在多輪交互中不斷擴大對隱私知識的覆蓋。這種策略使攻擊過程更加隱蔽,難以被傳統檢測手段發現。下文給出了「良性」問題的具體生成方式:



該方法設計了兩項關鍵機制以確保知識提取效率:

  • 經驗反思采樣 (Experience Reflection Sampling)
  • 可信域有向變異 (Trust Region Directed Mutation, TRDM)

經驗反思采樣 (Experience Reflection Sampling)



每個候選錨點概念的采樣概率由如下懲罰得分函數定義:



最終的采樣概率為:



可信域有向變異 (Trust Region Directed Mutation)



圖 2: (左) IKEA 整體流程圖;(右) TRDM 示意圖





其中:





實驗結果:IKEA 的提取效率遠超基線方法

研究團隊在三個不同領域數據集 (醫療-HealthCareMagic100k、小說-HarryPotter、百科-Pokémon) 上測試了 IKEA 攻擊效果。以下是 IKEA 與其他攻擊方法在「無防御」、「輸入檢測」、「輸出過濾」三種防御策略下的比較:



表 1: 在三種數據集上不同防御策略下的攻擊效果對比分析

提取知識是否「有用」?

研究團隊圍繞知識有效性開展了兩類實驗:其一,評估提取出的知識在對應文檔相關的問答任務中的表現;其二,評估在有限輪次攻擊下所提取知識對完整知識庫的覆蓋與支撐能力。實驗結果表明,IKEA 不僅能夠高效提取 RAG 系統中的信息,而且所提取的知識在問答任務中展現出良好的實用性,其性能接近于使用原始知識庫時的表現。

  • 提取知識有效性評估。我們在三個數據集上評估 IKEA 提取知識在 MCQ 與 QA 任務中的效果,并與原始片段和無參考場景進行對比。結果顯示,在雙重防御下提取的知識顯著提升了回答的準確性與質量。Extracted表示使用 IKEA 提取的文本片段構建的知識庫,Origin代表評估數據集中原始的參考片段,Empty則表示在回答問題時未提供任何參考上下文。



圖 3: 在三種不同知識庫設定下的選擇題 (MCQ) 與問答 (QA) 任務結果對比



表 2: 在不同防御與不同基線下提取的知識作為參考的選擇題與問答任務結果對比

  • 使用提取知識構建的替代 RAG 系統進行在完整 Pokémon 數據集上評估。IKEA 提取的知識用于多項選擇 (MCQ) 和開放式問答 (QA) 任務時,表現顯著優于其他攻擊方法:



表 3: 基于不同攻擊方法提取數據構建的 RAG 系統在完整知識庫上的評估結果

總結

IKEA 攻擊提出了一種全新且高度隱蔽的 RAG 系統攻擊范式。借助自然語言生成策略與基于歷史交互的經驗反饋機制,IKEA 能有效規避現有輸入與輸出層面的防御措施,實現對系統中敏感知識的持續、高效提取。本研究揭示了 RAG 系統在知識提取上的潛在脆弱性,為后續更全面的防御機制設計提供了關鍵參考。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
井柏然與劉雯被網友偶遇逛街,二人牽手摟腰破除分手謠言

井柏然與劉雯被網友偶遇逛街,二人牽手摟腰破除分手謠言

TVB的四小花
2025-06-08 09:14:52
銀行人提醒:60歲以上老人存錢,建議加上“第二存款人”!

銀行人提醒:60歲以上老人存錢,建議加上“第二存款人”!

搬磚營Z
2025-05-26 13:36:56
馬斯克刪除涉特朗普帖子!世界首富都治不了特朗普,那還有誰?!

馬斯克刪除涉特朗普帖子!世界首富都治不了特朗普,那還有誰?!

正經說個事兒
2025-06-08 10:46:08
遼寧號直抵關島,美國態度大變,扣下臺島66架戰機,只收錢不交貨

遼寧號直抵關島,美國態度大變,扣下臺島66架戰機,只收錢不交貨

一個有靈魂的作者
2025-06-08 13:55:58
父母離婚21年,女兒收到父親留給自己的深圳別墅,打開門后她愣住了

父母離婚21年,女兒收到父親留給自己的深圳別墅,打開門后她愣住了

澤澤先生
2025-05-26 13:37:37
印度學者警告莫迪,別招惹中國,人家只是欠缺一個收拾你的理由!

印度學者警告莫迪,別招惹中國,人家只是欠缺一個收拾你的理由!

近史閣
2025-06-06 14:39:49
從加價8萬到優惠6萬,普拉多降價后銷量一路大漲,比日本版貴25萬

從加價8萬到優惠6萬,普拉多降價后銷量一路大漲,比日本版貴25萬

小李子體育
2025-06-08 03:13:07
韋神開通抖音號,被迫營業與外甥合照,全程一副敢怒不敢言的模樣

韋神開通抖音號,被迫營業與外甥合照,全程一副敢怒不敢言的模樣

大笑江湖史
2025-06-06 11:12:12
6 月起,咸魚翻身的3生肖,喜事來,橫財不斷

6 月起,咸魚翻身的3生肖,喜事來,橫財不斷

人閒情事
2025-06-08 14:21:58
今年入梅太反常!十年最早梅雨季,三伏天要熱瘋?農諺早有預警

今年入梅太反常!十年最早梅雨季,三伏天要熱瘋?農諺早有預警

愛下廚的阿椅
2025-06-05 15:45:29
《陣地》央視首播!王勁松領銜8位實力派飆戲,沖擊2025劇王

《陣地》央視首播!王勁松領銜8位實力派飆戲,沖擊2025劇王

樂楓電影
2025-06-07 12:23:39
聯合國預測:中國人口迅速萎縮,可能成為全球面對的最大挑戰

聯合國預測:中國人口迅速萎縮,可能成為全球面對的最大挑戰

巢客HOME
2025-04-07 18:24:52
回顧:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結果釀慘案

回顧:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結果釀慘案

談史論天地
2025-06-08 11:40:06
最新世界大學排名出爐,中國數量首超美國

最新世界大學排名出爐,中國數量首超美國

陸棄
2025-06-07 13:50:15
女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

女跑者真實經歷分享:天熱跑步謹慎走光,小心“春光乍泄”

馬拉松跑步健身
2025-05-29 13:53:35
6月12日養老金調整方案公布了?企退人員能補發多少錢?

6月12日養老金調整方案公布了?企退人員能補發多少錢?

社保小達人
2023-06-12 12:40:49
國家衛健委發布會回應:無償獻血對身體沒有損害

國家衛健委發布會回應:無償獻血對身體沒有損害

封面新聞
2025-06-05 18:58:23
中美談完不到24小時,美方就開始報復了,停止對華出口核電設備!

中美談完不到24小時,美方就開始報復了,停止對華出口核電設備!

科技有趣事
2025-06-08 12:52:27
考上清北獎勵100萬,中考全市100名以內獎勵50!南京這學校有魄力

考上清北獎勵100萬,中考全市100名以內獎勵50!南京這學校有魄力

小人物看盡人間百態
2025-06-07 20:03:02
央視《長安的荔枝》首播!連追3集后,我想說:古裝劇就該這么拍

央視《長安的荔枝》首播!連追3集后,我想說:古裝劇就該這么拍

大笑江湖史
2025-06-07 21:35:27
2025-06-08 17:28:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10599文章數 142333關注度
往期回顧 全部

科技要聞

馬斯克"越紅線",美政府急尋SpaceX替代品

頭條要聞

安徽涇縣再通報游客被打:3人被拘 公安局多人被追責

頭條要聞

安徽涇縣再通報游客被打:3人被拘 公安局多人被追責

體育要聞

冠軍高芙:只要專注自己 太陽就會照常升起

娛樂要聞

結婚15年紀念!孫儷發長文談夫妻感情

財經要聞

暴漲超9%!白銀狂飆,“搶奪”黃金光環!

汽車要聞

復古造型樂趣依舊 寶馬R12 nineT又帥又好騎

態度原創

游戲
藝術
教育
旅游
健康

任天堂換人!碧姬公主迎新配音:原演員為其配音18年

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

高考,為什么定在每年6月份?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

減重專家破解減肥九大謠言!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 吴忠市| 襄城县| 庄浪县| 云林县| 仁布县| 万山特区| 宁蒗| 临安市| 麻江县| 绥德县| 会宁县| 宁陵县| 通化市| 凤凰县| 新宁县| 云阳县| 浠水县| 镇平县| 明水县| 桐城市| 法库县| 邯郸县| 柯坪县| 会理县| 东源县| 定结县| 翁源县| 厦门市| 大安市| 宁夏| 武定县| 岗巴县| 信阳市| 锡林浩特市| 阿拉善盟| 雅江县| 漳平市| 曲阳县| 榆林市| 咸丰县| 霍林郭勒市|