網易首頁 > 網易號 > 正文申請入駐

【安全圈】新的 Inception 越獄攻擊繞過了 ChatGPT、DeepSeek、Gemini、Grok 和 Copilot

2025-04-27 19:42:41　來源: 安全圈

江蘇舉報

分享至

關鍵詞

網絡攻擊

一對新發現的越獄技術暴露了當今最流行的生成式人工智能服務的安全護欄中的系統性漏洞，包括 OpenAI 的 ChatGPT 、谷歌的 Gemini、微軟的 Copilot、DeepSeek、Anthropic 的 Claude、X 的 Grok、MetaAI 和 MistralAI。

這些越獄可以在各個平臺上以幾乎相同的提示執行，允許攻擊者繞過內置的內容審核和安全協議，生成非法或危險的內容。第一個被稱為“盜夢空間”，利用嵌套的虛構場景來侵蝕人工智能的道德界限，而第二個則操縱人工智能揭示它不應該如何回應，然后轉向非法請求。

這些技術的發現凸顯了一個關鍵的、全行業的挑戰：即使供應商競相實施復雜的護欄，對手仍在繼續尋找新的方法來破壞它們，這對人工智能安全的穩健性和未來提出了緊迫的問題。

系統性越獄：“盜夢空間”和上下文繞過技術

最近幾個月出現了兩種非常有效的越獄策略，它們利用了大型語言模型 (LLM) 設計和部署中的基礎弱點。

第一種技術名為“Inception”，它促使人工智能想象一個虛構的場景，通常是在另一個場景中分層的，然后逐漸將對話轉向通常會被安全過濾器阻止的請求。

通過利用人工智能的角色扮演和在多個回合中維持背景的能力，攻擊者可以誘使模型生成違反其道德和法律準則的內容。

該方法已被證明在一系列領先的人工智能平臺上有效，表明底層漏洞并不局限于任何單一供應商或架構。

第二種越獄技術是通過詢問人工智能如何不響應特定請求來獲取有關其內部護欄的信息。

攻擊者可以交替使用常規提示和非法提示，利用人工智能的上下文記憶來繞過安全檢查。這種方法已被證明可以在多個平臺上發揮作用，進一步凸顯了該威脅的系統性。

CERT咨詢指出，這兩種方法都依賴于人工智能的基本設計、其提供幫助的動力、其維護上下文的能力以及其對語言和場景框架的微妙操縱的敏感性。

這些越獄行為后果嚴重。通過繞過安全措施，攻擊者可以指示人工智能系統生成與管制物質、武器、釣魚郵件、惡意軟件和其他非法活動相關的內容。

雖然每次越獄的嚴重程度可能單獨來看較低，但漏洞的系統性會顯著增加風險。有動機的威脅行為者可能會利用這些漏洞，大規模地自動創建有害內容，并可能使用合法的人工智能服務作為代理來掩蓋其活動。

ChatGPT、Claude、Copilot、 DeepSeek 、Gemini、Grok、MetaAI 和 MistralAI等主要平臺普遍存在易受攻擊性，這表明當前的人工智能安全和內容審核方法不足以應對對手不斷演變的策略。

鑒于從客戶服務到醫療保健到金融等各行各業對生成式人工智能的依賴日益增加，這一點尤其令人擔憂，因為成功越獄的后果可能非常嚴重。

供應商回應

針對這些漏洞的發現，受影響的供應商已經開始發布聲明并實施緩解措施。

例如，DeepSeek 承認了這份報告，但堅稱觀察到的行為屬于傳統的越獄，而非架構缺陷，并指出該 AI 提到的“內部參數”和“系統提示”只是幻覺，而非實際信息泄露。該公司承諾將繼續改進其安全防護措施。

截至本文撰寫時，其他供應商（包括 OpenAI、Google、Meta、Anthropic、MistralAI 和 X）尚未發表公開聲明，但據報道內部調查和更新正在進行中。

業內專家強調，雖然事后防護欄和內容過濾器仍然是人工智能安全的重要組成部分，但它們并非萬無一失。

攻擊者不斷開發新技術，例如字符注入和對抗性機器學習規避，以利用審核系統中的盲點，降低檢測準確性并使有害內容得以逃脫。

隨著生成模型的功能越來越強大且被越來越廣泛地采用，人工智能開發者和對手之間的軍備競賽可能會愈演愈烈。

報告“Inception”技術的安全研究人員 David Kuzsmar 和確定上下文繞過方法的 Jacob Liddle 被認為發現了這些越獄行為。

他們的工作由克里斯托弗·卡倫 (Christopher Cullen) 記錄下來，促使人們對人工智能安全協議進行重新審查，并迫切需要更強大、更適應性的防御措施。

隨著生成性人工智能繼續快速融入日常生活和關鍵基礎設施，保護這些系統免受富有創造力和持久性的對手的攻擊的挑戰變得越來越復雜。

安全圈

網羅圈內熱點專注網絡安全

實時資訊一手掌握！

好看你就分享有用就點個贊

支持「安全圈」就點個三連吧！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

虛假繁榮？五一假期各地景區人山人海，為什么大家卻不愿意花錢？

小毅說事 2025-05-07 07:55:34
2557 跟貼 2557
男子從二樓跳下躺地不動，妻子一旁淡定從容引發網友熱議！

爆料視頻 2025-05-08 15:13:49
313 跟貼 313

滑沙有這么大吸引力嗎，這樣滑下去，會不會是顆粒感十足

德旺茶觀感 2025-05-07 10:43:38
2213 跟貼 2213

仇珂靜，主動交代問題

新京報政事兒 2025-05-08 10:28:36
101 跟貼 101
國防部奉勸有關國家不要引狼入室

財聯社 2025-05-08 15:06:09
1207 跟貼 1207

解放軍儀仗隊紅場高唱抗日歌曲

環球時報 2025-05-05 09:29:36
49725 跟貼 49725

捷克登山客挖到價值超247萬元寶藏:可獲10%獎金

大象新聞 2025-05-05 09:26:02
7361 跟貼 7361
老外：全球頂尖的陣風戰斗機被虐？這是今年聽過的超無腦的話！

瀘沽湖 2025-05-08 10:26:59
1473 跟貼 1473

iPhone 13 升級到 iOS 18.5 后可接入運營商提供的衛星服務

cnBeta.COM 2025-05-07 03:46:18
1473 跟貼 1473
這條吃相難看的新聞，每一行都寫滿了惡

末名先生 2025-05-08 14:49:49
2 跟貼 2
美機場雷達黑屏1分多鐘嚇得數名空管員請了45天病假

紅星新聞 2025-05-07 21:08:30
1235 跟貼 1235
大四本科生已發14篇SCI論文，初中就已申請發明專利？學校工作人員回應：已記錄情況并匯報

紅星新聞 2025-05-08 12:46:43
1166 跟貼 1166
涉就業、年假、育兒補貼等，廣東發布31條措施提振消費

新快報新聞 2025-05-07 20:10:03
516 跟貼 516
西安碑林博物館票價將調至85元，工作人員：10元屬于改擴建期間惠民票

澎湃新聞 2025-05-08 10:08:11
34 跟貼 34
倒計時！俄羅斯紅場閱兵最后一次彩排

中國日報網 2025-05-08 00:00:13
400 跟貼 400
中美會談是否提出貿易協定中方回應

界面新聞 2025-05-08 15:59:23
22 跟貼 22
波音公司計劃于2027年交付新版“空軍一號”飛機

央視新聞客戶端 2025-05-08 09:47:54
488 跟貼 488
國家發改委：保障對民營企業非禁即入

北京日報 2025-05-08 10:55:08
0 跟貼 0
被指機器狗存后門漏洞宇樹科技回應

第一財經資訊 2025-05-08 09:46:35
259 跟貼 259
趙心童世界排名升至第11位

大象新聞 2025-05-08 08:30:09
628 跟貼 628
韓軍方稱朝鮮向半島東部海域發射短程彈道導彈

界面新聞 2025-05-08 09:11:41
508 跟貼 508
AI辦公加持基因科技？金山辦公宣布與華大集團戰略簽約

企業家日報 2025-05-08 13:59:36
6850 跟貼 6850
今日辟謠（2025年5月8日）

今日辟謠 2025-05-08 17:44:05
0 跟貼 0
G4前不會回歸！勇士官宣庫里至少傷停一周

雷速體育 2025-05-08 06:12:11
0 跟貼 0
車墜20米深崖！西鄉警方搶回一條命

縱享漢中 2025-05-08 17:51:40
0 跟貼 0
又是20分逆轉！尼克斯2-0凱爾特人，唐斯21+17塔圖姆致命失誤

湖人崛起 2025-05-08 09:31:20
0 跟貼 0
男子撿到他人遺失證件經歷13次搬家一直保存，18年后找到失主

上游新聞 2025-05-08 16:26:19
0 跟貼 0
痛！腳上的鞋帶扣竟“咬”住了嘴唇！

溫州消防 2025-05-08 17:56:42
0 跟貼 0
“最直接表態”，外媒：烏克蘭央行行長稱，烏方考慮放棄美元作為參考貨幣

環球網資訊 2025-05-08 13:49:35
0 跟貼 0
戈登：雷霆一直對約基奇犯規裁判就是不吹

北青網-北京青年報 2025-05-08 16:47:03
0 跟貼 0

手機 / 數碼

房產 / 家居

【安全圈】新的 Inception 越獄攻擊繞過了 ChatGPT、DeepSeek、Gemini、Grok 和 Copilot

OpenAI任命"應用CEO" 奧特曼聚焦研究/安全

女子走路打電話轉身撞男子摔骨折 法院調解男子賠7萬

女子走路打電話轉身撞男子摔骨折 法院調解男子賠7萬

面對一群天賦怪，阿森納只能接受失敗

劉畊宏老婆補刀 清場風波口碑翻車！

57政策解讀:力度空前的系統性穩增長舉措

23.68萬元起 新款途觀L Pro限時優惠5.8萬

態度原創

侘寂美學 樸素而有生機

非遺里的河南｜汴梁鳶舞千年韻！宋室風箏藏多少絕活

微軟悄悄發布Surface Arc 鼠標海洋藍、紫羅蘭配色，89.99美元

《使命召喚：黑色行動6》第3賽季季中更新襲來 全新多人游戲地圖

【安全圈】新的 Inception 越獄攻擊繞過了 ChatGPT、DeepSeek、Gemini、Grok 和 Copilot

女子走路打電話轉身撞男子摔骨折法院調解男子賠7萬

女子走路打電話轉身撞男子摔骨折法院調解男子賠7萬

面對一群天賦怪，阿森納只能接受失敗

劉畊宏老婆補刀清場風波口碑翻車！

23.68萬元起新款途觀L Pro限時優惠5.8萬

侘寂美學樸素而有生機

非遺里的河南｜汴梁鳶舞千年韻！宋室風箏藏多少絕活

《使命召喚：黑色行動6》第3賽季季中更新襲來全新多人游戲地圖