99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Grok 4發布僅兩天即遭「越獄」!號稱“超越人類博士”的它,竟被輕松騙出了違禁內容?

0
分享至

  整理 | 鄭麗媛

  出品 | CSDN(ID:CSDNnews)

  投稿或尋求報道 | zhanghy@csdn.net

  上周,xAI 重磅發布了其最新一代大語言模型 Grok 4,馬斯克還在上高調表示:“Grok 4 在每一個學科上都優于博士水平,沒有任何例外。”

  然而,僅僅兩天之后,安全研究機構 NeuralTrust 就宣布已成功“越獄”了 Grok 4——不是用暴力破解或明顯的惡意提示,而是通過一種更隱蔽、更高級的“組合攻擊”方式,悄無聲息地繞過模型防護機制,使其說出了本不該說的話。

  

  

  沒有敏感詞,沒有暴力指令,Grok4 就這樣“中招”了

  如開頭所說,在這次越獄中,NeuralTrust研究人員沒有輸入任何明顯的惡意關鍵詞,比如“制造炸彈”、“毒品配方”或“暴力襲擊”等——這些通常會立即觸發大模型的安全護欄。但他們依然誘導 Grok4 給出了“燃燒瓶制作指南”這種違禁內容。

  這正是本次越獄攻擊的可怕之處:攻擊者使用了 Echo Chamber(回音室)+ Crescendo(漸進式) 兩種越獄技術的組合,在短短幾輪對話中,就讓模型“放松警惕”,最終生成了原本不該輸出的信息。

  而這兩種攻擊方法,其實早已被不同團隊公開過:

  ●Echo Chamber:最早由 NeuralTrust 開發,其原理是通過“上下文投毒”的方式,在不觸發敏感詞過濾的情況下,逐步引導模型生成有害內容。這種攻擊的關鍵在于永遠不會直接輸入那些容易觸發模型“護欄”的危險詞語,而是通過反復鋪墊、引導,讓模型在不知不覺中給出違禁信息。

  ●Crescendo:由微軟在 2024 年 4 月首次提出。這是一種漸進式誘導機制,即“溫水煮青蛙”式攻擊路徑。攻擊者從安全邊界附近的提示開始,一步步引用模型自己先前的回答內容,不斷將話題推向危險邊緣,直到模型逐步放松防御并生成敏感輸出。

  這兩種攻擊方式看似思路不同,但當結合使用時,攻擊效果呈倍數增強:Echo Chamber 用于建立基礎攻擊路徑,Crescendo 負責“補刀”推進,最終突破防線。

  

  Grok4 是如何一步步“淪陷”的?

  據介紹,NeuralTrust 在 Grok4 發布后的第二天,就嘗試使用 Echo Chamber讓模型生成一份制作燃燒瓶(Molotov cocktail)的操作手冊。他們表示,雖然 Echo Chamber能夠實現初步引導,但單靠這一手段仍無法完全突破模型的安全防護機制。

  為此,他們接著引入了 Crescendo 技術,通過兩輪補充引導,最終成功誘導模型輸出完整的制作流程——整個過程未涉及任何顯性敏感詞,完全靠多輪上下文引導完成。

  

  (出于安全原因,NeuralTrust 對Grok4的輸出結果進行了部分模糊處理)

  “只要掌握兩種方法的核心邏輯,組合使用其實并不復雜。”研究人員表示。

  大體而言,NeuralTrust的測試流程是:先以 Echo Chamber 為起點,當模型進入“停滯”狀態時(即模型開始猶豫或重復回應),就引入 Crescendo進行“補刀”。一般來說,這種組合方式在兩輪對話內就能見效:要么模型成功識別意圖并拒絕響應;要么就成功繞過防護,生成違禁內容。

  

  

  組合型攻擊或成未來模型安全防護的大敵

  為了驗證這種組合攻擊的適用范圍,NeuralTrust研究人員還選取了 Crescendo 原論文中的多個非法目標,對 Grok 4 進行了系統性測試:

  

  對于這個結果,研究人員補充道:“在某些情況下,我們僅憑一輪提示就讓Grok4生成了惡意輸出,甚至都無需執行 Crescendo 步驟——這說明 Grok 4 仍存在明顯的防護缺口。”

  在研究報告的最后,NeuralTrust向所有LLM研發人員提出建議:將模型的多輪對話能力以及“細水長流式越獄”防護列為重點關注方向,因為這類攻擊的隱蔽性和破壞力都“遠超想象”。

  畢竟,對于某些惡意攻擊者來說,只要成功一次,就可能會造成嚴重的現實風險。

  參考鏈接:https://neuraltrust.ai/blog/grok-4-jailbreak-echo-chamber-and-crescendo

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
甜瓜:比斯利是史上最有天賦的球員之一 他并未被真正尊重過

甜瓜:比斯利是史上最有天賦的球員之一 他并未被真正尊重過

直播吧
2025-07-23 17:57:59
杭州余杭受影響用戶7月份水費全免

杭州余杭受影響用戶7月份水費全免

界面新聞
2025-07-23 17:49:15
深圳最新人事任免發布

深圳最新人事任免發布

南方都市報
2025-07-23 20:53:42
周恩來祭拜孫中山,得知守靈人20年未發餉,總理問:他給你多少錢

周恩來祭拜孫中山,得知守靈人20年未發餉,總理問:他給你多少錢

與史說
2025-07-23 12:12:43
老人扎堆乘涼,肯德基損失過萬,警方沒有辦法,老人一語說出關鍵

老人扎堆乘涼,肯德基損失過萬,警方沒有辦法,老人一語說出關鍵

鋭娛之樂
2025-07-22 23:31:40
上海郊區小鎮,全面崩盤

上海郊區小鎮,全面崩盤

魔都財觀
2025-07-23 07:41:49
廣東2個孩子被燒死在爺爺家中!繼奶容貌曝光!身體火辣,僅34歲

廣東2個孩子被燒死在爺爺家中!繼奶容貌曝光!身體火辣,僅34歲

魔都姐姐雜談
2025-07-23 14:08:40
惡魔基因天生壞種?母親執意生下“超雄”兒子,長大后驚嚇全部人

惡魔基因天生壞種?母親執意生下“超雄”兒子,長大后驚嚇全部人

冰雅憶史
2025-07-21 11:38:31
8年前,那個卷走父親全部300萬積蓄到國外揮霍的18歲女孩,咋樣了

8年前,那個卷走父親全部300萬積蓄到國外揮霍的18歲女孩,咋樣了

趣談人物紀
2025-07-23 12:00:03
石破茂辭職,日本變天!日本極右翼得勢,中國嚴陣以待

石破茂辭職,日本變天!日本極右翼得勢,中國嚴陣以待

哲叔視野
2025-07-23 18:12:27
19歲小伙錯付1010元打車費索要無果后自殺,家屬起訴司機案開庭,上海交通委已介入

19歲小伙錯付1010元打車費索要無果后自殺,家屬起訴司機案開庭,上海交通委已介入

極目新聞
2025-07-23 16:43:52
讓中國人滾出韓國!中方再也不忍了,一紙嚴正函件送到李在明手上

讓中國人滾出韓國!中方再也不忍了,一紙嚴正函件送到李在明手上

軍哥風云說
2025-07-23 12:14:03
53歲性感女神驚爆真空上陣露古怪胸型!豐滿上圍下垂到肚臍

53歲性感女神驚爆真空上陣露古怪胸型!豐滿上圍下垂到肚臍

粵睇先生
2025-07-23 00:55:58
咸魚一條狗賣26000:特會配,一次四十分鐘,男生勿擾

咸魚一條狗賣26000:特會配,一次四十分鐘,男生勿擾

丫頭舫
2025-07-23 10:27:36
謝尚果被撤職

謝尚果被撤職

極目新聞
2025-07-23 19:32:34
曝深圳14歲女學生被同班男生殺害,連捅26刀手段殘忍,母親曝原因

曝深圳14歲女學生被同班男生殺害,連捅26刀手段殘忍,母親曝原因

180視角
2025-07-23 16:49:24
市監部門回應“上海和平飯店罐裝可樂一杯賣50元”:屬市場調節價,只要消費者愿意買單

市監部門回應“上海和平飯店罐裝可樂一杯賣50元”:屬市場調節價,只要消費者愿意買單

極目新聞
2025-07-23 18:30:14
A股跳水原因找到了!1.2萬億股民買單了?今晚關注特朗普重磅行動

A股跳水原因找到了!1.2萬億股民買單了?今晚關注特朗普重磅行動

看財經show
2025-07-23 16:56:53
和平湖市委書記聊了一個半小時,他提了106次上海

和平湖市委書記聊了一個半小時,他提了106次上海

上觀新聞
2025-07-23 19:43:51
英偉達大跌!黃仁勛持續減持,近一個月套現約2億美元

英偉達大跌!黃仁勛持續減持,近一個月套現約2億美元

每日經濟新聞
2025-07-22 22:42:08
2025-07-24 00:24:49
CSDN incentive-icons
CSDN
成就一億技術人
25804文章數 242100關注度
往期回顧 全部

科技要聞

別自嗨了!XREAL徐馳:AI眼鏡只有5歲智商

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

頭條要聞

印度、孟加拉關切雅魯藏布江下游水電站工程 中方回應

體育要聞

英格蘭最紅球星 也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本 各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡 場地極限測試全新奧迪A5L

態度原創

房產
教育
數碼
時尚
親子

房產要聞

海南自由貿易港全島封關,2025年12月18日正式啟動!

教育要聞

黑龍江考生389分撿漏雙一流鄭州大學

數碼要聞

京東京造推出 10KG 家用變頻熱泵式烘干機,3099 元

搶戲《醬園弄》、尬演《長安荔枝》,雷佳音的舒適圈正在反噬

親子要聞

醫學科普中醫脾胃育兒

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 铜山县| 个旧市| 奉节县| 宁波市| 容城县| 南木林县| 武鸣县| 长泰县| 正宁县| 墨玉县| 山丹县| 桑日县| 新巴尔虎左旗| 泸州市| 蒲城县| 大庆市| 天门市| 新邵县| 铅山县| 阿尔山市| 图们市| 威宁| 甘泉县| 岗巴县| 太康县| 赞皇县| 额尔古纳市| 宜宾市| 孟津县| 天镇县| 高碑店市| 高清| 安远县| 苍梧县| 蕲春县| 延寿县| 塘沽区| 吉林省| 张家口市| 崇义县| 榆中县|