7月18日,據報道,網絡安全公司NeuralTrust宣布成功“越獄”xAI旗下的Grok 4模型。此次越獄采用“回音室攻擊”方法,通過引導模型進行多輪推理,逐步注入風險信息,規避常見安全攔截機制。NeuralTrust已成功誘導Grok 4生成制造武器、毒品等內容,越獄成功率高達30%以上。這表明新一代大模型在復雜攻擊路徑下仍存在安全短板,需進一步加強防護機制。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.