關鍵詞
人工智能
基于人工智能的對話機器人正在快速滲透到我們的生活中,由于不合適的利用導致的問題也非常多,例如學生使用 AI 機器人寫作業或撰寫論文。
針對這類問題此前 OpenAI 就嘗試開發文本分類器用來檢測內容是否是由 ChatGPT 生成的,但因為檢測成功率太低最終 OpenAI 放棄了。
現在谷歌宣布在 Gemini 機器人中添加用戶不可見的盲水印,這種盲水印本質上是一種算法,利用算法將特定字詞嵌入到文本中,用戶雖然看不出來但檢測器可以根據算法識別出來。
這個系統的名稱叫做 SynthID-Text,谷歌稱已經將該系統集成到 Gemini 機器人中,同時谷歌還開源了這個系統供開發者和企業快速檢測特定文本內容是否來自他們的大型語言模型。
也就是后續包括 OpenAI 和 Anthropic 都可以使用這個系統 (如果他們愿意的話),提前在模型里埋上盲水印即可,接下來就能成功檢測。
SynthID-Text 的原理也不算復雜,谷歌開發了一種算法,首先將特定的提示詞集成到 AI 模型中,這個提示詞會干預 AI 模型向用戶輸出的內容。
被干預后 AI 模型生成的某些字詞具有一定的特點,用戶應該發現不了這種情況,但算法可以重新檢測出來,DeepMind 研究人員稱這種修改會在生成的文本中統計簽名,在水印檢測階段,可以重新測量簽名以確定文本是否確實由帶有盲水印的 AI 模型生成。
AI 模型或者叫大型語言模型 (LLM),本質上就是利用海量數據預測下一個最有可能的字詞,SynthID-Text 通過隨機為候選字詞分配數字分數讓 LLM 輸出分數較高的詞進行干擾。
因此各位接下來使用 Gemini 進行對話時,長期使用可能會注意到某些字詞被其他字詞替代,那說明這些字詞就是盲水印,當然用戶應該很難發現這種情況。
那有辦法能夠干擾這種盲水印呢?也確實有,既然谷歌開源了檢測器,那就可以使用對文本內容的字詞使用其他字詞替代,然后再使用檢測器進行測試,直到查重率降低到檢測器能夠接受的閾值。
只不過這樣相對來說就麻煩了很多,于此如此不如直接使用沒有盲水印的 AI 機器人。
來源:https://www.landiannews.com/archives/106449.html
安全圈
網羅圈內熱點 專注網絡安全
實時資訊一手掌握!
好看你就分享 有用就點個贊
支持「安全圈」就點個三連吧!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.