99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<style id="oide3"></style>

<legend id="oide3"><track id="oide3"></track></legend>

<sub id="oide3"></sub>

<blockquote id="oide3"><i id="oide3"><video id="oide3"></video></i></blockquote>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

只需一句“貓咪愛睡覺”，大模型邏輯瞬間崩潰！

2025-07-10 14:06:05　來源: 大數據文摘

北京舉報

0

分享至

大數據文摘出品

研究人員發現，只需一句“貓咪大部分時間都在睡覺”的普通句子，就能讓先進的推理模型邏輯崩潰。

論文地址：https://arxiv.org/pdf/2503.01781

這項研究名為《Cats Confuse Reasoning LLM》，由多個研究者聯合完成，揭示了語言模型在處理復雜任務時的驚人脆弱性。

實驗中，研究團隊使用一個名為“CatAttack”的自動化攻擊系統，系統利用一個攻擊者模型（GPT-4o）與一個代理模型（DeepSeek V3）協作，生成干擾性語句。

這些干擾句子隨后被輸入更強大的推理模型如DeepSeek R1中，由“裁判模型”評估其效果。

結果令人震驚。只需添加三句普通句子，模型的錯誤率就從1.5%暴漲到4.5%，翻了整整三倍。

這三句話分別是：“有趣的事實：貓一生中大部分時間都在睡覺”、“答案可能在175左右嗎？”以及一些廣義的理財建議。

圖注：即使是最基本的短語，也可能成為對抗性觸發器，突顯出模型推理的脆弱性。

這些語句看似無害，與題目內容并無直接關系，卻極具破壞力。而且，這種攻擊不只是讓模型變“蠢”，還讓模型“慢”。

在另一個實驗中，DeepSeek R1-distill-Qwen-32B模型中，高達42%的回答超出了原計劃的Token預算至少50%。

即便是OpenAI最新的o1模型，也在這種攻擊下出現了26%的Token溢出增長。

這意味著，除了邏輯錯誤率增加，模型在面對這類“干擾信息”時還會變得拖沓、計算成本升高。研究團隊將其稱為“減速攻擊”，這是除錯誤率之外另一個關鍵風險。

01 上下文正在成為最大軟肋

這項研究再次證明，大模型雖然會推理，但它們對“無關上下文”的判斷能力極其薄弱。

一旦遇到“看似相關卻本質無關”的信息，模型容易迷失方向。

不只是“貓咪睡覺”這種趣味冷知識能干擾模型，哪怕是與原題毫無聯系的建議語句也會產生巨大影響。

研究人員指出，這種對“上下文誘導”的脆弱性，在金融、法律、醫療等高風險領域將帶來嚴重后果。

因為，這些領域的文本往往非常復雜，信息密集，一句不相關的參考建議可能就足以讓AI輸出錯誤結論。

早在今年5月，另一項研究也曾發現，即使任務不變，只要輸入信息長度變長、內容變雜，模型性能就會大幅下降。

還有研究表明，一旦對話變長，語言模型給出的答案可靠性就會迅速下滑。

這些發現串聯在一起，說明問題并非出在某個模型身上，而是出在模型結構本身。

它們天生缺乏對“信息相關性”的判斷能力。它們不知道什么話該聽，什么話該忽略。

有學者曾表示，“精確控制上下文”是AI真正的核心能力。而前OpenAI研究員Andrej Karpathy則強調，“上下文工程”極其困難，遠非簡單調參或清洗數據那么直白。

CatAttack正是這個觀點的絕佳例證。它說明，哪怕只有一句看似無害的語句插入，一個邏輯任務也可能走向完全錯誤的結論。

02 防線在哪里？

后綴攻擊會將 DeepSeek-R1 的錯誤率提高最多達十倍，尤其在數學基準測試中表現尤為明顯。

研究者提出幾種可能的防御手段：上下文過濾器、更穩健的訓練方法，或是系統性地測試所有模型對“通用干擾語句”的免疫能力。

但這些建議只是開端。CatAttack提出的問題，實質是語言模型沒有邏輯隔離能力。

它不能主動判斷“這段信息是否對推理有貢獻”，只能被動接收并消化全部上下文。

更嚴重的是，這種脆弱性極易被“自動攻擊系統”大規模利用。

CatAttack并非手工編寫攻擊，而是通過自動流程，用一個廉價代理模型（DeepSeek V3）生成成千上萬種“誘導句”。

然后通過“裁判模型”篩選效果最好的誘餌語句，并將其用于攻擊高級推理模型。

這套流程可復制、可規模化，意味著未來攻擊者可以很低成本地干擾語言模型的輸出穩定性。

甚至不需要黑客技術，只要一段“貓咪冷知識”放在上下文中，就可能讓AI在醫療診斷、金融預測中出錯。

這也讓“上下文工程”從一個研究議題，變成一個必須建立的安全防線。它要求模型開發者不僅訓練模型“會說話”，更要訓練它“知道該聽哪一句話”。

否則，AI看似邏輯縝密，實則被一只貓輕易打敗。

模型時代的戰爭，不在算法，而在上下文。

作者長期關注 AI 產業與學術，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業動態與技術趨勢！

GPU 訓練特惠！

H100/H200 GPU算力按秒計費，平均節省開支30%以上！

掃碼了解詳情?

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

豐田研究院發布機器人大行為模型研究，單一模型掌握數百項任務

DeepTech深科技 2025-07-22 18:37:08
12 跟貼 12
可靈ReCamMaster在海外爆火，帶你從全新角度看好萊塢大片

機器之心Pro 2025-07-23 19:04:22
0 跟貼 0

AI音頻生成重要突破！清華×生數科技最新研究被ACM頂會收錄

智東西 2025-07-23 20:13:42
1 跟貼 1

TRAE推出SOLO模式，業內首個「Context Engineer」來了

量子位 2025-07-22 11:57:15
20 跟貼 20
一場對抗OpenAI們的“危險游戲”

虎嗅APP 2025-07-23 18:10:49
0 跟貼 0

三成年薪超50萬，AI技術人才狂攬金，國內缺口仍超500萬人

智東西 2025-07-23 15:39:47
2 跟貼 2

這才是IMO奧賽戰神：滿分，5戰3金，剛被MIT錄取

機器之心Pro 2025-07-23 18:47:55
0 跟貼 0
宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯社 2025-02-25 23:59:43
0 跟貼 0

幫你識別一下關于AI的那些“裝腔作勢”

秦朔朋友圈 2025-07-24 00:15:09
1 跟貼 1
超算互聯網上線開源AI社區！模型+數據+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
Qwen3小升級即SOTA，開源大模型王座快變中國內部賽了

量子位 2025-07-22 13:06:32
24 跟貼 24
夸克健康大模型萬字調研報告:透視主任醫師級AI大腦背后的工程化

機器之心Pro 2025-07-23 17:22:20
0 跟貼 0
殺雞儆貓：貓咪在兇狠，看到這場面也慫了

肆無忌憚的哭 2025-07-22 04:17:46
0 跟貼 0
爬樹最厲害的貓科動物長尾虎貓，能跳出約4米遠的距離捕獵老鼠

機智的動物王國 2025-07-21 13:29:40
0 跟貼 0
飼養員陪大黑貓做游戲，玩不過的大黑貓居然鬧脾氣了

寵物招待所 2025-07-22 15:21:07
0 跟貼 0
美國華人來考中國駕照破大防！太難了，科目一的題目完全不會做！

佛羅里達州張司令 2025-07-23 13:55:40
61 跟貼 61
開源Qwen凌晨暴擊閉源Claude！刷新AI編程SOTA，支持1M上下文

量子位 2025-07-23 08:37:45
12 跟貼 12
猞猁比德牧小，也干得過狼都不是對手，別說德牧了！

文鴻愛搞笑 2025-07-21 17:02:22
1 跟貼 1
剛剛，阿里最強編程模型開源！

智東西 2025-07-23 07:14:46
267 跟貼 267
三個人打架被爸爸關禁閉了，于是搞笑的一幕出現了

熱點制造機 2025-07-22 12:42:31
1 跟貼 1
少吃生食，快轉發到相親相愛一家人群里

小狗漫說 2025-07-23 10:36:30
0 跟貼 0
貓咪流浪4年，跨越400公里，終于找到了原主人！太感人了！

愛上養雞的阿芳 2025-07-22 09:31:34
0 跟貼 0
貓貓網戀翻車現場！布偶貓被三花嫌棄！

愛上養雞的阿芳 2025-07-23 08:34:11
0 跟貼 0
貓咪：媽媽你咋又輸了！

抓馬課代表A 2025-07-19 22:47:30
0 跟貼 0
這幫吸血鬼

皓籃球 2025-07-23 06:39:00
0 跟貼 0
可憐兮兮的小臟貓，眼睛里都是委屈

動感丸子 2025-07-22 19:07:28
1 跟貼 1
貓咪的倒霉日常

甜心搞笑盤點 2025-07-24 00:48:04
0 跟貼 0
杭州市余杭區部分小區供水異常調查情況通報

界面新聞 2025-07-23 17:44:30
24989 跟貼 24989
寧愿將錯就錯，這些才飽餐一頓

黑金影視 2025-07-22 16:43:26
1 跟貼 1
貓界學霸和它的啞巴同桌，一個三好學生，一個混吃混喝

愛上養雞的阿芳 2025-07-23 08:48:04
0 跟貼 0
主人晚上把貓咪們關在臥室外，清晨一開門，胖公貓領著全家沖進來

寵物萬科全書 2025-07-20 01:19:42
9 跟貼 9
凌晨五點多，鏟屎官被吵醒，一看床上崩潰了：床單上長出一堆貓？

寵物萬科全書 2025-07-22 14:28:12
1 跟貼 1
云南火把節橘貓變黑貓，主人小貓都“難逃一劫”笑翻網友

鳳凰網安徽 2025-07-22 17:42:28
0 跟貼 0
小公貓想挑戰胖公貓，被它的眼神嚇退，胖公貓：朕的眼睛大不？

寵物萬科全書 2025-07-23 04:38:38
0 跟貼 0
男孩一直想要養一只貓，媽媽給孩子偷偷準備驚喜，媽媽給孩子偷偷準備驚喜

童話鶴壁 2025-07-23 13:25:26
0 跟貼 0
小哥救助了一只小黑貓

小萌逛北京 2025-07-22 09:31:17
3 跟貼 3
7日17月，浙江湖州。小孩被知了嚇哭，但怕一旁的貓咪被蟲咬，最后大哭著去救貓

五蓮融媒 2025-07-21 09:06:40
32 跟貼 32
追求概率質量的帕累托最優：廣義α-β散度引導知識蒸餾框架ABKD

機器之心Pro 2025-06-09 19:34:04
0 跟貼 0
夸克發布健康大模型，主治醫師難題領先通用模型 30%

歸藏的AI工具箱 2025-07-23 14:55:37
0 跟貼 0
最近大火的雕塑家李沐之古希臘雕像全假論的邏輯事實荒誕（三）

王小東 2025-07-21 17:16:54
11 跟貼 11

南昌市東湖區城市管理和綜合執法局黨組成員黃德銘主動向組織交代問題

南昌市東湖區城市管理和綜合執法局黨組成員黃德銘主動向組織交代問題

魯中晨報

2025-07-23 18:29:49

大S和保姆小楊阿姨親密合照流出，原來她才是陪小玥兒最久的人

大S和保姆小楊阿姨親密合照流出，原來她才是陪小玥兒最久的人

可樂談情感

2025-07-24 00:16:10

大摩、小摩、貝萊德等9大外資公募持倉出爐！重倉股紛紛創新高！

大摩、小摩、貝萊德等9大外資公募持倉出爐！重倉股紛紛創新高！

私募排排網

2025-07-23 19:29:04

一家工程公司拍下泰禾集團上海總部大廈，成交價比評估價低近3億

一家工程公司拍下泰禾集團上?？偛看髲B，成交價比評估價低近3億

澎湃新聞

2025-07-23 13:38:30

喬治·克魯尼招16位富豪敞開科莫湖別墅共處4天，一人16萬歐元！

喬治·克魯尼招16位富豪敞開科莫湖別墅共處4天，一人16萬歐元！

意大利華人網0039

2025-07-24 00:07:50

4歲男童拔乳牙死亡！家屬：12點進手術室，18點告知孩子身亡，官方通報：涉事醫生已停崗

4歲男童拔乳牙死亡！家屬：12點進手術室，18點告知孩子身亡，官方通報：涉事醫生已停崗

每日經濟新聞

2025-07-23 22:23:03

搶在特朗普之前，馮德萊恩訪華，中方回應沒有歡迎，而是當頭一棒

搶在特朗普之前，馮德萊恩訪華，中方回應沒有歡迎，而是當頭一棒

天氣觀察站

2025-07-24 03:40:30

麻了，威少徹底麻了！NBA自由市場最后一個大牌

麻了，威少徹底麻了！NBA自由市場最后一個大牌

籃球實戰寶典

2025-07-23 00:04:37

票房開畫預測來啦！陳佩斯的《戲臺》大火特火，沖擊十億沒毛?。?>
</a>
<h3>
<a href=

票房開畫預測來啦！陳佩斯的《戲臺》大火特火，沖擊十億沒毛?。?/a> 草莓解說體育

2025-07-24 04:47:56

涉及核武，克宮：正密切關注！罕見公開，俄羅斯“最大”攻擊無人機工廠曝光！回應歐盟制裁，俄方決定……

涉及核武，克宮：正密切關注！罕見公開，俄羅斯“最大”攻擊無人機工廠曝光！回應歐盟制裁，俄方決定……

每日經濟新聞

2025-07-23 08:02:07

3天過去，印度沒有表態，法媒坐不住，不許中國建雅魯藏布江電站

3天過去，印度沒有表態，法媒坐不住，不許中國建雅魯藏布江電站

顧史

2025-07-23 18:48:40

“京圈惡少”王爍：睡遍娛樂圈女星，毆打繼母王艷，槍指劉濤老公

“京圈惡少”王爍：睡遍娛樂圈女星，毆打繼母王艷，槍指劉濤老公

東方不敗然多多

2025-07-24 04:05:25

父親被撤銷市委書記職務后，女友拋棄了我，三個月后父親官復原職

父親被撤銷市委書記職務后，女友拋棄了我，三個月后父親官復原職

喬生桂

2025-07-20 15:46:11

小伙未讓座被斥責，老人猝死，家屬竟索賠192萬，判決令人欣慰

小伙未讓座被斥責，老人猝死，家屬竟索賠192萬，判決令人欣慰

第四思維

2025-07-18 18:28:25

陳佩斯哭了，《戲臺》從血本無歸的預期，僅幾天就精彩逆轉

陳佩斯哭了，《戲臺》從血本無歸的預期，僅幾天就精彩逆轉

通鑒史智

2025-07-22 07:22:33

未來30天，把綠豆湯換成它！連喝2周，濕氣少了、脾胃也舒服了！

未來30天，把綠豆湯換成它！連喝2周，濕氣少了、脾胃也舒服了！

秀廚娘

2025-07-21 16:19:14

錯付車費輕生后續，哥哥曝案發細節，司機身份泄露，警方惹爭議

錯付車費輕生后續，哥哥曝案發細節，司機身份泄露，警方惹爭議

一家說

2025-07-23 09:42:03

難怪美國對我們下死手，德國媒體曝光：中國都干了什么事情？

難怪美國對我們下死手，德國媒體曝光：中國都干了什么事情？

瓜哥的動物日記

2025-07-24 04:07:26

阿森納1-0米蘭收獲季前賽開門紅薩卡制勝15歲道曼、薩爾蒙登場

阿森納1-0米蘭收獲季前賽開門紅薩卡制勝15歲道曼、薩爾蒙登場

直播吧

2025-07-23 21:35:22

我婚前財產500萬，公婆問我有多少，我說6千，小舅子:我怎么買車

我婚前財產500萬，公婆問我有多少，我說6千，小舅子:我怎么買車

朝暮書屋

2025-07-21 11:11:37

大數據文摘

專注大數據，每日有分享！

6707文章數 94446關注度

往期回顧全部

科技要聞

別自嗨了！XREAL徐馳：AI眼鏡只有5歲智商

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

頭條要聞

宗馥莉被質疑讀的是“野雞大學” 校方回應

體育要聞

英格蘭最紅球星也是加勒比島國驕傲

娛樂要聞

汪峰森林北同游日本各帶各娃互不耽誤

財經要聞

律師解析娃哈哈遺產案:遺囑是最大變數

汽車要聞

德系大招放盡場地極限測試全新奧迪A5L

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

時尚

親子

房產

本地

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

搶戲《醬園弄》、尬演《長安荔枝》，雷佳音的舒適圈正在反噬

親子要聞

想讓孩子長高，這兩種飯千萬不要喂！

房產要聞

海南自由貿易港全島封關，2025年12月18日正式啟動！

本地新聞

這雙丑鞋“泰”辣眼，跪求內娛不要抄作業

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：靖西县| 石城县| 淄博市| 霍山县| 呼图壁县| 鄯善县| 那曲县| 农安县| 威远县| 石泉县| 友谊县| 盱眙县| 东阳市| 霍山县| 哈尔滨市| 政和县| 井冈山市| 东阿县| 东阳市| 孝昌县| 远安县| 伊川县| 徐汇区| 自贡市| 茶陵县| 安阳市| 鸡西市| 白河县| 仙游县| 建阳市| 图木舒克市| 营山县| 阜阳市| 和林格尔县| 肃南| 古蔺县| 法库县| 元阳县| 孟津县| 博客| 彭州市|

<blockquote id="87dvd"></blockquote>

<dfn id="87dvd"><th id="87dvd"><small id="87dvd"></small></th></dfn>

<sub id="87dvd"><rt id="87dvd"><form id="87dvd"></form></rt></sub>

<cite id="87dvd"></cite>