網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

我讓AI查了330次新聞，平均錯誤率75%!

2025-04-10 20:27:23　來源: 21財聞匯

廣東舉報

分享至

來源：競爭秩序場

作者：肖瀟陶暢隆欣玲

今年3月，來自美國哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出，讓AI查找新聞時，八款A(yù)I搜索提供的回復(fù)有 60% 是不準確的。

沿著這一測試方法，我們也在國內(nèi)選擇了10家市場化運作的機構(gòu)媒體——

一半偏社會新聞（新京報、澎湃新聞、北青深一度、南方周末、三聯(lián)生活周刊），一半偏財經(jīng)新聞（21世紀經(jīng)濟報道、第一財經(jīng)、每日經(jīng)濟新聞、財經(jīng)雜志、經(jīng)濟觀察報）。

每家媒體3篇報道，一共30篇新聞報道。

然后，我們從這些新聞報道中手動摘取片段，以此一一詢問AI：“請幫我找出包含這段引用文字的原文出處，并提供標題、原文作者、原鏈接：……”

我們發(fā)現(xiàn)，AI很難準確引用新聞報道，六款A(yù)I的平均準確率只有25%。

其中，豆包最準確，文心一言出錯最多，通義千問最常拒絕回答。大部分AI依然會自信提供錯誤答案。

尤其悲哀的是，AI普遍鏈接到騰訊新聞等門戶網(wǎng)站，而不是原始來源，媒體拿流量更難了。

自信的錯誤

我們總共提問了330次（3篇報道x10家媒體x11個版本AI），在AI的330次回答中，只有大約25%的回答完全正確，即準確回答了標題、作者和鏈接三個指標。

不同大模型的準確度不同。

按照正確、錯誤、沒回答的情況分別賦分，整體來看，豆包得分最高，通義千問吊車尾。而在錯誤率上文心一言最高，87%的回答出現(xiàn)錯誤。

去年5月時，我們也測試了不同AI搜索的準確度。

當(dāng)時Perplexity帶火了“AI搜索”概念，AI聯(lián)網(wǎng)搜索之后，一方面有了實時更新的知識庫，一方面更有可能拒絕回答不確定的問題。

今年的測試結(jié)果顯示，AI搜索依然會自信提供錯誤答案，而不是“謙虛”承認局限性——除了通義千問，所有AI錯誤回答的次數(shù)都比拒絕回答多。

自DeepSeek全球走紅后，各個AI嘗到了推理大模型的甜頭，紛紛新增了“深度思考”功能。

不過，在溯源新聞事實上，我們并沒有發(fā)現(xiàn)深度思考讓AI準確度明顯更好或更糟。

只有通義千問在打開深度思考后，愿意回答的問題增加了，但錯誤也更多了。

有用or正確，目前對所有AI依然是一道選擇題：太追求正確，容易走向?qū)挿簾o用，但具體有用的回復(fù)往往避免不了錯誤。

要讓技術(shù)繼續(xù)前進，比錯誤更關(guān)鍵的兩個問題是，AI哪里容易出錯？為什么會出錯？

混亂的合作網(wǎng)

找基本的新聞背景，AI還稱得上靠譜。在測評的330次回答中，AI只有28次完全說錯了報道標題和事件（占比約8%）。

但AI并不擅長辨別“新聞事實來自哪里”。

當(dāng)被問到原文作者時，AI的表現(xiàn)出現(xiàn)了明顯滑坡——90次回復(fù)完全錯誤（約27%），是三項指標中錯誤率最高的一項。

一種常見的錯誤情景是，AI把實際作者和發(fā)布平臺混為一談。

例如，我們拿一篇講述老人王秋生在直播間網(wǎng)購古董的片段提問，幾乎所有AI都準確指出原報道是《在假古董直播間瘋狂下單的老人》，來源卻五花八門。

這篇報道由澎湃新聞采寫、發(fā)表在騰訊新聞中，而DeepSeek的回答是：“作者是澎湃新聞轉(zhuǎn)自騰訊新聞”。

類似的，Kimi的回答也出現(xiàn)混淆。一篇由北青深一度采寫、在網(wǎng)易新聞發(fā)布的家暴報道，Kimi直接把作者歸為網(wǎng)易。

另一種情況里，AI分辨不出自媒體的轉(zhuǎn)載文章。

以經(jīng)濟觀察報采訪的《一位高中化學(xué)老師的困惑：阿司匹林實驗怎么做不成了》為例，雖然原文有明確的記者署名，但一部分內(nèi)容被自媒體賬號照搬洗稿后，DeepSeek把作者歸為該自媒體。

這些錯誤并不完全因為AI能力有限，也與國內(nèi)新聞的分發(fā)模式有關(guān)。國內(nèi)新聞并不遵循“發(fā)布即來源”的簡單邏輯，而是多平臺、多賬號的復(fù)雜格式。

現(xiàn)在，傳統(tǒng)媒體與互聯(lián)網(wǎng)平臺已經(jīng)形成了成熟的合作模式，通常是簽訂版權(quán)合同、開通官方賬號，一篇稿件全網(wǎng)多發(fā)。

（騰訊新聞里入駐的機構(gòu)媒體）

據(jù)統(tǒng)計，《21世紀經(jīng)濟報道》《南方都市報》《南方周末》《南方窗》在內(nèi)的119家廣東媒體，一共注冊了1197個公眾賬號，相當(dāng)于一家新聞媒體平均擁有10個不同賬號。

這些賬號覆蓋微信公眾號、今日頭條號、百家號、網(wǎng)易號、搜狐號等，構(gòu)成一張龐大的合作網(wǎng)。

這張合作網(wǎng)在AI時代帶來了新的混亂。

從此次測評結(jié)果來看，AI常常被新聞分發(fā)矩陣所迷惑——它面對的是同一篇文章的多個“面孔”，難以識別哪一個才是作者。

而移動互聯(lián)網(wǎng)時代未被根治的自媒體“洗稿”“搬運”“偽原創(chuàng)”等老問題，則在AI中繼續(xù)發(fā)酵。

失靈的鏈接

AI的另一個問題出在引用鏈接上。

在聯(lián)網(wǎng)狀態(tài)下，AI應(yīng)當(dāng)要附上來源鏈接，這是用戶驗證真?zhèn)蔚牡谝徊健?/p>

在我們統(tǒng)計的330次查詢中，大約43%的回復(fù)提供了無效鏈接，要么AI稱無法提供，要么鏈接已被刪除。

一些模型的問題更突出。文心一言和通義千問（深度思考版）有超過三分之一的回復(fù)，提供的是無法打開的鏈接，其他AI的頻率則要低得多。

令人意外的是，有些鏈接并不是失效，而是純屬虛構(gòu)。

比如，《第一財經(jīng)》發(fā)布的一篇關(guān)于亞馬遜低價商品的報道，被DeepSeek誤判作者為“刺猬公社”，并配上了一個根本不存在的網(wǎng)址：www.ciweigongshe.com。

根據(jù)各個AI產(chǎn)品“吐出”的鏈接，今日頭條、微信公眾號兩家平臺的鏈接出現(xiàn)次數(shù)最多，這并不意味他們渠道鋪陳到位，恰恰相反，這些“吐出”的鏈接多來自他們自身的產(chǎn)品：

今日頭條鏈接出現(xiàn)的37次里，34次都來自字節(jié)跳動旗下豆包AI，剩下3次來自Kimi，其他平臺引用了0次。

同樣的，27條微信公眾號的鏈接，19條都由騰訊旗下元寶AI引用。文心一言、豆包在個別場景下也能提供公眾號鏈接，其他平臺沒有提供過。

這種局面是由底層結(jié)構(gòu)決定的。

App內(nèi)的信息孤島，大部分在搜索引擎的公域網(wǎng)中不可見，只有“自家人”才能索引，大廠旗下的AI因此擁有得天獨厚的數(shù)據(jù)庫。互聯(lián)網(wǎng)時代圍墻花園的問題，在AI時代依舊在加固。

消失的原創(chuàng)者

更令人擔(dān)憂的是媒體自身的可見度。

許多媒體也有自己的官方網(wǎng)站，但除了澎湃新聞，其他媒體官網(wǎng)很少出現(xiàn)在AI文獻列表里。

相比之下，搜狐、網(wǎng)易、新浪、騰訊四大門戶網(wǎng)站是AI更普遍的索引資料，補上缺位的App數(shù)據(jù)。

站在媒體的立場上，如果AI能引用媒體官方賬號的鏈接——不管是官方搜狐號還是官方今日頭條號，都能拿到屬于內(nèi)容創(chuàng)作者的流量。

也存在傷媒體的情況。各個平臺的內(nèi)容池魚龍混雜，原創(chuàng)內(nèi)容、轉(zhuǎn)載文章、自媒體洗稿并存。

比如新浪財經(jīng)賬號經(jīng)常“全文轉(zhuǎn)載”其他媒體的原創(chuàng)報道，媒體署名雖在，但流量早已轉(zhuǎn)嫁。

測試結(jié)果顯示，AI有大約14%回復(fù)引用了這些轉(zhuǎn)載鏈接，而非官方鏈接。

在這之中，豆包情況最嚴重，30次查詢中8次查詢都引用了轉(zhuǎn)載鏈接，主要引流向今日頭條的自媒體號。

這也不是一個AI時代的新問題。

哪些新聞會被優(yōu)先推送、哪些新聞更容易被看見，一定程度上仍然取決于不同平臺的算法設(shè)計。而AI的到來，并沒有改變這一結(jié)構(gòu)，反而可能固化。

類似的狀況也在全球范圍內(nèi)上演。哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出，Grok-3和Gemini在超過60%的回答中提供了失效鏈接。

在正確回答中，AI也傾向于引用雅虎新聞、AOL（美國在線）等轉(zhuǎn)載鏈接，而非原始來源。

對新聞媒體來說，這意味著兩重更大的挑戰(zhàn)：其一，拒絕被AI引用變得困難。

比如，該研究指出，雖然《今日美國》直接屏蔽了ChatGPT爬取網(wǎng)站，但ChatGPT抓取了雅虎新聞的轉(zhuǎn)載頁面，提供原文的副本；

其二，有些媒體和AI公司牽手成為合作伙伴，希望換取精準推薦與流量回報，但AI仍然會錯誤引用轉(zhuǎn)載版本。

被視為解藥的版權(quán)合作，效果沒有想象中好。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

伊朗走不走？

閃電制片廠 2025-06-18 18:49:30
7519 跟貼 7519
伊朗“反美立國”戰(zhàn)略的窮途末路

黑噪音 2025-06-18 08:02:41
11541 跟貼 11541

65歲男子因不喜歡狗投放劇毒氟乙酸，小區(qū)11只寵物犬接連死亡

大象新聞 2025-06-19 08:53:02
215 跟貼 215

俄羅斯告誡美國不要攻擊伊朗

環(huán)球時報 2025-06-19 12:06:12
17279 跟貼 17279
伊朗來華游客面臨艱難選擇有人選擇停留等待局勢變化

紅星新聞 2025-06-18 23:07:38
7947 跟貼 7947

超100億美元創(chuàng)紀錄！湖人多數(shù)股權(quán)將易主新老板執(zhí)掌3000億公司

羅說NBA 2025-06-19 06:05:19
2083 跟貼 2083

伊朗發(fā)布“霍拉姆沙赫爾-4”導(dǎo)彈畫面

央視新聞客戶端 2025-06-19 19:57:03
4041 跟貼 4041
【獨家報道】如何看待外界比較殲-10CE和“陣風(fēng)”？航空工業(yè)新聞發(fā)言人：它們都是世界先進戰(zhàn)機

環(huán)球網(wǎng)資訊 2025-06-19 21:17:02
18 跟貼 18

游客景區(qū)遇“單車刺客”！騎16分鐘花50元，起步價30元

大象新聞 2025-06-19 17:57:07
137 跟貼 137
多所高校明確不招復(fù)讀生

大象新聞 2025-06-19 10:03:32
3139 跟貼 3139
蘋果20周年紀念版iPhone曝光：全玻璃機身設(shè)計結(jié)合無開孔全面屏

環(huán)球網(wǎng)資訊 2025-06-17 11:31:10
2098 跟貼 2098
男子中獎1000萬元！結(jié)果彩票掉洗衣機被洗爛，沒想到

FM93浙江交通之聲 2025-06-19 06:36:05
1702 跟貼 1702
今日辟謠（2025年6月19日）

今日辟謠 2025-06-19 18:06:46
8 跟貼 8
奧迪暫停全面電動化

環(huán)球Tech 2025-06-19 10:44:05
1483 跟貼 1483
LABUBU全渠道補貨黃牛回收報價大幅下跌

紅星新聞 2025-06-19 16:06:20
231 跟貼 231
韋東奕吃飯遭圍觀拍攝網(wǎng)友：令人窒息

新京報 2025-06-19 11:20:27
691 跟貼 691
四川一水庫水位下降再現(xiàn)“水下佛國”，佛像石獅栩栩如生文保員：半世紀來有十余年完整露出

紅星新聞 2025-06-19 18:36:30
1 跟貼 1
突然爆發(fā)！盤中漲超170%！

證券時報 2025-06-19 12:45:11
286 跟貼 286
海軍潛艇支隊高燃實戰(zhàn)化演練

環(huán)球網(wǎng)資訊 2025-06-19 15:06:21
680 跟貼 680
杭州警方差點坑死了人質(zhì)

李宇琛 2025-06-19 23:38:39
0 跟貼 0
網(wǎng)友質(zhì)疑南京一商場“大面積取消男廁”，商場最新回應(yīng)

大象新聞 2025-06-19 22:17:15
0 跟貼 0
李雪琴和老謝，誰在說謊？

中國新聞周刊 2025-06-19 16:34:11
0 跟貼 0
韋東奕又去聽王虹教授講座了，連續(xù)三天坐第一排聽講，還有學(xué)生為王虹獻花

極目新聞 2025-06-19 13:30:31
0 跟貼 0
月薪三千，器官十萬

求實處 2025-06-19 23:55:40
0 跟貼 0
哈梅內(nèi)伊任命伊朗革命衛(wèi)隊陸軍司令

財聯(lián)社 2025-06-19 16:24:22
0 跟貼 0
湖南一高校畢業(yè)證上寫著“準予結(jié)業(yè)”，校方：系印刷錯誤，已連夜趕制新證發(fā)放

極目新聞 2025-06-19 16:33:30
0 跟貼 0
違規(guī)吃喝的邊界

非典型佛教徒 2025-06-19 23:48:27
0 跟貼 0
敏感時刻，美媒發(fā)現(xiàn)：美國“末日飛機”出現(xiàn)異常動向，變更呼號飛行4小時抵達華盛頓附近空軍基地

環(huán)球網(wǎng)資訊 2025-06-19 20:15:49
0 跟貼 0
搬至新址的提籃橋監(jiān)獄，有哪些變與不變

澎湃新聞 2025-06-19 13:08:28
0 跟貼 0

【硬件資訊】真是弟弟？NVIDIA重回中國市場的定制款RTX 5090規(guī)格確認！啟用全新后綴“DD”！

21財聞匯

一切有趣有料的商業(yè)財經(jīng)新聞

4439文章數(shù) 65676關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產(chǎn)

數(shù)碼

旅游

健康

手機

手機 / 數(shù)碼

房產(chǎn) / 家居

我讓AI查了330次新聞，平均錯誤率75%!

羅永浩數(shù)字人爆火，可怕的不是5500萬GMV

美打擊伊核設(shè)施計劃披露 特朗普鼓勵以總理"繼續(xù)干"

美打擊伊核設(shè)施計劃披露 特朗普鼓勵以總理"繼續(xù)干"

22年，云南足球走出了一條自己的路

章子怡“吃蛋糕”戲在全網(wǎng)爆火

Labubu黃牛價腰斬 誰會是最后的接盤俠

5.99萬起/空間大續(xù)航長 純電小車凱翼拾月Mate上市

態(tài)度原創(chuàng)

預(yù)定爆款！江東CBD+海中，海口這一國企大盤，即將引爆市場！

榮耀平板 MagicPad 3 首次亮相：官方稱最佳 AI 平板

熱聞|清明假期將至，熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言！

曝折疊屏iPhone三季度生產(chǎn)，這次真的來了？

美打擊伊核設(shè)施計劃披露特朗普鼓勵以總理"繼續(xù)干"

美打擊伊核設(shè)施計劃披露特朗普鼓勵以總理"繼續(xù)干"

Labubu黃牛價腰斬誰會是最后的接盤俠

5.99萬起/空間大續(xù)航長純電小車凱翼拾月Mate上市