99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

我讓AI查了330次新聞,平均錯誤率75%!

0
分享至


來源:競爭秩序場

作者:肖瀟 陶暢 隆欣玲

今年3月,來自美國哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出,讓AI查找新聞時,八款A(yù)I搜索提供的回復(fù)有 60% 是不準確的。

沿著這一測試方法,我們也在國內(nèi)選擇了10家市場化運作的機構(gòu)媒體——

一半偏社會新聞(新京報、澎湃新聞、北青深一度、南方周末、三聯(lián)生活周刊),一半偏財經(jīng)新聞(21世紀經(jīng)濟報道、第一財經(jīng)、每日經(jīng)濟新聞、財經(jīng)雜志、經(jīng)濟觀察報)。

每家媒體3篇報道,一共30篇新聞報道。

然后,我們從這些新聞報道中手動摘取片段,以此一一詢問AI:“請幫我找出包含這段引用文字的原文出處,并提供標題、原文作者、原鏈接:……”

我們發(fā)現(xiàn),AI很難準確引用新聞報道,六款A(yù)I的平均準確率只有25%。

其中,豆包最準確,文心一言出錯最多,通義千問最常拒絕回答。大部分AI依然會自信提供錯誤答案。

尤其悲哀的是,AI普遍鏈接到騰訊新聞等門戶網(wǎng)站,而不是原始來源,媒體拿流量更難了。

1

自信的錯誤

我們總共提問了330次(3篇報道x10家媒體x11個版本AI),在AI的330次回答中,只有大約25%的回答完全正確,即準確回答了標題、作者和鏈接三個指標。

不同大模型的準確度不同。

按照正確、錯誤、沒回答的情況分別賦分,整體來看,豆包得分最高,通義千問吊車尾。而在錯誤率上文心一言最高,87%的回答出現(xiàn)錯誤。


去年5月時,我們也測試了不同AI搜索的準確度。

當(dāng)時Perplexity帶火了“AI搜索”概念,AI聯(lián)網(wǎng)搜索之后,一方面有了實時更新的知識庫,一方面更有可能拒絕回答不確定的問題。

今年的測試結(jié)果顯示,AI搜索依然會自信提供錯誤答案,而不是“謙虛”承認局限性——除了通義千問,所有AI錯誤回答的次數(shù)都比拒絕回答多。

自DeepSeek全球走紅后,各個AI嘗到了推理大模型的甜頭,紛紛新增了“深度思考”功能。

不過,在溯源新聞事實上,我們并沒有發(fā)現(xiàn)深度思考讓AI準確度明顯更好或更糟。

只有通義千問在打開深度思考后,愿意回答的問題增加了,但錯誤也更多了。

有用or正確,目前對所有AI依然是一道選擇題:太追求正確,容易走向?qū)挿簾o用,但具體有用的回復(fù)往往避免不了錯誤。

要讓技術(shù)繼續(xù)前進,比錯誤更關(guān)鍵的兩個問題是,AI哪里容易出錯?為什么會出錯?

2

混亂的合作網(wǎng)

找基本的新聞背景,AI還稱得上靠譜。在測評的330次回答中,AI只有28次完全說錯了報道標題和事件(占比約8%)。

但AI并不擅長辨別“新聞事實來自哪里”。

當(dāng)被問到原文作者時,AI的表現(xiàn)出現(xiàn)了明顯滑坡——90次回復(fù)完全錯誤(約27%),是三項指標中錯誤率最高的一項。


一種常見的錯誤情景是,AI把實際作者和發(fā)布平臺混為一談。

例如,我們拿一篇講述老人王秋生在直播間網(wǎng)購古董的片段提問,幾乎所有AI都準確指出原報道是《在假古董直播間瘋狂下單的老人》,來源卻五花八門。

這篇報道由澎湃新聞采寫、發(fā)表在騰訊新聞中,而DeepSeek的回答是:“作者是澎湃新聞轉(zhuǎn)自騰訊新聞”。

類似的,Kimi的回答也出現(xiàn)混淆。一篇由北青深一度采寫、在網(wǎng)易新聞發(fā)布的家暴報道,Kimi直接把作者歸為網(wǎng)易。

另一種情況里,AI分辨不出自媒體的轉(zhuǎn)載文章。

以經(jīng)濟觀察報采訪的《一位高中化學(xué)老師的困惑:阿司匹林實驗怎么做不成了》為例,雖然原文有明確的記者署名,但一部分內(nèi)容被自媒體賬號照搬洗稿后,DeepSeek把作者歸為該自媒體。

這些錯誤并不完全因為AI能力有限,也與國內(nèi)新聞的分發(fā)模式有關(guān)。國內(nèi)新聞并不遵循“發(fā)布即來源”的簡單邏輯,而是多平臺、多賬號的復(fù)雜格式。

現(xiàn)在,傳統(tǒng)媒體與互聯(lián)網(wǎng)平臺已經(jīng)形成了成熟的合作模式,通常是簽訂版權(quán)合同、開通官方賬號,一篇稿件全網(wǎng)多發(fā)。


(騰訊新聞里入駐的機構(gòu)媒體)

據(jù)統(tǒng)計,《21世紀經(jīng)濟報道》《南方都市報》《南方周末》《南方窗》在內(nèi)的119家廣東媒體,一共注冊了1197個公眾賬號,相當(dāng)于一家新聞媒體平均擁有10個不同賬號。

這些賬號覆蓋微信公眾號、今日頭條號、百家號、網(wǎng)易號、搜狐號等,構(gòu)成一張龐大的合作網(wǎng)。

這張合作網(wǎng)在AI時代帶來了新的混亂。

從此次測評結(jié)果來看,AI常常被新聞分發(fā)矩陣所迷惑——它面對的是同一篇文章的多個“面孔”,難以識別哪一個才是作者。

而移動互聯(lián)網(wǎng)時代未被根治的自媒體“洗稿”“搬運”“偽原創(chuàng)”等老問題,則在AI中繼續(xù)發(fā)酵。

3

失靈的鏈接

AI的另一個問題出在引用鏈接上。

在聯(lián)網(wǎng)狀態(tài)下,AI應(yīng)當(dāng)要附上來源鏈接,這是用戶驗證真?zhèn)蔚牡谝徊健?/p>

在我們統(tǒng)計的330次查詢中,大約43%的回復(fù)提供了無效鏈接,要么AI稱無法提供,要么鏈接已被刪除。

一些模型的問題更突出。文心一言和通義千問(深度思考版)有超過三分之一的回復(fù),提供的是無法打開的鏈接,其他AI的頻率則要低得多。

令人意外的是,有些鏈接并不是失效,而是純屬虛構(gòu)。

比如,《第一財經(jīng)》發(fā)布的一篇關(guān)于亞馬遜低價商品的報道,被DeepSeek誤判作者為“刺猬公社”,并配上了一個根本不存在的網(wǎng)址:www.ciweigongshe.com。


根據(jù)各個AI產(chǎn)品“吐出”的鏈接,今日頭條、微信公眾號兩家平臺的鏈接出現(xiàn)次數(shù)最多,這并不意味他們渠道鋪陳到位,恰恰相反,這些“吐出”的鏈接多來自他們自身的產(chǎn)品:

今日頭條鏈接出現(xiàn)的37次里,34次都來自字節(jié)跳動旗下豆包AI,剩下3次來自Kimi,其他平臺引用了0次。

同樣的,27條微信公眾號的鏈接,19條都由騰訊旗下元寶AI引用。文心一言、豆包在個別場景下也能提供公眾號鏈接,其他平臺沒有提供過。

這種局面是由底層結(jié)構(gòu)決定的。

App內(nèi)的信息孤島,大部分在搜索引擎的公域網(wǎng)中不可見,只有“自家人”才能索引,大廠旗下的AI因此擁有得天獨厚的數(shù)據(jù)庫。互聯(lián)網(wǎng)時代圍墻花園的問題,在AI時代依舊在加固。

4

消失的原創(chuàng)者

更令人擔(dān)憂的是媒體自身的可見度。

許多媒體也有自己的官方網(wǎng)站,但除了澎湃新聞,其他媒體官網(wǎng)很少出現(xiàn)在AI文獻列表里。

相比之下,搜狐、網(wǎng)易、新浪、騰訊四大門戶網(wǎng)站是AI更普遍的索引資料,補上缺位的App數(shù)據(jù)。


站在媒體的立場上,如果AI能引用媒體官方賬號的鏈接——不管是官方搜狐號還是官方今日頭條號,都能拿到屬于內(nèi)容創(chuàng)作者的流量。

也存在傷媒體的情況。各個平臺的內(nèi)容池魚龍混雜,原創(chuàng)內(nèi)容、轉(zhuǎn)載文章、自媒體洗稿并存。

比如新浪財經(jīng)賬號經(jīng)常“全文轉(zhuǎn)載”其他媒體的原創(chuàng)報道,媒體署名雖在,但流量早已轉(zhuǎn)嫁。

測試結(jié)果顯示,AI有大約14%回復(fù)引用了這些轉(zhuǎn)載鏈接,而非官方鏈接。

在這之中,豆包情況最嚴重,30次查詢中8次查詢都引用了轉(zhuǎn)載鏈接,主要引流向今日頭條的自媒體號。

這也不是一個AI時代的新問題。

哪些新聞會被優(yōu)先推送、哪些新聞更容易被看見,一定程度上仍然取決于不同平臺的算法設(shè)計。而AI的到來,并沒有改變這一結(jié)構(gòu),反而可能固化。

類似的狀況也在全球范圍內(nèi)上演。哥倫比亞大學(xué)數(shù)字新聞研究中心的最新研究指出,Grok-3和Gemini在超過60%的回答中提供了失效鏈接。

在正確回答中,AI也傾向于引用雅虎新聞、AOL(美國在線)等轉(zhuǎn)載鏈接,而非原始來源。

對新聞媒體來說,這意味著兩重更大的挑戰(zhàn):其一,拒絕被AI引用變得困難。

比如,該研究指出,雖然《今日美國》直接屏蔽了ChatGPT爬取網(wǎng)站,但ChatGPT抓取了雅虎新聞的轉(zhuǎn)載頁面,提供原文的副本;

其二,有些媒體和AI公司牽手成為合作伙伴,希望換取精準推薦與流量回報,但AI仍然會錯誤引用轉(zhuǎn)載版本。

被視為解藥的版權(quán)合作,效果沒有想象中好。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
【硬件資訊】真是弟弟?NVIDIA重回中國市場的定制款RTX 5090規(guī)格確認!啟用全新后綴“DD”!

【硬件資訊】真是弟弟?NVIDIA重回中國市場的定制款RTX 5090規(guī)格確認!啟用全新后綴“DD”!

電腦吧評測室
2025-06-18 22:10:24
北青:伊萬下課前圈定了國足50人名單;上周陸續(xù)有球員交護照

北青:伊萬下課前圈定了國足50人名單;上周陸續(xù)有球員交護照

懂球帝
2025-06-19 17:55:12
易建聯(lián)正式復(fù)出,央視直播專訪揭秘:流言不攻自破,重塑籃壇旗幟

易建聯(lián)正式復(fù)出,央視直播專訪揭秘:流言不攻自破,重塑籃壇旗幟

大昆說臺球
2025-06-19 15:33:09
“新禁酒令”后“升學(xué)宴禁令”來襲,白酒直面消費轉(zhuǎn)型挑戰(zhàn)

“新禁酒令”后“升學(xué)宴禁令”來襲,白酒直面消費轉(zhuǎn)型挑戰(zhàn)

鈦媒體APP
2025-06-19 21:16:22
512GB跳水2500元,iPhone16ProMax售價再創(chuàng)新低,256GB售價更親民

512GB跳水2500元,iPhone16ProMax售價再創(chuàng)新低,256GB售價更親民

科技阿維
2025-06-19 17:09:13
鄧正權(quán)已任四川省衛(wèi)生健康委黨組書記

鄧正權(quán)已任四川省衛(wèi)生健康委黨組書記

微甘孜
2025-06-19 23:11:39
辛芷蕾 姐姐這個吊帶確定是放一邊的嗎,太有個性了

辛芷蕾 姐姐這個吊帶確定是放一邊的嗎,太有個性了

可樂談情感
2025-06-17 13:08:50
突發(fā)!“星艦”爆炸了

突發(fā)!“星艦”爆炸了

中國網(wǎng)
2025-06-19 16:10:55
以方公布停火條件:伊放棄核計劃,內(nèi)塔尼亞胡:與美國“完全協(xié)調(diào)”,特朗普否決刺殺哈梅內(nèi)伊計劃

以方公布停火條件:伊放棄核計劃,內(nèi)塔尼亞胡:與美國“完全協(xié)調(diào)”,特朗普否決刺殺哈梅內(nèi)伊計劃

東方網(wǎng)
2025-06-16 12:26:32
數(shù)學(xué)家學(xué)姐王虹開講,韋東奕聽到一半離場,評論區(qū)又在拉郎配

數(shù)學(xué)家學(xué)姐王虹開講,韋東奕聽到一半離場,評論區(qū)又在拉郎配

深析古今
2025-06-19 18:33:36
實探“洗漱包內(nèi)發(fā)現(xiàn)HIV檢測盒”酒店:監(jiān)管介入,檢測盒已送檢 醫(yī)師稱感染率較低

實探“洗漱包內(nèi)發(fā)現(xiàn)HIV檢測盒”酒店:監(jiān)管介入,檢測盒已送檢 醫(yī)師稱感染率較低

紅星新聞
2025-06-19 18:04:55
后悔了?奧迪宣布將繼續(xù)生產(chǎn)燃油車,取消全面電動化計劃

后悔了?奧迪宣布將繼續(xù)生產(chǎn)燃油車,取消全面電動化計劃

泡泡網(wǎng)
2025-06-18 10:20:13
宮導(dǎo),把李夢請回吧!球迷:李夢再差也比這兩人強啊

宮導(dǎo),把李夢請回吧!球迷:李夢再差也比這兩人強啊

南海浪花
2025-06-19 11:05:50
貝萊德(BlackRock)在中國銀行的持股比例于06月16日從5.85%升至6.06%

貝萊德(BlackRock)在中國銀行的持股比例于06月16日從5.85%升至6.06%

每日經(jīng)濟新聞
2025-06-19 17:25:16
為了東大,伊朗必須挺住!

為了東大,伊朗必須挺住!

牲產(chǎn)隊2024
2025-06-19 13:26:27
西熱力江妻子證實兩人已分居,原因疑似丈夫有家暴行為!

西熱力江妻子證實兩人已分居,原因疑似丈夫有家暴行為!

十點街球體育
2025-06-19 00:40:02
江蘇美女老師梁嬌去世!僅38歲,老公離世不到百天,小女兒才7歲

江蘇美女老師梁嬌去世!僅38歲,老公離世不到百天,小女兒才7歲

裕豐娛間說
2025-06-19 09:18:07
沉默五天,普京終于承認事實,伊朗祭出殺手锏,中方站在21國身后

沉默五天,普京終于承認事實,伊朗祭出殺手锏,中方站在21國身后

影孖看世界
2025-06-19 22:55:02
羅馬諾:威廉斯已與巴薩就6年合同達成協(xié)議,年薪約800萬歐

羅馬諾:威廉斯已與巴薩就6年合同達成協(xié)議,年薪約800萬歐

懂球帝
2025-06-19 15:48:15
A股:全體股民做好準備!不出意外,明天迎來更大級別調(diào)整!

A股:全體股民做好準備!不出意外,明天迎來更大級別調(diào)整!

悠然安晴
2025-06-19 09:02:17
2025-06-20 00:27:00
21財聞匯 incentive-icons
21財聞匯
一切有趣有料的商業(yè)財經(jīng)新聞
4439文章數(shù) 65676關(guān)注度
往期回顧 全部

科技要聞

羅永浩數(shù)字人爆火,可怕的不是5500萬GMV

頭條要聞

美打擊伊核設(shè)施計劃披露 特朗普鼓勵以總理"繼續(xù)干"

頭條要聞

美打擊伊核設(shè)施計劃披露 特朗普鼓勵以總理"繼續(xù)干"

體育要聞

22年,云南足球走出了一條自己的路

娛樂要聞

章子怡“吃蛋糕”戲在全網(wǎng)爆火

財經(jīng)要聞

Labubu黃牛價腰斬 誰會是最后的接盤俠

汽車要聞

5.99萬起/空間大續(xù)航長 純電小車凱翼拾月Mate上市

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
旅游
健康
手機

房產(chǎn)要聞

預(yù)定爆款!江東CBD+海中,海口這一國企大盤,即將引爆市場!

數(shù)碼要聞

榮耀平板 MagicPad 3 首次亮相:官方稱最佳 AI 平板

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言!

手機要聞

曝折疊屏iPhone三季度生產(chǎn),這次真的來了?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 横峰县| 会昌县| 涟水县| 海阳市| 武义县| 台前县| 县级市| 长乐市| 天门市| 雅江县| 巴林左旗| 兴国县| 饶平县| 安顺市| 清涧县| 兴义市| 吉林省| 锡林浩特市| 台东县| 镇沅| 赞皇县| 阳城县| 崇文区| 贡嘎县| 黔南| 册亨县| 苍溪县| 乌拉特前旗| 琼海市| 万州区| 邯郸县| 库车县| 泰宁县| 巩留县| 绥江县| 马山县| 永和县| 田阳县| 介休市| 抚宁县| 山东省|