這要命的幻覺率!
聽筒Tech(ID:tingtongtech)原創(chuàng)
文|楊 林
編|陳 珂
盡管巨頭的競(jìng)爭(zhēng)依然火熱,但毋庸置疑的是,AI搜索正面臨最割裂的時(shí)期。
7月2日,在百度AI Day開放日上,百度搜索宣布進(jìn)行十年來(lái)最大改版,從搜索框、搜索結(jié)果頁(yè)到搜索生態(tài)全面革新。諸多的報(bào)道指出,百度的此次變革,“從產(chǎn)品形態(tài)到商業(yè)模式,從用戶體驗(yàn)到開發(fā)者生態(tài),全都重做一遍。”
當(dāng)然,不僅僅是百度,今年以來(lái),AI搜索依然是頭部企業(yè)的必爭(zhēng)之地。不久之前,蘋果傳出要收購(gòu)明星創(chuàng)業(yè)公司Perplexity AI,為未來(lái)的AI搜索引擎加碼。除此之外,谷歌等巨頭亦在持續(xù)重塑搜索形態(tài)。
不過(guò),遺憾的是,一邊是巨頭白熱化的“技術(shù)變革”,一邊卻是普通用戶的“望而卻步”。
一位網(wǎng)絡(luò)原住民馬少便直言,盡管市場(chǎng)都在傳導(dǎo)“技術(shù)的進(jìn)步”,但他只感受到了AI應(yīng)用的“退步”或“停滯”。
僅就AI搜索和AI聊天而言,這是馬少常用的AI功能,實(shí)際上,這也是市場(chǎng)上AI最為普遍的應(yīng)用功能。但這兩個(gè)普通用戶最常接觸的產(chǎn)品,似乎離用戶需求越來(lái)越遠(yuǎn)。
“原來(lái)下載的AI聊天軟件早就卸載了,AI搜索現(xiàn)在錯(cuò)誤百出,也不敢用了。”當(dāng)然,這并不是馬少一位網(wǎng)民的感受。在社交平臺(tái),對(duì)AI搜索的幻覺“吐槽”的相關(guān)內(nèi)容,比比皆是。
一位互聯(lián)網(wǎng)大廠的AI從業(yè)人士林強(qiáng)對(duì)普通用戶的失望表示理解,在他看來(lái),如今的現(xiàn)狀是,AI產(chǎn)品的開發(fā),與普通用戶的需求脫節(jié),“事實(shí)上,AI開發(fā)已經(jīng)陷入困境。諸多開發(fā)是在大模型的基礎(chǔ)上進(jìn)行簡(jiǎn)單的調(diào)優(yōu),甚至沒(méi)有去調(diào)研過(guò)真正的市場(chǎng)需求。”
“目前的AI開發(fā),主要的目的是‘如何盡快實(shí)現(xiàn)商業(yè)化’,說(shuō)直接點(diǎn),是為了‘搞錢’,而不是解決‘普通用戶的需求’。”林強(qiáng)直言,這是導(dǎo)致“普通用戶感受不到AI技術(shù)的進(jìn)步”的本質(zhì)所在。
但于馬少等普通用戶而言,“真正的好產(chǎn)品,難道不應(yīng)該是符合大眾需求的嗎?”
很顯然,就目前而言,橫亙?cè)凇傲謴?qiáng)”和“馬少”之間的這道巨溝,還難以跨越。
決定拋棄AI搜索的普通用戶
“盡管諸多巨頭都唏噓自己的技術(shù)多厲害,但作為普通用戶,我還是決定拋棄AI搜索。”
作為網(wǎng)絡(luò)原住民,95后馬少直言,在過(guò)去的半年,作為普通用戶,他最大的體會(huì)是,在應(yīng)用層面,尤其是最常用的AI搜索,是在倒退,而不是在進(jìn)步,“AI搜索的錯(cuò)誤率和胡說(shuō)八道,已經(jīng)到了令人發(fā)指的程度。”
馬少告訴《聽筒Tech(ID:tingtongtech)》,以最常用的DeepSeek為例,“但凡稍微專業(yè)一點(diǎn)點(diǎn)的搜索,幾乎都會(huì)出現(xiàn)幻覺。”
如馬少所言,《聽筒Tech》近期測(cè)試了多個(gè)市場(chǎng)上常用的AI搜索。
在DeepSeek中,搜索“目前市場(chǎng)上美黑產(chǎn)品情況”時(shí),DeepSeek總結(jié)出了目前市場(chǎng)上“主流美黑產(chǎn)品形態(tài)對(duì)比”,并制作成表格。
但遺憾的是,DeepSeek所總結(jié)出的產(chǎn)品,如雅詩(shī)蘭黛、完美日記、花西子等,甚至并沒(méi)有推出相關(guān)的“美黑產(chǎn)品”。很顯然,DeepSeek是將市場(chǎng)上的防曬產(chǎn)品作為“美黑產(chǎn)品”進(jìn)行了總結(jié)歸納。
圖:DeepSeek所總結(jié)的“主流美黑產(chǎn)品形態(tài)對(duì)比”
來(lái)源:DeepSeek 《聽筒Tech》截圖
對(duì)此,馬少直言,不僅僅是DeepSeek,實(shí)際上,目前市場(chǎng)上普通用戶使用的AI搜索,幾乎都存在這種現(xiàn)象,“即便是最新更新的百度文小言,同樣不能避免這種現(xiàn)象。”
在馬少的建議下,《聽筒Tech》對(duì)文小言進(jìn)行了簡(jiǎn)單的測(cè)試,在搜索“中國(guó)吊帶出口東南亞的產(chǎn)業(yè)情況”時(shí),文小言總結(jié)出了相關(guān)的數(shù)據(jù),“2025年?yáng)|南亞電商大促數(shù)據(jù)顯示,中國(guó)產(chǎn)女士吊帶在Lazada、Shopee等平臺(tái)的單日成交峰值突破50萬(wàn)件”。
圖:文小言的相關(guān)搜索結(jié)果
來(lái)源:文小言APP 《聽筒Tech》截圖
為了保障數(shù)據(jù)的準(zhǔn)確性,《聽筒Tech》在多個(gè)搜索軟件中對(duì)數(shù)據(jù)來(lái)源進(jìn)行了檢索,但遺憾的是,并沒(méi)有找到完整的數(shù)據(jù)來(lái)源。帶著質(zhì)疑,《聽筒Tech》點(diǎn)擊了“問(wèn)小言”考證數(shù)據(jù)來(lái)源,得到的卻是如下答案。
圖:文小言的相關(guān)搜索結(jié)果
來(lái)源:文小言APP 《聽筒Tech》截圖
這便意味著,文小言在相關(guān)資料的基礎(chǔ)上,自行杜撰了相關(guān)數(shù)據(jù)。
對(duì)此,馬少表示,“習(xí)以為常。”他直言,如果不是對(duì)相關(guān)知識(shí)具備一定的認(rèn)知,這些數(shù)據(jù)往往會(huì)被采用,并反投入數(shù)據(jù)庫(kù),“然后,搜索產(chǎn)生的結(jié)果便會(huì)錯(cuò)得越來(lái)越離譜。”
“作為AI產(chǎn)品的基礎(chǔ)功能,AI搜索的準(zhǔn)確率不升反降,這是一件令人無(wú)法理解的事情。”在馬少看來(lái),盡管AI技術(shù)始終在進(jìn)步,諸多企業(yè),尤其是大廠都在聲稱投入了多少資金,但作為普通用戶,時(shí)至今日,他始終沒(méi)有感受到明顯的改變。
實(shí)際上,馬少所言并不是危言聳聽,在社交平臺(tái),越來(lái)越多的網(wǎng)友吐槽AI搜索的“離譜”,“AI搜索將幾位名人的名言排列組合,杜撰了一位所謂的‘名人名言’”、“N年前的數(shù)據(jù),改寫成了2025年的數(shù)據(jù)”等等吐槽,在社交平臺(tái)比比皆是。
-02-“為什么AI搜索會(huì)越來(lái)越離譜?”
實(shí)際上,AI搜索的“離譜”,不僅僅是對(duì)普通用戶造成困擾,也導(dǎo)致了諸多不明真相的用戶因輕信AI的結(jié)果,導(dǎo)致“謠言滿天飛”,并產(chǎn)生較大的不良影響。
以近日引發(fā)熱議的“DeepSeek就AI模型違規(guī)關(guān)聯(lián)向王一博道歉”消息為例。近日,諸多消息稱,DeepSeek因內(nèi)容審核疏漏,將王一博與近期相關(guān)案件進(jìn)行了不當(dāng)關(guān)聯(lián),損害了其名譽(yù),并已作出正式道歉。
但隨后,消息核實(shí)稱,DeepSeek官方從未發(fā)表過(guò)道歉聲明,部分媒體發(fā)布的所謂聲明截圖,竟然本身就是AI生成的文字。聲明中所提及的法律判決書,在中國(guó)裁判文書網(wǎng)上也檢測(cè)不到。然而,這則信源存疑的消息,仍然引發(fā)大量平臺(tái)、媒體轉(zhuǎn)發(fā)。
更重要的是,據(jù)報(bào)道稱,有網(wǎng)友向其他的AI大模型詢問(wèn)該事件,得到的答案也是,DeepSeek的確因?yàn)檫`規(guī)關(guān)聯(lián)“李愛慶腐敗案”向王一博道歉了。
7月4日,《聽筒Tech》同樣在目前主流AI通用大模型中,以“DeepSeek的確因?yàn)檫`規(guī)關(guān)聯(lián)‘李愛慶腐敗案’向王一博道歉了嗎?”為題進(jìn)行搜索,發(fā)現(xiàn)僅兩家AI大模型得出了肯定答案,并明確“該消息為‘不實(shí)信息’”。但其他大模型仍肯定表示,“DeepSeek因違規(guī)關(guān)聯(lián)‘李愛慶腐敗案’向王一博道歉屬實(shí)。”
圖:某大模型7月4日搜索的相關(guān)結(jié)果
來(lái)源:《聽筒Tech》截圖
對(duì)于這一現(xiàn)象,在林強(qiáng)看來(lái),于普通用戶而言,不管是AI搜索“錯(cuò)得離譜”,還是“AI謠言”,都不足為奇。
“AI大模型本質(zhì)上是基于大量數(shù)據(jù)訓(xùn)練的模型,它沒(méi)有真實(shí)的情感和判斷力,當(dāng)它面對(duì)大量帶有情緒和偏見的信息時(shí),很容易被‘訓(xùn)練’出錯(cuò)誤的結(jié)論。”林強(qiáng)直言,“這是一個(gè)無(wú)法回避的問(wèn)題,AI大模型接收了大量‘錯(cuò)誤信息’的投喂后,會(huì)分析出越來(lái)越多的‘離譜’的信息。”
林強(qiáng)直言,一個(gè)根本原因在于,如今市場(chǎng)上普通用戶使用的通用模型,實(shí)際上主要盈利入口是面對(duì)B端用戶,“這些通用大模型主要收的是B端用戶的錢,但對(duì)C端用戶是免費(fèi)開放使用的,做個(gè)人定制化服務(wù)成本太高,基本不太可能。”
“C端用戶如果要獲得精準(zhǔn)的數(shù)據(jù),還是用細(xì)分領(lǐng)域的AI應(yīng)用比較合適。”林強(qiáng)表示,例如,需要找學(xué)術(shù)相關(guān)的數(shù)據(jù),就下載學(xué)術(shù)領(lǐng)域的AI應(yīng)用,“當(dāng)然,即便這樣,也不可能從根本意義上杜絕AI搜索的幻覺率。”
“比如,學(xué)術(shù)搜索,需要在通用模型的基礎(chǔ)上,進(jìn)行‘調(diào)教’,才可能達(dá)到一定的精確度。”林強(qiáng)透露,但這種“調(diào)教”,需要的是“長(zhǎng)期且穩(wěn)定的專業(yè)數(shù)據(jù)輸入”,“建立相應(yīng)的數(shù)據(jù)庫(kù),本身是一個(gè)極為復(fù)雜的過(guò)程。”
林強(qiáng)指出,實(shí)際上,目前市場(chǎng)上有不少企業(yè)在開發(fā)更為細(xì)分領(lǐng)域的產(chǎn)品,但遺憾的是,市場(chǎng)推廣不足,普通用戶無(wú)法接觸,“比如,健康搜索,有專門針對(duì)健康搜索的AI產(chǎn)品,但普通用戶還是習(xí)慣DeepSeek,或者直接微信、百度內(nèi)搜索。”
“市場(chǎng)推廣的不足,使得諸多普通用戶無(wú)法接解到那些細(xì)分領(lǐng)域的AI搜索,這本質(zhì)上也是一種信息差。”林強(qiáng)直言,某種意義上,讓普通用戶接受細(xì)分領(lǐng)域的AI搜索,是一個(gè)長(zhǎng)期且漫長(zhǎng)的市場(chǎng)培育過(guò)程。
-03-到底如何才能服務(wù)好普通用戶?
不過(guò),在科技企業(yè)技術(shù)人員陳哥看來(lái),不管是通用大模型也好,還是垂直領(lǐng)域的模型也好,目前最大的問(wèn)題是,AI的技術(shù)研發(fā),已經(jīng)缺乏真正意義上的創(chuàng)新,“當(dāng)萬(wàn)物皆AI,創(chuàng)新已經(jīng)陷入了泥潭。”
陳哥對(duì)《聽筒Tech》直言,“目前絕大部分的技術(shù)開發(fā),都是以‘賺錢’為目的,很難去服務(wù)好C端用戶。”即便是細(xì)分領(lǐng)域AI搜索應(yīng)用,“除非有非常大的資金支撐,否則都是以‘賺快錢’為目的。”
陳哥指出,目前市場(chǎng)上的諸多AI應(yīng)用,實(shí)際上都是在通用大模型的基礎(chǔ)上,進(jìn)行開發(fā)便投入市場(chǎng),“很多企業(yè),在進(jìn)行產(chǎn)品研發(fā)時(shí),甚至沒(méi)有進(jìn)行過(guò)市場(chǎng)調(diào)研,更談不上專業(yè)的技術(shù)維護(hù)和后期數(shù)據(jù)更新。”
實(shí)際上,陳哥所言,并不是毫無(wú)根據(jù)。僅從用戶體驗(yàn)而言,馬少便指出,作為普通用戶,他的體會(huì)便是,“盡管產(chǎn)品的功能越來(lái)越琳瑯滿目,但不管是GPT-4o,還是其他巨頭的通用大模型,他們的應(yīng)用場(chǎng)景,都和之前沒(méi)有本質(zhì)區(qū)別。”
馬少直言,雖然不少宣傳稱,“模型參數(shù)從千億走向萬(wàn)億,視頻生成從幾秒擴(kuò)展到幾分鐘。但作為普通用戶,我們的體驗(yàn)仍停留在使用’更好的聊天機(jī)器人‘,或’日常的AI搜索‘這一階段。”
林強(qiáng)亦指出,實(shí)際上,近兩年來(lái),AI的應(yīng)用開發(fā),集中在“對(duì)話機(jī)器人”和“圖像視頻”賽道,“當(dāng)創(chuàng)業(yè)者和投資人擠在這兩條狹窄賽道,AI便成了’高級(jí)濾鏡‘和’自動(dòng)客服‘的代名詞。”
“一個(gè)問(wèn)題是,AI到底才能如何服務(wù)好普通用戶?”對(duì)于馬少的疑問(wèn),林強(qiáng)和陳哥各有認(rèn)知。
在林強(qiáng)看來(lái),最重要的是,從產(chǎn)品角度而言,“在做產(chǎn)品研發(fā)時(shí),至少做好用戶調(diào)研。”比如,如果產(chǎn)品是針對(duì)下沉市場(chǎng),“至少知道下沉市場(chǎng)需要的是什么,而不是在通用大模型的基礎(chǔ)上,簡(jiǎn)單調(diào)優(yōu),便投入市場(chǎng),對(duì)外聲稱能夠解決’母豬不產(chǎn)崽‘的問(wèn)題。”
“如果準(zhǔn)備做垂直領(lǐng)域的產(chǎn)品研發(fā),就在做好‘干苦力’的思想準(zhǔn)備。”林強(qiáng)直言,垂直領(lǐng)域數(shù)據(jù)庫(kù)的建立,是一個(gè)漫長(zhǎng)的過(guò)程,且“耗資巨大”,“實(shí)際上,和很多產(chǎn)品創(chuàng)新一樣,AI的研發(fā),也需要長(zhǎng)時(shí)間的沉淀。”
陳哥認(rèn)可林強(qiáng)的觀點(diǎn),在他看來(lái),真正的AI技術(shù)創(chuàng)新,并不是簡(jiǎn)單的“調(diào)優(yōu)”,而需要“真正的變革”,“否則,永遠(yuǎn)只停留在表面,也永遠(yuǎn)不可能開發(fā)出來(lái)好的產(chǎn)品。”
當(dāng)然,在林強(qiáng)看來(lái),毋庸置疑的是,AI在進(jìn)步,未來(lái)的AI,一定能夠解決普通用戶的諸多問(wèn)題。
林強(qiáng)認(rèn)同OpenAI創(chuàng)始人山姆·奧特曼(Sam Altman)曾經(jīng)提出AI發(fā)展的五個(gè)階段(L1聊天者—L2推理者—L3行動(dòng)者—L4創(chuàng)新者—L5組織者)。在他看來(lái),現(xiàn)在的AI,正處于“思考”向“進(jìn)行”的階段,“普通用戶應(yīng)該更有耐心,給市場(chǎng)更多的時(shí)間。”
當(dāng)然,于馬少等普通用戶而言,他們的訴求很簡(jiǎn)單,“我們需要的不是花里胡哨的功能,我們需要的是實(shí)用和可用的產(chǎn)品。”
這顯然,代表的是AI時(shí)代諸多普通用戶的心聲。
(文中均為化名。)
(頭圖及部分內(nèi)文配圖由AI生成。)
(聲明:本文僅作為信息交流,不構(gòu)成任何投資參考建議。)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.