AI搜索的結(jié)果,有可能干預(yù)嗎?
作者|王博??
大年初二,邊鋒(化名)看到公司微信群里老板發(fā)了一條消息:“為什么沒有我們?”
他趕緊點開看了一眼,之前從來不用AI大模型產(chǎn)品的老板用DeepSeek和豆包問了與公司所在行業(yè)相關(guān)的問題,并讓大模型推薦行業(yè)內(nèi)知名的公司,老板曬出了問答截圖,但大模型的回答有競品公司,沒有他們公司的信息。
邊鋒測試了其他大模型產(chǎn)品,有的就能顯示他們公司的信息,有的還能排在第一位。他把這些信息反饋給了老板,老板只回答了三個字:“多思考。”
春節(jié)假期之后,邊鋒的老板再次曬出DeepSeek的回答截圖,要求團(tuán)隊按照DeepSeek方案去做用戶增長并更新了KPI。有同事委婉地向老板提出疑問,老板回應(yīng)了六個字:“你要被淘汰了。”
邊鋒的老板因為DeepSeek的回答沒有他們公司而生氣,但也有商家因為自己在DeepSeek的回答中排名靠前而高興,并利用DeepSeek的回答做起了營銷。
上海一家拉面店在門口打出廣告寫明DeepSeek推薦(左圖),圖片來源:小紅書用戶@柚子
「甲子光年」實際詢問DeepSeek得到的回答(右圖),圖片來源:「甲子光年」截圖
「甲子光年」注意到,大模型產(chǎn)品的回答,尤其是DeepSeek的回答,正在被越來越多的人認(rèn)可,且已具有商業(yè)價值。
而邊鋒的老板看似離譜行為的背后,藏著一個真需求——AI搜索引擎優(yōu)化。
邊鋒所在的這家公司屬于傳統(tǒng)行業(yè),且是行業(yè)頭部公司,擁有較高的行業(yè)知名度。如果在傳統(tǒng)搜索引擎中搜索,只要正常做好SEO(搜索引擎優(yōu)化),搜索相關(guān)內(nèi)容都會出現(xiàn)該公司的信息。
但是,AI搜索的結(jié)果就不一定了。
1.AI搜索的邏輯變了
由于目前越來越多的大模型產(chǎn)品加入了聯(lián)網(wǎng)搜索功能,因此有聯(lián)網(wǎng)搜索功能的大模型產(chǎn)品(如ChatGPT、DeepSeek、Kimi、豆包等)和專門的AI搜索產(chǎn)品(Perplexity、夸克、秘塔AI搜索、納米AI搜索等)都屬于AI搜索的范疇。
此前,在一文中,我們曾說,AI搜索已經(jīng)不是傳統(tǒng)搜索。
為什么會這么說?
AI搜索主要有檢索(Retrieval)和生成(Generation)兩個步驟。
如果你在大模型產(chǎn)品中打開了聯(lián)網(wǎng)搜索模式再提問的話,你會發(fā)現(xiàn)它會先檢索了若干個網(wǎng)頁,找到相關(guān)參考資料之后,再生成回答。
在檢索方面,AI搜索會接入傳統(tǒng)搜索引擎API,采用自建索引庫,或使用新一代AI搜索引擎架構(gòu)。在檢索步驟里還有很多小步驟,比如意圖識別、問題改寫、檢索結(jié)果重排、獲取詳情內(nèi)容、內(nèi)容過濾、上下文增強(qiáng)等。
在生成方面,AI搜索就是根據(jù)用戶需求,基于檢索出來的內(nèi)容,通過不同的模型生成回答。
AI搜索流程圖 ,圖片來源:ThinkAny創(chuàng)始人idoubi、AI產(chǎn)品黃叔編輯
如果把檢索和生成比作備菜和炒菜的話,那么接入傳統(tǒng)搜索引擎API的“備菜”方式是相對粗放的,而使用新的AI搜索引擎架構(gòu)的“備菜”的食材來源更有保障、質(zhì)量更高,配料、調(diào)味料也更加精細(xì),雖然最后“炒菜”的廚師是不同的大模型,經(jīng)驗?zāi)芰τ懈哂械停皞洳恕蓖鶝Q定了最后菜品的口味。
博查AI搜索CTO翁柔瑩Eileen告訴「甲子光年」,新一代AI搜索引擎和傳統(tǒng)搜索引擎不同,它不再通過關(guān)鍵字密度和PageRank排序,而是通過混合檢索和語義排序,為大模型提供最需要的內(nèi)容。
第一階段,進(jìn)行向量+關(guān)鍵詞兩路混合檢索。通過向量關(guān)聯(lián),直接匹配用戶意圖,然后通過關(guān)鍵字搜索解決部分直接匹配的需求,之后召回結(jié)果進(jìn)行第一次排序。在這一層中,搜索引擎會沿用谷歌的EEAT原則(專業(yè)性、經(jīng)驗、權(quán)威性、可信度),對信息源的權(quán)威性、原創(chuàng)性、邏輯性等進(jìn)行評分,增加內(nèi)容源的排序權(quán)重分。
第二階段,通過Semantic Reranker(語義重排器)進(jìn)行語義排序。基于用戶問題與搜索結(jié)果的語義相關(guān)性進(jìn)行評分,并作為最終結(jié)果輸出給相關(guān)AI應(yīng)用中的大模型。由于Semantic Reranker與大模型都是基于Transformer架構(gòu),語義排序后的結(jié)果會更受大模型的“喜歡”,更加符合大模型生成內(nèi)容的需要。
“博查目前在做的就是專為AI設(shè)計的世界知識搜索引擎,是基于混合檢索和語義排序的新一代搜索引擎。”翁柔瑩Eileen說,“目前我們主要服務(wù)B端AI應(yīng)用廠商,承接著國內(nèi)AI應(yīng)用60%以上的聯(lián)網(wǎng)搜索請求。”
AI搜索邏輯變了,就會導(dǎo)致即使是同一個用戶用同樣的問題,問不同AI搜索產(chǎn)品,也會得出不一樣的結(jié)果。更不用說不同用戶去問了。
這就可以解釋前文那位老板的困惑。
那么SEO對于AI搜索還有用嗎?
傳統(tǒng)搜索引擎支持的是關(guān)鍵字搜索,SEO的核心是通過關(guān)鍵字密度、鏈接權(quán)重、頁面結(jié)構(gòu)等技術(shù)手段影響網(wǎng)頁位置,希望可以獲得更高的競價排名。
而在AI搜索產(chǎn)品中,用戶搜索方式轉(zhuǎn)變?yōu)槭褂米匀徽Z言提問,必須使用新的AI搜索引擎架構(gòu)來滿足用戶需求,這就會帶來變化。“學(xué)術(shù)論文、權(quán)威機(jī)構(gòu)網(wǎng)站的內(nèi)容權(quán)重更高,低質(zhì)量、過度優(yōu)化或AI生成的SEO內(nèi)容可能被判定為‘噪聲’而過濾。”翁柔瑩Eileen說。
總結(jié)來說,如果相關(guān)AI搜索產(chǎn)品是直接接入傳統(tǒng)搜索引擎API的話,SEO還會有一定作用;隨著越來越多的AI搜索產(chǎn)品使用新一代AI搜索引擎,SEO的作用將會逐漸下降。
但這并不意味著整體SEO市場已死。
市場研究機(jī)構(gòu)Research and Markets數(shù)據(jù)顯示,2024年全球SEO市場規(guī)模為891億美元,預(yù)計到2030年將達(dá)到1439億美元,2024年至2030年的復(fù)合年均增長率(CAGR)為 8.3%。
SEO市場規(guī)模,圖片來源:Research and Markets
不過,AI搜索SEO是一個客觀存在的需求,且隨著DeepSeek的火熱,需求被逐漸放大,這種需求不容忽視。
有人想到了方法——GEO。
2.GEO有效果嗎?
2024年6月,來自印度理工學(xué)院德里分校、普林斯頓大學(xué)的學(xué)者和一些獨立研究者在arXiv上發(fā)表了論文《GEO: Generative Engine Optimization(生成引擎優(yōu)化)》,提出了GEO(生成引擎優(yōu)化)概念、 框架及相關(guān)的實驗設(shè)計。
圖片來源:《GEO: Generative Engine Optimization》
這篇論文介紹,大模型的出現(xiàn)帶來了搜索引擎的新范式,這些搜索引擎利用生成式模型收集和總結(jié)信息以回答用戶的查詢。這一新興技術(shù),論文作者在統(tǒng)一的框架下稱之為生成引擎(Generative Engines)。
雖然生成引擎顯著提高了用戶效率和相關(guān)產(chǎn)品的流量,但它給第三方利益相關(guān)者——網(wǎng)站和內(nèi)容創(chuàng)作者帶來了巨大的挑戰(zhàn)。由于生成引擎具有黑箱性質(zhì)且變化迅速,內(nèi)容創(chuàng)作者幾乎無法控制他們的內(nèi)容何時以及如何被展示。隨著生成引擎的普及,論文作者認(rèn)為,必須確保創(chuàng)作者經(jīng)濟(jì)不被邊緣化。
因此,這篇論文提出了GEO,這是第一個幫助內(nèi)容創(chuàng)作者提高其內(nèi)容在生成引擎響應(yīng)中可見度的新型框架。作者認(rèn)為,設(shè)計得當(dāng)?shù)腉EO方法相當(dāng)于一個黑箱優(yōu)化方法,它可以在不知道生成引擎的具體算法設(shè)計的情況下,提升相關(guān)網(wǎng)站的可見性。
論文中提出了9種方法:
權(quán)威性(Authoritative):將源內(nèi)容的文本風(fēng)格修改為更具說服力和權(quán)威性。
增加統(tǒng)計數(shù)據(jù)(Statistics Addition):在可能的情況下,用定量統(tǒng)計數(shù)據(jù)替代定性討論。
關(guān)鍵詞堆砌(Keyword Stuffing):在內(nèi)容中加入更多來自查詢的關(guān)鍵詞,這也是經(jīng)典的SEO優(yōu)化方法。
引用來源(Cite Sources):標(biāo)注相關(guān)內(nèi)容的來源。
添加引語(Quotation Addition):從可信來源添加相關(guān)的引用語。
易于理解(Easy-to-Understand):簡化網(wǎng)站的語言表達(dá)。
優(yōu)化流暢度(Fluency Optimization):改善網(wǎng)站文本的流暢度。
獨特詞匯(Unique Words):在可能的地方加入獨特的詞匯。
技術(shù)術(shù)語(Technical Terms):在內(nèi)容中加入更多的技術(shù)術(shù)語。
由于目前沒有公開可用的包含生成引擎相關(guān)查詢的數(shù)據(jù)集,論文作者推出了一個名為GEO-bench的基準(zhǔn)測試。這是一個涵蓋多個領(lǐng)域和相關(guān)網(wǎng)頁來源的大規(guī)模基準(zhǔn)測試,用于評估不同用戶查詢。
測試發(fā)現(xiàn),關(guān)鍵詞堆砌和獨特詞匯的方法沒有效果,其他方式都有效果,其中添加引語和增加統(tǒng)計數(shù)據(jù)的方式效果最好。
不同GEO方式效果對比,圖片來源:《GEO: Generative Engine Optimization》
論文中還呈現(xiàn)了GEO方法的定性分析,包含了引用來源、增加統(tǒng)計數(shù)據(jù)、權(quán)威性這三種方法的示例,展示了GEO方法如何在最小變動的情況下提升源網(wǎng)站內(nèi)容的可見性。
示例一,引用來源。僅僅添加聲明的來源就可以顯著提升最終答案的可見性。
示例二,增加統(tǒng)計數(shù)據(jù)。添加相關(guān)統(tǒng)計數(shù)據(jù)可以確保在最終生成引擎的響應(yīng)中提升來源的可見性。
示例三,權(quán)威性。僅僅強(qiáng)調(diào)文本的某些部分,并使用說服性的文本風(fēng)格也可以提升可見性。
GEO優(yōu)化源網(wǎng)站方法的代表性示例,新增內(nèi)容用綠色標(biāo)記,刪除內(nèi)容用紅色標(biāo)記,圖片來源:《GEO: Generative Engine Optimization》
論文指出,通過嚴(yán)格的評估,GEO可以將內(nèi)容在生成引擎響應(yīng)中的可見度提升多達(dá)40%。
不過,論文作者也承認(rèn),GEO也存在一定局限性。隨著生成式引擎的演變,這些方法可能需要隨著時間的推移進(jìn)行適應(yīng)性調(diào)整,這與SEO的演變類似。GEO方法所做出的改變是針對文本內(nèi)容的針對性改變,與SEO方法有一定相似性,但不會影響其他元數(shù)據(jù),例如域名、反向鏈接等,因此它們不太可能影響搜索引擎的排名。
「甲子光年」注意到,GEO相比SEO更加注重內(nèi)容的與用戶問題的語義相關(guān)性,符合EEAT原則的內(nèi)容質(zhì)量依然很重要。
翁柔瑩Eileen認(rèn)為,企業(yè)通過做GEO來提高內(nèi)容的質(zhì)量,相較于傳統(tǒng)搜索引擎的SEO成本更低,也更加容易,新一代AI搜索引擎將不再是通過廣告競價排名機(jī)制來破壞用戶體驗,更有可能是通過優(yōu)質(zhì)內(nèi)容獲得曝光度,甚至直接獲得分潤。
“企業(yè)的GEO策略需要從‘關(guān)鍵詞優(yōu)化’轉(zhuǎn)向‘知識庫建設(shè)’,可以構(gòu)建高質(zhì)量、結(jié)構(gòu)化、多模態(tài)的知識庫,如技術(shù)白皮書、案例研究,去提升推廣內(nèi)容被模型引用的概率。”翁柔瑩Eileen告訴「甲子光年」。
大模型知識庫旨在通過深度學(xué)習(xí)和自然語言處理技術(shù),自動化地存儲、管理和檢索大量信息。隨著大模型的快速發(fā)展,結(jié)合知識庫的應(yīng)用成為提升信息檢索和問答系統(tǒng)性能的重要方向。
3.我們與信息的距離
AI搜索主要有檢索(Retrieval)和生成(Generation)兩個步驟,如果在兩個步驟之外再加上推薦(Recommendation)呢?
2024年12月,在火山引擎冬季Force原動力大會上,火山引擎推出全域AI搜索,通過場景化搜索推薦一體化服務(wù)、企業(yè)私域信息整合服務(wù)、聯(lián)網(wǎng)問答服務(wù),將企業(yè)的信息、業(yè)務(wù)和用戶需求緊密結(jié)合,幫助企業(yè)實現(xiàn)“發(fā)現(xiàn)更多,推薦更準(zhǔn),搜索無限可能”。
圖片來源:火山引擎
AI搜推引擎的應(yīng)用場景中,最典型的是電商零售場景。用戶可以在大模型產(chǎn)品聊天對話框上傳一張場景照片,讓AI推薦一些“在這拍照能出片的服裝搭配”。
圖片來源:火山引擎
用戶也可以更詳細(xì)地描述需求,例如:“我正在尋找完美的滑雪板。在冬季,我主要會在北海道滑雪,每月大約兩次。我喜歡平整的滑道,但也希望有一塊能夠偶爾應(yīng)對新鮮粉雪的滑雪板……”O(jiān)penAI全新的Agent(智能體)deep research就可以給出極為專業(yè)的滑雪用具推薦。
圖片來源:OpenAI
AI搜推引擎可以廣泛覆蓋多種應(yīng)用場景,在電商零售場景之外,還有企業(yè)信息檢索、媒體內(nèi)容推送、本地生活服務(wù)、游戲、教育等。
火山引擎智能算法負(fù)責(zé)人吳迪告訴「甲子光年」,搜索和推薦此前在產(chǎn)品層面是比較割裂的,通過傳統(tǒng)搜索引擎搜索東西,推薦的可能并不太符合用戶需要。而推薦又主要根據(jù)用戶的興趣、行為,用戶的主動表達(dá)沒有很好兼顧,“從現(xiàn)在開始,AI搜索推薦將會真正被緊密地融合在一起。”
圖片來源:火山引擎
「甲子光年」了解到,火山AI搜索推薦引擎是用Agent-base搜推統(tǒng)一的框架對混合模型進(jìn)行端到端、輕量、靈活編排調(diào)度,具有開放的可擴(kuò)展功能。
“團(tuán)隊也在技術(shù)和算法上面投入了很大的力量,讓推薦模型能夠?qū)ontext(上下文)的理解更加深入。” 吳迪說, “強(qiáng)大的AI搜索加強(qiáng)大的AI推薦,可以形成1+1>2的效果。”
「甲子光年」認(rèn)為,從表面上來看,AI搜推引擎可以幫助企業(yè)應(yīng)對信息獲取和搜索推薦的挑戰(zhàn),但在更深維度,它其實是在拉近人與信息之間的距離。
AI搜索的邏輯變了,但沒有變的是大家對有價值、更精準(zhǔn)信息的需求,這種需求在DeepSeek出圈后更加旺盛了,標(biāo)準(zhǔn)也更高了,無論是從技術(shù)角度還是從營銷角度,AI搜索及相關(guān)的SEO、GEO都值得重新思考和創(chuàng)新。
*王藝對本文亦有貢獻(xiàn)
**應(yīng)受訪者要求,邊鋒為化名
(封面圖由AI生成)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.