AI 正在重構(gòu)搜索本身的體驗。
從早期的 AI Summary,到現(xiàn)在各家產(chǎn)品產(chǎn)品推出的 Deep Research,搜索的廣度和深度,一直在被拓展。
Agent 時代,又從智能體的角度對搜索進(jìn)行了能力的升維。
不僅僅是簡單搜索,復(fù)雜問題乃至千字問題、研究任務(wù)、復(fù)雜的商品購買需求、投資任務(wù),甚至直接解決用戶的內(nèi)容創(chuàng)作難題,比如快速生成幾分鐘的視頻或者一份需要花很長時間才能完成的 PPT。
搜索意味著用戶有問題要解決,Agent 智能體,可能是在今天解決搜索問題的更好答案。
納米 AI 推出的「超級搜索智能體」就是基于這樣的思路而誕生的一款產(chǎn)品,基于搜索但不止于搜索。
結(jié)合了今天的多 Agent 協(xié)作、多模型協(xié)作、MCP、AI 瀏覽器等能力,納米 AI 超級搜索智能體是在當(dāng)前的模型技術(shù)架構(gòu)下,國內(nèi)公司對于 AI 搜索和 AI 智能體的一個新的解決方案的嘗試。
在 AGI Playground 2025 上,360 集團(tuán)副總裁、納米 AI 負(fù)責(zé)人梁志輝詳細(xì)分享了 360 對于 AI 時代的搜索、智能體搭建以及 AI 瀏覽器的看法,和 360 在這些產(chǎn)品上的探索與經(jīng)驗。
以下內(nèi)容基于演講內(nèi)容,由 Founder Park 整理。
超 7000 人的「AI 產(chǎn)品市集」社群!不錯過每一款有價值的 AI 應(yīng)用。
邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,飛書掃碼加群:
進(jìn)群后,你有機(jī)會得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
01從問答到智能體,AI 搜索的三個階段
「納米 AI 超級搜索智能體」是我們一周多前發(fā)布的新產(chǎn)品,這個產(chǎn)品主要是希望通過大模型的加持來改善大家的搜索體驗。自從大模型產(chǎn)品出現(xiàn)后,很多人的搜索習(xí)慣應(yīng)該都發(fā)生了改變,我自己也是這樣。
傳統(tǒng)搜索確實存在很多痛點。
從從業(yè)者的角度看,過去使用傳統(tǒng)搜索時,我們必須輸入關(guān)鍵字。但這里有一個很明顯的問題,無論是國外的谷歌,還是國內(nèi)的百度及 360,一旦關(guān)鍵詞超過 20 個,基本上得到的答案質(zhì)量就會很差。我們做過統(tǒng)計,搜索引擎里超過 40% 的用戶需求是找網(wǎng)址或資源,但超過 60% 的需求是在提問。隨著大模型的到來,用戶提問的比例基本上升到了 90%,剩下的 10% 可能是創(chuàng)作、改寫等需求。
在傳統(tǒng)搜索時代,瀏覽器呈現(xiàn)給你的鏈接很多,大家會發(fā)現(xiàn)大部分的鏈接都是雷同的,因為它優(yōu)先返回的是那些關(guān)鍵字相似、點擊率高的網(wǎng)頁,但它們不一定能解決你的問題。
所以我們看到,自從有了大模型,大家的搜索習(xí)慣被改變了。過去大家主動將問題拆分成關(guān)鍵詞,并控制其數(shù)量和長度,到現(xiàn)在流行一個詞叫「vibe」,大家會「vibe」地提出各種問題,比如「vibe coding」,我們也可以稱之為「vibe search」。在這種趨勢下,用傳統(tǒng)的搜索引擎或檢索思路,已經(jīng)完全解決不了現(xiàn)在用戶的許多需求了。
我們看到一個數(shù)據(jù),過去的搜索關(guān)鍵詞大約是 5 到 10 個字,而用了 AI 搜索或大模型產(chǎn)品后,大家提問的長度基本超過 20 字。在一些能自主解決通用問題的場景下,用戶提的關(guān)鍵詞或提示詞會越來越長,我們見過最夸張的提示詞高達(dá)數(shù)千字。在這個不經(jīng)意的過程中,大家在很多場景下的習(xí)慣正被大模型逐步改變。
面臨這樣的時代變遷,360 也在嘗試用 AI 來改造傳統(tǒng)搜索。
在 1.0 時代,無論是谷歌、必應(yīng)還是國內(nèi)的搜索引擎,最直接的想法是讓 AI 總結(jié)問題,把答案放在搜索結(jié)果之前。
但這面臨幾個問題:第一,這種解法不夠純粹,它仍然基于統(tǒng)計+檢索的思路,提前總結(jié)了用戶常問的問題,很多用戶用了之后,感覺跟用大模型的體驗沒有太大區(qū)別,提升有限。今天無論是谷歌還是國內(nèi)的廠商,都在逐步提升這一體驗。
在第二階段,我們嘗試讓大模型和搜索結(jié)合起來,用大模型做意圖識別,實現(xiàn)多意圖的全網(wǎng)搜索,這樣能夠?qū)崿F(xiàn)一個深層次的答案。但說實話,隨著現(xiàn)在模型能力的提升,我們發(fā)現(xiàn)這種體驗跟用 DeepSeek 的區(qū)別并不大。
所以我們在想,既然模型的調(diào)用能力越來越強(qiáng),價格越來越便宜,大家對 AI 提的問題也越來越復(fù)雜,我們便嘗試把搜索升級到 AI 搜索的 3.0。也就是說,以前你可能提的是一個問題,但今天你提的可能是一個研究任務(wù)。
有了研究任務(wù),現(xiàn)在 AI 的自我規(guī)劃能力、分布執(zhí)行能力很強(qiáng),還有各種各樣的工具。我們把整個產(chǎn)品的底層重構(gòu)了,當(dāng)它接到一個指令后,能夠自動判斷是簡單需求還是復(fù)雜需求。對于復(fù)雜需求,它還可以做分解規(guī)劃、分布執(zhí)行和分布理解,然后交付一個專家級的結(jié)果。
發(fā)布后發(fā)現(xiàn)效果很明顯。這里有一張曲線圖,可以看到,與其他友商相比,截至今年四五月份,我們的月度使用量已經(jīng)超過 1.5 億,基本上是第二名的十倍左右。
02選擇搜索場景是因為用戶習(xí)慣在這里
在選擇賽道的過程中,我們思考的是。有了通用的超級智能體能力,可以幫用戶解決什么問題。
最后我們依然選擇以搜索為主要場景,原因有三個。第一,搜索是用戶被培養(yǎng)了 20 年習(xí)慣的入口,需求非常強(qiáng)烈,工作、生活、辦公、學(xué)習(xí)都要用到。但傳統(tǒng)搜索不完美,它像一個懶惰的圖書館管理員,接到你的需求后告訴你去某個書柜找書,你還得自己去讀、去分析。有了 AI 之后,就變成 AI 幫你讀、幫你分析。
第二,我們做過統(tǒng)計,發(fā)現(xiàn)在大模型對話里,用戶的大部分需求主要是以搜索為目的。無論是我們做的類似 DeepSeek 滿血版的大模型入口,還是其他友商的產(chǎn)品,大家用大模型的第一需求依然是搜索,但大家提的問題越來越長,可能一次搜索解決不了。所以在這種場景下,我們覺得在 AI 搜索場景里結(jié)合超級智能體的能力,可以達(dá)到我們做產(chǎn)品期待的目標(biāo):高頻、剛需、有痛點。解決簡單問題是高頻需求,而解決復(fù)雜任務(wù)則是有痛點的事情。
可以看到,如果只是一個很簡單的問題,也許大模型只需要翻一下維基百科就能回答,我們定義這種叫做「簡單問題」或「快問快答」。很多場景下,今天所有的 AI 搜索都能做到直接給答案,你不需要去翻閱非常多的鏈接,就能在 10 秒之內(nèi)對問題得到解答。但是我們發(fā)現(xiàn),有 20% 的用戶需求是單次推理解決不了的。
如圖所示,在簡單問題的場景下,可能大模型幫你做多次搜索、單次推理,問題就解決了。但遇到一個復(fù)雜問題時,就需要對大量的網(wǎng)頁、書籍、圖片、視頻等去做搜索,然后不停地讓模型邊搜邊思考、邊搜邊驗證。國內(nèi)外的產(chǎn)品都在逐步推出一種叫「Deep Research」的能力。這樣的一張圖其實跟谷歌前段時間發(fā)的開源項目很像,相當(dāng)于把過去的單次搜索變成一個循環(huán)推理的過程。在這種場景下,我們的超級搜索能夠?qū)τ脩舻暮芏鄰?fù)雜意圖,比如一口氣提 10 個有關(guān)聯(lián)性的問題,模型自己就能夠去進(jìn)行邊搜索邊思考和邊搜索邊驗證。
用語言描述可能比較難理解,可以看下面這個視頻。
但還有一種更復(fù)雜的任務(wù),比如你要做大件投資,或者買學(xué)區(qū)房,這個任務(wù)會變得更復(fù)雜。
我們提出了一種框架,即遇到復(fù)雜任務(wù)時,會利用多 agent 結(jié)構(gòu)。用戶提出問題后,會有一個專門的任務(wù)分解智能體和一個任務(wù)調(diào)度智能體,來調(diào)度一堆小智能體完成這種復(fù)雜任務(wù)。最后有一個多模態(tài)生成智能體,能把結(jié)果變成圖文并茂的報告,或者超過一分鐘的視頻。有了這樣的能力之后,我們就可以讓大模型來幫你做一個投資決策,讓大模型像一個高盛分析師一樣幫你做投資報告。
03超級搜索智能體的三個技術(shù)挑戰(zhàn)
過去形容大模型有一種現(xiàn)象叫「garbage in, garbage out」*。在傳統(tǒng)搜索過程里,大家追求的一般都是點擊率,很多場景下一些不知名的小站或 SEO 內(nèi)容,很容易比官方內(nèi)容的點擊量更高。可以看到,針對這種復(fù)雜任務(wù),有了 AI 超級搜索智能體之后,它會自動推理并去尋找官網(wǎng)、對應(yīng)的研報和深度高質(zhì)量的信息,通過分析這些信息,并對其中的圖片、視頻做拆解后,來重新給你組成一個新的圖文并茂的報告。剛才看到的 K 線圖、數(shù)據(jù)表格,實際上都引用自各種專業(yè)的 PDF 文檔。
附:如果輸入系統(tǒng)的數(shù)據(jù)或信息本身存在錯誤、無效或低質(zhì)量問題,那么系統(tǒng)輸出的結(jié)果也必然是錯誤、無效或無價值的。
在打造這樣的超級智能體的過程里面,我們面對三個非常大的挑戰(zhàn)。
第一,今天大模型的編程范式在變。過去我們只是讓大模型做閱讀總結(jié),但今天我們實際上是讓大模型做任務(wù)分解。23 年有個項目很火,叫 AutoGPT,但當(dāng)時受限于模型和智能體編程框架的能力,很多場景下它不能分解一個可執(zhí)行的任務(wù)。今天我們利用國內(nèi)的很多模型,通過組合之后能夠?qū)崿F(xiàn)非常穩(wěn)定的分解效果。
我們有一個很大的優(yōu)點,大家過去看到的很多超級智能體都是面對海外的,需要海外信用卡和賬號。而 360 推出的納米 AI 超級搜索智能體,只要你在國內(nèi),無論下載 APP 還是電腦客戶端,都可以直接使用。我們是完全基于合規(guī)的場景,用國內(nèi)的各種模型組合之后,來讓模型的組合能力超過原來單個模型的能力。
第二個挑戰(zhàn)在于,如何調(diào)度模型去完成非常多的任務(wù)。我們現(xiàn)在已經(jīng)能夠穩(wěn)定地讓模型調(diào)用 50 個工具,甚至分析 500 個復(fù)雜文檔,最后給出一個答案。在這種場景下,長調(diào)用鏈對模型的推理能力、執(zhí)行能力都要求非常高。為了保證交付成功率,我們圍繞超級智能體打造了一整套 AI 專用的底層能力。我們甚至覺得這有可能是在 AI 時代的一種新的、像馮諾依曼的計算架構(gòu):大模型變成了新時代的 CPU,MCP 工具箱相當(dāng)于計算機(jī)的總線,而知識庫相當(dāng)于計算機(jī)的記憶和存儲能力。
在此基礎(chǔ)上,為了擴(kuò)展大模型的手和腳,我們專門做了一個 AI 專用的瀏覽器、AI 專用的搜索,還有一個 AI 專用的代碼生成工具。圍繞這幾個能力,我們期待能夠打造一個開放式的、基于純國產(chǎn)模型的智能底座,讓我們的智能體首先做到可用,人人可用,每個人都能在國內(nèi)的網(wǎng)絡(luò)環(huán)境底下直接跑起來。
國內(nèi)最火的這些大模型,基本上我們都已接入并提供給用戶去用。我們背后大概有 80 多個大大小小的模型,這 80 多個模型是我們組成「團(tuán)隊」來實現(xiàn)超長思維鏈和調(diào)用鏈的一個非常關(guān)鍵的智能底座。
我們把這 80 個模型做了一些分類:有的模型負(fù)責(zé)做高級推理,比如像 DeepSeek R1 或 Qwen 3 這樣的模型;有的模型基于工具調(diào)用能力,比如豆包或通義千問 Plus 等 function call 模型;還有一些專業(yè)模型,是我們自己內(nèi)部做小模型訓(xùn)練的,舉個例子,像專門為快速搜索打造的小模型,或者做快速翻譯的小模型。有了這樣一個智能底座,在一個非常大的用戶體量上,我們就能有不同的能力讓不同的模型來組合發(fā)揮。
最后,我們在做的這個產(chǎn)品,無論是在手機(jī)上還是 PC 上,其實都是開放了智能體的打造能力的。只要你會寫 prompt, 就能使用國內(nèi)外能力最強(qiáng)的 100 多個 MCP。有一些付費的 MCP,你甚至都不需要海外注冊,相當(dāng)于我們直接就內(nèi)置了一些付費的 key。
在這個過程里,我們會看到其實哪怕是一個高中生,使用手機(jī)版納米 AI,他都可以去構(gòu)建一個基于 MCP 能力的智能體。
在這種場景下,過去的智能體可能只能去做一些有限的工作,比如說角色扮演。但是在我們這樣一個超級智能體里面,相當(dāng)于已經(jīng)內(nèi)置了能力非常強(qiáng)的 MCP 工具,就可以基于我們的 MCP 工具去打造一些過去光靠大模型實現(xiàn)不了的一些效果。
為此我們還做了很多自研的 MCP,因為我們發(fā)現(xiàn)在 MCP 市場雖然有很多大廠也都進(jìn)來了。但是有很多 MCP 工具,其實不是專門為國內(nèi)的環(huán)境或者模型去打造的,所以我們又重做了很多常見的 MCP,比如說生成網(wǎng)頁、視頻生成。
有了這樣的一個能力之后能干什么呢?過去我們做一個視頻,可能需要跟大模型進(jìn)行多次的交互,生成腳本、修改腳本,然后去調(diào)各種工具,才能夠生成一個一分多鐘的視頻。但今天我們只需要一句話,在納米 AI 搜索里面,它就可以去生成一個超過一分鐘的帶 BGM、帶腳本、帶字幕的復(fù)雜視頻。
除了生成視頻以外,其實我們還有對應(yīng)的一些多模態(tài)知識庫的生成能力。
過去大家說自己長文本能力很強(qiáng),可能可以分析 10 個文檔,最多也就 100 個文檔。但今天我們有了一個最強(qiáng)的多模態(tài)知識庫的能力,可以一口氣幫你分析 500 份文檔。點擊上傳文件按鈕,批量上傳 500 份候選人簡歷,輸入你的需求:「幫我找出這里具有 5 年以上工作經(jīng)驗,本科以上學(xué)歷,計算機(jī)專業(yè)背景的候選人」,AI 會自動調(diào)取工具,分別打開 500 份簡歷,分析簡歷內(nèi)容,篩選出符合以上要求的候選人,最終以表格的形式呈現(xiàn)給你。
04超級智能體需要 AI 瀏覽器
同時納米 AI 還有更強(qiáng)的超級搜索能力。
過去,國內(nèi)的產(chǎn)品只能檢索國內(nèi)的一些網(wǎng)站,國外的產(chǎn)品只能檢索一些國外的網(wǎng)站。今天我們的納米 AI 搜索,對國內(nèi)國外都實現(xiàn)了超過 1,000 億的內(nèi)容的抓取。與此同時,我們發(fā)現(xiàn)在很多復(fù)雜場景,比如說像投資決策,以及知識視頻的分解,只有一些靜態(tài)的網(wǎng)頁數(shù)據(jù)是不夠的。所以我們的搜索引擎還具備了搜索各種 PDF、視頻網(wǎng)站、音頻內(nèi)容和檢索各類社交網(wǎng)站的能力,甚至可以去檢索一些像電商金融這樣相對專門的網(wǎng)站。
在這個過程中,有些東西我們是靠 MCP 的能力來實現(xiàn)的;有些東西我們是通過 API 的調(diào)用來實現(xiàn)的;那也有些東西我們是通過我們的瀏覽器來做到的。
提到瀏覽器,我們可能會發(fā)現(xiàn)今天很多的通用智能體都在說自己有瀏覽器的能力,能夠?qū)崿F(xiàn)各種信息的抓取、搜索等等能力。但同時,很多開源項目,或者是一些海外的智能體用到一些國內(nèi)場景的時候,問題很多。
舉個例子,你會發(fā)現(xiàn)無處不在的一些登錄要求。國內(nèi)基本上稍微正規(guī)一點的網(wǎng)站都必須要登錄,在這種場景底下,靠云瀏覽器要實現(xiàn)云端的登錄,用戶其實是很不放心的。這可能就不是一個技術(shù)的問題,而是一個信任的問題。
其次,國內(nèi)很多網(wǎng)站的嵌套一般比海外網(wǎng)站更復(fù)雜。比如在每個 div 互相嵌套的場景底下,要模型能夠穩(wěn)定快速地實現(xiàn)信息的識別,去遍歷整個網(wǎng)頁信息,基本上就做不到了。在這個過程中,我們基本上重做了我們整個瀏覽器的底層。在大模型的基礎(chǔ)上,我們提供了一個瀏覽器的運行環(huán)境。有了這個東西,相當(dāng)于就是可以讓大模型像人一樣去操作瀏覽器,比如說它可以自主分解你的指令,分解指令之后它會識別網(wǎng)頁上的所有的可點擊元素,甚至對于彈窗,都會主動地關(guān)掉。甚至可以幫你去把一些商品添加到購物車,完成一些自主的行動指令。以及對頁面里面的一項評論,還有贊、評、踩,以及更多的一些多模態(tài)信息,全部能夠讀取出來。
然后最重要的一點,在很多場景底下,如果有光靠模型自己解決不了的問題,我們也訓(xùn)練了一個智能體,讓智能體能夠知道在什么場景底下要求助人類,比如說需要登錄的時候讓人類來進(jìn)行掃碼。
以及,AI 瀏覽器還可以打破信息孤島。今天所有的網(wǎng)站其實都是一個一個的信息孤島,很多場景底下它其實是不允許搜索引擎檢索信息的。但今天有了一個被 AI 操縱的瀏覽器之后,它就可以充分利用這些網(wǎng)站內(nèi)部的深度檢索,能夠讓你去檢索到以前靠百度、360、谷歌都檢索不到的一些內(nèi)容。
瀏覽器有了這樣的一個能力可以解決什么問題呢?
國外的很多產(chǎn)品都喜歡說幫用戶做 Deep Research。但我們會發(fā)現(xiàn)其實國內(nèi)的用戶在絕大部分場景底下是沒有做 Deep Research 需求的。往往是當(dāng)他們要去買一個電冰箱或者做股票投資的時候,才會進(jìn)行大量的檢索和搜索。所以我們做了一個購物的智能體,利用了 AI 專用的瀏覽器,可以通過智能體把世界上任何一個網(wǎng)站都可以被大模型去進(jìn)行操縱。
這里面可以看到,納米 AI 搜索是帶了一個瀏覽器的。這個瀏覽器就跑在你本地的計算機(jī)里面。接到任務(wù)后,大模型會自動分解任務(wù),讓四個瀏覽器并行幫用戶在小紅書、淘寶、京東等去搜索,最后把這些筆記的信息、電商的優(yōu)惠信息做整合之后,再生成一個圖文并茂的報告;會告訴用戶買一個 8,000 元的電冰箱、1 萬元的一個電視機(jī),應(yīng)該找哪些品牌;以及線上的一些用戶的真實反饋是怎么樣的。
我試過很多最近發(fā)布的通用 agent,會發(fā)現(xiàn)大家都會存在同一個問題,也就是在具體的一些任務(wù)的時候,成功率會很低。其中和成功率相關(guān)的一個最核心的點就是他們非常依賴類似于瀏覽器的操縱能力,但今天我們通過重做整個瀏覽器的底層,把瀏覽器的一些模擬人的行為封裝成各種 API,讓大模型去進(jìn)行調(diào)用。最后能夠把調(diào)用 API 做網(wǎng)頁分析、網(wǎng)頁提取和網(wǎng)頁行動的能力,做到行業(yè)里面成功率最高。這個事情是非常非常厲害的。
今天大模型的生成能力很強(qiáng),除了能夠生成圖片、視頻,還可以生成各種各樣的應(yīng)用、互動網(wǎng)頁,甚至是 PPT。舉一個例子,就是如果有了這樣的一個能力之后,其實今天用 AI 來生成 PPT 的能力已經(jīng)遠(yuǎn)遠(yuǎn)超過很多人自己哧吭吭哧做一晚上的效果。
從內(nèi)容邏輯到視覺設(shè)計,納米 AI 生成的內(nèi)容都很精美、專業(yè),徹底解決了 PPT 的老大難問題。做個簡單的比喻。過去,你要做一份 PPT,可能要熬夜加班去搜索寫作,然后做排版。這個過程里面付出的工資成本可能是幾百到上千不等。今天通過大模型來幫你去搜索,幫你生成代碼,以及做最后的 PPT 渲染。得到這樣一個 PPT 大概我們會消耗 100 萬的 token,那換算成國內(nèi)的一些模型的費用,也就是大概是 8 到 10 塊之間。
我覺得未來會有越來越多這樣的智能體,也許以后大家會每個人都可以變成一個超級個體。
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.