通用 Agent(智能體)的火爆,仍在繼續(xù)。
引爆這一領(lǐng)域的明星初創(chuàng)公司Manus AI,近期被曝出完成了新一輪7500萬(wàn)美元融資,估值在短短不到2個(gè)月內(nèi),飆升至5億美元。
被Manus打開(kāi)未來(lái)想象空間的通用 Agent市場(chǎng),正在吸引一眾科技大廠(chǎng)的入局。最新加入進(jìn)來(lái)的是百度。
近日,百度對(duì)外推出了類(lèi)通用 Agent產(chǎn)品“心響”。百度之前,字節(jié)搶跑一眾國(guó)內(nèi)科技大廠(chǎng),率先上線(xiàn)了自家的Agent產(chǎn)品“扣子空間”。
相比傳統(tǒng)Agent產(chǎn)品,通用Agent本質(zhì)區(qū)別在于其定位從“工具”向“伙伴”的角色轉(zhuǎn)變,能夠處理復(fù)雜、多步驟的任務(wù)場(chǎng)景。
背靠大廠(chǎng)已有的產(chǎn)品生態(tài),字節(jié)和百度共同盯上了同一目標(biāo),即借 AI Agent尋找自家 AI 產(chǎn)品體系的新增長(zhǎng)點(diǎn):字節(jié)試圖將通用Agent概念嵌入工作流,尋找專(zhuān)業(yè)場(chǎng)景的落地應(yīng)用;百度則想要在普通消費(fèi)者中率先破局。
兩者都在嘗試打破各自?xún)?nèi)部的生態(tài)壁壘,構(gòu)建更廣泛的AI Agent生態(tài)體系,將通用Agent概念徹底打入用戶(hù)的心智。
然而,受限于大模型技術(shù)的成熟度,包括字節(jié)、百度在內(nèi)的所有參與者,都不得不在探索的路上,不斷地捫心自問(wèn):AI Agent的真正應(yīng)用場(chǎng)景是什么?
01
追逐AI Agent的場(chǎng)景答案
在找尋差異化應(yīng)用場(chǎng)景的道路上,字節(jié)與百度在這一問(wèn)題上選擇了不同的路徑。
字節(jié)的扣子空間主要入口為網(wǎng)頁(yè)端,更易于接觸日常辦公場(chǎng)景下的軟件資源;百度的心響主要面向手機(jī)端,目前仍只支持安卓系統(tǒng),意圖將自身產(chǎn)品打入用戶(hù)的日常場(chǎng)景體驗(yàn)之中。
字節(jié)希望用 AI 深度嵌入工作流已成為業(yè)界共識(shí)。扣子空間“和Agent一起開(kāi)始你的工作”這句宣傳語(yǔ)精準(zhǔn)地貫穿了產(chǎn)品邏輯。
扣子空間的最大目標(biāo):生產(chǎn)力全面提升。其MCP擴(kuò)展中,飛書(shū)云文檔、多維表格和電子表格尤為令人關(guān)注。如果能夠與飛書(shū)平臺(tái)進(jìn)行高度整合的話(huà),打通生態(tài)間壁壘,扣子空間將會(huì)成為企業(yè)效率的“智能中樞”。
我們讓扣子空間作為一位藝術(shù)類(lèi)型公眾號(hào)撰稿者,搜集日本藝術(shù)家的文字與圖片信息,制作成一份文字與藝術(shù)作品圖片交叉的稿件。
在實(shí)際測(cè)試中,它對(duì)提示詞的遵循能力優(yōu)異,能夠自動(dòng)檢索網(wǎng)頁(yè)、制作可視化報(bào)告,流程流暢幾乎沒(méi)有卡頓,給出了一份完整的、規(guī)規(guī)矩矩的文字報(bào)告以及作品時(shí)間軸。
字節(jié)希望把Agent當(dāng)作辦公過(guò)程中的“AI實(shí)習(xí)生”,主動(dòng)幫助用戶(hù)處理文件檢索、表格制作、報(bào)告生成等任務(wù)。其背后的邏輯是:在企業(yè)私域內(nèi),聰明的AI輔助工具才更容易產(chǎn)生價(jià)值。
百度則選擇進(jìn)一步降低使用門(mén)檻,從更廣泛的普通C端用戶(hù)切入,其產(chǎn)品心響專(zhuān)為移動(dòng)端設(shè)計(jì),在實(shí)際測(cè)試中的產(chǎn)品邏輯有些不同:“把難題留給心響,把時(shí)間留給生活。"
從功能模塊的設(shè)計(jì)來(lái)看,心響相對(duì)于字節(jié)的扣子空間一個(gè)最大的區(qū)別是“靈感廣場(chǎng)”模塊。在該模塊內(nèi),百度的產(chǎn)品設(shè)計(jì)者集成了大量的任務(wù)模版:晚安故事集、AI繪本、AI相親等等。
不過(guò),百度的C端策略既聚焦于用戶(hù)習(xí)慣的培養(yǎng),也有在一定程度上限制了產(chǎn)品的想象空間的嫌疑。技術(shù)上來(lái)看,心響給了外界一個(gè)明顯的感受:主模型的指令遵循能力似乎并不如字節(jié)扣子空間那樣精準(zhǔn),它的思維更加發(fā)散。
相比于扣子空間迅捷的內(nèi)容生成速度,百度的心響在響應(yīng)速度上顯得相對(duì)緩慢的多,生成過(guò)程耗時(shí)更長(zhǎng)。
然而,與扣子空間嚴(yán)格遵循提示詞、輸出規(guī)整的報(bào)告不同,心響在生成結(jié)果時(shí)額外設(shè)計(jì)了交互元素和視覺(jué)優(yōu)化,在輸出中融入更多細(xì)節(jié)和附加價(jià)值。
這樣的產(chǎn)品邏輯,非常適配于日常場(chǎng)景,因?yàn)橛脩?hù)往往被認(rèn)為在與AI的交互中,提示詞工程的經(jīng)驗(yàn)較弱,甚至很多時(shí)候自己都不清楚自己想要的是什么。
02
大廠(chǎng)摸著Manus過(guò)河
盡管產(chǎn)品體驗(yàn)上仍有不完美之處,令字節(jié)、百度們爭(zhēng)搶推出相應(yīng)Agent產(chǎn)品的的一大原因,則離不開(kāi)其在商業(yè)變現(xiàn)上的天花板足夠高。
要知道,競(jìng)爭(zhēng)打到現(xiàn)在,無(wú)論國(guó)外的OpenAI,還是國(guó)內(nèi)的字節(jié)、百度,其在大模型上都處于虧錢(qián)投入階段。如何尋找到足夠強(qiáng)的付費(fèi)變現(xiàn)模式,無(wú)疑是一眾大模型廠(chǎng)商的當(dāng)務(wù)之急。
Manus成功拿下7500萬(wàn)美元融資的現(xiàn)身說(shuō)法,讓科技大廠(chǎng)看到了進(jìn)軍Agent領(lǐng)域的一絲曙光。最近OpenAI的一份預(yù)期收入報(bào)告,則讓這絲曙光變得更明亮了些。
據(jù)The Information報(bào)道,OpenAI預(yù)測(cè)至2029年,AI Agent及其他新產(chǎn)品的銷(xiāo)售額將超越ChatGPT,推高總營(yíng)收至 1250 億美元,2030年總營(yíng)收有望達(dá)到1740億美元。Agent,正被視為繼對(duì)話(huà)式大模型產(chǎn)品之后的下一個(gè)大金礦。
而且,對(duì)于字節(jié)和百度這樣生態(tài)龐大的公司而言,在各自的生態(tài)體系下,借助需要外部MCP交互的Agent,還可以達(dá)到盤(pán)活現(xiàn)有產(chǎn)品矩陣的效果。
但是,MCP本身不足以實(shí)現(xiàn)“世界的互通互聯(lián)”。其需要大模型在多模態(tài)(尤其是推理能力)以及成本價(jià)格方面,給予支持。這能也反過(guò)來(lái)說(shuō)明,為什么是此時(shí)此刻,字節(jié)和百度才有能力推出“扣子空間”和“心響”。
根據(jù)The Information報(bào)道,Manus僅僅在Claude大模型的調(diào)用上,兩周內(nèi)就燒掉了超過(guò)百萬(wàn)美元。AI Agent的基礎(chǔ)工作流中的必要部分——多步推理涉及多次模型調(diào)用,處理復(fù)雜任務(wù)時(shí)需結(jié)合文本、圖像等多模態(tài)數(shù)據(jù),導(dǎo)致計(jì)算量激增,消耗大量GPU資源,說(shuō)得直白點(diǎn):AI智能體需要強(qiáng)算力資源、高多模態(tài)能力、強(qiáng)推理能力、低成本價(jià)格。
進(jìn)入2025年,推理模型尤其是視覺(jué)推理領(lǐng)域的進(jìn)步,使得Agent在實(shí)際產(chǎn)品中的部署變得技術(shù)上可行且經(jīng)濟(jì)上可持續(xù)。字節(jié)與百度在多模態(tài)大模型領(lǐng)域的早期投入開(kāi)始有了回報(bào),AI Agent的基礎(chǔ)產(chǎn)品形態(tài)有了現(xiàn)實(shí)支撐。
近期,百度發(fā)布了文心4.5 Turbo及 X1 Turbo,強(qiáng)調(diào)推理性能與成本優(yōu)化。代碼智能體文心快碼更是接入MCP,李彥宏本人直接提出“創(chuàng)新的核心在于成本下降”。
字節(jié)同樣在4月中旬更新了豆包1.5·深度思考模型,同樣主打一個(gè)多模態(tài)和性?xún)r(jià)比。據(jù)晚點(diǎn)LatePost報(bào)道,扣子空間對(duì)比了六款國(guó)內(nèi)大模型,最終還是選用了自家的豆包作為基座模型技術(shù)支撐,原因是后者推理成本較低,大規(guī)模調(diào)用可行性高。
03
大廠(chǎng)尋找新“增長(zhǎng)點(diǎn)”旅途坎坷
AI Agent概念雖然打得火熱,但其定義正被泛化、濫用。通用Agent的資本故事里每一個(gè)字都異常美妙,市場(chǎng)潛力巨大,其仍然面臨多重技術(shù)挑戰(zhàn),包括高任務(wù)失敗率、上下文理解不足、數(shù)據(jù)安全風(fēng)險(xiǎn)及潛在的偏見(jiàn)放大問(wèn)題。例如,無(wú)論是Manus、還是字節(jié)的扣子空間、百度的心響,這些產(chǎn)品在復(fù)雜任務(wù)中的可靠性仍說(shuō)不上有多高。
從較短的時(shí)間尺度上來(lái)看,AI Agent在復(fù)雜任務(wù)中的表現(xiàn)仍難以配得上“通用”二字。但如果將目光放得更長(zhǎng)遠(yuǎn),其作為大廠(chǎng)們AI產(chǎn)品體系的新增長(zhǎng)點(diǎn)的潛力無(wú)法被忽視。
沒(méi)有大廠(chǎng)愿意冒著落后的風(fēng)險(xiǎn),而不選擇跟進(jìn)。這一點(diǎn)深刻地體現(xiàn)在了字節(jié)、百度這樣的中國(guó)科技大廠(chǎng)身上。根據(jù)晚點(diǎn)LatePost報(bào)道,Manus出圈前后,字節(jié)就搞了至少5個(gè)團(tuán)隊(duì)在開(kāi)發(fā)不同Agent產(chǎn)品;百度的心響則由一群95后組成的團(tuán)隊(duì),在30天內(nèi)研發(fā)出來(lái)。
對(duì)大廠(chǎng)而言,技術(shù)優(yōu)化迭代是必由之路,挖掘差異化的應(yīng)用場(chǎng)景才是打開(kāi)這條路的起始。誰(shuí)能率先找到復(fù)雜用戶(hù)場(chǎng)景的解決方案,誰(shuí)就能從這塊蛋糕里分走一部分。
這也意味著,字節(jié)和百度絕不會(huì)是這條賽道里的唯二玩家。國(guó)內(nèi)方面,阿里和騰訊同樣虎視眈眈。國(guó)外,不光是率先確立了A2A協(xié)議的Google,MCP協(xié)議的Anthropic,OpenAI對(duì)Agent也下了重注。一個(gè)月前,The Information 報(bào)道稱(chēng),OpenAI已經(jīng)在與投資者商議了三類(lèi)未來(lái)的Agent產(chǎn)品的發(fā)布,價(jià)格從每月2000美元到20000美元不等。
可以想見(jiàn)的是,技術(shù)、資本、場(chǎng)景、標(biāo)準(zhǔn)正在AI Agent領(lǐng)域進(jìn)行混合博弈,對(duì)于大廠(chǎng)們而言,這不僅僅是燒錢(qián)的開(kāi)始,也是為產(chǎn)品體系找到全新商業(yè)引擎的起點(diǎn)。
歡迎在評(píng)論區(qū)留言~
如需開(kāi)白請(qǐng)加小編微信:dongfangmark
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.