| 本文作者張賀飛,系福布斯中國(guó)撰稿人,表達(dá)觀點(diǎn)僅代表個(gè)人。
隨著Deepseek、Manus火遍全網(wǎng),科技圈的熱點(diǎn)過(guò)半和大模型、智能體有關(guān)。
4月22日的酷開(kāi)春季發(fā)布會(huì)上,由影音、健康、生活、設(shè)備、創(chuàng)作、教育六大智能體構(gòu)成的超級(jí)智能體正式亮相;
3天后的百度AI開(kāi)發(fā)者大會(huì),李彥宏連發(fā)通用超級(jí)智能體心響APP、內(nèi)容操作系統(tǒng)滄舟OS等多款A(yù)I應(yīng)用;
5月中旬舉辦的紅杉AI峰會(huì),意料之中地將“智能體”列為核心議題,坦言AI有著“10倍于云計(jì)算”的市場(chǎng)潛力;
以及接踵而至的谷歌I/O 2025、微軟 Build 2025等開(kāi)發(fā)者大會(huì),無(wú)不提到了智能體,涵蓋編程、醫(yī)療、金融等多個(gè)行業(yè)……無(wú)論是微軟、谷歌、OpenAI等海外巨頭,阿里、騰訊、百度、酷開(kāi)等國(guó)內(nèi)企業(yè),還是紅杉代表的資本機(jī)構(gòu),無(wú)不開(kāi)始大力推進(jìn)智能體。
與之對(duì)應(yīng)的問(wèn)題是:到底什么是智能體,為什么“大廠”都在競(jìng)逐智能體,又將會(huì)帶來(lái)哪些改變?
01 智能體的“魔力”:下一個(gè)交互入口
開(kāi)始討論前,不妨先花點(diǎn)時(shí)間了解下“智能體”的概念。
智能體是英文AI Agent,其中Agent的含義中有“代理人”的意思,讓智能體和對(duì)話式AI產(chǎn)生了質(zhì)的差別:不再局限于問(wèn)答,而是一種能夠深度思考、自主規(guī)劃、作出決策并深度執(zhí)行的智能應(yīng)用。
場(chǎng)景不可謂不誘人。可想要解開(kāi)智能體爆紅的原因,還需要找到另一個(gè)視角——企業(yè)和消費(fèi)者為什么需要智能體?
任何一項(xiàng)技術(shù)的普及,最關(guān)鍵的可能不是能力的上限有多高,而是應(yīng)用的門(mén)檻有多低。倘若只有工程師才能調(diào)用、專家才能配置、少數(shù)人才能用明白,即使再?gòu)?qiáng)大的能力,也只能停留在“實(shí)驗(yàn)室中的奇跡”。
將大模型和云計(jì)算的演變歷程做個(gè)對(duì)比的話:
大模型的訓(xùn)練和推理需要龐大的算力和底層架構(gòu)優(yōu)化,類似于云計(jì)算中的IaaS,擔(dān)綱了智能體的“發(fā)動(dòng)機(jī)”,但離業(yè)務(wù)和用戶較遠(yuǎn);
大模型平臺(tái)能力與API封裝,包括MCP工具、插件系統(tǒng)、開(kāi)發(fā)接口等,對(duì)應(yīng)的是PaaS,為AI開(kāi)發(fā)與調(diào)用提供了統(tǒng)一的“工具箱”;
最貼近用戶和業(yè)務(wù)場(chǎng)景的智能體,通過(guò)能力的整合、意圖的理解和任務(wù)的執(zhí)行,可以看作是SaaS的形態(tài),提供的是“即買(mǎi)即用”的智能。
以To B場(chǎng)景為例,傳統(tǒng)的企業(yè)系統(tǒng)功能模塊繁多、界面邏輯復(fù)雜,通常需要接受系統(tǒng)培訓(xùn)、掌握業(yè)務(wù)規(guī)則后,才能順利完成一個(gè)流程。企業(yè)投入了大量的時(shí)間成本,只是為了“讓人適應(yīng)系統(tǒng)”。
當(dāng)智能體有了理解、推理和執(zhí)行的能力,用戶無(wú)需面對(duì)復(fù)雜界面,不必理解系統(tǒng)的內(nèi)部邏輯,僅需一句自然語(yǔ)言發(fā)出指令,智能體即可自動(dòng)識(shí)別意圖,調(diào)用系統(tǒng)資源,完成任務(wù)鏈路,并以圖表、文本或通知的形式輸出結(jié)果。從人適應(yīng)系統(tǒng),到AI適配人的需求,生產(chǎn)力將大幅提升。
再比如To C場(chǎng)景中的例子,過(guò)去用戶想要看某部電影,需要用遙控器蹩腳地輸入片名進(jìn)行搜索。有時(shí)想不起片名,還要先在手機(jī)上搜索關(guān)鍵詞,查看幾十個(gè)鏈接找片名,幾乎耗盡了看電影的心情。
如果是搭載了酷開(kāi)超級(jí)智能體的電視,只需要用語(yǔ)音說(shuō)出“我要看什么電影”,哪怕不記得片名,簡(jiǎn)單描述電影里的情節(jié)和角色,超級(jí)智能體理解用戶的需求,并將任務(wù)拆解后,分配至影音智能體進(jìn)行搜索各大視頻網(wǎng)站上的內(nèi)容,一步直達(dá)播放界面。甚至在AIOT居家場(chǎng)景中,智能體接收到看電影的需求后,還能自動(dòng)執(zhí)行調(diào)節(jié)燈光、關(guān)閉窗簾等操作。
可以找到的例子還有很多。
除了生產(chǎn)力上的顛覆,智能體還進(jìn)一步改變了人機(jī)協(xié)作的范式:用戶不需要主動(dòng)操作工具,而是簡(jiǎn)單地發(fā)出指令,讓智能體去完成一系列復(fù)雜的任務(wù)。誰(shuí)能成為用戶需求的第一個(gè)承接者,誰(shuí)就能掌握系統(tǒng)的調(diào)度權(quán),控制資源分配。
對(duì)于AI企業(yè)來(lái)說(shuō),智能體承載的是下一個(gè)入口級(jí)機(jī)遇,布局智能體即是在搶占下一代交互的“控制權(quán)”。
02 智能體爆發(fā)前夜,涌現(xiàn)出三個(gè)“流派”
不可否認(rèn)的是,現(xiàn)階段的智能體還處于剛剛起步的階段。
但在技術(shù)迭代和市場(chǎng)需求的雙輪驅(qū)動(dòng)下,在有越來(lái)越多的企業(yè)參與其中。因?yàn)椴煌那腥肼窂剑瑢?duì)智能體價(jià)值的不同理解,基于自身的核心優(yōu)勢(shì)和資源稟賦,逐漸分化出了三個(gè)鮮明的陣營(yíng)。
第一派是標(biāo)準(zhǔn)意義上的AI廠商,比如百度、字節(jié)跳動(dòng)、谷歌、OpenAI等,試圖主導(dǎo)技術(shù)生態(tài)的構(gòu)建。
它們的打法可以概括為:以大模型為底座,開(kāi)放智能體的開(kāi)發(fā)工具鏈和解決方案,吸引開(kāi)發(fā)者到平臺(tái)上構(gòu)建各類智能體應(yīng)用。目標(biāo)是構(gòu)建一個(gè)面向智能體時(shí)代的AppStore,讓智能體像App一樣被創(chuàng)造、調(diào)用與分發(fā)。
在這種理念下,智能體不再是一個(gè)產(chǎn)品,而是一個(gè)新的“操作系統(tǒng)”,希望在“模型-開(kāi)發(fā)-分發(fā)”的鏈路中,扮演基礎(chǔ)設(shè)施建設(shè)者與生態(tài)主導(dǎo)者的角色。畢竟誰(shuí)擁有了最強(qiáng)大的開(kāi)發(fā)平臺(tái)和最活躍的開(kāi)發(fā)者生態(tài),誰(shuí)就掌握了AI時(shí)代的“分發(fā)權(quán)”與“調(diào)度權(quán)”,可以說(shuō)是最迷人、難度最大的一門(mén)生意。
第二派是主攻垂直場(chǎng)景的企業(yè)服務(wù)商,比如微軟、IBM、阿里云等,正在著手構(gòu)建企業(yè)級(jí)的智能體解決方案。
這個(gè)陣營(yíng)大多來(lái)自云計(jì)算和企業(yè)服務(wù)領(lǐng)域,對(duì)行業(yè)Know-How和企業(yè)架構(gòu)有著深厚理解,并不急于打造“面向大眾的入口”,選擇從最具現(xiàn)實(shí)價(jià)值的垂直場(chǎng)景切入,聚焦智能體的交付能力和效果驗(yàn)證。
所以在打法上,傾向于將智能體的能力集成進(jìn)企業(yè)原有的系統(tǒng)流程中,解決財(cái)務(wù)、銷售、人力資源、倉(cāng)儲(chǔ)等業(yè)務(wù)模塊的自動(dòng)化與智能化問(wèn)題。微軟對(duì)此有一個(gè)大膽的判斷:隨著越來(lái)越多智能體加入,每位員工都將成為“智能體主管”,負(fù)責(zé)建立、委派和管理智能體,最大化它們的能力。
第三派是深諳用戶體驗(yàn)痛點(diǎn)的軟硬件廠商,比如華為、聯(lián)想、酷開(kāi)、三星等,將智能體直接植入到了用戶“觸點(diǎn)”。
動(dòng)輒千萬(wàn)級(jí)的用戶量,讓軟硬件廠商長(zhǎng)期處在用戶體驗(yàn)的第一線,在用戶需求滿足、軟硬件打磨和數(shù)據(jù)積累上有著天然優(yōu)勢(shì),普遍開(kāi)始將智能體深度融合進(jìn)終端產(chǎn)品,用智能體解決用戶體驗(yàn)上的瓶頸。
直接的例子就是酷開(kāi),早在2014年就推出了帶有AI功能的智慧屏。2025年率先為“超級(jí)智能體”提出了“長(zhǎng)記憶、快思考、秒行動(dòng)”的標(biāo)準(zhǔn):能夠?qū)崿F(xiàn)在用戶使用過(guò)程中形成“經(jīng)驗(yàn)庫(kù)”,讓模型更懂用戶習(xí)慣,減少重復(fù)交互成本。同時(shí)采用原子化組件和多智能體協(xié)同框架,將響應(yīng)速度提升至1.5秒內(nèi),滿足終端用戶對(duì)“更快、更準(zhǔn)、更直達(dá)”的體驗(yàn)要求。
以上分類或許并不嚴(yán)謹(jǐn),就像阿里在To C方向上也有布局,酷開(kāi)也在向B端市場(chǎng)拓展。
之所以采用三大流派的說(shuō)法,在于他們構(gòu)成了智能體生態(tài)的三角架構(gòu)——平臺(tái)、服務(wù)和體驗(yàn),分別從技術(shù)生態(tài)、行業(yè)適配和終端場(chǎng)景出發(fā),既有競(jìng)爭(zhēng),也有協(xié)作,一同推動(dòng)著智能體從概念到落地再到規(guī)模化應(yīng)用。
03 狂熱與理性并存,智能體的可能潮向
多方力量的共振,讓智能體成了當(dāng)下最具想象力的風(fēng)口。但歷史經(jīng)驗(yàn)告訴我們,風(fēng)口和泡沫往往如影隨形。
Manus意外走紅后,一線大廠迅速跟進(jìn),不到一個(gè)月就“炮制”出了同樣的產(chǎn)品。熱度之下也暗藏隱憂:不少“智能體”只是對(duì)大模型API的簡(jiǎn)單封裝,缺乏任務(wù)編排、長(zhǎng)期記憶等核心能力,看似智能,實(shí)則“像卻不靈”。
但不能因此否定智能體。
每次新技術(shù)周期的起始,或多或少都存在“泡沫先行”的現(xiàn)象,市場(chǎng)對(duì)概念的追逐快于技術(shù)本身的成熟,導(dǎo)致短期價(jià)值被高估,長(zhǎng)期價(jià)值被嚴(yán)重低估,最終在狂熱與理性的較量中螺旋式進(jìn)步。
身處“概念已清晰、路徑未統(tǒng)一”的前夜,我們嘗試從理性思考的角度,“揣測(cè)”下智能體接下來(lái)的可能潮向。
1、垂直智能體將比通用更早落地。
通用智能體的問(wèn)題普遍在于“強(qiáng)而不專”。相比之下,貼近業(yè)務(wù)、熟悉流程、擁有明確目標(biāo)邊界和行業(yè)知識(shí)圖譜的垂直智能體,已經(jīng)在醫(yī)療、教育、酒店、制造等場(chǎng)景中初步達(dá)到了“能上崗”的要求。
由此產(chǎn)生的一個(gè)挑戰(zhàn)在于:?jiǎn)蝹€(gè)智能體可以勝任簡(jiǎn)單任務(wù),一旦任務(wù)鏈條稍復(fù)雜,就必須依賴多個(gè)智能體協(xié)同工作。
比如在日常生活中,可能涉及旅行規(guī)劃、美食推薦、酒店預(yù)訂等任務(wù),需要在用戶給出指令后,準(zhǔn)確理解用戶的意圖,將需求進(jìn)行拆解并分配給不同智能體進(jìn)行完成。目前只有酷開(kāi)的超級(jí)智能體展示了對(duì)家庭服務(wù)的智能化整合,其余大多數(shù)智能體還停留在手動(dòng)調(diào)用單個(gè)智能體對(duì)話的階段。
當(dāng)用戶提出“幫我規(guī)劃下全家5人在深圳 3 日游的行程”這樣的復(fù)雜需求,智能體可以一站式關(guān)聯(lián)天氣、交通、美食、酒店、景點(diǎn)和地圖等服務(wù),制定出一份詳細(xì)的旅行計(jì)劃,直接選好合適的機(jī)票、酒店,你可以直接掃碼購(gòu)票。
整合用戶個(gè)性化意圖識(shí)別、動(dòng)態(tài)任務(wù)編排、多智能體協(xié)同等能力,或?qū)⒊蔀橹悄荏w馬拉松的第一個(gè)賽點(diǎn)。
2、屬于硬件的機(jī)會(huì)可能大于軟件。
當(dāng)前關(guān)于智能體的討論,話題主要是對(duì)軟件形態(tài)的重構(gòu):從工具到助手,從應(yīng)用到代理。一個(gè)更值得關(guān)注的現(xiàn)象是——智能體對(duì)硬件的影響,可能遠(yuǎn)遠(yuǎn)大于軟件。可當(dāng)智能體開(kāi)始主導(dǎo)交互邏輯,硬件本身就成了“服務(wù)的入口”。
甚至可以預(yù)見(jiàn):基于自然語(yǔ)言的交互,將重塑硬件的話語(yǔ)權(quán),每一塊屏幕都可能成為“服務(wù)中樞”。
在智能音箱上已經(jīng)有了類似的趨勢(shì),用戶關(guān)心的只有結(jié)果,不在乎智能音箱播放的是哪個(gè)平臺(tái)的內(nèi)容。有了智能體的賦能,服務(wù)的交付權(quán)將進(jìn)一步從APP轉(zhuǎn)移到具備感知與理解能力的硬件:
電視、閨蜜機(jī)等不再只是播放工具,而是一個(gè)家庭的AI控制中心;學(xué)習(xí)機(jī)的能力不再局限于批改作業(yè)、視頻課程,教育智能體的“長(zhǎng)記憶”精準(zhǔn)記錄孩子的學(xué)習(xí)軌跡,“快思考”實(shí)時(shí)解析薄弱點(diǎn),“秒行動(dòng)”生成個(gè)性化方案,真正實(shí)現(xiàn)“千人千面”的AI教育范式……
需要說(shuō)明的是,以上只是我們研究微軟、聯(lián)想、酷開(kāi)、IBM等企業(yè)的智能體戰(zhàn)略后得出的淺見(jiàn)。
卻可以篤定,智能體不會(huì)是單一產(chǎn)品,而是技術(shù)、交互、服務(wù)方式的全面重構(gòu),從通用大模型的“萬(wàn)能引擎”,到垂直智能體的“行業(yè)大腦”,再到硬件終端的“智能入口”,AI產(chǎn)業(yè)的結(jié)構(gòu)性升級(jí)已悄然開(kāi)始。
04 寫(xiě)在最后
留給智能體的難關(guān)還有很多很多。
通用智能體能否打破孤島,形成可持續(xù)的開(kāi)放生態(tài);垂直智能體能否找準(zhǔn)應(yīng)用場(chǎng)景,從樣板間走向規(guī)模化部署;以及人機(jī)協(xié)同的邊界如何設(shè)定、數(shù)據(jù)安全與個(gè)性隱私如何平衡、多智能體之間的協(xié)同機(jī)制是否能像現(xiàn)實(shí)組織那樣高效有序……都是智能體走向產(chǎn)業(yè)主舞臺(tái)必須翻越的“能力之坎”。
當(dāng)這些問(wèn)題被一一回答,AGI將不再遙遠(yuǎn)。
借用紅杉AI峰會(huì)上的共識(shí):AI時(shí)代的勝利屬于那些既深耕垂直場(chǎng)景、構(gòu)建護(hù)城河,又能保持敏捷迭代、擁抱技術(shù)浪潮的行動(dòng)派。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.