網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

智能體大爆發(fā)，騰訊要怎么做？

2025-05-23 01:25:21　來(lái)源: 虎嗅APP

北京舉報(bào)

分享至

出品｜虎嗅科技組

作者｜宋思杭

編輯｜苗正卿

頭圖｜視覺(jué)中國(guó)

5月21日，在北京一家五星級(jí)酒店的宴會(huì)廳里，騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)正在舉行。會(huì)場(chǎng)入口處，一排混元大模型和智能體的互動(dòng)展示吸引了絡(luò)繹不絕的參觀者。騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生身著深灰色西裝、淺藍(lán)色襯衫出現(xiàn)在會(huì)場(chǎng)中央的演講臺(tái)上。他保持了一貫的沉穩(wěn)風(fēng)格，平靜而有力地闡述著騰訊對(duì)AI的全面戰(zhàn)略布局。

“AI持續(xù)落地，每個(gè)企業(yè)正在成為AI公司，每個(gè)人也將成為AI加持的’超級(jí)個(gè)體’。”湯道生開(kāi)門(mén)見(jiàn)山地表示。而在加大AI投入力度方面，騰訊的做法可以說(shuō)是相當(dāng)激進(jìn)，其打通了各業(yè)務(wù)條線與AI之間的壁壘，極大權(quán)限地對(duì)各業(yè)務(wù)開(kāi)放了AI能力。

而“全面擁抱AI”，既是本場(chǎng)峰會(huì)的主題，同時(shí)也貫穿了騰訊2025年的全年戰(zhàn)略重要。它正在影響著這家科技大廠的方方面面。在演講中，湯道生還提出了大模型、智能體、知識(shí)庫(kù)和基礎(chǔ)設(shè)施”四個(gè)加速”的戰(zhàn)略。其中，智能體則是極為重要的一種呈現(xiàn)形式。它所代表的是當(dāng)大模型在國(guó)內(nèi)走過(guò)三年時(shí)間，應(yīng)用范式的迭代。

然而，究竟什么是智能體？這個(gè)定義在行業(yè)里似乎還不夠清晰。

在大部分人的眼中，智能體是這樣的——當(dāng)你想打開(kāi)軟件訂機(jī)票，或者查找、整理信息，統(tǒng)計(jì)一個(gè)excel表，不再需要打開(kāi)不同軟件app自己完成，而是告訴智能助手，它就能夠自動(dòng)幫你完成，最終幫你訂好機(jī)票。就好像在媒體群訪間，騰訊云副總裁吳運(yùn)聲對(duì)媒體打趣道，“我現(xiàn)在就很希望有一個(gè)智能體來(lái)替我回答你們的問(wèn)題。”

從這個(gè)層面來(lái)理解，智能體的概念并不模糊。然而，目前之所以概念模糊，正是因?yàn)樾袠I(yè)內(nèi)存在諸多問(wèn)題。

比如市面上的智能體，它們的能力范圍、交互方式甚至底層架構(gòu)都可能完全不同。這從而也導(dǎo)致用戶(hù)對(duì)智能體的期望與實(shí)際能力之間存在巨大差距。有些智能體可能僅具備自然語(yǔ)言交互能力，有些智能體甚至只是一個(gè)簡(jiǎn)單的自動(dòng)化工具，后者與過(guò)去的SaaS軟件唯一的差異可能只是象征性地加了AI，實(shí)際上并沒(méi)有自主思考從而改變用戶(hù)與軟件應(yīng)用的交互方式，而這一點(diǎn)才是稚嫩體的核心。吳運(yùn)聲在現(xiàn)場(chǎng)對(duì)媒體表示，“真正的智能體需要有思考、規(guī)劃和執(zhí)行的能力”。

其次，目前的智能體最大的bug還不是會(huì)不會(huì)思考，而是能力邊界的問(wèn)題。因?yàn)榍罢咭呀?jīng)有部分智能體做到了，但后者，想要真正突破能力邊界，還要走很長(zhǎng)的路。

因?yàn)橛脩?hù)往往期望智能體能像人類(lèi)助手一樣全能，但實(shí)際上智能體的能力邊界受到權(quán)限、API接口、數(shù)據(jù)孤島等多方面因素的限制。比如讓智能體幫你訂機(jī)票，它可能需要訪問(wèn)日歷、聯(lián)系人、支付系統(tǒng)，還需要與航空公司的系統(tǒng)對(duì)接。任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題，整個(gè)任務(wù)都無(wú)法完成。但放大來(lái)講，這并不只是 AI 時(shí)代存在的問(wèn)題。從這一維度來(lái)看，真正能做到的智能體幾乎為0。

在本次騰訊云AI峰會(huì)的會(huì)場(chǎng)上，智能體也成了大家討論最激烈的話(huà)題。因?yàn)樵诖酥埃瑹o(wú)論是Manus，還是國(guó)內(nèi)一眾巨頭和模型廠商推出的類(lèi)Manus產(chǎn)品，一度把智能體推向了風(fēng)口浪尖，使其成為熱議的焦點(diǎn)。

以下是在騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)現(xiàn)場(chǎng)與騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲的對(duì)話(huà)內(nèi)容：

Q：今天騰訊云推出了智能體開(kāi)發(fā)平臺(tái)，在這背后騰訊云有哪些思考？

吳運(yùn)聲：首先是從我自己從業(yè)者的感覺(jué)來(lái)講，最近幾年AI的發(fā)展非常迅速，大環(huán)境從技術(shù)到產(chǎn)品形態(tài)，到面對(duì)客戶(hù)的需求，以及技術(shù)與客戶(hù)需求的結(jié)合，這些變化非常重要。

我們一貫的理念是AI不是一個(gè)基座，它是要真正服務(wù)客戶(hù)需求的，所以不管做技術(shù)做產(chǎn)品，我們都希望服務(wù)客戶(hù)實(shí)際的場(chǎng)景，給客戶(hù)帶來(lái)價(jià)值，這是我們的宗旨。

過(guò)往我們提知識(shí)引擎，是因?yàn)槲覀冇^察到在大模型出來(lái)之后，企業(yè)知識(shí)的使用或者知識(shí)庫(kù)能力對(duì)企業(yè)的構(gòu)建起著非常重要的作用。所以我們最直接的用途是怎么用技術(shù)在知識(shí)挖掘上有更好的能力，在這一塊我們積累了非常多的能力，今天我也介紹了相關(guān)能力，比如我們?cè)趺丛诖?Excel表格里挖掘答案，在過(guò)去這是很難的。

Q：智能體與傳統(tǒng)SaaS的本質(zhì)差異？

吳運(yùn)聲：我認(rèn)為最關(guān)鍵的區(qū)別在于：

一、智能體具備自主思考和決策能力。傳統(tǒng)的軟件開(kāi)發(fā)范式（包括SaaS）通常是開(kāi)發(fā)者事先設(shè)計(jì)好流程，即使存在分支邏輯，也是開(kāi)發(fā)者預(yù)先定義好的。但智能體面對(duì)的是自然語(yǔ)言交互，用戶(hù)的輸入是開(kāi)放的，不可能窮舉所有分支。這時(shí)就需要智能體能夠自主理解、規(guī)劃、執(zhí)行任務(wù)，而不是依賴(lài)于固定流程。

二、智能體能融合確定性工作流與自主規(guī)劃?rùn)C(jī)制。我們的智能體平臺(tái)也支持工作流組件的融合。用戶(hù)可以構(gòu)建確定性的流程來(lái)處理特定任務(wù)，同時(shí)也允許智能體在其中進(jìn)行自主規(guī)劃。這樣就實(shí)現(xiàn)了靈活性與確定性的結(jié)合，更好地滿(mǎn)足復(fù)雜多樣的企業(yè)應(yīng)用場(chǎng)景。

Q：最近一兩個(gè)月，騰訊在視覺(jué)模型和多模態(tài)模型方面的發(fā)布節(jié)奏明顯加快了。作為優(yōu)圖實(shí)驗(yàn)室的負(fù)責(zé)人，您能否從騰訊自身的行業(yè)觀察和客戶(hù)需求出發(fā)，談?wù)劄槭裁次覀儸F(xiàn)在會(huì)加快這一塊的技術(shù)發(fā)布和開(kāi)源？背后有哪些戰(zhàn)略或行業(yè)層面的考量？

吳運(yùn)聲：我們現(xiàn)在發(fā)布節(jié)奏加快，本質(zhì)是客戶(hù)需求在驅(qū)動(dòng)我們不斷優(yōu)化技術(shù)堆棧。無(wú)論是視覺(jué)、多模態(tài)、文本還是智能體技術(shù)，它們其實(shí)并不是孤立演進(jìn)的，而是彼此協(xié)同、共同支撐整個(gè)企業(yè)AI應(yīng)用的落地。

舉個(gè)例子，我們?cè)缙诰陀幸粋€(gè)非常重要的產(chǎn)品——媒體AI中臺(tái)，服務(wù)對(duì)象包括電視臺(tái)、廣告公司、內(nèi)容平臺(tái)等。很多客戶(hù)有海量的媒資內(nèi)容，尤其是視頻內(nèi)容，最常見(jiàn)的需求是：

?快速檢索視頻中的某一段內(nèi)容，例如1990年春晚中馮鞏的小品；

?將長(zhǎng)視頻進(jìn)行自動(dòng)切分、分類(lèi)、打標(biāo)簽；

?對(duì)視頻內(nèi)容生成摘要，便于理解和傳播。

過(guò)去用傳統(tǒng)AI技術(shù)實(shí)現(xiàn)這些能力的時(shí)候，其實(shí)效果并不理想。比如抽取關(guān)鍵詞、生成摘要這類(lèi)任務(wù)，對(duì)語(yǔ)言理解能力要求很高。傳統(tǒng)模型對(duì)“第十一屆三中全會(huì)”或“2008年北京奧運(yùn)會(huì)”這種長(zhǎng)實(shí)體的識(shí)別非常依賴(lài)詞典或規(guī)則，擴(kuò)展性很差。

但現(xiàn)在我們有了大模型，特別是多模態(tài)大模型，在語(yǔ)義理解、上下文建模、內(nèi)容切分、標(biāo)簽生成等方面都有顯著提升。比如：

?大模型可以將不同語(yǔ)言表達(dá)的相似語(yǔ)義映射到同一個(gè)語(yǔ)義空間，從而實(shí)現(xiàn)更強(qiáng)的語(yǔ)義檢索與比對(duì)；

?視頻理解也不再是單純依賴(lài)視覺(jué)模型，而是視覺(jué)+文本多模態(tài)協(xié)同；

?通過(guò)引入Agent+工作流機(jī)制，可以將整個(gè)內(nèi)容理解與加工流程高度自動(dòng)化、模塊化地重構(gòu)。

所以你會(huì)看到我們?cè)谝曈X(jué)模型、多模態(tài)模型上的開(kāi)源和產(chǎn)品化節(jié)奏會(huì)快很多。這不是單點(diǎn)能力的堆積，而是以客戶(hù)需求為中心，把能力整合成“系統(tǒng)性解決方案”的過(guò)程。

總結(jié)來(lái)說(shuō)，技術(shù)節(jié)奏的加快是被真實(shí)業(yè)務(wù)需求推動(dòng)的。我們過(guò)去很多年的能力積累，現(xiàn)在正好借助大模型、Agent等最新范式重新激活，用更智能、更高效的方式去解決問(wèn)題。

Q：從騰訊的角度看，在推動(dòng)智能體落地過(guò)程中有哪些能力儲(chǔ)備？又有哪些挑戰(zhàn)正在面對(duì)？

吳運(yùn)聲：從儲(chǔ)備來(lái)看，我們其實(shí)不是“為了智能體而智能體”，而是在智能體背后有深厚的基礎(chǔ)能力作為支撐。

?第一是知識(shí)管理能力：這是構(gòu)建企業(yè)智能體的核心基礎(chǔ)，企業(yè)的智能體最終還是要用企業(yè)自己的知識(shí)體系來(lái)提供服務(wù)。

?第二是工作流的能力：盡管現(xiàn)在強(qiáng)調(diào)Agent的自主規(guī)劃能力，但現(xiàn)實(shí)場(chǎng)景中，很多任務(wù)還是需要明確的業(yè)務(wù)流程。我們把傳統(tǒng)的工作流能力和Agent能力融合起來(lái)，提出了一個(gè)很有代表性的創(chuàng)新——在工作流中引入“全局視野”的智能體節(jié)點(diǎn)。

傳統(tǒng)的工作流是串行執(zhí)行、節(jié)點(diǎn)獨(dú)立，但我們現(xiàn)在讓每一個(gè)節(jié)點(diǎn)在執(zhí)行時(shí)，都可以和一個(gè)擁有全局上下文理解能力的智能體交互，從而在保持流程確定性的同時(shí)，也兼顧了智能體的靈活性。

至于挑戰(zhàn)，主要有兩個(gè)方面：

1.技術(shù)層面：目前的Agent框架仍在快速演進(jìn)，尤其是在自主規(guī)劃（planning）這個(gè)環(huán)節(jié)上，底層模型還不能100%把復(fù)雜任務(wù)完全準(zhǔn)確地拆解并執(zhí)行。這是模型和框架協(xié)同進(jìn)化的問(wèn)題。

2.客戶(hù)認(rèn)知層面：很多客戶(hù)還停留在對(duì)“Agent”作為一個(gè)新概念的理解階段。但真正要用好Agent，需要掌握它的使用方式、搭建方法和運(yùn)行機(jī)制。這中間存在一個(gè)不小的“認(rèn)知與使用”的鴻溝，也需要我們通過(guò)產(chǎn)品體驗(yàn)優(yōu)化、培訓(xùn)、服務(wù)等多種方式不斷去彌合。

我們相信，隨著模型能力增強(qiáng)+平臺(tái)工具完善+企業(yè)認(rèn)知提升，智能體將在更多行業(yè)場(chǎng)景中真正發(fā)揮價(jià)值。

Q：您怎么看當(dāng)前AI應(yīng)用的發(fā)展趨勢(shì)？是否覺(jué)得智能體是最有前途的方向？因?yàn)楝F(xiàn)在大家似乎都在做智能體。

吳運(yùn)聲：說(shuō)智能體是AI應(yīng)用里最有前途的，這個(gè)說(shuō)法其實(shí)比較模糊。AI在很多領(lǐng)域都有廣泛應(yīng)用，智能體確實(shí)發(fā)展迅速，且智能體技術(shù)本身就是基于大模型。

很多企業(yè)使用的大模型技術(shù)，是不是算作用智能體，其實(shí)界限沒(méi)有那么分明。智能體和大模型是互相促進(jìn)的關(guān)系。智能體依賴(lài)于大模型的發(fā)展，特別是在模型理解任務(wù)、自主規(guī)劃和調(diào)用工具等能力上的進(jìn)步。

所以我認(rèn)為AI的發(fā)展是全方位的，不僅包括大語(yǔ)言模型、多模態(tài)模型，還有語(yǔ)音模型、視覺(jué)模型等一系列模型的進(jìn)步。智能體是其中一個(gè)非常重要的方向。

Q：在騰訊整體的AI生態(tài)里，智能體開(kāi)發(fā)平臺(tái)處于什么樣的位置？它如何與騰訊其他AI產(chǎn)品聯(lián)動(dòng)？

吳運(yùn)聲：智能體開(kāi)發(fā)平臺(tái)的定位是為客戶(hù)搭建更強(qiáng)大、更復(fù)雜的智能體應(yīng)用。我們?cè)谧鲞@個(gè)平臺(tái)時(shí)，天然會(huì)整合騰訊過(guò)去積累的各類(lèi)AI能力，比如端到端的語(yǔ)音識(shí)別和交互能力。以剛才演示的寄快遞場(chǎng)景為例，語(yǔ)音通話(huà)能力貫穿始終，這正是我們以前積累的優(yōu)勢(shì)。

本文來(lái)自虎嗅，原文鏈接：https://www.huxiu.com/article/4375742.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.