出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|視覺(jué)中國(guó)
5月21日,在北京一家五星級(jí)酒店的宴會(huì)廳里,騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)正在舉行。會(huì)場(chǎng)入口處,一排混元大模型和智能體的互動(dòng)展示吸引了絡(luò)繹不絕的參觀者。騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生身著深灰色西裝、淺藍(lán)色襯衫出現(xiàn)在會(huì)場(chǎng)中央的演講臺(tái)上。他保持了一貫的沉穩(wěn)風(fēng)格,平靜而有力地闡述著騰訊對(duì)AI的全面戰(zhàn)略布局。
“AI持續(xù)落地,每個(gè)企業(yè)正在成為AI公司,每個(gè)人也將成為AI加持的’超級(jí)個(gè)體’。”湯道生開(kāi)門(mén)見(jiàn)山地表示。而在加大AI投入力度方面,騰訊的做法可以說(shuō)是相當(dāng)激進(jìn),其打通了各業(yè)務(wù)條線與AI之間的壁壘,極大權(quán)限地對(duì)各業(yè)務(wù)開(kāi)放了AI能力。
而“全面擁抱AI”,既是本場(chǎng)峰會(huì)的主題,同時(shí)也貫穿了騰訊2025年的全年戰(zhàn)略重要。它正在影響著這家科技大廠的方方面面。在演講中,湯道生還提出了大模型、智能體、知識(shí)庫(kù)和基礎(chǔ)設(shè)施”四個(gè)加速”的戰(zhàn)略。其中,智能體則是極為重要的一種呈現(xiàn)形式。它所代表的是當(dāng)大模型在國(guó)內(nèi)走過(guò)三年時(shí)間,應(yīng)用范式的迭代。
然而,究竟什么是智能體?這個(gè)定義在行業(yè)里似乎還不夠清晰。
在大部分人的眼中,智能體是這樣的——當(dāng)你想打開(kāi)軟件訂機(jī)票,或者查找、整理信息,統(tǒng)計(jì)一個(gè)excel表,不再需要打開(kāi)不同軟件app自己完成,而是告訴智能助手,它就能夠自動(dòng)幫你完成,最終幫你訂好機(jī)票。就好像在媒體群訪間,騰訊云副總裁吳運(yùn)聲對(duì)媒體打趣道,“我現(xiàn)在就很希望有一個(gè)智能體來(lái)替我回答你們的問(wèn)題。”
從這個(gè)層面來(lái)理解,智能體的概念并不模糊。然而,目前之所以概念模糊,正是因?yàn)樾袠I(yè)內(nèi)存在諸多問(wèn)題。
比如市面上的智能體,它們的能力范圍、交互方式甚至底層架構(gòu)都可能完全不同。這從而也導(dǎo)致用戶(hù)對(duì)智能體的期望與實(shí)際能力之間存在巨大差距。有些智能體可能僅具備自然語(yǔ)言交互能力,有些智能體甚至只是一個(gè)簡(jiǎn)單的自動(dòng)化工具,后者與過(guò)去的SaaS軟件唯一的差異可能只是象征性地加了AI,實(shí)際上并沒(méi)有自主思考從而改變用戶(hù)與軟件應(yīng)用的交互方式,而這一點(diǎn)才是稚嫩體的核心。吳運(yùn)聲在現(xiàn)場(chǎng)對(duì)媒體表示,“真正的智能體需要有思考、規(guī)劃和執(zhí)行的能力”。
其次,目前的智能體最大的bug還不是會(huì)不會(huì)思考,而是能力邊界的問(wèn)題。因?yàn)榍罢咭呀?jīng)有部分智能體做到了,但后者,想要真正突破能力邊界,還要走很長(zhǎng)的路。
因?yàn)橛脩?hù)往往期望智能體能像人類(lèi)助手一樣全能,但實(shí)際上智能體的能力邊界受到權(quán)限、API接口、數(shù)據(jù)孤島等多方面因素的限制。比如讓智能體幫你訂機(jī)票,它可能需要訪問(wèn)日歷、聯(lián)系人、支付系統(tǒng),還需要與航空公司的系統(tǒng)對(duì)接。任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,整個(gè)任務(wù)都無(wú)法完成。但放大來(lái)講,這并不只是 AI 時(shí)代存在的問(wèn)題。從這一維度來(lái)看,真正能做到的智能體幾乎為0。
在本次騰訊云AI峰會(huì)的會(huì)場(chǎng)上,智能體也成了大家討論最激烈的話(huà)題。因?yàn)樵诖酥埃瑹o(wú)論是Manus,還是國(guó)內(nèi)一眾巨頭和模型廠商推出的類(lèi)Manus產(chǎn)品,一度把智能體推向了風(fēng)口浪尖,使其成為熱議的焦點(diǎn)。
以下是在騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)現(xiàn)場(chǎng)與騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲的對(duì)話(huà)內(nèi)容:
Q:今天騰訊云推出了智能體開(kāi)發(fā)平臺(tái),在這背后騰訊云有哪些思考?
吳運(yùn)聲:首先是從我自己從業(yè)者的感覺(jué)來(lái)講,最近幾年AI的發(fā)展非常迅速,大環(huán)境從技術(shù)到產(chǎn)品形態(tài),到面對(duì)客戶(hù)的需求,以及技術(shù)與客戶(hù)需求的結(jié)合,這些變化非常重要。
我們一貫的理念是AI不是一個(gè)基座,它是要真正服務(wù)客戶(hù)需求的,所以不管做技術(shù)做產(chǎn)品,我們都希望服務(wù)客戶(hù)實(shí)際的場(chǎng)景,給客戶(hù)帶來(lái)價(jià)值,這是我們的宗旨。
過(guò)往我們提知識(shí)引擎,是因?yàn)槲覀冇^察到在大模型出來(lái)之后,企業(yè)知識(shí)的使用或者知識(shí)庫(kù)能力對(duì)企業(yè)的構(gòu)建起著非常重要的作用。所以我們最直接的用途是怎么用技術(shù)在知識(shí)挖掘上有更好的能力,在這一塊我們積累了非常多的能力,今天我也介紹了相關(guān)能力,比如我們?cè)趺丛诖?Excel表格里挖掘答案,在過(guò)去這是很難的。
Q:智能體與傳統(tǒng)SaaS的本質(zhì)差異?
吳運(yùn)聲:我認(rèn)為最關(guān)鍵的區(qū)別在于:
一、智能體具備自主思考和決策能力。傳統(tǒng)的軟件開(kāi)發(fā)范式(包括SaaS)通常是開(kāi)發(fā)者事先設(shè)計(jì)好流程,即使存在分支邏輯,也是開(kāi)發(fā)者預(yù)先定義好的。但智能體面對(duì)的是自然語(yǔ)言交互,用戶(hù)的輸入是開(kāi)放的,不可能窮舉所有分支。這時(shí)就需要智能體能夠自主理解、規(guī)劃、執(zhí)行任務(wù),而不是依賴(lài)于固定流程。
二、智能體能融合確定性工作流與自主規(guī)劃?rùn)C(jī)制。我們的智能體平臺(tái)也支持工作流組件的融合。用戶(hù)可以構(gòu)建確定性的流程來(lái)處理特定任務(wù),同時(shí)也允許智能體在其中進(jìn)行自主規(guī)劃。這樣就實(shí)現(xiàn)了靈活性與確定性的結(jié)合,更好地滿(mǎn)足復(fù)雜多樣的企業(yè)應(yīng)用場(chǎng)景。
Q:最近一兩個(gè)月,騰訊在視覺(jué)模型和多模態(tài)模型方面的發(fā)布節(jié)奏明顯加快了。作為優(yōu)圖實(shí)驗(yàn)室的負(fù)責(zé)人,您能否從騰訊自身的行業(yè)觀察和客戶(hù)需求出發(fā),談?wù)劄槭裁次覀儸F(xiàn)在會(huì)加快這一塊的技術(shù)發(fā)布和開(kāi)源?背后有哪些戰(zhàn)略或行業(yè)層面的考量?
吳運(yùn)聲:我們現(xiàn)在發(fā)布節(jié)奏加快,本質(zhì)是客戶(hù)需求在驅(qū)動(dòng)我們不斷優(yōu)化技術(shù)堆棧。無(wú)論是視覺(jué)、多模態(tài)、文本還是智能體技術(shù),它們其實(shí)并不是孤立演進(jìn)的,而是彼此協(xié)同、共同支撐整個(gè)企業(yè)AI應(yīng)用的落地。
舉個(gè)例子,我們?cè)缙诰陀幸粋€(gè)非常重要的產(chǎn)品——媒體AI中臺(tái),服務(wù)對(duì)象包括電視臺(tái)、廣告公司、內(nèi)容平臺(tái)等。很多客戶(hù)有海量的媒資內(nèi)容,尤其是視頻內(nèi)容,最常見(jiàn)的需求是:
?快速檢索視頻中的某一段內(nèi)容,例如1990年春晚中馮鞏的小品;
?將長(zhǎng)視頻進(jìn)行自動(dòng)切分、分類(lèi)、打標(biāo)簽;
?對(duì)視頻內(nèi)容生成摘要,便于理解和傳播。
過(guò)去用傳統(tǒng)AI技術(shù)實(shí)現(xiàn)這些能力的時(shí)候,其實(shí)效果并不理想。比如抽取關(guān)鍵詞、生成摘要這類(lèi)任務(wù),對(duì)語(yǔ)言理解能力要求很高。傳統(tǒng)模型對(duì)“第十一屆三中全會(huì)”或“2008年北京奧運(yùn)會(huì)”這種長(zhǎng)實(shí)體的識(shí)別非常依賴(lài)詞典或規(guī)則,擴(kuò)展性很差。
但現(xiàn)在我們有了大模型,特別是多模態(tài)大模型,在語(yǔ)義理解、上下文建模、內(nèi)容切分、標(biāo)簽生成等方面都有顯著提升。比如:
?大模型可以將不同語(yǔ)言表達(dá)的相似語(yǔ)義映射到同一個(gè)語(yǔ)義空間,從而實(shí)現(xiàn)更強(qiáng)的語(yǔ)義檢索與比對(duì);
?視頻理解也不再是單純依賴(lài)視覺(jué)模型,而是視覺(jué)+文本多模態(tài)協(xié)同;
?通過(guò)引入Agent+工作流機(jī)制,可以將整個(gè)內(nèi)容理解與加工流程高度自動(dòng)化、模塊化地重構(gòu)。
所以你會(huì)看到我們?cè)谝曈X(jué)模型、多模態(tài)模型上的開(kāi)源和產(chǎn)品化節(jié)奏會(huì)快很多。這不是單點(diǎn)能力的堆積,而是以客戶(hù)需求為中心,把能力整合成“系統(tǒng)性解決方案”的過(guò)程。
總結(jié)來(lái)說(shuō),技術(shù)節(jié)奏的加快是被真實(shí)業(yè)務(wù)需求推動(dòng)的。我們過(guò)去很多年的能力積累,現(xiàn)在正好借助大模型、Agent等最新范式重新激活,用更智能、更高效的方式去解決問(wèn)題。
Q:從騰訊的角度看,在推動(dòng)智能體落地過(guò)程中有哪些能力儲(chǔ)備?又有哪些挑戰(zhàn)正在面對(duì)?
吳運(yùn)聲:從儲(chǔ)備來(lái)看,我們其實(shí)不是“為了智能體而智能體”,而是在智能體背后有深厚的基礎(chǔ)能力作為支撐。
?第一是知識(shí)管理能力:這是構(gòu)建企業(yè)智能體的核心基礎(chǔ),企業(yè)的智能體最終還是要用企業(yè)自己的知識(shí)體系來(lái)提供服務(wù)。
?第二是工作流的能力:盡管現(xiàn)在強(qiáng)調(diào)Agent的自主規(guī)劃能力,但現(xiàn)實(shí)場(chǎng)景中,很多任務(wù)還是需要明確的業(yè)務(wù)流程。我們把傳統(tǒng)的工作流能力和Agent能力融合起來(lái),提出了一個(gè)很有代表性的創(chuàng)新——在工作流中引入“全局視野”的智能體節(jié)點(diǎn)。
傳統(tǒng)的工作流是串行執(zhí)行、節(jié)點(diǎn)獨(dú)立,但我們現(xiàn)在讓每一個(gè)節(jié)點(diǎn)在執(zhí)行時(shí),都可以和一個(gè)擁有全局上下文理解能力的智能體交互,從而在保持流程確定性的同時(shí),也兼顧了智能體的靈活性。
至于挑戰(zhàn),主要有兩個(gè)方面:
1.技術(shù)層面:目前的Agent框架仍在快速演進(jìn),尤其是在自主規(guī)劃(planning)這個(gè)環(huán)節(jié)上,底層模型還不能100%把復(fù)雜任務(wù)完全準(zhǔn)確地拆解并執(zhí)行。這是模型和框架協(xié)同進(jìn)化的問(wèn)題。
2.客戶(hù)認(rèn)知層面:很多客戶(hù)還停留在對(duì)“Agent”作為一個(gè)新概念的理解階段。但真正要用好Agent,需要掌握它的使用方式、搭建方法和運(yùn)行機(jī)制。這中間存在一個(gè)不小的“認(rèn)知與使用”的鴻溝,也需要我們通過(guò)產(chǎn)品體驗(yàn)優(yōu)化、培訓(xùn)、服務(wù)等多種方式不斷去彌合。
我們相信,隨著模型能力增強(qiáng)+平臺(tái)工具完善+企業(yè)認(rèn)知提升,智能體將在更多行業(yè)場(chǎng)景中真正發(fā)揮價(jià)值。
Q:您怎么看當(dāng)前AI應(yīng)用的發(fā)展趨勢(shì)?是否覺(jué)得智能體是最有前途的方向?因?yàn)楝F(xiàn)在大家似乎都在做智能體。
吳運(yùn)聲:說(shuō)智能體是AI應(yīng)用里最有前途的,這個(gè)說(shuō)法其實(shí)比較模糊。AI在很多領(lǐng)域都有廣泛應(yīng)用,智能體確實(shí)發(fā)展迅速,且智能體技術(shù)本身就是基于大模型。
很多企業(yè)使用的大模型技術(shù),是不是算作用智能體,其實(shí)界限沒(méi)有那么分明。智能體和大模型是互相促進(jìn)的關(guān)系。智能體依賴(lài)于大模型的發(fā)展,特別是在模型理解任務(wù)、自主規(guī)劃和調(diào)用工具等能力上的進(jìn)步。
所以我認(rèn)為AI的發(fā)展是全方位的,不僅包括大語(yǔ)言模型、多模態(tài)模型,還有語(yǔ)音模型、視覺(jué)模型等一系列模型的進(jìn)步。智能體是其中一個(gè)非常重要的方向。
Q:在騰訊整體的AI生態(tài)里,智能體開(kāi)發(fā)平臺(tái)處于什么樣的位置?它如何與騰訊其他AI產(chǎn)品聯(lián)動(dòng)?
吳運(yùn)聲:智能體開(kāi)發(fā)平臺(tái)的定位是為客戶(hù)搭建更強(qiáng)大、更復(fù)雜的智能體應(yīng)用。我們?cè)谧鲞@個(gè)平臺(tái)時(shí),天然會(huì)整合騰訊過(guò)去積累的各類(lèi)AI能力,比如端到端的語(yǔ)音識(shí)別和交互能力。以剛才演示的寄快遞場(chǎng)景為例,語(yǔ)音通話(huà)能力貫穿始終,這正是我們以前積累的優(yōu)勢(shì)。
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4375742.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.