騰訊集團高級執行副總裁湯道生在會上發表演講
打造一個“智能體”(Agent),在現階段來說已經不是一個問題。但要打造出一個既實用又能高效解決業務流中問題的智能體,仍然是一個值得深入探討的大問題。
面對這個行業性的“大問題”,將“產品為王”奉為圭臬的騰訊,在打造“智能體”產品的過程中,又著重考慮了哪些問題?
在日前舉行的2025騰訊AI產業應用峰會上,騰訊云副總裁、騰訊云智能負責人,騰訊優圖實驗室負責人吳運聲就騰訊云在智能體方面的技術及產品設計邏輯,做了諸多回應,并特別提及了騰訊在智能體設計上的幾個“細節”:
- 智能回退
- 文檔比對
- 問答對強化
關于智能回退,在真實的智能體使用中,執行到某個節點經常會需要“回頭”修改前面的內容(比如行程修改等等)。騰訊云的智能體開發平臺,在工作流模式下引入了一個具備“全局視野”的智能體,能夠處理跨節點的回跳邏輯,并基于對整體流程結構的理解來做出判斷和引導,實現一種“有意識”的交互。 關于文檔比對,在很多企業場景中,同一個業務文檔會存在多個版本。比如保險公司推出的壽險產品,不同年份的版本可能差異很小,但都會被上傳到知識庫。這會導致問答時混淆使用。而文檔比對工具,使得用戶可以清晰地看到不同版本之間的具體差異。 關于問答對強化,智能體在企業中的應用往往對問答的準確性有著較高要求。由于基礎大模型在相同Prompt下可能產生不同的輸出結果,因此,強化從文檔中自動生成準確問答對的能力顯得尤為重要。企業可以對這些問答對進行審核、校驗,確保準確后再發布。
相比于一些智能體產品在宣發時只講單個智能體功能,而忽視實際體驗而言,吳運聲對智能體研發細節上的考量,考慮到了使用智能體的“人”的真實體驗:智能體不僅僅是“答”,還要在企業使用場景的現實業務中對答案負責。
吳運聲認為,在 ToB 場景下,智能體的本質是一種新的應用形態。它和傳統軟件最核心的區別在于,具備自主規劃能力,可以根據用戶的自然語言指令,自主調用工具,甚至多個 Agent 協同完成一個復雜任務。這種范式和過去軟件預設流程有本質不同。所以智能體開發有三個問題需要被核心關注:
1. 如何實現更精準地自主規劃與執行 2. 如何實現多 Agent 協同的復雜任務處理 3. 如何構建更高效的工具調用機制AI Agent對瀏覽器體驗的重構
會議當天,騰訊還宣布了在智能體落地上的一個重要實踐, QQ瀏覽器升級為AI瀏覽器,上線QBot,首批灰度4個Agent,其中包括AI高考通。
在騰訊的大模型落地版圖中,瀏覽器是必要且必須擁抱AI Agent的場景。這已經在現有市場得到驗證:前不久,由于Safari瀏覽器中的谷歌搜索次數出現首次下降,谷歌股價暴跌。Gartner曾預測,到2026年,傳統搜索可能會下降25%。這意味著,傳統瀏覽器如果不AI化,那么將被AI瀏覽器取代。
反過來看,Agent也并不是要沖擊傳統瀏覽器市場,如果結合得好,這可能是個雙贏得選擇。對于QQ瀏覽器也是如此,其迭代的一個核心思路是:Agent的加入不是重構瀏覽器,而是讓瀏覽器的搜索體驗可以更加高效,優先讓Agent優化傳統瀏覽器的痛點,是QQ瀏覽器在AI時代首要考慮的問題。
在此前的使用中,QQ瀏覽器的用戶或許已明顯感受到QQ瀏覽器提供的強大的工具功能,諸如PDF轉Word等。這也是QQ瀏覽器此前很長一段時間的一個功能定位:工具串聯。
Agent到來之后,QQ瀏覽器認為,基于之前豐富的網頁工具,如果這些工具能被模型絲滑調用,無論是token消耗數量還是計算時間成本都會降低。因此QQ瀏覽器AI化目前的重要任務只有一個:如何讓Agent絲滑調用“工具”。
“更側重解決瀏覽器原始行為,通過大模型技術來提升瀏覽器基礎功能的效率,而不是做特別泛或特別廣的復雜性。“QQ瀏覽器QBot產品負責人劉漢博表示。
以“下載”這個每天都在使用的環節為例,瀏覽器用戶經常遇到的問題是,下載源不靠譜、頁面打不開或內容隱藏較深等。模型能否具備一定的反思和學習能力,能理解人類的真實需求,自動完成多步操作:用戶只需發出一個指令,QQ瀏覽器便能迅速定位并下載最精確的內容。
“如果Agent具備了使用瀏覽器的能力,那它的‘行為邊界’就大大拓展了,可以覆蓋很多真實場景。這也是平臺賦予開發者和客戶‘想象空間’的關鍵。”吳運聲表示。
未來,騰訊也在研發本地電腦的沙箱能力(Computer Use 插件),讓Agent可以操作本地軟件、編輯文檔、調用工具,就像一個“虛擬操作員”。“你設想一下,如果一個Agent不僅能上網,還能幫你打開Excel自動填報表格、用Photoshop批量裁剪圖片,那它在企業內部的價值就會非常大。”
大模型浪潮讓企業更加需要知識庫
智能體之外,騰訊的另一大重注賽道是知識庫。一方面,結合了企業私域知識的智能體在思考、執行和決策上會更加精準;另一方面,比起智能體執行任務,“大模型+知識庫輔助個人和企業提效”在短期來看更有確定性。
大模型的幻覺問題短期內難以解決,而企業級場景對準確性的要求又非常高,通過企業知識庫讓大模型“學習”專業領域的知識是一個解法。可以說,大模型讓企業更加需要知識庫。
綜合騰訊內部的這一戰略判斷,在當天的大會上,騰訊樂享正式升級為樂享知識庫,在知識整合沉淀、知識更新、權限管理、AI問答等層面為企業用戶提供服務,提升知識流轉效率,也進一步讓企業能打造懂自身知識的AI助手。
據騰訊云副總裁、騰訊樂享業務負責人答治茜回憶,騰訊樂享業務起源于2008年前后有內部信息分享功能的km項目,2017年正式對外提供服務,大模型浪潮到來之后,騰訊內部決定將樂享定位為大模型時代具備知識管理功能的知識庫。
“一個很明顯的變化,還是技術上的變化。知識庫產品的形態,完美和大模型的能力做了非常好地結合。它既用到了大模型本身的通用能力,同時又通過知識庫的嫁接,完成了知識的沉淀、積累和進一步的精細化的提煉。所以,讓大模型真正地走向生產環節,真正地走向應用,知識庫是我們看起來,目前看到一個非常明確的場景。”答治茜表示。
他也補充,目前,企業使用Agent已經形成趨勢,往后推幾年,當企業內Agent遍地開花時,智能體的AI問答數據提取亟需一個統一的‘裁判’,而不是各說各話。基于此,騰訊認為,未來企業當中,Agent搭配知識庫將會是一個核心需求場景。
為什么大模型技術能夠為產品帶來如此多改變?實際上,過去用傳統 AI 技術實現上述能力時,抽取關鍵詞、生成摘要這類任務,對語言理解能力要求很高,效果并不理想。對“2008年北京奧運會”這種長實體的識別非常依賴詞典或規則,擴展性很差。但現在有了大模型,特別是多模態大模型,在語義理解、上下文建模、內容切分、標簽生成等方面都有顯著提升。
總結來講,大模型在技術上的突破,讓之前成為問題的問題被迎刃解決。而騰訊作為一家強產品基因的公司,在新技術打開想象力之后,讓產品更好用成為本能。
用吳運聲的一句話來說,比起智能體數量的增長,騰訊更關注的是:如何將大模型、智能體技術真正融入企業的業務流程,以滿足企業的真實業務需求。“這不是一個簡單的‘產品交付’,而是構建了一個高度可組合、可擴展的平臺,企業可以在上面構建適配自己場景的復雜應用。”(本文首發鈦媒體APP 作者 |秦聰慧)?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.