作者:吳敏達(dá),IBM科技事業(yè)部數(shù)據(jù)與人工智能資深技術(shù)專家
作者簡介:吳敏達(dá)是 The Open Group 卓越級技術(shù)專家(Distinguished Technical Specialist),同時擁有計算機(jī)技術(shù)與軟件專業(yè)系統(tǒng)架構(gòu)設(shè)計師技術(shù)資格。他現(xiàn)在是 IBM 科技事業(yè)部數(shù)據(jù)與人工智能資深技術(shù)專家,擁有 20 多年數(shù)據(jù)分析軟件相關(guān)技術(shù)經(jīng)驗,是 IBM 認(rèn)證的大數(shù)據(jù)架構(gòu)師和 Watson 開發(fā)者,專長是大數(shù)據(jù)、人工智能等領(lǐng)域。他是 IBM Developer 的大師級作者,已經(jīng)發(fā)表了 40 余篇技術(shù)文章和教程。現(xiàn)從事大數(shù)據(jù)、人工智能相關(guān)技術(shù)支持和架構(gòu)設(shè)計工作。
北京2025年7月21日/美通社/ -- 在AI發(fā)展日新月異的今天,AI智能體無疑正處在技術(shù)前沿。近日,IBM發(fā)布了通用型企業(yè)級AI智能體(IBM Computer Using Generalist Agent,此后簡稱IBM CUGA)的重要突破,引發(fā)業(yè)界廣泛關(guān)注。繼 Think 2025大會上發(fā)布AI 智能體平臺watsonx Orchestrate后,IBM研究院在企業(yè)級智能體領(lǐng)域再次邁出了實質(zhì)性的一大步。
IBM實現(xiàn)通用型企業(yè)級 AI 智能體的重大突破
IBM CUGA
如今,IBM CUGA不僅在模擬企業(yè)場景中經(jīng)受住了嚴(yán)苛測試,更在最新(2025年7月)的AppWorld Benchmark中榮登第一(注:AppWorld Benchmark 是一個由多個研究機(jī)構(gòu)和學(xué)者共同創(chuàng)建、用于評估交互式編程智能體的基準(zhǔn)測試環(huán)境)。在不久的未來,我們或許能看到AI 智能體逐步從"實驗室玩具"邁向"企業(yè)核心助手"。
通用型企業(yè)級AI智能體是什么?為何重要?
傳統(tǒng)AI智能體在企業(yè)應(yīng)用中多是"單一功能專家"——比如處理發(fā)票、生成郵件、跟蹤銷售進(jìn)度等。這些功能雖然實用,但面對跨流程、跨系統(tǒng)、跨業(yè)務(wù)的復(fù)雜場景時,往往會顯得力不從心。
IBM CUGA 正是為復(fù)雜業(yè)務(wù)場景而生。它是一種能夠跨多個業(yè)務(wù)場景、整合多種工具、執(zhí)行復(fù)雜任務(wù)的通用型智能體,可以像資深員工一樣理解用戶意圖、規(guī)劃任務(wù)、調(diào)用工具、協(xié)調(diào)多個系統(tǒng),并不斷學(xué)習(xí)和適應(yīng)新的挑戰(zhàn)。
榮耀背后,是技術(shù)進(jìn)階和厚積薄發(fā)
IBM CUGA的出現(xiàn)并不是一蹴而就的,它是架構(gòu)進(jìn)化、方法創(chuàng)新和工具集成的系統(tǒng)性成果:
- 架構(gòu)演進(jìn):從最初簡單的"計劃-執(zhí)行-觀察"模型(完成率15%),進(jìn)化到如今能協(xié)調(diào)多個子智能體、感知網(wǎng)頁環(huán)境、處理復(fù)雜任務(wù)的多層級系統(tǒng),任務(wù)完成率提升到61.7% 甚至更高。[1]
- 工具賦能
- 實時性能儀表盤,掌握每一個智能體動作的效果;
- 軌跡可視化工具,直觀診斷失敗原因;
- 并行執(zhí)行框架,將評估速度從數(shù)天壓縮到數(shù)分鐘。
- 多智能體協(xié)作:一個任務(wù)由多個"子任務(wù)智能體"協(xié)同完成。比如,規(guī)劃、執(zhí)行、信息提取各司其職,讓智能體能像團(tuán)隊一樣作戰(zhàn)。
- 環(huán)境感知增強(qiáng):結(jié)合網(wǎng)頁截圖和可訪問性樹,智能體看得更清、操作更準(zhǔn),還能識別彈窗等障礙進(jìn)行規(guī)避。
安全、可信、可控的智能體平臺,打造適配業(yè)務(wù)需求的AI智能體
IBM不僅關(guān)注智能體的"聰明程度",更重視它的"企業(yè)適配能力"。借助最新發(fā)布的企業(yè)級AI 智能體平臺watsonx Orchestrate,客戶有望實現(xiàn):
- 全生命周期可觀測性,兼顧性能監(jiān)控、模型優(yōu)化、安全防護(hù);
- 無代碼與專業(yè)工具并存,既支持業(yè)務(wù)人員快速部署,也支持開發(fā)者深度定制;
- 兼容超過80種企業(yè)級系統(tǒng),與Adobe、SAP、Salesforce、ServiceNow等生態(tài)無縫集成;
- 治理與合規(guī),為隱私、安全、成本可控提供保障,幫助企業(yè)實現(xiàn)AI治理與合規(guī)。
IBM致力于打造安全、可信、可控的AI智能體平臺
真正的"企業(yè)AI助手"正在加速來到
除了在AppWorld基準(zhǔn)測試奪魁,IBM CUGA還在WebArena等真實瀏覽器任務(wù)中展現(xiàn)強(qiáng)大能力。通過"智能采樣"、"反饋反射"、"知識注入"等一系列創(chuàng)新方法,CUGA每一次迭代都更接近企業(yè)級實用標(biāo)準(zhǔn)
真正的“企業(yè)AI助手” 正在加速來到
IBM CUGA不是實驗室的"炫技",而是指向未來企業(yè)運營方式的變革。在準(zhǔn)確率達(dá)到更高門檻后,CUGA有望成為企業(yè)內(nèi)部的通用調(diào)度平臺——不再是被動響應(yīng)用戶指令,而是主動協(xié)助完成復(fù)雜的工作任務(wù),例如跨系統(tǒng)的數(shù)據(jù)整合、文檔生成、流程管理等。
團(tuán)隊心聲
"CUGA的成功,不是因為某一個神奇的模型,而是靠IBM團(tuán)隊對創(chuàng)新的執(zhí)著、對真實企業(yè)需求的深刻理解。感謝每一位參與其中的工程師、研究員和產(chǎn)品經(jīng)理。"
- 想了解CUGA背后的技術(shù)細(xì)節(jié)與實踐經(jīng)驗?歡迎訪問https://cuga.dev和https://appworld.dev/leaderboard
- 可以直接聯(lián)系IBM團(tuán)隊,了解如何部署屬于你企業(yè)的AI智能體:https://www.ibm.com/cn-zh/products/watsonx-orchestrate
- 歡迎訪問下方鏈接,注冊參加IBM將于7月24-25日在北京舉行的AI智能體技術(shù)賦能工作坊,了解AI智能體在真實場景中的創(chuàng)新應(yīng)用,助力企業(yè)構(gòu)建智能化競爭力。
https://www.ibm.com/events/reg/flow/ibm/E6X298MB/landing/page/landing
關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯(lián)絡(luò)人
崔守峰,shou.feng.cui@ibm.com
[1] 數(shù)據(jù)來源:IBM CUGA開發(fā)者網(wǎng)頁,https://cuga.dev
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.