文 | 賽迪智庫信息化與軟件產業研究所
智能體概念內涵不斷演進
(一)智能體泛指具有感知決策能力的代理體
智能體泛指能夠感知環境、理解信息并作出決策與行動的代理體,它可以是軟件、硬件或者一個系統,具備自主性、適應性和交互能力。從歷史起源看,智能體的演進經歷五個關鍵階段。一是符號智能體階段,主要使用邏輯規則和符號表示對知識進行封裝并推動推理進程。20世紀80年代興起的基于知識的專家系統是典型代表案例,這類系統在醫療診斷、財務分析等領域展現了智能體在特定任務中的實用價值。二是反應式智能體階段,主要關注智能體與環境之間的交互,能夠快速感知環境并做出反應。這類智能體的設計優先考慮直接的輸入、輸出映射,而不是復雜的推理和符號操作。1999年索尼推出的AIBO娛樂機器人是此類智能體在消費電子領域的早期應用,展現了智能體在日常生活和休閑互動中的應用前景。三是基于強化學習的智能體階段,主要關注使智能體通過與環境交互優化決策過程。在這一階段,智能體能夠從高維輸入中學習復雜的策略,并取得許多重大成果。例如,2011年IBM研發的Watson智能體在《危險邊緣》問答比賽中戰勝人類冠軍;2016年谷歌研發的AlphaGo戰勝圍棋世界冠軍李世石,這一系列里程碑展示了智能體在復雜環境中不斷提升的決策能力。四是具有遷移學習和元學習能力的智能體階段,主要關注提高智能體在新任務方面的學習效率與泛化能力,降低對大量訓練樣本的依賴。2020年Deep Mind推出的Alpha Fold2在蛋白質結構預測領域的重大突破是這一階段的標志性成果。五是基于大語言模型的智能體階段,將大語言模型作為智能體大腦或控制器的核心組件,并借助多模態感知技術和工具使用等多樣化策略顯著擴展感知范圍和行動空間。2023年AutoGPT的出現進一步提升了智能體的自主性和任務執行能力,推動智能體向更通用化的方向演進。
圖1智能體演進經歷(數據來源:賽迪智庫整理)
廣義智能體包含多種類型。按照產品形態劃分,包括“硬智能體”和“軟智能體”兩類,其中“硬智能體”指具備物理實體的產品,包括具身智能、自動駕駛等;“軟智能體”指數字世界的軟件實體,是未來數字生態的神經中樞,也是“硬智能體”的核心驅動。按照智能體作出決策的依據劃分,包括確定性和非確定性兩類,確定性智能體是基于固定規則和邏輯運行,結果可預測;非確定性智能體是基于數據驅動的,具有靈活的適應性。
按照智能體作出決策的過程劃分,包括簡單反射、基于模型的反射、基于目標的、基于效用的四類,簡單反射智能體不考慮過去經驗,直接根據規則作出反應;基于模型的反射智能體根據歷史數據和模型規則共同作出決策;基于目標的智能體以最大化未來目標為依據作出決策;基于效用的智能體可以在目標相互沖突或不確定的復雜環境中作出決策。按照智能體所處層次劃分,包括操作系統智能體和應用層智能體,其中操作系統智能體具備操作計算設備底層硬件和上層應用的能力;應用層智能體面向特定應用,具備調用外部軟件工具能力。按照功能定位與應用場景劃分,包括智能助理、感知交互、仿真、安全、協作等多種類型。按照智能體數量與協作能力劃分,包括單智能體系統、多智能體系統以及人類與智能體協作三類,單智能體系統側重于獨立運作與自主決策,適用于執行明確任務并實現單一目標的應用場景;多智能體系統以智能體協同與信息交互為核心特征,通過集體智能解決單體智能難以應對的復雜問題;人類與智能體協作將人類認知與機器能力有機結合,構建從工具使用到伙伴協作的多層次交互模式。
(二)當代智能體主要指以大模型為基礎的智能系統
當前,智能體是指以大模型為核心驅動,具備感知、學習、適應、決策、執行能力的智能系統。
圖2基于大語言模型驅動的智能體基本框架
數據來源:Lilian Weng《LLM Powered Autonomous Agents》,賽迪智庫整理
當代智能體是人工智能新發展階段的重要產品形態。英偉達CEO黃仁勛認為,人工智能發展可以分為四個階段,一是感知式人工智能,以圖像識別等為代表,具備能看能聽能力,但不具備思考能力。二是生成式人工智能,以大模型為代表,會思考能寫作,但是不具備使用工具能力。三是代理式人工智能,以智能體為代表,能分解任務、自主決策并執行任務。四是物理式人工智能,以具身智能為代表,是智能體與機器人的結合,能夠改造物理世界。當前人工智能正在經歷一個新的拐點,正在從生成式邁向代理式階段,智能體是新發展階段的重要產品形態。
當代智能體是大模型之上能力更強的系統。大模型擅長知識處理和語言交互,是一種被動響應輸入,智能體則擁有自主思考和調用工具的能力,能實現端到端的問題解決。具體來看,從功能定位方面,大模型以內容生成及理解為核心能力,而智能體以任務完成為目標,具備規劃和執行能力。從模型結構方面,大模型為神經網絡架構,智能體則是多組件系統,包括感知器、大模型、工具、記憶組件、規劃器等。從自主性方面,大模型為被動響應輸入,無主動決策能力,智能體可主動規劃、迭代、調用工具。從應用場景方面,大模型適用于問答、寫作等生成式服務,智能體可解決一站式智能助手等復雜問題或端到端問題。綜合看,智能體能力不再僅限于大模型的被動響應人類指令,而是可以理解人類意圖、自動分解任務、作出決策并尋找可用工具執行任務,推動人工智能從只會回答問題的“做題家”升級為能夠解決問題的“項目經理”,能力發生飛躍質變。
(三)當代智能體是下一代軟件演進躍遷的新方向
智能體的核心軟件屬性既延續傳統軟件的本質特征,又通過智能化實現能力躍遷,代表了下一代軟件變革演進的新方向、新形態。
智能體的軟件屬性不變,其本質是由代碼構成的可執行程序的延續升級。智能體通過自主決策系統和動態適應能力,將軟件從“工具屬性”升級為“伙伴屬性”,但其代碼驅動、可執行、可管理的軟件本質屬性未變。從代碼驅動的一致性看,智能體的大模型推理、強化學習策略等核心決策模塊本質上是動態代碼的集合,API、數據庫等工具調用仍依賴于軟件接口規范;從運行環境的一致性看,智能體需部署在服務器、云端或邊緣設備,依賴操作系統、容器化技術,與傳統軟件的運行環境兼容,如谷歌云平臺、亞馬遜云服務、微軟Azure云平臺提供各種云計算服務,用于構建和部署智能體;從部署運維的一致性看,智能體遵循需求分析→設計→編碼→測試→部署→運維的軟件開發流程,依賴軟件開發相關的版本控制、測試、監控等工具提升開發效率、保證質量。
智能體推動軟件的用戶從人變為智能體,從而推動軟件向原子化、個性化、智能體友好轉變。過去軟件面向的用戶群體是人,界面的易用性、功能的完備性是爭奪用戶的核心要素,但正因為功能設置過于繁瑣,加上需要人通過點擊等操作方式來使用特定功能,造成諸多“隱藏產品”和“隱藏功能”出現。相關數據表明,微軟應用商店現有超過16萬個APP,“搜索難”“選擇難”問題一直存在。根據微軟發布會公布的數據,PowerPoint、Excel中超過90%的功能因“操作難”而被用戶閑置。智能體能夠有效解決上述問題,其進行任務規劃、調用和使用工具的能力能夠幫助用戶完成“選軟件-手動操作軟件”的整個過程,用戶僅需在聊天界面中用自然語言描述需求,智能體就能自動執行任務。這表明,用戶與軟件之間將產生隔離,軟件的用戶將從用戶端轉移到智能體,“運行哪款軟件”將交由智能體判斷,軟件特別是工具軟件的生態將迎來重構,有可能轉變為智能體的功能插件或數據源,從一體化轉向原子化、從人類友好轉向智能體友好將是工具軟件的演進趨勢。
智能體推動軟件形態由“靜態”變為“動態”,從而改變軟件的生產范式。過去軟件的開發是通過人總結經驗并將其轉化為機器能夠理解的代碼,其運行規則是既定的,任務執行只能依據既有的規則進行機械化響應,每次功能更新都需要對軟件進行重新開發。智能體依托大模型的“思考”和“學習”能力,克服了傳統軟件規則僵化、響應機械、升級困難的局限性。人類向智能體下達任務指令后,智能體能夠依據任務要求自適應調用功能、工具甚至自主編寫代碼來完成指定任務,比如在金融分析中,Manus可以自主制定搜索方案、抓取數據信息、編寫Python分析腳本并生成可視化圖表。另外,智能體憑借自主學習能力還能實現自成長、自演進。例如,借助強化學習算法,Devin每周的編程能力迭代提升幅度達15%,目前已精通12種主流編程語言,熟練使用300+開發框架。在代碼質量評測中,其生成代碼的穩定性和可維護性得分比初級程序員平均水平高出37%。未來,智能體將同時扮演軟件本體、軟件使用者以及軟件設計、編寫、修改者等多重角色。軟件的生產模式將從人類學習掌握機器語言進而完成軟件開發的模式,轉變為智能體按照人類需求完成軟件功能擴展和迭代的模式。
智能體推動軟件由“孤島”走向“互聯”,從而改變軟件的商業模式。與傳統軟件作為獨立工具、彼此無法相互調用不同,智能體具備調用外部軟硬件工具的能力。它既可以在數字環境中調用各種軟件接口,比如數據分析、圖像生成、辦公套件等,也可以通過IoT協議獲取空間感知、環境適應和實時反饋功能,并控制物理設備如機械臂、汽車等,形成虛實結合的任務執行能力。此外,通過多個獨立智能體之間的職能劃分和協同合作來處理復雜任務的多智能體網絡系統,使得智能體生態具有極強的可擴展性,如同一個自組織系統持續演化,可以突破單一軟件在任務類型和應用場景上的限制。研究數據顯示,現有的軟件工程智能體中,多智能體系統占比達52.8%。比如阿里云發布的智能編程助手通義靈碼2.0,通過規劃智能體、搜索、生成、單測、調試智能體等多智能體框架來處理復雜的軟件開發任務。在智能體互聯互通特性的支撐下,用戶逐漸無需在多個軟件產品或者云端SaaS產品之間進行切換,“訂閱多個獨立軟件或SaaS”可能轉變為“訂閱一個通用智能體”。這或將推動以往按工具使用收費模式向按任務量收費模式的轉變。
全球智能體技術研發和應用創新
不斷加快
全球智能體快速興起,科技巨頭紛紛加大技術研發和應用創新布局力度,市場預期樂觀向好。英偉達CEO黃仁勛稱,智能體可能是下一個機器人產業,蘊藏著價值數萬億美元的機會,未來每家公司的IT部門都將成為智能體的“人力資源部”。據Gartner預測,至2028年,將有33%的企業軟件應用程序包含智能體,至少15%的日常工作決策將通過智能體自主做出。凱捷(Capgemini)的一份報告表示,大多數組織(82%)計劃到2026年整合智能體,主要用于諸如電子郵件生成、編碼和數據分析等任務。特別是客戶服務智能體,已成為眾多品牌的標配,在許多行業中,高達60%的客戶交互由智能體處理。國際著名市場研究機構Researchand Market發布報告顯示,AI智能體的市場規模將從2024年的51億美元增長到2030年的471億美元,年均復合增長率為44.8%。
圖3、2023-2030E全球AI智能體市場規模(億美元)
數據來源:Research and Market
(一)技術研發持續突破,核心能力不斷增強
大模型技術持續迭代升級,賦予智能體“超強大腦”。大模型是當代智能體的核心驅動,是智能體具備自主規劃、自主決策、自主學習能力的關鍵組成。自2022年OpenAI發布ChatGPT以來,全球大模型發展進入技術加速進化、能力集中涌現、應用加快普及、創新群體突破交織疊加的“四階并進”時期。ChatGPT問世2年以來,月訪問量已達到37億人次,同比增長一倍以上;各國發布大語言模型突破1000個,前20款產品總訪問量突破87億人次,達到全球人口同等量級。斯坦福大學《2025年人工智能指數報告》顯示,大模型基準性能近年來顯著提升,在MMMU、GPQA、SWE-bench三個基準測試集上,2024年大模型相較2023年得分分別提升18.8、48.9、67.3個百分點,在SWE-bench上,AI編程問題解決率由2023年的4.4%升至2024年的71.7%,實現驚人躍遷。各國紛紛加大大模型布局力度,推動大模型進入應用成本和門檻雙重降低,技術水平和成熟度雙重提升階段。美國OpenAI相繼發布ChatGPT、Sora、o1、o3等標志性技術產品,引領全球大模型技術的里程碑式創新,Anthropic、谷歌、Meta、xAI等也加速跟進。我國DeepSeek公司推出DeepSeek-V3和DeepSeek-R1模型,實現大模型訓練成本和推理能力雙提升,模型能力達到國際領先水平,工程化水平得到全球廣泛認可,開辟大模型發展新路徑。隨著OpenAIo1和DeepSeek-R1的推出,大模型逐步從重訓練向重推理轉變,思維鏈(ChainofThought,CoT)技術成為推理模型的關鍵。思維鏈技術是智能體任務分解的關鍵,其可以模擬人類思考過程,將任務指令分解成多個可具體執行的子任務,逐步開展假設、演繹、反思、糾錯等步驟,顯著提升了模型的邏輯推理能力。
智能體開發平臺與工具快速涌現,構建產業發展“新基建”。智能體開發平臺與工具是承擔推動智能體技術創新和應用落地的關鍵角色,為智能體設計、訓練、測試和部署提供系統化、模塊化支持,目前正加速構建和完善。例如,微軟推出Copilot Studio平臺支持企業自建智能體,截至2024年11月,已有逾10萬家企業借助Copilot Studio創建屬于自己的智能體;谷歌推出Vertex AI Agent Builder,為企業提供無代碼/低代碼智能體開發平臺;Oracle推出AI Agent Studio平臺,使企業在安全合規的前提下,靈活構建智能體并嵌入核心業務流程;英偉達推出智能體協同開源工具組件Agent IQ Toolkit,優化智能體運行效率。我國阿里、字節跳動、百度、騰訊、科大訊飛等也紛紛推出智能體開發平臺。其中,百度文心智能體平臺允許開發者通過零代碼或低代碼的方式,利用自然語言交互快速創建智能體。截至2024年11月已匯聚15萬家企業,80萬名開發者,分發量較2024年初上漲16倍。
通信協議標準化加速推進,多智能體“社會”初步形成。互聯互通是智能體區別于傳統軟件的核心特性。通過多個智能體的相互連接,構建起一個多智能體協作網絡,而通信協議則是實現互聯互通的關鍵保障,目前已實現重要突破。例如,2024年11月,Anthropic推出模型上下文協議(MCP),MCP打破了模型鏈接外部資源的信息孤島,簡化了集成流程,被比喻為“AI領域的USB-C接口”。截至2025年2月,已有1000多個社區構建并對外提供MCP服務器服務,OpenAI等美國企業以及華為等我國企業均已在其產品中集成使用。2025年4月,谷歌聯合Oracle、德勤、Salesforce等超50家技術合作伙伴和服務商推出Agent 2 Agent(A2A)開放協議,旨在為不同框架、供應商構建的智能體提供標準化通信機制,實現跨平臺的無縫協同。A2A協議實現了與MCP協議的互補,可有效助力構建多智能體團隊處理復雜工作任務。此外,常高偉團隊推出智能體互聯通信協議(ANP),并在GitHub開源。ANP采用點對點(P2P)思路,基于W3CDID(去中心化標識符)標準實現智能體身份管理,形成去中心化協作網絡。基于ANP可實現多智能體的去中心化高效協作,且具有可擴展性,以適應復雜網絡環境。
表1智能體通信協議對比
(二)應用創新蓬勃發展,產品形態日益豐富
當前,手機、電腦等端側設備廠商以及大模型廠商、智能體創新企業紛紛面向消費級應用和企業級應用推出一系列智能體產品,應用場景逐步拓展。
消費級智能體方面,聚焦手機、電腦等終端使用,具備網頁瀏覽及操作、報告撰寫等功能的智能體加速涌現。在手機智能助手方面,蘋果通過接入OpenAI的ChatGPT等大模型將Siri升級為智能體,華為、小米等手機廠商也紛紛將語音助手升級為智能體。此外,智譜發布智能體系列產品,針對手機端的AutoGLM,兼容抖音、微博、餓了么、京東、拼多多等熱門APP,并具備跨APP操作能力。在計算機助手方面,微軟推出Windows Copilot,打造用戶與應用軟件的智能交互新入口,推動用戶使用應用軟件的方式由傳統的適應學習轉變為自然語言驅動。智能體創新企業Monica推出智能體Manus,能夠直接控制電腦,完成報告編寫、簡歷篩選等任務。
表2消費級智能體產品圖譜
企業級智能體方面,行業通用工具類和面向特定行業類“一縱一橫”兩類智能體加速發展。從縱向看,辦公、管理等行業通用工具類智能體不斷推出。美國軟件巨頭依托前期積累,重點發力行業管理智能體并迎來高增長。微軟在Dynamics365中集成了10個銷售、運營、服務類自主智能體,為企業用戶節約大量時間和運營成本。比如美國電信企業Lumen通過運用微軟智能體每年節約了5000萬美元的成本,相當于新增了187名全職員工的效能;麥肯錫借助自動化的流程分配智能體,將項目受理流程從20天壓縮至僅2天。管理軟件廠商Salesforce將智能體與客戶管理軟件融合打造Agentforce,允許企業按需創建客戶服務、銷售、數據分析等智能體,已與超過1000家客戶達成了付費協議,涵蓋銷售、招聘和客服等多個業務場景。我國金山、金蝶、用友等企業也紛紛推出辦公輔助、人力資源智能體產品,但國際知名度較低。從橫向看,行業智能體產品不斷豐富。軟件工程領域,美國CognitionAI公司推出人工智能軟件工程師Devin推動軟件工程全流程智能化。金融領域,招商銀行推出“掌上生活優惠”與“財富看點”兩款智能體,為用戶提供優惠查詢、辦卡指南、行情分析、資產配置建議等個性化服務。教育領域,字節跳動推出“豆包愛學”,可協助學生和教師進行智能解題、作業批改。
全球智能體發展面臨的挑戰
(一)底層技術瓶頸:算法、數據、算力三大要素制約發展
一是算法性能有待優化。現有算法在面對復雜應用場景時表現欠佳,穩定性有待加強,以智能體基準測試環境OSWorld為例,當設置最大操作步數為50步時,OpenAI開發的Operator智能體僅能達到32.6%的任務成功率,而字節跳動的UI-TARS智能體任務成功率更是僅有24.6%。二是高質量數據獲取難、治理難。訓練高性能的智能體通常需要大規模、高質量、多樣性豐富的標注數據。然而,這類數據獲取成本高昂,標注過程耗時費力且易出錯。許多行業存在“數據孤島”現象,數據分散在不同部門或系統中,難以整合利用。三是高性能算力資源相對緊缺。相較于傳統大模型,推理導向的應用對計算資源的消耗呈現幾何級增長。隨著智能體應用邊界的持續擴展,推理算力的需求呈現爆發式增長態勢,對算力的執行效率和響應速度提出更為嚴苛的要求。
(二)實際部署困境:決策質量穩定性與跨場景協作能力不足
智能體的商業化應用和大規模部署仍處于初期探索階段,主要困難集中在決策質量不穩定、跨場景協作能力不足等問題。當前許多智能體以大語言模型作為核心認知引擎。然而,大模型固有的“幻覺”問題,導致智能體輸出結果的可靠性難以保證,質量難以穩定控制。尤其在高精度和高可靠性的應用場景中,一旦智能體輸出錯誤決策,恐導致系統性問題,甚至產生不可修復的損失。如在醫療領域,智能體承擔輔助診斷、疾病預測和個性化治療等關鍵任務,其決策失誤可能直接危害患者健康甚至生命,并可能引發對整個醫療AI技術體系的信任危機。此外,智能體跨場景跨系統協作能力不足,現有智能體大多只能在特定工作環節中發揮作用,缺乏靈活調配和自主決策的綜合能力,影響了其在自主駕駛、復雜任務規劃等多元化、融合性場景中的適用性。
(三)產業生態挑戰:隱私保護、算法偏見、責任歸屬等多維度風險并存
隱私保護方面,智能體為用戶提供個性化、智能化服務的過程中,不可避免地需要接觸和處理大量數據,其中不乏個人敏感信息和企業核心機密。其日益增強的自主決策能力和與外部環境API接口、數據庫系統等的交互能力,使其在某種程度上成為數據系統中的“特權訪問者”,帶來了前所未有的隱私泄露風險。算法偏見方面,智能體決策行為高度依賴其訓練數據和底層算法設計,其自主學習和強化訓練過程可能會將訓練數據中存在的隱性偏見進一步放大,從而加劇社會公平問題,導致在關鍵應用領域產生歧視性后果。此外,智能體作為未來軟件應用的實際操控者,在軟件產品選擇方面擁有較大的話語權。一旦智能體開發商將不公平競爭規則內置于智能體系統中,勢必會對軟件市場的公平選擇機制造成干擾。責任歸屬方面,智能體具備高度自主的決策能力,當智能體的行為導致損失時,極大增加了在開發者、部署者、使用者等多元主體之間清晰界定并分配責任的難度。
對策建議
對照全球發展情況,結合我國實際,智能體發展仍面臨一些問題瓶頸,如自主芯片軟件生態發展緩慢、模型性能不夠優化、產業化發展缺乏成熟的商業模式、產業生態體系不夠健全等,亟需強化支持引導,統籌推進技術創新、應用推廣、標準制定、人才培養等各項工作,為加快推動我國智能體發展創造良好條件。
(一)推動技術創新
一是加強智能體關鍵技術研發,支持高校院所和企業圍繞智能體核心算法、架構設計、協同機制等開展技術攻關,提升智能體技術水平和應用能力。二是促進智能體開源創新發展,鼓勵建設開源技術社區和代碼倉庫,推動智能體相關工具、框架、模型的開源共享,降低技術應用門檻。三是完善技術創新支持政策,通過科技計劃項目、創新基金等方式,加大對智能體技術研發的資金投入和政策支持力度。
(二)深化融合應用
一是推進智能體在重點行業的應用示范,在制造、金融、教育、醫療等重點行業開展智能體應用試點,探索智能體與傳統業務的深度融合模式。二是建立智能體應用推廣機制,組織開展智能體技術交流、產品展示、供需對接等活動,促進智能體技術成果的轉化應用。三是完善智能體應用效果評價機制,建立涵蓋技術先進性、應用成熟度、經濟效益等多維度的評價指標體系。
(三)完善標準體系
一是制定智能體技術標準,圍繞智能體架構、接口、協議等技術要素,研究制定相關技術標準和規范,為智能體產品開發和應用提供技術指引。二是建立智能體評估評測標準,制定智能體性能評價、安全評估、能力測試等標準體系,為智能體產品質量評價和應用選擇提供科學依據。三是推動標準宣貫實施,通過標準培訓、認證評估等方式,促進智能體相關標準的推廣應用和持續完善。
(四)加強人才培養
一是完善智能體人才培養體系,支持高校設立智能體相關專業課程,培養既懂人工智能技術又熟悉行業應用的復合型人才。二是開展智能體專業技能培訓,面向企業技術人員和管理人員,組織智能體技術培訓、應用實踐等活動,提升從業人員專業技能水平。三是建立人才交流合作機制,促進產學研用各方在智能體人才培養方面的交流合作,推動優秀人才向智能體領域聚集。
來源:賽迪智庫
作者:王宇霞、胡靖陽、牛子佳、劉健、劉麗超、許旭
編輯:曉燕
指導:辛文
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.