Agentic AI 要終結(jié)數(shù)據(jù)庫和 SaaS？大廠掌門人公開互撕，焦慮的 CEO 們押上了不同的技術(shù)路線

2025-05-12 13:33:37　來源: InfoQ

北京舉報

分享至

作者 | Tina

Agent 正在成為 2025 年 AI 世界最炙手可熱的關(guān)鍵詞之一。

無論是大模型廠商、AI 初創(chuàng)公司，還是企業(yè)級應(yīng)用團隊，幾乎都在討論“多智能體協(xié)作”“自動化決策流程”以及“具備工具調(diào)用能力的 AI 系統(tǒng)”。

谷歌、英偉達等科技巨頭紛紛布局，上個月亞馬遜還成立了一個專注于 Agentic AI 的新部門，初創(chuàng)公司們也爭相推出各類“Agent”產(chǎn)品。開源社區(qū)也不甘示弱，從 LangGraph 到 Agent SDK、AutoGen、CrewAI，一波 Agent 框架競相登場，掀起了繼大模型之后的第二輪工具潮。

連大廠掌門人也開始在公開場合“互嗆”。

微軟 CEO Satya Nadella 高調(diào)宣稱：“我們所知的 SaaS 時代即將結(jié)束……Agent 將成為核心驅(qū)動力”。而 Salesforce CEO Marc Beinoff 則直接嘲諷微軟的 Copilot，稱其為“Clippy 2.0”：“根本不起作用，而且沒有任何準(zhǔn)確性”。Clippy（回形針）即 Office 虛擬助手，是微軟上世紀推出的基于規(guī)則的代理，為用戶吐槽最多的失敗設(shè)計之一。

言辭之鋒利，背后其實是對 Agentic AI 兩種截然不同落地路徑的分歧。

一條是微軟 Nadella 倡議的“面向全平臺的智能代理框架”路線。按照他們的設(shè)想，未來將出現(xiàn)一個 AI 操作系統(tǒng)，能夠調(diào)度多個智能體，并且這些智能體可以在整個企業(yè)內(nèi)無縫地傳遞任務(wù)、消息和知識。

Nadella 認為，這是一場從“App Stack”到“Agent Stack”的根本性變革。過去，我們依賴前端 UI 驅(qū)動的應(yīng)用形態(tài)，每一個業(yè)務(wù)場景都被拆分為獨立的 App，用戶通過操作完成任務(wù)。未來，主導(dǎo)者將是 Agent，它能感知用戶意圖，基于數(shù)據(jù)、模型和推理鏈條，完成決策和自動執(zhí)行。

在這種架構(gòu)轉(zhuǎn)變下，當(dāng)前的 SaaS 等應(yīng)用因為其本質(zhì)上是嵌入商業(yè)邏輯的數(shù)據(jù)庫，未來這些邏輯會被 Agent 接管，由 Agent 去做增刪改查，在多個數(shù)據(jù)庫之間工作，所有的邏輯都會轉(zhuǎn)移到 AI 層。而一旦 AI 層成為主導(dǎo)，背后的數(shù)據(jù)庫最終也會開始被替代。

本質(zhì)上，這是微軟構(gòu)建通用人工智能代理體系、通過底層架構(gòu)向企業(yè)應(yīng)用生態(tài)滲透的戰(zhàn)略布局。正如數(shù)勢科技 AI 負責(zé)人李飛博士在分析中指出，微軟此舉旨在依托其既有生態(tài)系統(tǒng)優(yōu)勢，打造覆蓋全場景的 AI 接入平臺，形成對垂直領(lǐng)域應(yīng)用的聚合效應(yīng)。通過構(gòu)建人工智能交互的核心樞紐，微軟試圖確立其在產(chǎn)業(yè)智能化轉(zhuǎn)型中的頂層平臺地位，實現(xiàn)對各類專業(yè)化應(yīng)用的系統(tǒng)性整合。

大模型公司或云資源提供商大多支持這種“通用”入口性質(zhì)的路線。比如 OpenAI 就肯定傾向于 Nadella 的思路，因為在它看來，所有的 Agent 本質(zhì)上都是對其大模型能力的延伸和增強。對 OpenAI 來說，構(gòu)建通用 Agent 能將所有應(yīng)用集成在自己的能力框架之下，使其成為一個統(tǒng)一入口。類似的例子還有 Manus，以及 AutoGLM 沉思等。無論是微軟、OpenAI，還是 Manus、沉思，這背后體現(xiàn)的，依然是一場關(guān)于“誰來掌握 AI 入口權(quán)”的競爭。

與之相對，另一條路線則由 Salesforce 所代表。

Salesforce 的思路是從現(xiàn)有企業(yè)軟件棧出發(fā)，強調(diào)以垂直領(lǐng)域（如 CRM）為根基，推動業(yè)務(wù)邏輯的 AI 原生重構(gòu)。他們不認為 AI 會“取代”現(xiàn)有 SaaS 應(yīng)用，而是主張 AI 和 SaaS 深度集成，將 Agent 機制嵌入業(yè)務(wù)流程中，通過業(yè)務(wù)數(shù)據(jù)和流程去驅(qū)動 Agent 的運行和決策。Agent 不是一個外部工具或統(tǒng)一入口，而只是整個流程當(dāng)中的一個節(jié)點。

相較于微軟自底而上的通用化策略，Salesforce 的設(shè)計思路是自頂向下，從實際的業(yè)務(wù)流程出發(fā)，反向構(gòu)建 Agentic AI 能力，旨在復(fù)用并增強現(xiàn)有的各類 SaaS 應(yīng)用。

事實上，許多沒有龐大通用平臺基礎(chǔ)、專注于 ToB 軟件或垂直場景的企業(yè)，可能會更傾向于 Salesforce 這種貼近業(yè)務(wù)、務(wù)實的路線。他們往往是先搭建好業(yè)務(wù)或工作流程，然后將 Agent 融入這些流程中，使其專注于解決特定垂直場景的問題。

哪種路徑更具可行性？

貼補丁式 Agentic，能落地但改不了舊系統(tǒng)的命

Salesforce 的 CEO 對微軟 Copilot 的攻擊頗為犀利，甚至直言這是“微軟的一場巨大災(zāi)難”。他公開表示，自己與多位微軟客戶交流后發(fā)現(xiàn)，“他們并沒有發(fā)現(xiàn)自己因為這項 Copilot 技術(shù)而發(fā)生了改變，很多人幾乎沒怎么使用這個功能”。相比之下，Salesforce 則宣稱其平臺每周處理多達兩萬億筆企業(yè) AI 交易。

有意思的是，Salesforce 自家的平臺最初也叫 Einstein Copilot。更耐人尋味的是，在棄用“Copilot”這個名稱后，Benioff 便開始公開批評微軟的 Copilot 產(chǎn)品。并且 Salesforce 堅稱，從 Einstein Copilot 更名為 Agentforce，絕不僅僅是換了一個名字，而是其底層架構(gòu)也經(jīng)歷了重要的調(diào)整。

從 Salesforce 架構(gòu)師的公開演講來看，Einstein Copilot 在與用戶進行交互時使用的是“Chain of Thought”（思維鏈）模式，而 Agentforce 的一個關(guān)鍵進展，就是用 React prompting 替代了效果不好的傳統(tǒng)的思維鏈。其次是引入 Topic 分類機制，解決 Copilot 在對話過程中難以將任務(wù)限定在某個特定的范圍內(nèi)的問題。然后是改進了 LLM 的響應(yīng)方式，Copilot 直接返回未經(jīng)處理的后端數(shù)據(jù)，導(dǎo)致用戶難以理解，而 Agentforce 則會利用 LLM 對原始數(shù)據(jù)進行自然語言包裝，使其更易讀懂。最后是引入了主動觸發(fā)能力，與 Copilot 依賴用戶主動發(fā)起對話不同，Agentforce 希望實現(xiàn)基于特定數(shù)據(jù)庫操作的自動觸發(fā)，無需用戶干預(yù)即可啟動 Agent 執(zhí)行任務(wù)。

可以說，早期的 Einstein Copilot 側(cè)重于通過對話觸發(fā)和調(diào)用預(yù)設(shè)的比如銷量預(yù)測等算法，實現(xiàn)人機協(xié)作。而 Agentforce 的目標(biāo)似乎是轉(zhuǎn)向更自主的任務(wù)執(zhí)行模式，用戶設(shè)定目標(biāo)后，系統(tǒng)能夠自主規(guī)劃并執(zhí)行工作流程，最終呈現(xiàn)結(jié)果。

因此，盡管 Salesforce 強調(diào)這是架構(gòu)的演進，但其核心仍然是提升 AI 在任務(wù)執(zhí)行中的自主性和智能化水平。

不僅如此，Beinoff 還評價微軟是“快速追隨者”，并稱：“他們肯定會像往常一樣想抄襲我們，向我們靠攏。但我們現(xiàn)在已經(jīng)有數(shù)千客戶在實際使用我們的產(chǎn)品。”

根據(jù)截至 3 月的最新數(shù)據(jù)顯示，雙方的 Agent 都有大規(guī)模的落地，Salesforce 宣稱擁有約 15 萬名客戶，微軟則表示已有 16 萬客戶，基于 Copilot 打造出了 40 萬個 Agent。

然而，白鯨開源 CEO 郭煒一針見血地指出，當(dāng)前微軟的 Agent 只是個人用戶輔助工具，和 Nadella 技術(shù)路線里要實現(xiàn)的最終理想，并不是同一個東西。

微軟對 Agentic AI 的設(shè)想是“OS”級別的變革。它構(gòu)想中的 AI 操作系統(tǒng)不僅要能夠調(diào)度多個智能體，還要持續(xù)保持上下文狀態(tài)、理解用戶意圖，并在多種數(shù)據(jù)源和系統(tǒng)能力之間進行協(xié)調(diào)。在這一架構(gòu)中，業(yè)務(wù)邏輯將由 Agent 全面接管，而“狀態(tài)管理器”（State Manager）被視為 AI 操作系統(tǒng)的核心組件——只有具備對用戶狀態(tài)的持續(xù)記憶，Agent 才能真正理解用戶是誰、在做什么、希望實現(xiàn)什么目標(biāo)，類似于 AI 世界中的“內(nèi)存管理”。為此，微軟正在打通自身所有產(chǎn)品線，并與 OpenAI 這樣的企業(yè)合作，構(gòu)建一個開放的智能體生態(tài)平臺。

而 Salesforce 的 Agentforce，“它都不是行業(yè)智能體，只是 CRM 生態(tài)線的智能體。目前技術(shù)手段都實現(xiàn)了個高級版本 RPA/ 按鍵精靈，只不過通過大語言模型交互可以自動做一些分拆動作，做一些組合罷了。和當(dāng)年移動互聯(lián)網(wǎng)出來時候的塞班操作系統(tǒng)一樣，屬于早期‘嬰兒’版本的 Agentic AI。”

當(dāng)前 Salesforce 模式雖能被快速推廣落地，但是這件事情的門檻也不高，很多創(chuàng)業(yè)公司都可以做到類似的事情，大公司就更不用說了。

這些做法本質(zhì)上仍停留在對原有軟件和交互流程的增強層面，就像當(dāng)年微軟試圖將 Windows 系統(tǒng)移植到手機上一樣——看似容易實現(xiàn)，但并不是最優(yōu)解。真正開啟移動互聯(lián)網(wǎng)時代的，是 iPhone 和 iOS 的誕生，它們從底層重新定義了系統(tǒng)與用戶之間的交互邏輯。

正因如此，Nadella 才會提出“所有軟件和 SaaS 都將被重構(gòu)”的觀點，因為他預(yù)見到了 Agentic AI 時代的來臨。如果我們只是把 Agent 嵌入到現(xiàn)有軟件中去打補丁，就像是把 Windows 裝在手機上——表面上可行，但遠未觸及這場變革的真正核心。

真正的 Agentic AI 將倒逼整個技術(shù)體系重建

短期來看，復(fù)用現(xiàn)有 SaaS API 或許是 Agentic AI 實現(xiàn)功能落地的捷徑，對現(xiàn)有流程體系的沖擊也相對較小。然而，從長期視角出發(fā)，Nadella 所代表的觀點顯然更具顛覆性：大模型和 Agent 的到來會徹底重塑整個軟件和 SaaS 生態(tài)。

郭煒認為，甚至 Nadella 所描述的“代理程序在多個數(shù)據(jù)庫之間工作”的設(shè)想，還不夠 Agentic AI。因為在這一新范式下，整體的技術(shù)框架都會要被重新設(shè)計。傳統(tǒng)數(shù)據(jù)庫的設(shè)計初衷，是為了服務(wù)于“人類決策”的時代。從數(shù)據(jù)庫到數(shù)據(jù)倉庫，所有的設(shè)計都是上個世紀，為了輔助人類做決策、完成信息記錄而構(gòu)建的。于是我們看到了復(fù)雜的 CRUD 操作、DAO 層、數(shù)據(jù)庫層、數(shù)據(jù)倉庫層以及 ETL 流程，它們共同支撐起了人與數(shù)據(jù)之間的交互邏輯。

然而，在 Agent 成為主要用戶的背景下，這些為“人類使用”而生的復(fù)雜數(shù)據(jù)處理體系是否仍然必要，正面臨質(zhì)疑。未來的存儲不一定是數(shù)據(jù)庫形式了，使用的方式也必然不是 SQL 了。

順著 Satya 的邏輯推演，被重塑的不只是 SaaS，更是整個技術(shù)架構(gòu)生態(tài)。數(shù)據(jù)庫技術(shù)，甚至是基礎(chǔ)理論會被倒逼升級，傳統(tǒng)的 No-SQL，New-SQL 都不適用于未來 Agentic AI 的場景。就像從軟件工程學(xué)角度來看，所有的軟件設(shè)計都是從 Use Case（UML）圖開始設(shè)計的，而 User 都變了，憑什么底層的技術(shù)還是原來的技術(shù)體系呢？

AWS Agentic AI 主任科學(xué)家章毅也贊同整個技術(shù)架構(gòu)生態(tài)體系會被重構(gòu)，他進一步指出，當(dāng)前 Agent 利用 API 調(diào)用已有的數(shù)據(jù)庫系統(tǒng)進行知識查詢和整合（典型 RAG 架構(gòu)）能夠覆蓋一些基本的業(yè)務(wù)邏輯，但是知識、信息碎片化（以不同模態(tài)和格式存儲于多個數(shù)據(jù)庫中）對 AI Agent 高效搜索、鏈接、歸納、提煉、使用與更新信息帶來很大的困難。這必然會帶動對數(shù)據(jù)存儲、管理系統(tǒng)進行重新思考和設(shè)計。

而且，作為 AI 操作系統(tǒng)的核心的記憶層“能否實現(xiàn)”也是未知數(shù)。

Salesforce 的 Agentforce 架構(gòu)在預(yù)設(shè)的業(yè)務(wù)流程中，Agent 可以有效地訪問和利用先前操作產(chǎn)生的數(shù)據(jù)和狀態(tài)信息，形成一種上下文記憶。但一旦進入微軟所設(shè)想的跨系統(tǒng)、跨復(fù)雜場景環(huán)境，Agent 就沒有一個穩(wěn)定的獲取記憶的依托點，出錯概率顯著增加，顯然比 Salesforce 這種嵌入式設(shè)計的難度系數(shù)大。

微軟設(shè)想的“AI 操作系統(tǒng)”中，狀態(tài)管理的關(guān)鍵在于讓 AI 能夠跨不同的應(yīng)用和設(shè)備記住信息，并需要有一種結(jié)合短期交互與長期語義記憶的機制。這實際上是將來 Agentic AI 時代替代數(shù)據(jù)庫地位的關(guān)鍵組件，然而在實際架構(gòu)層面，挑戰(zhàn)遠超預(yù)期。也有觀點認為這并不是一個簡單的“狀態(tài)管理”，而是是在云端為每個用戶構(gòu)建一個“虛擬人生”——系統(tǒng)需要持續(xù)記錄用戶的行為、偏好與選擇，形成大模型的短期記憶和長期語義。問題在于，這種能力無法用向量將它描述清楚，并且目前還不知道可以用什么技術(shù)實現(xiàn)。

可以說，微軟的 Agentic AI 代表了一種技術(shù)理想主義。

雖然很多廠商在嘗試，但這個模式整體還太早，大模型和 Agent 本身都還沒有進化完全。當(dāng)前階段，更現(xiàn)實的路徑是 Salesforce 式 Agent，其類 RPA 的特性使其更容易被企業(yè)接受。畢竟，在當(dāng)下，企業(yè)更愿意為確定性買單。

但長期來看，傳統(tǒng)企業(yè)軟件終會被取代，因為軟件只不過是規(guī)范流程，信息傳遞，實現(xiàn)多人協(xié)同的一種方式，如果有更先進的更高效的管理和交流模式，舊有模式一定會替換。今天的企業(yè)軟件形態(tài)必然會被顛覆，這正如固定電話被移動設(shè)備取代、再被微信等應(yīng)用徹底重構(gòu)通訊方式一樣。Agentic AI 時代會是一個和移動互聯(lián)網(wǎng)一樣的全新的時代。

不過，這需要的是一次自底向上全套生態(tài)的改變，挑戰(zhàn)不亞于當(dāng)年的“云原生”轉(zhuǎn)型，甚至更甚。這種全模式的創(chuàng)新，或許只有在底層信息科學(xué)取得突破之后，才有真正實現(xiàn)的可能。

“MoE”是個折中選擇

微軟式的通用 Agent 路線，聽起來誘人，但在現(xiàn)實中目前還行不通。而在大模型的最新演進中，已經(jīng)出現(xiàn)越來越多轉(zhuǎn)向 Mixture of experts（MoE）架構(gòu)的趨勢。

MoE 背后的理念正是將任務(wù)拆分給更擅長的“專家”，而不是試圖構(gòu)建一個無所不能的模型。

如果在大模型里大家能接受 MoE 的思想，那么，同樣的道理，在實現(xiàn) Agent 的時候，也一樣可以采用這種方式：不是打造一個“超級大腦”，而是強調(diào)分工協(xié)作、各盡其職。

而且，當(dāng)前現(xiàn)實來看，因為 Agent 能力太弱，還是多個專科 Agent 來做比較合適，例如 Salesforce 的 Agent、SAP 的 Agent 等等。

就算未來的 Agent 即使是基于一個“超級大腦”的路線，這個“大腦”中也必然存在多個并行的、具有不同專屬能力的組件，而不是靠一個模型包打天下。事實上，哪怕使用少數(shù)甚至是同一個基礎(chǔ)模型，構(gòu)建多個專家 Agent 并通過高效協(xié)同完成復(fù)雜任務(wù)，無疑是一個有效的設(shè)計范式，是同大模型能力提升演化協(xié)同共進、互補互助的方法。

更重要的是，所謂“通用”與“垂直”的兩條路線，從產(chǎn)業(yè)實踐來看，并非互斥，而是根據(jù)不同企業(yè)的戰(zhàn)略優(yōu)勢進行差異化布局。微軟聚焦平臺型能力，將 Agent 集中于 Copilot 品牌下統(tǒng)一推進，同時也不放棄在 Microsoft 365 等具體場景中的垂直落地。Salesforce 以 SaaS 為核心，在 CRM 等場景深耕垂直 Agent，同時借助 Agentforce 等平臺工具，向多云生態(tài)拓展。平臺化和垂直場景的結(jié)合，正成為行業(yè)主流趨勢。

打平臺牌需要非常大量的固有成本。對于中小企業(yè)而言、迅速找到垂直 Agent 應(yīng)用并落地，會是更重要的當(dāng)務(wù)之急。

從“能不能做”到“做得成、做得起”

回顧 Agentic AI 近兩年多的發(fā)展，我們看到，行業(yè)正經(jīng)歷著從對大語言模型的初步探索，到逐步賦予其感知、理解和行動能力的關(guān)鍵階段。

從最初直接依賴 LLM 進行信息處理，逐步演進到利用檢索增強生成（RAG）技術(shù)來擴展其知識覆蓋范圍。隨后，多模態(tài)模型的出現(xiàn)使其能夠處理更豐富的輸入和輸出形式。

緊接著，行業(yè)進入了“Agentic 對話”階段，核心在于賦予模型執(zhí)行動作的能力，使其不再僅僅是內(nèi)容生成工具。為模型添加可執(zhí)行功能被視為一個重要的里程碑。

關(guān)于 Agentic AI 最早的雛形，存在兩種主要觀點：一種認為是 OpenAI 推出的“Function Call”功能，它使得大模型能夠根據(jù)需求調(diào)用外部函數(shù)。另一種觀點則認為，真正的更早出現(xiàn)的 AutoGPT，因為 Function Call 并不是一個完整的鏈路。AutoGPT 是在 OpenAI 的 ChatGPT (GPT-3.5) 發(fā)布后，由 Toran Bruce Richards（蘇格蘭愛丁堡人工智能公司 Significant Gravitas Ltd. 的創(chuàng)始人兼首席開發(fā)者）在 2023 年 3 月份創(chuàng)建的演示項目，展示了如何利用大型模型實現(xiàn)任務(wù)的自動分解和執(zhí)行。

此后，Agent 的完整生態(tài)閉環(huán)首次被較為系統(tǒng)地提出，這要歸功于 OpenAI 研究員 Lilian Weng 在 X（原 Twitter）上分享的 Agent 工作流程文章，清晰地描繪了包括“目標(biāo)規(guī)劃、工具調(diào)用、執(zhí)行、結(jié)果反思”等關(guān)鍵環(huán)節(jié)，被認為是 Agent 架構(gòu)逐步演進的重要起點。受此啟發(fā)，業(yè)界圍繞 AI Agent 展開了大量的探索與實踐，并逐漸形成了更為系統(tǒng)化的工程方法。

數(shù)勢科技的 Agent 系統(tǒng)演進，也反映了 Agent 技術(shù)自身的發(fā)展歷程。其系統(tǒng)經(jīng)歷了從 1.0 到 3.0 的迭代：初期的 1.0 階段，主要實現(xiàn)了單個 Agent 對數(shù)據(jù)工具的調(diào)用。進入 2.0 階段，系統(tǒng)引入了與環(huán)境交互的反饋機制，并強化了自我反思與迭代能力。發(fā)展到 3.0 階段，則根據(jù)用戶需求，從單 Agent 升級為多 Agent 協(xié)作機制，以覆蓋更廣泛的場景和角色。

Agentic AI 還有哪些挑戰(zhàn)？

當(dāng)前，Agentic AI 系統(tǒng)構(gòu)建中，任務(wù)編排依然是極具挑戰(zhàn)的技術(shù)難題。

相較于 Salesforce 等平臺采用的預(yù)定義工作流模式（其泛化性受限），微軟提出了通過 AI 實時理解規(guī)則并動態(tài)生成編排規(guī)則，進而連接現(xiàn)有 API 的設(shè)想。但真正落地時，問題遠比想象中復(fù)雜。

當(dāng)業(yè)務(wù)流程僅涉及少量節(jié)點時，編排復(fù)雜度尚在可控范圍內(nèi)。然而當(dāng)節(jié)點數(shù)量增長至 10 個、20 個甚至 100 個量級，且涉及多系統(tǒng)、API 和工具的協(xié)同工作時，確定正確的線性執(zhí)行順序（如 ABCDEFG... 或 ACBDEFG...）將面臨組合爆炸問題——100 個節(jié)點的全排列組合達 100! 種。每新增一個節(jié)點，系統(tǒng)復(fù)雜度將以階乘級數(shù)倍增，這種非線性增長特性使得大規(guī)模編排系統(tǒng)極易產(chǎn)生級聯(lián)錯誤。正如李飛博士指出的：“當(dāng)編排網(wǎng)絡(luò)中出現(xiàn)單個節(jié)點順序錯位時，整個拓撲結(jié)構(gòu)的執(zhí)行邏輯都將發(fā)生系統(tǒng)性偏差。”

基于實際構(gòu)建 Agent 的經(jīng)驗，合理的工作流編排是核心難點。一旦工作流得以確定，后續(xù) API 的輸入輸出參數(shù)便相對固定。因此，能否實現(xiàn)準(zhǔn)確高效的工作流編排，直接關(guān)乎 Agentic AI 系統(tǒng)的可靠性。

盡管如此，Agentic AI 根本性的進步仍然依賴于底層大模型能力的提升。“大模型基座本身有錯誤率，Agent 和軟件其實是在給大模型的錯誤率或者幻覺去做兜底的。”因此無論上層應(yīng)用多么創(chuàng)新，如果底層模型能力沒有顯著進步，系統(tǒng)所能解決的問題依然有限。

如今的大模型在各種基準(zhǔn)測試中表現(xiàn)越來越好，但要真正實現(xiàn)具備自主性的 Agent 系統(tǒng)，還存在不小的挑戰(zhàn)。Google首席科學(xué)家 Jeff Dean 剛好在 4 月底的一次演講中透露了目前大模型實際能力：當(dāng)前模型大致能以 60% 到 70% 的準(zhǔn)確率，完成三到五步的小任務(wù)，能在有限范圍內(nèi)調(diào)用工具處理一些簡單請求。但真正理想的智能體，應(yīng)當(dāng)能夠面對模糊而復(fù)雜的目標(biāo)，自主拆解并完成上千個步驟，完成相當(dāng)于一個月人類工作量的任務(wù)，且準(zhǔn)確率達到 95%。

從現(xiàn)在的能力到這一目標(biāo)之間，仍有巨大差距。這一演進過程可能會經(jīng)歷多個階段——從勝任 3～5 步的任務(wù)，提升到能夠穩(wěn)定完成 10 步以上的流程，最終邁向真正具備規(guī)劃、執(zhí)行、反饋能力的智能體系統(tǒng)。

章毅則進一步指出，目前的前沿大模型中能夠全面達到打造具有高智能、高自主性 Agent 要求的選擇并不多、甚至可以說非常少。

即便是在大模型服務(wù)平臺如 AWS Bedrock 提供了多個主流模型（如 Claude、LLaMA、Amazon Nova、Mistral Mixtral 等等）供開發(fā)者選擇的背景下，真正能夠滿足構(gòu)造 Agent 能力要求的模型還是主要局限于 Anthropic Claude 的幾個最新版本（Sonnet 3.5/3.7 或者 Haiku 3.0/3.5）。

從短期落地的可行性角度看，聚焦一個或少數(shù)幾個前沿大模型會得到比較好的投資回報率。

“每次對話 2 美元”

“節(jié)省數(shù)百萬美元”“一半客服被 AI 替代”——這類故事，已經(jīng)成為 AI 圈標(biāo)配的營銷劇本。Salesforce 和微軟正是靠這樣的案例，推廣他們的智能 Agent 系統(tǒng)。

這些故事構(gòu)建了一個極具吸引力的愿景：AI 代理系統(tǒng)不僅能顯著提升效率，還能直接壓縮運營成本，甚至重塑組織結(jié)構(gòu)。但真正落地到企業(yè)環(huán)境中，很多人才發(fā)現(xiàn)，這場變革的代價遠比想象中高。

以 Salesforce 的 Agentforce 為例，其官網(wǎng)宣傳“每次對話 2 美元起”。但在實際合同中，超出 1000 次免費額度的部分，會按每次 2.50 美元收費。也就是說，雖然預(yù)購有折扣，但一旦使用超額，就需要按每次 2.50 美元支付。相比微軟 Copilot 那種更強調(diào)“按有效消息計費、結(jié)果導(dǎo)向” 的模式，Salesforce 更像是“按次數(shù)定額收錢”，不管任務(wù)是否真正成功完成。

如果按當(dāng)前國內(nèi)大模型的標(biāo)準(zhǔn)報價（如 0.0008 元 / 千 token）折算，這“每次 2 美元”的對話，意味著系統(tǒng)可能要消耗接近 1800 萬 token。這不僅意味著成本高昂，也從側(cè)面反映出任務(wù)流程可能執(zhí)行起來極其復(fù)雜。一旦規(guī)模化使用，成本壓力會驟然放大：以一家中型企業(yè)為例，1000 名員工、每人每天調(diào)用 10 次，每天光軟件費就超過 2 萬美元，月支出高達 60 萬美元。有從業(yè)者直言：“比傳統(tǒng)軟件貴多了。”

對于像 Dow 這樣有能力重構(gòu)系統(tǒng)流程的大企業(yè)而言，AI Agent 可能真能創(chuàng)造“幾百萬美元的節(jié)省”；但對大多數(shù)公司來說，這種奇跡并不容易復(fù)刻。節(jié)省成本的路徑，遠比那些營銷故事復(fù)雜。

這也引出了一個更現(xiàn)實的問題：企業(yè)到底該怎么上 Agent？

你的企業(yè)該怎么上 Agent？

對大多數(shù)企業(yè)來說，“要不要上 Agent”其實早就不是問題了。一旦基礎(chǔ)系統(tǒng)和生態(tài)完備，未來 Agentic AI 就像移動互聯(lián)網(wǎng)一樣蓬勃發(fā)展。技術(shù)領(lǐng)袖的共識也正在浮現(xiàn)：AWS 等云廠商認為 AI Agent 將會重新定義云服務(wù)的未來，明確將 Agent 定位為“下一代基礎(chǔ)設(shè)施”，提供模型托管、推理算力以及致力開發(fā)針對 AI Agent 的可重用組件和功能模塊。

但越是全行業(yè)熱捧的趨勢，越需要冷靜評估其落地的現(xiàn)實條件。

“不是十倍提效，就不值得上。”技術(shù)部署要看“性價比”。李飛直言：“如果不是十倍時效，這個場景的意義其實不大”。也就是說，如果原來 20 小時能完成一個任務(wù)，現(xiàn)在 Agent 縮短到 10 小時，效率雖提升了一倍，但不足以支撐 AI Agent 高昂的部署成本，其實企業(yè)很可能不買賬。特別是在企業(yè)端，Agent 本質(zhì)上是對業(yè)務(wù)流程的自動編排，必須依賴業(yè)務(wù)與技術(shù)的深度協(xié)同：業(yè)務(wù)人員提供流程知識，技術(shù)人員將這種 Know-how 嵌入 Agent 開發(fā)中，才能讓 Agent 真正融入企業(yè)工作流。

“通用 Agent，不適合企業(yè)。”目前一些企業(yè)已經(jīng)準(zhǔn)備好了部署 Agent，但“通用 Agent”更適合 C 端用戶。因為 C 端的容錯性更高，“這個任務(wù)不行就換下一個”，但企業(yè)不能容忍任務(wù)中斷或出錯，一旦流程關(guān)鍵環(huán)節(jié)失敗，就可能影響整個業(yè)務(wù)判斷。“在企業(yè)當(dāng)中，大部分工作都是嚴謹?shù)模氵@個任務(wù)給我執(zhí)行錯了或者執(zhí)行不出來，我就認為你這個軟件不行。”

因此，企業(yè)更傾向從垂直場景做起，把 Agent 深度嵌入到已有業(yè)務(wù)流程中，通過產(chǎn)品設(shè)計和流程兜底，把錯誤率降到最低，才能真正達成企業(yè)級可用。“垂直 Agent 在今年其實已經(jīng)準(zhǔn)備好了采購”，但不同領(lǐng)域成熟度差異較大，最終落地效果也存在顯著差異。同時還應(yīng)優(yōu)先選擇容錯性相對較高的任務(wù)切入，比如在“研報分析”這類允許人工校驗和干預(yù)的內(nèi)容生成任務(wù)，避免一上來就部署端到端決策系統(tǒng)，“Human-in-the-loop”機制可以顯著降低幻覺和錯誤的風(fēng)險。

“不要急著全部用 Agent。”“現(xiàn)在的 Agent 就像當(dāng)年的 Windows Phone。”郭煒給出了一個務(wù)實的策略：不要過早的迷信于現(xiàn)在的 agent，先采用 RPA+Agent 模式來實現(xiàn)企業(yè)內(nèi)部流程自動化，等待外部技術(shù)條件成熟（10 年 +），在開始考慮公司全面 Agent 化。

“不執(zhí)著于單一的架構(gòu)范式。”在全球范圍內(nèi)，亞馬遜是最早系統(tǒng)化推動 Agentic AI 的企業(yè)之一。從 Alexa 的智能化重構(gòu)、“Buy for Me” 融入購物體驗，到 Amazon Q 面向開發(fā)者的代碼助理，再到電商目錄處理、合規(guī)審核，或者服務(wù)于公司員工的 HR 信息系統(tǒng)，Agent 技術(shù)已在其多個業(yè)務(wù)線并行推進。從這些項目中，可以看到亞馬遜“全面擁抱 AI agent 技術(shù)的明顯趨勢”。正如章毅所說：“公司各個業(yè)務(wù)部門都非常重視 AI Agent 可能帶來的機遇和挑戰(zhàn)，所以有各類并行的、針對不同應(yīng)用場景的嘗試。”

值得一提的是，亞馬遜對 Agent 架構(gòu)持開放態(tài)度，并不執(zhí)著于單一標(biāo)準(zhǔn)化框架。AI agent 作為一個新興的領(lǐng)域，技術(shù)架構(gòu)仍然有很大的不穩(wěn)定、不確定性，新生框架鱗次櫛比。有的框架誕生不到六個月，時間長的也不過只有兩年多。在它們成熟、演化、歸一的過程中，亞馬遜會對這些框架靈活應(yīng)用。

“Agent 是個日新月異的領(lǐng)域，保持靈活性而不迷信某一種架構(gòu)，將會是更務(wù)實的做法。”對于正處于數(shù)字化轉(zhuǎn)型關(guān)鍵階段的企業(yè)，建議從具體場景出發(fā)，快速構(gòu)建 Agent 原型并驗證可行性。他提醒，盡管開發(fā)門檻已降低，但有效的評測機制仍是選型與演進的關(guān)鍵。

相比之下，中國企業(yè)在 Agentic AI 落地上正面臨不同的挑戰(zhàn)與機會。

從落地模式來看，郭煒認為目前大多數(shù)中國企業(yè)更傾向于 Salesforce 式的“融合”路徑，而非微軟式的“重構(gòu)”：“我個人希望中國可以像新能源車一樣，在 Agentic AI 上通過重構(gòu)實現(xiàn)彎道超車，顛覆傳統(tǒng)軟件。但是當(dāng)前仍缺少一些基礎(chǔ)信息學(xué)理論的突破，因此融合模式更現(xiàn)實，也更容易落地。”

不過，中國軟件市場定制化需求多，因此生態(tài)不如海外 SaaS 軟件標(biāo)準(zhǔn)，“哪怕是用 Salesforce 模式做的 Agent，也需要千人千面的定制開發(fā)。整體來看，在中國沒有出現(xiàn)大型全球性軟件企業(yè)生態(tài)之前，中國本土 Agent 還是在沙灘上的樓閣。先做好軟件，再說軟件上的自動化。”總的來說，對國內(nèi)開發(fā)者和企業(yè)來說，從 App Stack 到 Agent Stack 的轉(zhuǎn)變，是一次前所未有的“彎道超車”的機會。

AI 技術(shù)的演進史，總在狂熱與反思的交織中螺旋上升。

兩年前，微軟投入數(shù)十億美元以及大量人力打造 Microsoft Copilot，宣稱它將成為“新一代的開始菜單”；與此同時，向量數(shù)據(jù)庫 Pinecone 一舉拿下 1 億美元融資，VC 們爭相下注，仿佛“新數(shù)據(jù)庫時代”已經(jīng)到來。

但現(xiàn)實很快潑下了一盆冷水。預(yù)裝在 15 億臺 Windows 設(shè)備中的 Copilot，其月活用戶量卻始終徘徊在 ChatGPT 的 5%，最終迫使微軟放棄 Copilot 鍵的唯一性，允許用戶將其恢復(fù)為傳統(tǒng)菜單鍵。而向量數(shù)據(jù)庫也在短短半年內(nèi)從“下一代數(shù)據(jù)庫”淪為通用功能模塊，初創(chuàng)公司估值迅速回落。

時間到了 2025 年，Agentic AI 站上新的風(fēng)口。回望 Copilot 和向量數(shù)據(jù)庫的發(fā)展，我們不禁要問：這一次，那些看似前景光明的技術(shù)，能否真正落地生根，擺脫曇花一現(xiàn)的命運，成為推動下一輪 AI 革命的關(guān)鍵引擎？

AICon 2025 強勢來襲，5 月上海站、6 月北京站，雙城聯(lián)動，全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合，匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票，一同探索 AI 應(yīng)用邊界！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.