作者 | Tina
Agent 正在成為 2025 年 AI 世界最炙手可熱的關(guān)鍵詞之一。
無論是大模型廠商、AI 初創(chuàng)公司,還是企業(yè)級應(yīng)用團隊,幾乎都在討論“多智能體協(xié)作”“自動化決策流程”以及“具備工具調(diào)用能力的 AI 系統(tǒng)”。
谷歌、英偉達等科技巨頭紛紛布局,上個月亞馬遜還成立了一個專注于 Agentic AI 的新部門,初創(chuàng)公司們也爭相推出各類“Agent”產(chǎn)品。開源社區(qū)也不甘示弱,從 LangGraph 到 Agent SDK、AutoGen、CrewAI,一波 Agent 框架競相登場,掀起了繼大模型之后的第二輪工具潮。
連大廠掌門人也開始在公開場合“互嗆”。
微軟 CEO Satya Nadella 高調(diào)宣稱:“我們所知的 SaaS 時代即將結(jié)束……Agent 將成為核心驅(qū)動力”。而 Salesforce CEO Marc Beinoff 則直接嘲諷微軟的 Copilot,稱其為“Clippy 2.0”:“根本不起作用,而且沒有任何準(zhǔn)確性”。Clippy(回形針)即 Office 虛擬助手,是微軟上世紀推出的基于規(guī)則的代理,為用戶吐槽最多的失敗設(shè)計之一。
言辭之鋒利,背后其實是對 Agentic AI 兩種截然不同落地路徑的分歧。
一條是微軟 Nadella 倡議的“面向全平臺的智能代理框架”路線。按照他們的設(shè)想,未來將出現(xiàn)一個 AI 操作系統(tǒng),能夠調(diào)度多個智能體,并且這些智能體可以在整個企業(yè)內(nèi)無縫地傳遞任務(wù)、消息和知識。
Nadella 認為,這是一場從“App Stack”到“Agent Stack”的根本性變革。過去,我們依賴前端 UI 驅(qū)動的應(yīng)用形態(tài),每一個業(yè)務(wù)場景都被拆分為獨立的 App,用戶通過操作完成任務(wù)。未來,主導(dǎo)者將是 Agent,它能感知用戶意圖,基于數(shù)據(jù)、模型和推理鏈條,完成決策和自動執(zhí)行。
在這種架構(gòu)轉(zhuǎn)變下,當(dāng)前的 SaaS 等應(yīng)用因為其本質(zhì)上是嵌入商業(yè)邏輯的數(shù)據(jù)庫,未來這些邏輯會被 Agent 接管,由 Agent 去做增刪改查,在多個數(shù)據(jù)庫之間工作,所有的邏輯都會轉(zhuǎn)移到 AI 層。而一旦 AI 層成為主導(dǎo),背后的數(shù)據(jù)庫最終也會開始被替代。
本質(zhì)上,這是微軟構(gòu)建通用人工智能代理體系、通過底層架構(gòu)向企業(yè)應(yīng)用生態(tài)滲透的戰(zhàn)略布局。正如數(shù)勢科技 AI 負責(zé)人李飛博士在分析中指出,微軟此舉旨在依托其既有生態(tài)系統(tǒng)優(yōu)勢,打造覆蓋全場景的 AI 接入平臺,形成對垂直領(lǐng)域應(yīng)用的聚合效應(yīng)。通過構(gòu)建人工智能交互的核心樞紐,微軟試圖確立其在產(chǎn)業(yè)智能化轉(zhuǎn)型中的頂層平臺地位,實現(xiàn)對各類專業(yè)化應(yīng)用的系統(tǒng)性整合。
大模型公司或云資源提供商大多支持這種“通用”入口性質(zhì)的路線。比如 OpenAI 就肯定傾向于 Nadella 的思路,因為在它看來,所有的 Agent 本質(zhì)上都是對其大模型能力的延伸和增強。對 OpenAI 來說,構(gòu)建通用 Agent 能將所有應(yīng)用集成在自己的能力框架之下,使其成為一個統(tǒng)一入口。類似的例子還有 Manus,以及 AutoGLM 沉思等。無論是微軟、OpenAI,還是 Manus、沉思,這背后體現(xiàn)的,依然是一場關(guān)于“誰來掌握 AI 入口權(quán)”的競爭。
與之相對,另一條路線則由 Salesforce 所代表。
Salesforce 的思路是從現(xiàn)有企業(yè)軟件棧出發(fā),強調(diào)以垂直領(lǐng)域(如 CRM)為根基,推動業(yè)務(wù)邏輯的 AI 原生重構(gòu)。他們不認為 AI 會“取代”現(xiàn)有 SaaS 應(yīng)用,而是主張 AI 和 SaaS 深度集成,將 Agent 機制嵌入業(yè)務(wù)流程中,通過業(yè)務(wù)數(shù)據(jù)和流程去驅(qū)動 Agent 的運行和決策。Agent 不是一個外部工具或統(tǒng)一入口,而只是整個流程當(dāng)中的一個節(jié)點。
相較于微軟自底而上的通用化策略,Salesforce 的設(shè)計思路是自頂向下,從實際的業(yè)務(wù)流程出發(fā),反向構(gòu)建 Agentic AI 能力,旨在復(fù)用并增強現(xiàn)有的各類 SaaS 應(yīng)用。
事實上,許多沒有龐大通用平臺基礎(chǔ)、專注于 ToB 軟件或垂直場景的企業(yè),可能會更傾向于 Salesforce 這種貼近業(yè)務(wù)、務(wù)實的路線。他們往往是先搭建好業(yè)務(wù)或工作流程,然后將 Agent 融入這些流程中,使其專注于解決特定垂直場景的問題。
哪種路徑更具可行性?
貼補丁式 Agentic,能落地但改不了舊系統(tǒng)的命
Salesforce 的 CEO 對微軟 Copilot 的攻擊頗為犀利,甚至直言這是“微軟的一場巨大災(zāi)難”。他公開表示,自己與多位微軟客戶交流后發(fā)現(xiàn),“他們并沒有發(fā)現(xiàn)自己因為這項 Copilot 技術(shù)而發(fā)生了改變,很多人幾乎沒怎么使用這個功能”。相比之下,Salesforce 則宣稱其平臺每周處理多達兩萬億筆企業(yè) AI 交易。
有意思的是,Salesforce 自家的平臺最初也叫 Einstein Copilot。更耐人尋味的是,在棄用“Copilot”這個名稱后,Benioff 便開始公開批評微軟的 Copilot 產(chǎn)品。并且 Salesforce 堅稱,從 Einstein Copilot 更名為 Agentforce,絕不僅僅是換了一個名字,而是其底層架構(gòu)也經(jīng)歷了重要的調(diào)整。
從 Salesforce 架構(gòu)師的公開演講 來看,Einstein Copilot 在與用戶進行交互時使用的是“Chain of Thought”(思維鏈)模式,而 Agentforce 的一個關(guān)鍵進展,就是用 React prompting 替代了效果不好的傳統(tǒng)的思維鏈。其次是引入 Topic 分類機制,解決 Copilot 在對話過程中難以將任務(wù)限定在某個特定的范圍內(nèi)的問題。然后是改進了 LLM 的響應(yīng)方式,Copilot 直接返回未經(jīng)處理的后端數(shù)據(jù),導(dǎo)致用戶難以理解,而 Agentforce 則會利用 LLM 對原始數(shù)據(jù)進行自然語言包裝,使其更易讀懂。最后是引入了主動觸發(fā)能力,與 Copilot 依賴用戶主動發(fā)起對話不同,Agentforce 希望實現(xiàn)基于特定數(shù)據(jù)庫操作的自動觸發(fā),無需用戶干預(yù)即可啟動 Agent 執(zhí)行任務(wù)。
可以說,早期的 Einstein Copilot 側(cè)重于通過對話觸發(fā)和調(diào)用預(yù)設(shè)的比如銷量預(yù)測等算法,實現(xiàn)人機協(xié)作。而 Agentforce 的目標(biāo)似乎是轉(zhuǎn)向更自主的任務(wù)執(zhí)行模式,用戶設(shè)定目標(biāo)后,系統(tǒng)能夠自主規(guī)劃并執(zhí)行工作流程,最終呈現(xiàn)結(jié)果。
因此,盡管 Salesforce 強調(diào)這是架構(gòu)的演進,但其核心仍然是提升 AI 在任務(wù)執(zhí)行中的自主性和智能化水平。
不僅如此,Beinoff 還評價微軟是“快速追隨者”,并稱:“他們肯定會像往常一樣想抄襲我們,向我們靠攏。但我們現(xiàn)在已經(jīng)有數(shù)千客戶在實際使用我們的產(chǎn)品。”
根據(jù)截至 3 月的最新數(shù)據(jù)顯示,雙方的 Agent 都有大規(guī)模的落地,Salesforce 宣稱擁有約 15 萬名客戶,微軟則表示已有 16 萬客戶,基于 Copilot 打造出了 40 萬個 Agent。
然而,白鯨開源 CEO 郭煒一針見血地指出,當(dāng)前微軟的 Agent 只是個人用戶輔助工具,和 Nadella 技術(shù)路線里要實現(xiàn)的最終理想,并不是同一個東西。
微軟對 Agentic AI 的設(shè)想是“OS”級別的變革。它構(gòu)想中的 AI 操作系統(tǒng)不僅要能夠調(diào)度多個智能體,還要持續(xù)保持上下文狀態(tài)、理解用戶意圖,并在多種數(shù)據(jù)源和系統(tǒng)能力之間進行協(xié)調(diào)。在這一架構(gòu)中,業(yè)務(wù)邏輯將由 Agent 全面接管,而“狀態(tài)管理器”(State Manager)被視為 AI 操作系統(tǒng)的核心組件——只有具備對用戶狀態(tài)的持續(xù)記憶,Agent 才能真正理解用戶是誰、在做什么、希望實現(xiàn)什么目標(biāo),類似于 AI 世界中的“內(nèi)存管理”。為此,微軟正在打通自身所有產(chǎn)品線,并與 OpenAI 這樣的企業(yè)合作,構(gòu)建一個開放的智能體生態(tài)平臺。
而 Salesforce 的 Agentforce,“它都不是行業(yè)智能體,只是 CRM 生態(tài)線的智能體。目前技術(shù)手段都實現(xiàn)了個高級版本 RPA/ 按鍵精靈,只不過通過大語言模型交互可以自動做一些分拆動作,做一些組合罷了。和當(dāng)年移動互聯(lián)網(wǎng)出來時候的塞班操作系統(tǒng)一樣,屬于早期‘嬰兒’版本的 Agentic AI。”
當(dāng)前 Salesforce 模式雖能被快速推廣落地,但是這件事情的門檻也不高,很多創(chuàng)業(yè)公司都可以做到類似的事情,大公司就更不用說了。
這些做法本質(zhì)上仍停留在對原有軟件和交互流程的增強層面,就像當(dāng)年微軟試圖將 Windows 系統(tǒng)移植到手機上一樣——看似容易實現(xiàn),但并不是最優(yōu)解。真正開啟移動互聯(lián)網(wǎng)時代的,是 iPhone 和 iOS 的誕生,它們從底層重新定義了系統(tǒng)與用戶之間的交互邏輯。
正因如此,Nadella 才會提出“所有軟件和 SaaS 都將被重構(gòu)”的觀點,因為他預(yù)見到了 Agentic AI 時代的來臨。如果我們只是把 Agent 嵌入到現(xiàn)有軟件中去打補丁,就像是把 Windows 裝在手機上——表面上可行,但遠未觸及這場變革的真正核心。
真正的 Agentic AI 將倒逼整個技術(shù)體系重建
短期來看,復(fù)用現(xiàn)有 SaaS API 或許是 Agentic AI 實現(xiàn)功能落地的捷徑,對現(xiàn)有流程體系的沖擊也相對較小。然而,從長期視角出發(fā),Nadella 所代表的觀點顯然更具顛覆性:大模型和 Agent 的到來會徹底重塑整個軟件和 SaaS 生態(tài)。
郭煒認為,甚至 Nadella 所描述的“代理程序在多個數(shù)據(jù)庫之間工作”的設(shè)想,還不夠 Agentic AI。因為在這一新范式下,整體的技術(shù)框架都會要被重新設(shè)計。傳統(tǒng)數(shù)據(jù)庫的設(shè)計初衷,是為了服務(wù)于“人類決策”的時代。從數(shù)據(jù)庫到數(shù)據(jù)倉庫,所有的設(shè)計都是上個世紀,為了輔助人類做決策、完成信息記錄而構(gòu)建的。于是我們看到了復(fù)雜的 CRUD 操作、DAO 層、數(shù)據(jù)庫層、數(shù)據(jù)倉庫層以及 ETL 流程,它們共同支撐起了人與數(shù)據(jù)之間的交互邏輯。
然而,在 Agent 成為主要用戶的背景下,這些為“人類使用”而生的復(fù)雜數(shù)據(jù)處理體系是否仍然必要,正面臨質(zhì)疑。未來的存儲不一定是數(shù)據(jù)庫形式了,使用的方式也必然不是 SQL 了。
順著 Satya 的邏輯推演,被重塑的不只是 SaaS,更是整個技術(shù)架構(gòu)生態(tài)。數(shù)據(jù)庫技術(shù),甚至是基礎(chǔ)理論會被倒逼升級,傳統(tǒng)的 No-SQL,New-SQL 都不適用于未來 Agentic AI 的場景。就像從軟件工程學(xué)角度來看,所有的軟件設(shè)計都是從 Use Case(UML)圖開始設(shè)計的,而 User 都變了,憑什么底層的技術(shù)還是原來的技術(shù)體系呢?
AWS Agentic AI 主任科學(xué)家章毅也贊同整個技術(shù)架構(gòu)生態(tài)體系會被重構(gòu),他進一步指出,當(dāng)前 Agent 利用 API 調(diào)用已有的數(shù)據(jù)庫系統(tǒng)進行知識查詢和整合(典型 RAG 架構(gòu))能夠覆蓋一些基本的業(yè)務(wù)邏輯,但是知識、信息碎片化(以不同模態(tài)和格式存儲于多個數(shù)據(jù)庫中)對 AI Agent 高效搜索、鏈接、歸納、提煉、使用與更新信息帶來很大的困難。這必然會帶動對數(shù)據(jù)存儲、管理系統(tǒng)進行重新思考和設(shè)計。
而且,作為 AI 操作系統(tǒng)的核心的記憶層“能否實現(xiàn)”也是未知數(shù)。
Salesforce 的 Agentforce 架構(gòu)在預(yù)設(shè)的業(yè)務(wù)流程中,Agent 可以有效地訪問和利用先前操作產(chǎn)生的數(shù)據(jù)和狀態(tài)信息,形成一種上下文記憶。但一旦進入微軟所設(shè)想的跨系統(tǒng)、跨復(fù)雜場景環(huán)境,Agent 就沒有一個穩(wěn)定的獲取記憶的依托點,出錯概率顯著增加,顯然比 Salesforce 這種嵌入式設(shè)計的難度系數(shù)大。
微軟設(shè)想的“AI 操作系統(tǒng)”中,狀態(tài)管理的關(guān)鍵在于讓 AI 能夠跨不同的應(yīng)用和設(shè)備記住信息,并需要有一種結(jié)合短期交互與長期語義記憶的機制。這實際上是將來 Agentic AI 時代替代數(shù)據(jù)庫地位的關(guān)鍵組件,然而在實際架構(gòu)層面,挑戰(zhàn)遠超預(yù)期。也有觀點認為這并不是一個簡單的“狀態(tài)管理”,而是是在云端為每個用戶構(gòu)建一個“虛擬人生”——系統(tǒng)需要持續(xù)記錄用戶的行為、偏好與選擇,形成大模型的短期記憶和長期語義。問題在于,這種能力無法用向量將它描述清楚,并且目前還不知道可以用什么技術(shù)實現(xiàn)。
可以說,微軟的 Agentic AI 代表了一種技術(shù)理想主義。
雖然很多廠商在嘗試,但這個模式整體還太早,大模型和 Agent 本身都還沒有進化完全。當(dāng)前階段,更現(xiàn)實的路徑是 Salesforce 式 Agent,其類 RPA 的特性使其更容易被企業(yè)接受。畢竟,在當(dāng)下,企業(yè)更愿意為確定性買單。
但長期來看,傳統(tǒng)企業(yè)軟件終會被取代,因為軟件只不過是規(guī)范流程,信息傳遞,實現(xiàn)多人協(xié)同的一種方式,如果有更先進的更高效的管理和交流模式,舊有模式一定會替換。今天的企業(yè)軟件形態(tài)必然會被顛覆,這正如固定電話被移動設(shè)備取代、再被微信等應(yīng)用徹底重構(gòu)通訊方式一樣。Agentic AI 時代會是一個和移動互聯(lián)網(wǎng)一樣的全新的時代。
不過,這需要的是一次自底向上全套生態(tài)的改變,挑戰(zhàn)不亞于當(dāng)年的“云原生”轉(zhuǎn)型,甚至更甚。這種全模式的創(chuàng)新,或許只有在底層信息科學(xué)取得突破之后,才有真正實現(xiàn)的可能。
“MoE”是個折中選擇
微軟式的通用 Agent 路線,聽起來誘人,但在現(xiàn)實中目前還行不通。而在大模型的最新演進中,已經(jīng)出現(xiàn)越來越多轉(zhuǎn)向 Mixture of experts(MoE)架構(gòu)的趨勢。
MoE 背后的理念正是將任務(wù)拆分給更擅長的“專家”,而不是試圖構(gòu)建一個無所不能的模型。
如果在大模型里大家能接受 MoE 的思想,那么,同樣的道理,在實現(xiàn) Agent 的時候,也一樣可以采用這種方式:不是打造一個“超級大腦”,而是強調(diào)分工協(xié)作、各盡其職。
而且,當(dāng)前現(xiàn)實來看,因為 Agent 能力太弱,還是多個專科 Agent 來做比較合適,例如 Salesforce 的 Agent、SAP 的 Agent 等等。
就算未來的 Agent 即使是基于一個“超級大腦”的路線,這個“大腦”中也必然存在多個并行的、具有不同專屬能力的組件,而不是靠一個模型包打天下。事實上,哪怕使用少數(shù)甚至是同一個基礎(chǔ)模型,構(gòu)建多個專家 Agent 并通過高效協(xié)同完成復(fù)雜任務(wù),無疑是一個有效的設(shè)計范式,是同大模型能力提升演化協(xié)同共進、互補互助的方法。
更重要的是,所謂“通用”與“垂直”的兩條路線,從產(chǎn)業(yè)實踐來看,并非互斥,而是根據(jù)不同企業(yè)的戰(zhàn)略優(yōu)勢進行差異化布局。微軟聚焦平臺型能力,將 Agent 集中于 Copilot 品牌下統(tǒng)一推進,同時也不放棄在 Microsoft 365 等具體場景中的垂直落地。Salesforce 以 SaaS 為核心,在 CRM 等場景深耕垂直 Agent,同時借助 Agentforce 等平臺工具,向多云生態(tài)拓展。平臺化和垂直場景的結(jié)合,正成為行業(yè)主流趨勢。
打平臺牌需要非常大量的固有成本。對于中小企業(yè)而言、迅速找到垂直 Agent 應(yīng)用并落地,會是更重要的當(dāng)務(wù)之急。
從“能不能做”到“做得成、做得起”
回顧 Agentic AI 近兩年多的發(fā)展,我們看到,行業(yè)正經(jīng)歷著從對大語言模型的初步探索,到逐步賦予其感知、理解和行動能力的關(guān)鍵階段。
從最初直接依賴 LLM 進行信息處理,逐步演進到利用檢索增強生成(RAG)技術(shù)來擴展其知識覆蓋范圍。隨后,多模態(tài)模型的出現(xiàn)使其能夠處理更豐富的輸入和輸出形式。
緊接著,行業(yè)進入了“Agentic 對話”階段,核心在于賦予模型執(zhí)行動作的能力,使其不再僅僅是內(nèi)容生成工具。為模型添加可執(zhí)行功能被視為一個重要的里程碑。
關(guān)于 Agentic AI 最早的雛形,存在兩種主要觀點:一種認為是 OpenAI 推出的“Function Call”功能,它使得大模型能夠根據(jù)需求調(diào)用外部函數(shù)。另一種觀點則認為,真正的更早出現(xiàn)的 AutoGPT,因為 Function Call 并不是一個完整的鏈路。AutoGPT 是在 OpenAI 的 ChatGPT (GPT-3.5) 發(fā)布后,由 Toran Bruce Richards(蘇格蘭愛丁堡人工智能公司 Significant Gravitas Ltd. 的創(chuàng)始人兼首席開發(fā)者)在 2023 年 3 月份創(chuàng)建的演示項目,展示了如何利用大型模型實現(xiàn)任務(wù)的自動分解和執(zhí)行。
此后,Agent 的完整生態(tài)閉環(huán)首次被較為系統(tǒng)地提出,這要歸功于 OpenAI 研究員 Lilian Weng 在 X(原 Twitter)上分享的 Agent 工作流程文章,清晰地描繪了包括“目標(biāo)規(guī)劃、工具調(diào)用、執(zhí)行、結(jié)果反思”等關(guān)鍵環(huán)節(jié),被認為是 Agent 架構(gòu)逐步演進的重要起點。受此啟發(fā),業(yè)界圍繞 AI Agent 展開了大量的探索與實踐,并逐漸形成了更為系統(tǒng)化的工程方法。
數(shù)勢科技的 Agent 系統(tǒng)演進,也反映了 Agent 技術(shù)自身的發(fā)展歷程。其系統(tǒng)經(jīng)歷了從 1.0 到 3.0 的迭代:初期的 1.0 階段,主要實現(xiàn)了單個 Agent 對數(shù)據(jù)工具的調(diào)用。進入 2.0 階段,系統(tǒng)引入了與環(huán)境交互的反饋機制,并強化了自我反思與迭代能力。發(fā)展到 3.0 階段,則根據(jù)用戶需求,從單 Agent 升級為多 Agent 協(xié)作機制,以覆蓋更廣泛的場景和角色。
Agentic AI 還有哪些挑戰(zhàn)?
當(dāng)前,Agentic AI 系統(tǒng)構(gòu)建中,任務(wù)編排依然是極具挑戰(zhàn)的技術(shù)難題。
相較于 Salesforce 等平臺采用的預(yù)定義工作流模式(其泛化性受限),微軟提出了通過 AI 實時理解規(guī)則并動態(tài)生成編排規(guī)則,進而連接現(xiàn)有 API 的設(shè)想。但真正落地時,問題遠比想象中復(fù)雜。
當(dāng)業(yè)務(wù)流程僅涉及少量節(jié)點時,編排復(fù)雜度尚在可控范圍內(nèi)。然而當(dāng)節(jié)點數(shù)量增長至 10 個、20 個甚至 100 個量級,且涉及多系統(tǒng)、API 和工具的協(xié)同工作時,確定正確的線性執(zhí)行順序(如 ABCDEFG... 或 ACBDEFG...)將面臨組合爆炸問題——100 個節(jié)點的全排列組合達 100! 種。每新增一個節(jié)點,系統(tǒng)復(fù)雜度將以階乘級數(shù)倍增,這種非線性增長特性使得大規(guī)模編排系統(tǒng)極易產(chǎn)生級聯(lián)錯誤。正如李飛博士指出的:“當(dāng)編排網(wǎng)絡(luò)中出現(xiàn)單個節(jié)點順序錯位時,整個拓撲結(jié)構(gòu)的執(zhí)行邏輯都將發(fā)生系統(tǒng)性偏差。”
基于實際構(gòu)建 Agent 的經(jīng)驗,合理的工作流編排是核心難點。一旦工作流得以確定,后續(xù) API 的輸入輸出參數(shù)便相對固定。因此,能否實現(xiàn)準(zhǔn)確高效的工作流編排,直接關(guān)乎 Agentic AI 系統(tǒng)的可靠性。
盡管如此,Agentic AI 根本性的進步仍然依賴于底層大模型能力的提升。“大模型基座本身有錯誤率,Agent 和軟件其實是在給大模型的錯誤率或者幻覺去做兜底的。”因此無論上層應(yīng)用多么創(chuàng)新,如果底層模型能力沒有顯著進步,系統(tǒng)所能解決的問題依然有限。
如今的大模型在各種基準(zhǔn)測試中表現(xiàn)越來越好,但要真正實現(xiàn)具備自主性的 Agent 系統(tǒng),還存在不小的挑戰(zhàn)。Google首席科學(xué)家 Jeff Dean 剛好在 4 月底的一次演講中透露了目前大模型實際能力:當(dāng)前模型大致能以 60% 到 70% 的準(zhǔn)確率,完成三到五步的小任務(wù),能在有限范圍內(nèi)調(diào)用工具處理一些簡單請求。但真正理想的智能體,應(yīng)當(dāng)能夠面對模糊而復(fù)雜的目標(biāo),自主拆解并完成上千個步驟,完成相當(dāng)于一個月人類工作量的任務(wù),且準(zhǔn)確率達到 95%。
從現(xiàn)在的能力到這一目標(biāo)之間,仍有巨大差距。這一演進過程可能會經(jīng)歷多個階段——從勝任 3~5 步的任務(wù),提升到能夠穩(wěn)定完成 10 步以上的流程,最終邁向真正具備規(guī)劃、執(zhí)行、反饋能力的智能體系統(tǒng)。
章毅則進一步指出,目前的前沿大模型中能夠全面達到打造具有高智能、高自主性 Agent 要求的選擇并不多、甚至可以說非常少。
即便是在大模型服務(wù)平臺如 AWS Bedrock 提供了多個主流模型(如 Claude、LLaMA、Amazon Nova、Mistral Mixtral 等等)供開發(fā)者選擇的背景下,真正能夠滿足構(gòu)造 Agent 能力要求的模型還是主要局限于 Anthropic Claude 的幾個最新版本(Sonnet 3.5/3.7 或者 Haiku 3.0/3.5)。
從短期落地的可行性角度看,聚焦一個或少數(shù)幾個前沿大模型會得到比較好的投資回報率。
“每次對話 2 美元”
“節(jié)省數(shù)百萬美元”“一半客服被 AI 替代”——這類故事,已經(jīng)成為 AI 圈標(biāo)配的營銷劇本。Salesforce 和微軟正是靠這樣的案例,推廣他們的智能 Agent 系統(tǒng)。
這些故事構(gòu)建了一個極具吸引力的愿景:AI 代理系統(tǒng)不僅能顯著提升效率,還能直接壓縮運營成本,甚至重塑組織結(jié)構(gòu)。但真正落地到企業(yè)環(huán)境中,很多人才發(fā)現(xiàn),這場變革的代價遠比想象中高。
以 Salesforce 的 Agentforce 為例,其官網(wǎng)宣傳“每次對話 2 美元起”。但在實際合同中,超出 1000 次免費額度的部分,會按每次 2.50 美元收費。也就是說,雖然預(yù)購有折扣,但一旦使用超額,就需要按每次 2.50 美元支付。相比微軟 Copilot 那種更強調(diào)“按有效消息計費、結(jié)果導(dǎo)向” 的模式,Salesforce 更像是“按次數(shù)定額收錢”,不管任務(wù)是否真正成功完成。
如果按當(dāng)前國內(nèi)大模型的標(biāo)準(zhǔn)報價(如 0.0008 元 / 千 token)折算,這“每次 2 美元”的對話,意味著系統(tǒng)可能要消耗接近 1800 萬 token。這不僅意味著成本高昂,也從側(cè)面反映出任務(wù)流程可能執(zhí)行起來極其復(fù)雜。一旦規(guī)模化使用,成本壓力會驟然放大:以一家中型企業(yè)為例,1000 名員工、每人每天調(diào)用 10 次,每天光軟件費就超過 2 萬美元,月支出高達 60 萬美元。有從業(yè)者直言:“比傳統(tǒng)軟件貴多了。”
對于像 Dow 這樣有能力重構(gòu)系統(tǒng)流程的大企業(yè)而言,AI Agent 可能真能創(chuàng)造“幾百萬美元的節(jié)省”;但對大多數(shù)公司來說,這種奇跡并不容易復(fù)刻。節(jié)省成本的路徑,遠比那些營銷故事復(fù)雜。
這也引出了一個更現(xiàn)實的問題:企業(yè)到底該怎么上 Agent?
你的企業(yè)該怎么上 Agent?
對大多數(shù)企業(yè)來說,“要不要上 Agent”其實早就不是問題了。一旦基礎(chǔ)系統(tǒng)和生態(tài)完備,未來 Agentic AI 就像移動互聯(lián)網(wǎng)一樣蓬勃發(fā)展。技術(shù)領(lǐng)袖的共識也正在浮現(xiàn):AWS 等云廠商認為 AI Agent 將會重新定義云服務(wù)的未來,明確將 Agent 定位為“下一代基礎(chǔ)設(shè)施”,提供模型托管、推理算力以及致力開發(fā)針對 AI Agent 的可重用組件和功能模塊。
但越是全行業(yè)熱捧的趨勢,越需要冷靜評估其落地的現(xiàn)實條件。
“不是十倍提效,就不值得上。”技術(shù)部署要看“性價比”。李飛直言:“如果不是十倍時效,這個場景的意義其實不大”。也就是說,如果原來 20 小時能完成一個任務(wù),現(xiàn)在 Agent 縮短到 10 小時,效率雖提升了一倍,但不足以支撐 AI Agent 高昂的部署成本,其實企業(yè)很可能不買賬。特別是在企業(yè)端,Agent 本質(zhì)上是對業(yè)務(wù)流程的自動編排,必須依賴業(yè)務(wù)與技術(shù)的深度協(xié)同:業(yè)務(wù)人員提供流程知識,技術(shù)人員將這種 Know-how 嵌入 Agent 開發(fā)中,才能讓 Agent 真正融入企業(yè)工作流。
“通用 Agent,不適合企業(yè)。”目前一些企業(yè)已經(jīng)準(zhǔn)備好了部署 Agent,但“通用 Agent”更適合 C 端用戶。因為 C 端的容錯性更高,“這個任務(wù)不行就換下一個”,但企業(yè)不能容忍任務(wù)中斷或出錯,一旦流程關(guān)鍵環(huán)節(jié)失敗,就可能影響整個業(yè)務(wù)判斷。“在企業(yè)當(dāng)中,大部分工作都是嚴謹?shù)模氵@個任務(wù)給我執(zhí)行錯了或者執(zhí)行不出來,我就認為你這個軟件不行。”
因此,企業(yè)更傾向從垂直場景做起,把 Agent 深度嵌入到已有業(yè)務(wù)流程中,通過產(chǎn)品設(shè)計和流程兜底,把錯誤率降到最低,才能真正達成企業(yè)級可用。“垂直 Agent 在今年其實已經(jīng)準(zhǔn)備好了采購”,但不同領(lǐng)域成熟度差異較大,最終落地效果也存在顯著差異。同時還應(yīng)優(yōu)先選擇容錯性相對較高的任務(wù)切入,比如在“研報分析”這類允許人工校驗和干預(yù)的內(nèi)容生成任務(wù),避免一上來就部署端到端決策系統(tǒng),“Human-in-the-loop”機制可以顯著降低幻覺和錯誤的風(fēng)險。
“不要急著全部用 Agent。”“現(xiàn)在的 Agent 就像當(dāng)年的 Windows Phone。”郭煒給出了一個務(wù)實的策略:不要過早的迷信于現(xiàn)在的 agent,先采用 RPA+Agent 模式來實現(xiàn)企業(yè)內(nèi)部流程自動化,等待外部技術(shù)條件成熟(10 年 +),在開始考慮公司全面 Agent 化。
“不執(zhí)著于單一的架構(gòu)范式。”在全球范圍內(nèi),亞馬遜是最早系統(tǒng)化推動 Agentic AI 的企業(yè)之一。從 Alexa 的智能化重構(gòu)、“Buy for Me” 融入購物體驗,到 Amazon Q 面向開發(fā)者的代碼助理,再到電商目錄處理、合規(guī)審核,或者服務(wù)于公司員工的 HR 信息系統(tǒng),Agent 技術(shù)已在其多個業(yè)務(wù)線并行推進。從這些項目中,可以看到亞馬遜“全面擁抱 AI agent 技術(shù)的明顯趨勢”。正如章毅所說:“公司各個業(yè)務(wù)部門都非常重視 AI Agent 可能帶來的機遇和挑戰(zhàn),所以有各類并行的、針對不同應(yīng)用場景的嘗試。”
值得一提的是,亞馬遜對 Agent 架構(gòu)持開放態(tài)度,并不執(zhí)著于單一標(biāo)準(zhǔn)化框架。AI agent 作為一個新興的領(lǐng)域,技術(shù)架構(gòu)仍然有很大的不穩(wěn)定、不確定性,新生框架鱗次櫛比。有的框架誕生不到六個月,時間長的也不過只有兩年多。在它們成熟、演化、歸一的過程中,亞馬遜會對這些框架靈活應(yīng)用。
“Agent 是個日新月異的領(lǐng)域,保持靈活性而不迷信某一種架構(gòu),將會是更務(wù)實的做法。”對于正處于數(shù)字化轉(zhuǎn)型關(guān)鍵階段的企業(yè),建議從具體場景出發(fā),快速構(gòu)建 Agent 原型并驗證可行性。他提醒,盡管開發(fā)門檻已降低,但有效的評測機制仍是選型與演進的關(guān)鍵。
相比之下,中國企業(yè)在 Agentic AI 落地上正面臨不同的挑戰(zhàn)與機會。
從落地模式來看,郭煒認為目前大多數(shù)中國企業(yè)更傾向于 Salesforce 式的“融合”路徑,而非微軟式的“重構(gòu)”:“我個人希望中國可以像新能源車一樣,在 Agentic AI 上通過重構(gòu)實現(xiàn)彎道超車,顛覆傳統(tǒng)軟件。但是當(dāng)前仍缺少一些基礎(chǔ)信息學(xué)理論的突破,因此融合模式更現(xiàn)實,也更容易落地。”
不過,中國軟件市場定制化需求多,因此生態(tài)不如海外 SaaS 軟件標(biāo)準(zhǔn),“哪怕是用 Salesforce 模式做的 Agent,也需要千人千面的定制開發(fā)。整體來看,在中國沒有出現(xiàn)大型全球性軟件企業(yè)生態(tài)之前,中國本土 Agent 還是在沙灘上的樓閣。先做好軟件,再說軟件上的自動化。”總的來說,對國內(nèi)開發(fā)者和企業(yè)來說,從 App Stack 到 Agent Stack 的轉(zhuǎn)變,是一次前所未有的“彎道超車”的機會。
AI 技術(shù)的演進史,總在狂熱與反思的交織中螺旋上升。
兩年前,微軟投入數(shù)十億美元以及大量人力打造 Microsoft Copilot,宣稱它將成為“新一代的開始菜單”;與此同時,向量數(shù)據(jù)庫 Pinecone 一舉拿下 1 億美元融資,VC 們爭相下注,仿佛“新數(shù)據(jù)庫時代”已經(jīng)到來。
但現(xiàn)實很快潑下了一盆冷水。預(yù)裝在 15 億臺 Windows 設(shè)備中的 Copilot,其月活用戶量卻始終徘徊在 ChatGPT 的 5%,最終迫使微軟放棄 Copilot 鍵的唯一性,允許用戶將其恢復(fù)為傳統(tǒng)菜單鍵。而向量數(shù)據(jù)庫也在短短半年內(nèi)從“下一代數(shù)據(jù)庫”淪為通用功能模塊,初創(chuàng)公司估值迅速回落。
時間到了 2025 年,Agentic AI 站上新的風(fēng)口。回望 Copilot 和向量數(shù)據(jù)庫的發(fā)展,我們不禁要問:這一次,那些看似前景光明的技術(shù),能否真正落地生根,擺脫曇花一現(xiàn)的命運,成為推動下一輪 AI 革命的關(guān)鍵引擎?
AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯(lián)動,全覽 AI 技術(shù)前沿和行業(yè)落地。大會聚焦技術(shù)與應(yīng)用深度融合,匯聚 AI Agent、多模態(tài)、場景應(yīng)用、大模型架構(gòu)創(chuàng)新、智能數(shù)據(jù)基建、AI 產(chǎn)品設(shè)計和出海策略等話題。即刻掃碼購票,一同探索 AI 應(yīng)用邊界!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.