“2025年將是AI智能體突破年”、“2025年是AI智能體爆發的元年”、“2025年是邁向智能體的關鍵一年”。包括百度創始人李彥宏、OpenAI CEO山姆·阿特爾曼、AlphaGo之父戴密斯·哈薩比斯等一連串業界大咖都認為,智能體(Agent)會是今年AI圈無可爭議的主角。
眼看智能體要火,業者自然是一擁而上。然而此前曾預測到2028年15%的日常工作決策將由智能體自主完成的信息技術研究機構Gartner,如今卻給火熱的智能體創業潑了盆冷水。根據他們的預測,到2027年末,或有超過40%的智能體項目將因成本不斷攀升、商業價值不明確或風險控制不足而被取消。
Gartner高級研究總監Anushree Verma表示,“目前大多數智能體乃至代理式人工智能項目,仍處于早期實驗或概念驗證階段,這些項目大多受炒作驅動、且常被誤用。這可能使得企業忽視大規模部署智能體的實際成本與復雜性,從而導致項目無法進入生產階段,因此企業應避免輕信此類炒作,并就如何使用這項新興技術做出謹慎的戰略決策。”
其實也不怪Gartner這時候站出來唱衰,因為當下的智能體生態確實已經呈現出非理性繁榮。早在2023年,智能體這一概念就開始被比爾·蓋茨等大佬推崇。因為相比ChatGPT、豆包、文小言等“聊天AI”,智能體屬于“干活AI”,它們能夠拆解任務、調用工具、并最終交付成果,其核心是將AI從提供答案,進化為能夠在真實場景里更緊密結合業務的生產力工具。
但當時的智能體還缺乏足夠的工具,開發者就必須自行“造輪子”。進入2025年之后,隨著為AI模型與外部工具和服務之間的交互提供標準化接口的MCP(模型上下文協議)被業界廣泛認可,“長出雙手”的智能體也終于有了實用性,由此使得其迎來了一次“寒武紀生命大爆發”。
有了MCP的存在,再加上AI廠商的內卷,如今開發一款智能體的門檻幾乎為零,哪怕是不懂編程的人也能輕松搭建出智能體。只是這種模式下誕生的智能體,只有在消費級市場實現“圖一樂”的能力,因為這些產品其實是“AI套殼智能體”,難以滿足企業用戶對于真實業務場景里,緊密結合數據、工程為生產環節動態調優的需求。
為什么說市面上相當多的智能體是“AI套殼智能體”呢?這是因為智能體真正的技術難點是在落地執行和流程復用上。拆解任務、規劃完成路徑其實毫無技術難度,因為這一部分工作實際上是基座大模型來完成的。以搭建一套企業OA系統為例,即便是普通人通過簡單的提示詞,也能獲得一套步驟清晰的規劃書。
問題是,如何將紙面上的規劃變成現實。在任務執行過程中一旦出現異常,或是遇到與預設不符的界面元素,大部分智能體常常出現的情況是直接“卡殼”,向用戶彈窗報錯、并終止任務。因為這類“AI套殼智能體”在具體的執行環節使用的依然是RPA(機器人流程自動化),而后者則是由程序員提前設計好的自動化任務動作列表、或者說“行為樹”。
作為一個廣泛應用于企業級市場的技術,RPA的優勢就在于能高效實現監視、跟蹤和控制業務的流程執行,但它主要是基于預設規則和流程運行,所以對于需要靈活處理和即興應變的復雜情境無法勝任。
“AI套殼智能體”使用RPA屬于投機取巧,是將企業的實際生產環境理想化,無視了任務過程中可能出現的一切意外因素。而真正的智能體則是根據任務需求臨時性調用需要的外部工具,并對執行中的問題進行分析,來重新制定新的規劃流程。
除了完成復雜任務的能力,穩定同樣也是目前智能體的一大痛點。由于“AI幻覺”的存在,AI大模型會出現小概率給出完全偏離用戶指令的規劃。由于“AI套殼智能體”是先用AI規劃流程,再讓RPA去執行,所以當它們被命令再次完成同樣的任務時,也會按照“先AI、再RPA”的順序重新執行。
如此一來,在面對相同任務時,“AI套殼智能體”可能就會給出截然不同的任務規劃,大幅增加了任務執行的不穩定性。同時再次調用AI也會消耗大量token、并占用業務資源,讓本來希望使用智能體降本增效的企業反而花費更多的代價。然而真正的智能體產品是可以進化的,也能將特定的任務流程固化為能力。
其實當下的智能體生態繁榮,頗有種兩年前“百模大戰”的既視感,真正有技術、有能力的廠商與蹭熱度的企業魚龍混雜。一如2023年興起的“百模大戰”在2025年春季被DeepSeek、Qwen等開源大模型終結,所以2025年爆發的智能體在2027年迎來洗牌,也在情理之中。
【本文圖片來自網絡】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.