論文作者包括來自上海交通大學的楊瀅軒、柴化燦、宋源祎、齊思遠、溫睦寧、李寧、廖俊威、胡浩毅、林江浩、劉衛文、溫穎、俞勇、張偉楠,以及 ANP 社區發起人常高偉。
隨著大語言模型 (LLM) 技術的迅猛發展,基于 LLM 的智能智能體在客戶服務、內容創作、數據分析甚至醫療輔助等多個行業領域得到廣泛應用。然而,不同智能體系統間的碎片化通信標準已成為制約其進一步發展的瓶頸。上海交通大學團隊與 ANP 社區合作推出了首個全面系統的 AI 智能體協議綜述《A Survey of AI Agent Protocols》,為解決這一關鍵挑戰提供了清晰的指導框架。
- ArXiv 論文鏈接:https://arxiv.org/abs/2504.16736
- Github 倉庫地址:https://github.com/zoe-yyx/Awesome-AIAgent-Protocol
交互碎片化:阻礙智能智能體發展的關鍵瓶頸
正如早期互聯網面臨的通信標準分散問題,當前的智能智能體生態系統同樣遭遇協議不統一的困境。研究團隊指出,隨著應用場景擴展和不同供應商、不同結構的智能體涌現,智能體與實體之間的交互規則變得越來越復雜。這種協議標準化缺失的問題體現在兩個方面:一方面,它阻礙了智能體與外部工具和數據源的互操作性;另一方面,它限制了不同提供商或架構背景的智能體之間的無縫協作,從而限制了智能體網絡的可擴展性,最終制約了智能智能體解決復雜實際問題的能力。
首創二維分類框架,清晰梳理智能體協議生態
論文創新性地提出了一個二維分類體系,將現有智能體協議分類為:
1. 對象導向維度:
- 上下文導向協議:專注于智能體與外部工具 / 數據源的通信,如 Anthropic 的 MCP 協議
- 智能體間協議:關注多個智能體之間的通信與協作,如 ANP、A2A 協議
2. 應用場景維度:
- 通用目的協議:適用于廣泛場景的通用協議
- 領域特定協議:針對特定場景優化的專用協議,如 LOKA 用于人機交互,CrowdES 用于機器人智能體交互
這一分類法涵蓋了主流協議,包括 Anthropic 的 MCP、Google 的 A2A、ANP 社區的 ANP、NEAR 基金會的 AITP、Eclipse 基金會的 LMOS 等十余種協議。詳細分類表格中,論文還對每種協議的提出者、應用場景、關鍵技術和開發階段進行了全面梳理,為開發者選擇合適協議提供了清晰指引。
七大維度多角度評估,全面對比協議性能
研究團隊從以下七個關鍵維度對各類協議進行了全面評估:
1.效率:評估延遲、吞吐量和資源利用率,包括大語言模型智能體特有的 token 消耗成本
2.可擴展性:衡量節點擴展性、鏈接擴展性和能力協商機制,提出了「能力協商得分」(CNS) 評估指標
3.安全性:分析認證模式多樣性、角色 / 訪問控制粒度和上下文脫敏機制
4.可靠性:檢驗包重傳、流量控制和持久連接機制,引入「自動重試計數」(ARC) 等評估指標
5.可擴展性:評估向后兼容性、靈活適應性和定制擴展能力
6.可操作性:測量協議棧代碼量、部署配置復雜度和可觀測性
7.互操作性:分析跨系統、跨瀏覽器、跨網絡和跨平臺適應性
論文特別強調,理想的智能體協議應平衡低延遲通信、資源消耗和任務完成速度,同時適應多智能體系統的復雜性。研究還通過 MCP 從 v1.0 到 v1.2 的迭代演進案例,以及從 MCP 到 ANP 再到 A2A 的協議系統演化案例,展示了智能體協議在功能、性能和安全性方面的多維度權衡。
真實案例解析:
四大協議在旅行規劃中的應用對比
論文通過一個「策劃北京到紐約的五日旅行」的真實用例,論文生動展示了四種不同協議架構的實際應用差異:
1.MCP(單一智能體調用工具):集中式架構,單一 MCP Travel Client 通過 Client-Server 結構依次調用 Flight Server、Hotel Server 和 Weather Server 等工具,所有通信必須經過中央智能體
2.A2A(多智能體復雜協作):分布式架構,將智能分散到多個專業智能體,如 Flight Agent、Hotel Agent 和 Weather Agent,智能體間可直接通信,A2A Travel Planner 作為非中心協調器主要收集最終結果
3.ANP(跨域智能體通信):跨域架構,通過標準化的跨域交互促進獨立智能體間協作,明確劃分航空公司、酒店和天氣網站等不同組織邊界,實現基于協議的跨域請求和響應
4.Agora(自然語言到協議生成):用戶中心架構,將自然語言請求直接轉換為標準化協議,引入三階段處理過程(自然語言理解、協議生成、協議分發),使專業智能體專注于核心能力
這一案例分析幫助開發者根據實際需求(智能體自主性、通信靈活性、接口標準化和任務復雜性)選擇最適合的協議方案。
未來展望
論文對智能體協議的發展前景進行了短期、中期和長期預測:
短期展望:從靜態到可進化
- 評估與基準測試:開發統一的評估框架,超越任務成功率,納入通信效率、環境變化適應性等方面
- 隱私保護協議:探索允許智能體交換信息同時最小化內部狀態或個人數據暴露的協議
- 智能體網格協議:開發受人類群聊啟發的通信模型,實現智能體組內通信透明度和共享訪問
- 可進化協議:將協議視為智能體自適應能力的動態、模塊化和可學習組件
中期展望:從規則到生態系統
- 內置協議知識:通過訓練將協議內容和結構集成到大語言模型參數中,實現無需明確提示的協議兼容行為
- 分層協議架構:借鑒經典網絡協議設計,將低級傳輸和同步機制與高級語義和任務相關交互分離,改善異構智能體間的模塊化和可擴展性
長期展望:從協議到智能基礎設施
- 集體智能與擴展定律:探索大規模、互聯智能體群體中集體智能的涌現,研究智能體數量、通信拓撲和協議配置如何共同塑造系統級行為
- 智能體數據網絡:構建專用于自主智能體通信和協調的基礎數據基礎設施,支持結構化、意圖驅動和符合協議的智能體間信息交換
這項研究不僅系統梳理了當前 AI 智能體協議的發展現狀,更為未來智能智能體互聯互通的網絡構建提供了理論基礎和技術路線圖。正如 TCP/IP 和 HTTP 協議的標準化推動了全球信息革命,統一的 AI 智能體協議有望催生一個全新的智能協作時代,實現不同形式的智能在系統間流動,工具與智能體無縫交互,形成超越單個組件能力的集體智能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.