今天,谷歌發布了一項名為 Agent2Agent(簡稱 A2A)的 Agent 互操作協議,并且還與包括 Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG 和 Workday 在內的 50 多家公司合作,旨在讓 Agent2Agent 成為 Agent 之間的通用互操作語言。
這個操作,有點讓我想起 10 年前 Google 發布 Kubernetes 時的場景。
現在各家公司似乎已經意識到,推出“協議”或標準有助于推動自身業務的發展。因為一旦這種協議被廣泛采用,就能為它們構建起一道“護城河”。
想象一下,如果 A2A 成為了代理通信的事實標準——由于它是 Google 發明的,并已融入其業務邏輯中,這將使整個 LLM 生態系統都向 Google 的服務敞開大門(也就是說,LLM 本身并不是最終目標)。屆時,微軟等公司要么得推出自己的“標準”,要么只能接受 Google 的方案。
那我們最近討論的MCP 和 A2A 有什么區別?一句話來說,它們倆是互補的。不是替代關系。
模型上下文協議(MCP) 是連接 LLM 和數據、資源和工具的標準。或者說,它正在成為跨不同模型和框架的標準化“函數調用”,可以大大降低了將智能體與工具和數據連接的復雜性。
而 A2A 關注的是另一個問題。A2A 是一個應用層協議,使 Agent 能夠以自然的方式協作。它允許 Agent 以 “Agent” 的身份進行交流,而不是作為工具。Google 希望 A2A 能夠作為 MCP 的補充被廣泛采用,從而推動 Agent 生態系統的發展,并將與社區開放合作來實現這一目標。
看一個例子:
我們想象一家汽車修理廠,它雇傭了使用專用工具(如千斤頂、多用電表和套筒扳手)來診斷和修復問題的修理工。這些工人經常需要處理他們以前從未遇到過的問題。修理過程可能涉及與客戶的深入交流、資料查詢以及與零件供應商的合作。
現在我們將這些修理廠員工建模為 AI 智能體:
MCP是將這些智能體與其結構化工具連接的協議(例如“將平臺升高 2 米”、“將扳手向右轉動 4 毫米”)。
A2A是使終端用戶或其他智能體能夠與修理廠員工協作的協議(例如 “我的車發出咔噠咔噠的聲音”)。A2A 支持持續的雙向交流和不斷演進的計劃以達成目標(例如 “發我一張左輪的照片”、“我注意到有液體在漏,這種情況持續多久了?”)。A2A 還幫助修理廠員工與其他智能體(如零件供應商)協作。
當然,A2A 并不是市場上唯一的互操作協議。前段時間,由 Cisco、LangChain、Galileo、LlamaIndex 和 Glean 等公司推出的 AGNTCY,也意圖成為 Agent 通信的標準。還有 LangChain,它作為工具,似乎哪個標準都樂意參與,之前也發布過 Agent Protocol。微軟也更新了其 AutoGen 框架,以支持代理互操作。
A2A 協議為不同的 Agent 提供了標準化的通信方式,使它們能夠像人類團隊一樣分工合作、實時溝通,并根據用戶的設備和界面能力靈活調整交互方式。
根據 Google 的官方介紹,Client Agent 負責制定任務并將其發送出去,而 Remote Agent 則負責執行這些任務,提供正確的信息或采取相應的行動。這種交互包含以下幾個關鍵能力:
1、能力發現
每個 Agent 可以通過一種稱為 “Agent Card” 的 JSON 格式文件來公開自己的能力。client agent 可以根據這些信息,識別出最適合執行某項任務的 Remote Agent ,并通過 A2A 協議與其建立通信。
2、任務管理
Agent 之間的通信以 “完成任務” 為核心。任務對象由協議定義,并具有完整的生命周期。任務可以是即時完成的,也可以是需要較長時間處理的。在任務執行過程中,agent 之間可以持續同步狀態,確保彼此了解任務的最新進展。任務完成后會生成一個 artifact,例如圖像、文本或其他形式的輸出。
3、協作
Agent 之間可以互發消息,用于傳遞上下文信息、用戶指令、任務結果等,實現真正的多 Agent 協同工作。
4、用戶體驗協商
每條消息可以包含多個“內容部分”,每個部分都是一個完整的內容單元,比如一張生成的圖片。每個部分都有明確的內容類型,Agent 之間可以就內容的展示格式進行協商,以適配用戶界面的能力,比如是否支持 iframe、視頻、網頁表單等。
下面是 Google 的一個案例。借助 A2A 協作,招聘軟件工程師的流程可以大大簡化,在一個統一的界面中,招聘經理可以指派自己的 Agent 去尋找符合職位描述、地點和技能要求的候選人。
這個 Agent 會與其他專門的 Agent 進行交互,從多個渠道獲取潛在候選人。用戶收到推薦人選后,可以進一步指示 Agent 安排面試,從而簡化整個人才篩選流程。面試結束后,還可以調用另一個 Agent 來執行背景調查。
Google 推出的新 Agent2Agent 協議,是實現 AI Agent 互操作性未來的重要一步。沒有任何單一工具能掌握用戶或企業大多數工作流程所需的全部數據,因此我們需要 Agent 之間能夠相互溝通。
Salesforce 將擁有理解 CRM 內部機制的 AI Agent,Workday 將擁有理解人力資源流程的 AI Agent,Notion 則擁有理解內容和文檔的 AI Agent,等等。我們很容易想象一個世界,擁有成千上萬的工具型 Agent,以及數十億甚至數萬億個定制化的 Agent,它們是這些工具型 Agent 的延伸。因此,開放性變得至關重要。
完成一個任務的工作流程通常需要來自多個系統的數據——比如一個銷售報告可能需要文檔和 CRM 數據,或一個人力資源任務可能需要 HR 政策和員工信息——這正是 A2A 發揮作用的地方。這個協議為 AI Agent 提供了一種相互溝通的方式,簡化了 Agent 之間的交流。
Agent 的時代要來了嗎?兄弟們。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.