作者:周雅
現在AI助手越來越多,但它們之間卻像是生活在平行世界,完全不能交流,現在谷歌也坐不住了,要來解決這個痛點。
過去幾個月,至少有兩個AI助手互操作標準出現:先是Anthropic推出了“模型上下文協議(MCP)”,然后思科帶頭搞了個叫做“AGNTCY”的聯盟標準。這是因為大家越來越認識到,讓不同公司開發的AI助手能夠“互相說話”非常重要。想象一下,財務部的AI、人事部的AI和銷售部的AI如果能無縫合作,效率會提高多少!
正是看到這個趨勢,現在谷歌也來湊熱鬧了,最新推出“Agent2Agent”(簡稱A2A)協議。
這次谷歌可沒單打獨斗,而是聯合了50多家大廠一起上,包括Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG和Workday等公司。看這陣仗,A2A協議旨在成為AI助手和AI應用之間的互操作語言。
谷歌云業務應用平臺副總裁兼總經理Rao Surapaneni在獨家采訪中表示,A2A讓具有不同專長和數據節點的助手更容易獲取所需上下文。
“每個AI系統都有特定專長,因為它們擁有數據節點或邏輯節點,或者當前用戶群專注于特定任務,這些框架預計會圍繞非常專業的焦點發展。作為客戶,如果我部署了這些多平臺和多框架,我不希望在它們之間來回切換。”他后面還補了一句:“谷歌與50多個合作伙伴和客戶合作的部分原因是為了構建A2A,使其具有「以企業級、安全和可信方式進行互操作的能力」。”
什么是A2A協議?
這個A2A協議到底是什么?
簡單來說,A2A協議主要是讓兩種AI助手互相交流:一種叫「客戶端助手」,另一種叫「遠程助手」。
這就像餐廳里的服務員和廚師的關系:服務員(客戶端助手)接收你的點餐并傳達給廚師,而廚師(遠程助手)則負責根據這些要求烹飪美食。比如你問自家AI一個財務問題,它如果不懂,就可以去請教專門的財務AI,然后把答案告訴你,全程你不用操心。
谷歌在最新一篇博文中寫道,A2A協議主要包括四項功能:
功能一,能力發現:助手可以通過JSON格式的“助手卡片”(技術上叫Agent Card)來展示它有什么能力,就像我們人類有個人簡歷一樣,這樣客戶端助手就能確定最適合完成任務的遠程助手。比如你問:“我想了解今年的稅收政策變化”,你的個人助手可能對稅務不精通,但它知道誰是稅務專家,于是就會找到稅務助手來合作。
功能二,任務管理:確保助手間的對話都是圍繞完成任務展開的,并定義任務的生命周期。對于耗時較長的任務,兩個助手會保持聯系,互相更新最新進度。任務的最終結果被稱為“工件(artifact)”。這就像你點了一道復雜的菜,廚師會不時告訴服務員:“已經開始準備食材了”、“馬上就好了”,最后才端出成品。
功能三,協作功能:助手們可以互相發送消息,傳遞上下文、回復、工件或用戶指令。就像服務員可能會告訴廚師:“客人對海鮮過敏”或“客人喜歡微辣口味”,AI助手之間也會分享這類重要信息,確保最終結果符合你的需求。
功能四,用戶體驗協商:每條消息都包含“一部分”內容,比如生成的圖像。每個部分都有特定的內容類型,這樣客戶端和遠程助手就能協商出正確的格式,并明確包括用戶界面能力的協商:比如是否支持嵌入框架、視頻、網頁表單等等。這就像服務員知道,你是坐在高腳凳上還是在包廂里,從而決定如何最好地為你上菜。
總結而言,A2A就像是給AI助手們創造了一種“通用語言”,讓它們能夠無障礙交流,共同為用戶提供更全面、更智能的服務。
最重要的是,谷歌把A2A設計成了開源協議,整個AI社區都可以來貢獻代碼和更新。Surapaneni強調:“我們希望這真正成為一個社區驅動的開源項目,有一個專門的治理委員會,但核心是要保持開放且由社區驅動。”
在開發A2A過程中,谷歌團隊特別注重讓AI助手們能用“自然、非結構化”的方式交流,即使它們沒有共享的記憶、工具和上下文也沒問題。而且A2A基于HTTP和JSON這些現成標準構建,所以更容易與現有技術棧集成,安全性也有保障。
真實案例:A2A如何革新招聘流程?
為了讓大家更直觀看到A2A協議的能力,谷歌還特別用了一個真實案例,主打一個全面。
谷歌在最新博文中寫道:有了A2A,招聘一名軟件工程師的過程可以變得很輕松:在Agentspace這樣的統一界面中,招聘經理只需告訴自己的AI助手:“幫我找符合這個職位描述、在這個地區、具備這些技能的候選人。”
接下來,神奇的事情發生了:
· 你的AI助手會自動聯系其他專門的招聘AI助手;
· 這些專業助手會幫你篩選潛在候選人;
· 你收到建議名單后,只需動動手指,就能指示助手安排面試;
· 面試結束后,另一個專門的AI助手還能幫你完成背景調查。
整個候選人尋找過程變得流暢無比。
AI圈的“通用語言”之爭:互操作協議的崛起
當然,A2A只是AI助手“通用語言”大戰的最新一幕,讓AI助手互相聽懂對方說話這件事,現在可熱鬧了,各大科技巨頭都在搶灘布局。
除了谷歌的A2A,市場上還有思科聯合LangChain、Galileo、LlamaIndex和Glean組成的AGNTCY聯盟,目標是為AI助手間創建標準通信方式;同時參與A2A的LangChain還單獨開發了Agent Protocol;微軟也升級了AutoGen框架,都是為了讓AI助手們能順暢交流。
有意思的是,微軟等很多公司已經擁抱了Anthropic的MCP協議,就連谷歌自己也通過新的Agent Development Kit支持MCP。面對這種情況,谷歌云Surapaneni趕緊澄清:A2A和MCP不是競爭關系,而是互補的。
“我們把MCP和A2A看作互補能力,”他解釋道,“A2A處于更高層次的抽象,讓應用和助手互相交流。你可以把它想象成分層架構,MCP負責在底層與LLM、工具和數據交互。”
谷歌明顯不想把自己孤立起來,Surapaneni沒有排除與其他互操作協議聯盟合作的可能。他表示A2A隨時歡迎新成員加入,協議會根據社區建議和需求不斷更新,是一個“活著的代碼”——“我們會考慮如何與所有協議保持一致,總會有一些協議帶來好點子,我們希望把所有好想法都吸收進來。”
為什么互操作性需求突然爆發?
各大組織和AI公司都認同一個觀點:未來的世界不會只有一個AI模型稱霸,而是多模型并存。這意味著AI助手也會基于不同的語言和框架構建,這很合理。
但要實現一個完整的助手生態系統,就必須讓各家公司的助手能夠互相交流。這說起來容易做起來難!行業標準通常需要時間才能確立,還需要大部分公司的認可和支持。
無論是A2A、MCP還是AGNTCY,如果希望成功創建一種標準方式讓所有AI助手都能使用,不管它們是誰構建的或基于哪種框架,都必須實現大規模采用和部署。
Surapaneni也坦率承認,即使有50多個合作伙伴在研發A2A,目前的采用率仍未達到臨界點。“所有這些協議都會不斷發展,特別是在AI快速變化的環境下,我們會發現新的用例和場景需要解決,所以它會繼續成長,”他說道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.