昨晚,谷歌在Google Cloud Next 25大會上,開源了首個(gè)標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2Agent Protocol(簡稱A2A)。
A2A將徹底打破系統(tǒng)孤島,對智能體的能力、跨平臺、執(zhí)行效率產(chǎn)生質(zhì)的改變,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企業(yè)應(yīng)用平臺。
簡單來說,這個(gè)A2A交互協(xié)議有點(diǎn)當(dāng)年谷歌牽頭80多家企業(yè)搞安卓系統(tǒng)的味道,因?yàn)槭着陀?/strong>50多家著名企業(yè)加入。隨著加入的企業(yè)越來越多,會極大提升A2A的商業(yè)價(jià)值以及推動整個(gè)智能體生態(tài)的快速發(fā)展。
開源地址:https://github.com/google/A2A
在本次大會上Agent成為了重點(diǎn),除了A2A之外,谷歌還效仿OpenAI開源了Agent開發(fā)套件ADK,內(nèi)部測試工具Agent Engine,新的Agent市場等。下面「AIGC開放社區(qū)」先為大家解讀A2A的重點(diǎn)內(nèi)容。
什么是A2A
A2A是一種開放協(xié)議,為Agent提供了一種標(biāo)準(zhǔn)的交互方式,使它們能夠相互協(xié)作,無論底層框架或供應(yīng)商是什么。
例如,一家大型電商公司使用了多種企業(yè)平臺和服務(wù)。Atlassian 用于團(tuán)隊(duì)項(xiàng)目管理,Box 用于文件存儲和共享,Salesforce 用于客戶關(guān)系管理,Workday 用于人力資源管理。
以前這些平臺上的Agent無法自由通信。現(xiàn)在通過A2A協(xié)議,這些企業(yè)平臺可以安全、自由地自動化交互數(shù)據(jù)。
A2A案例展示
在與合作伙伴設(shè)計(jì)協(xié)議時(shí),谷歌遵循了五個(gè)關(guān)鍵原則。第一,A2A專注于使Agent能夠在它們自然的、非結(jié)構(gòu)化的模式下進(jìn)行協(xié)作,即使它們不共享內(nèi)存、工具和上下文。谷歌正在啟用真正的多Agent場景,而不是限制Agent成為一個(gè)工具。
第二,該協(xié)議是基于現(xiàn)有的、流行的標(biāo)準(zhǔn)構(gòu)建的,包括HTTP、服務(wù)器端事件(SSE)、JSON-RPC等,這意味著它更容易與企業(yè)日常已經(jīng)使用的現(xiàn)有IT堆棧進(jìn)行集成。
例如,一家電商企業(yè)日常使用 HTTP 協(xié)議來處理網(wǎng)頁數(shù)據(jù)傳輸,利用 JSON - RPC 在前后端傳遞數(shù)據(jù)指令。引入 A2A 協(xié)議后,企業(yè)的訂單管理系統(tǒng)可以通過HTTP 與 A2A 協(xié)議對接,快速獲取相關(guān)智能Agent提供的物流數(shù)據(jù)更新,無需大費(fèi)周章地重新搭建復(fù)雜的數(shù)據(jù)傳輸通道,能輕松融入現(xiàn)有的IT架構(gòu),讓各個(gè)系統(tǒng)協(xié)同工作更加順暢。
第三,A2A被設(shè)計(jì)為支持企業(yè)級的認(rèn)證和授權(quán),在推出時(shí)與OpenAPI的認(rèn)證方案具有對等性。這點(diǎn)還是很人性的不排斥OpenAI,使用A2A 協(xié)議能快速通過身份驗(yàn)證,安全地獲取數(shù)據(jù),保障數(shù)據(jù)傳輸?shù)陌踩院秃弦?guī)性,防止數(shù)據(jù)泄露風(fēng)險(xiǎn)。
第四,谷歌設(shè)計(jì)A2A使其具有靈活性,能夠支持從快速任務(wù)到可能需要數(shù)小時(shí)甚至數(shù)天(當(dāng)人類參與其中時(shí))的深入研究等各種場景。在整個(gè)過程中,A2A可以向用戶提供實(shí)時(shí)反饋、通知和狀態(tài)更新。
以一家科研機(jī)構(gòu)為例,研究人員利用 A2A 協(xié)議下的Agent進(jìn)行新藥物研發(fā)相關(guān)研究。簡單的任務(wù)如快速檢索數(shù)據(jù)庫中已有的藥物分子結(jié)構(gòu)信息,幾秒內(nèi)就能完成并反饋給研究人員。但對于復(fù)雜任務(wù),像模擬新藥物分子在人體環(huán)境中的反應(yīng),可能需要數(shù)天時(shí)間。
在這期間,A2A 協(xié)議會不斷向研究人員推送模擬進(jìn)度,比如已經(jīng)完成了多少步驟、當(dāng)前遇到的問題等,讓研究人員隨時(shí)掌握情況,就像時(shí)刻有個(gè)助手在匯報(bào)工作進(jìn)展。
第五,Agent的世界不僅限于文本,所以,A2A支持各種模態(tài),包括音頻、圖像和視頻流。
A2A工作原理
A2A的工作原理是通過促進(jìn)客戶端Agent和遠(yuǎn)程Agent之間的通信來實(shí)現(xiàn)的。客戶端Agent負(fù)責(zé)制定和傳達(dá)任務(wù),而遠(yuǎn)程Agent則根據(jù)這些任務(wù)采取行動,以提供正確的信息或執(zhí)行相應(yīng)的操作。在這個(gè)過程中,A2A協(xié)議有以下幾個(gè)關(guān)鍵能力。
首先,Agent可以通過“Agent卡”來宣傳它們的能力。這些“Agent卡”是以JSON格式存在的,它們能夠讓客戶端Agent識別出哪個(gè)遠(yuǎn)程Agent最適合執(zhí)行特定的任務(wù)。
一旦確定了合適的遠(yuǎn)程Agent,客戶端Agent就可以利用A2A協(xié)議與之進(jìn)行通信,將任務(wù)分配給它。
然后,任務(wù)管理是A2A協(xié)議中的一個(gè)重要環(huán)節(jié)。客戶端和遠(yuǎn)程Agent之間的通信都是圍繞完成任務(wù)展開的。協(xié)議定義了一個(gè)“任務(wù)”對象,這個(gè)對象具有自己的生命周期。
對于一些簡單的任務(wù),可能可以立即完成;而對于一些復(fù)雜的、長期的任務(wù),Agent們可以相互溝通,以保持對任務(wù)完成狀態(tài)的同步。當(dāng)任務(wù)完成時(shí),其輸出被稱為“工件”。
此外,A2A還支持Agent之間的協(xié)作。Agent們可以相互發(fā)送消息,這些消息可以包含上下文信息、回復(fù)、工件或者用戶指令。通過這種方式,Agent們能夠更好地協(xié)同工作,共同完成復(fù)雜的任務(wù)。
最后,A2A還具備用戶體驗(yàn)協(xié)商的功能。每條消息都包含“部分”,這些部分是完整的內(nèi)容片段,例如,生成的圖像。
每個(gè)部分都有指定的內(nèi)容類型,這使得客戶端和遠(yuǎn)程Agent能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等。這樣,A2A就能夠根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗(yàn)。
哪些企業(yè)加入了A2A
其實(shí)最讓人驚訝的就是,A2A剛發(fā)布就獲得了大批著名企業(yè)的青睞和加入,包括埃森哲、波士頓咨詢集團(tuán)、凱捷、科尼、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麥肯錫、普華永道等50多家日常大家能經(jīng)常聽到的企業(yè)。
首批加入A2A的企業(yè)
還有一些技術(shù)公司也加入了到了A2A協(xié)議中。例如,Atlassian以其強(qiáng)大的團(tuán)隊(duì)協(xié)作工具Jira和Confluence而聞名。通過加入A2A,Atlassian能夠使其工具與各種Agent無縫協(xié)作,從而進(jìn)一步提升團(tuán)隊(duì)的工作效率和協(xié)作能力。
Box是一家專注于企業(yè)級云存儲和內(nèi)容管理服務(wù)的公司,它提供的解決方案能夠幫助企業(yè)安全地存儲、共享和管理文件。通過A2A協(xié)議,Box可以使其服務(wù)與Agent相結(jié)合,實(shí)現(xiàn)更高效的內(nèi)容管理和自動化工作流程。
Intuit知名的財(cái)務(wù)軟件公司,QuickBooks和TurboTax,已經(jīng)被廣泛應(yīng)用于財(cái)務(wù)管理和稅務(wù)處理。通過A2A協(xié)議,Intuit可以使其軟件與Agent協(xié)作,實(shí)現(xiàn)更自動化的財(cái)務(wù)流程和更高效的稅務(wù)處理。
MongoDB是一家提供高性能、開源的NoSQL數(shù)據(jù)庫解決方案的公司,其數(shù)據(jù)庫廣泛應(yīng)用于現(xiàn)代應(yīng)用程序的數(shù)據(jù)存儲和管理。通過A2A協(xié)議,MongoDB可以使其數(shù)據(jù)庫服務(wù)與智能Agent相結(jié)合,實(shí)現(xiàn)更高效的數(shù)據(jù)管理和自動化數(shù)據(jù)處理。
其實(shí)看到這里大家應(yīng)該都清楚了,谷歌就是想統(tǒng)一Agent混亂的格局,打造全新的執(zhí)行、交互標(biāo)準(zhǔn),這個(gè)比前段時(shí)間的MCP要猛的多啊~
本文素材來源谷歌,如有侵權(quán)請聯(lián)系刪除
報(bào)告下載
大 佬觀點(diǎn)分享
關(guān)于RPA、AI、企業(yè)數(shù)字化轉(zhuǎn)型
(點(diǎn)擊文字即可閱讀)
| |
| | |
| | |
| | |
| |
行業(yè)知識交流分享,結(jié)識擴(kuò)展人脈圈層
公眾號后臺回復(fù)【RPA】或者【流程挖掘】
可受邀加入相關(guān)的交流群
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.