作者 | ?陳駿達(dá)
編輯 | ?程茜
各家智能體可以“換名片、加好友”了。
智東西4月10日?qǐng)?bào)道,今天,在谷歌云Next大會(huì)上,谷歌正式發(fā)布Agent2Agent(A2A)開放協(xié)議。A2A協(xié)議讓智能體之間的溝通與協(xié)作更為順暢,不同開發(fā)者發(fā)布的智能體也可以有效通信。以招聘場景的多智能體系統(tǒng)為例,通過A2A協(xié)作,主智能體可以在理解用戶需求后,以高效準(zhǔn)確的方式,與其他專業(yè)智能體互動(dòng),合作給出人選建議。用戶還可以參與到這一流程中,如指示智能體安排進(jìn)一步的面試。
這一協(xié)議給智能體配備了一張“名片”,讓不同智能體看到彼此的功能。A2A還界定了智能體間溝通的固定方式,允許智能體相互發(fā)送消息,以傳達(dá)上下文、回復(fù)、交付物或用戶說明等信息。A2A幫助智能體跨越孤立的數(shù)據(jù)系統(tǒng)和應(yīng)用程序,完成協(xié)作,有望進(jìn)一步提升智能體的自主性,并大幅提高其生產(chǎn)力,長期來看有望降低多智能體系統(tǒng)的使用成本。
目前,A2A協(xié)議已經(jīng)獲得了50多家企業(yè)與組織的技術(shù)支持和貢獻(xiàn),包括PayPal、SAP、ServiceNow、埃森哲、德勤、畢馬威等知名企業(yè)。A2A協(xié)議與Anthropic的MCP(模型上下文協(xié)議)屬于互補(bǔ)關(guān)系,前者關(guān)注智能體間通信,后者將智能體與數(shù)據(jù)、資源和工具連接,讓智能體更好地與現(xiàn)實(shí)世界交互。為了更直觀的講解A2A的原理及其與MCP協(xié)議的互補(bǔ)關(guān)系,谷歌提供了一個(gè)生動(dòng)的案例:假設(shè)存在一家汽車維修廠,這家店雇傭具備自主行為能力的員工,他們使用千斤頂、萬用表和套筒扳手等工具來診斷和修復(fù)問題。工人經(jīng)常不得不診斷和修復(fù)他們以前從未見過的問題。維修過程可能涉及與客戶的對(duì)話、研究以及與零件供應(yīng)商的合作。
可以將上述場景中的員工類比為智能體,MCP協(xié)議處理的是員工對(duì)工具的調(diào)度,A2A協(xié)議處理的是員工與員工、員工與客戶(對(duì)應(yīng)AI用戶)間的溝通與協(xié)作。具體來看,在修理廠場景中,MCP讓員工能使用工具,完成類似“將汽車抬升50cm”、“將扳手往右擰4mm”這樣的操作。而A2A協(xié)議則讓用戶或員工能與其他員工合作,通過持續(xù)的溝通和不斷改善的計(jì)劃以實(shí)現(xiàn)結(jié)果。在汽車修理廠情境里,A2A協(xié)議讓員工可以主動(dòng)詢問客戶或者其他員工:“給我發(fā)一張左側(cè)輪胎的照片?!薄拔易⒁獾揭后w泄漏,這種情況已經(jīng)發(fā)生了多長時(shí)間?”A2A還可以幫助汽車修理廠員工與外部員工合作,例如他們的零件供應(yīng)商。上述交互過程中,A2A協(xié)議促進(jìn)了“客戶端”智能體和“遠(yuǎn)端”智能體之間的通信??蛻舳酥悄荏w負(fù)責(zé)制定和傳達(dá)任務(wù),而遠(yuǎn)端智能體負(fù)責(zé)處理這些任務(wù),提供正確的信息或采取正確的動(dòng)作。此交互涉及幾個(gè)關(guān)鍵功能:
1、功能發(fā)現(xiàn):
智能體可以使用JSON格式的智能體卡(類似智能體的名片)公布其功能與驗(yàn)證方式,讓客戶端智能體確定可以執(zhí)行任務(wù)的最佳智能體,并利用A2A與遠(yuǎn)端智能體進(jìn)行通信。
2、任務(wù)管理:
客戶端智能體與遠(yuǎn)端智能體之間的通信以任務(wù)完成為導(dǎo)向,雙方通過協(xié)作滿足終端用戶的請(qǐng)求。該協(xié)議定義的“任務(wù)”對(duì)象具有完整生命周期——對(duì)于即時(shí)任務(wù)可快速完成;對(duì)于耗時(shí)較長的任務(wù),各智能體將持續(xù)同步任務(wù)的最新執(zhí)行狀態(tài)。任務(wù)最終產(chǎn)出的結(jié)果被稱為“交付物”。3、協(xié)作:智能體可以相互發(fā)送消息,以傳達(dá)上下文、回復(fù)、交付物或用戶說明。
4、用戶體驗(yàn)協(xié)商機(jī)制:
每條消息均包含若干“內(nèi)容單元”(如生成的圖像等完整內(nèi)容模塊)。每個(gè)單元均標(biāo)注特定內(nèi)容類型,使客戶端與遠(yuǎn)端智能體能夠協(xié)商確定所需格式,并特別涵蓋UI能力的協(xié)調(diào)——包括嵌入式框架、視頻、網(wǎng)頁表單等交互元素的適配。
谷歌與其合作伙伴將A2A建立在HTTP、SSE、JSON-RPC等廣泛使用的現(xiàn)有標(biāo)準(zhǔn)之上,這意味著它能與企業(yè)日常使用的IT基礎(chǔ)設(shè)施集成。A2A支持企業(yè)級(jí)身份驗(yàn)證與授權(quán),其認(rèn)證方案在發(fā)布時(shí)即與OpenAPI標(biāo)準(zhǔn)保持同步。A2A協(xié)議支持包括音視頻流在內(nèi)的多種交互模態(tài),并采用靈活設(shè)計(jì),既能高效處理即時(shí)任務(wù),也能支持需要數(shù)小時(shí)甚至數(shù)天(含人工介入環(huán)節(jié))的深度研究任務(wù)。在整個(gè)過程中,A2A會(huì)向用戶提供實(shí)時(shí)反饋、通知和狀態(tài)更新。
結(jié)語:采用率未達(dá)臨界點(diǎn),將繼續(xù)拓展用例和場景
在接受科技媒體VeatureBeat采訪時(shí),谷歌云業(yè)務(wù)應(yīng)用平臺(tái)副總裁兼總經(jīng)理Rao Surapaneni稱,目前A2A雖獲得50多家合作伙伴的采用,但并未達(dá)到采用率的“臨界點(diǎn)”。未來,A2A能否成為一項(xiàng)易用、通行的協(xié)議,或?qū)⒃诤艽蟪潭壬先Q于企業(yè)的采用率。Surapaneni稱,谷歌將為A2A尋找更為廣闊的用例和場景,實(shí)現(xiàn)持續(xù)增長。