智东西(公众号:zhidxcom)
作者|陈骏达
编辑|程茜
智(zhi)东(dong)西4月10日报(bao)道,今天,在谷歌云Next大会(hui)上,谷歌正(zheng)式(shi)发(fa)(fa)布(bu)Agent2Agent(A2A)开放协(xie)议(yi)(yi)。A2A协(xie)议(yi)(yi)让智(zhi)能体之间的沟通与协(xie)作更为顺畅,不同开发(fa)(fa)者(zhe)发(fa)(fa)布(bu)的智(zhi)能体也(ye)可以有效通信(xin)。
以(yi)(yi)招聘场景的(de)多智能(neng)(neng)体(ti)(ti)系统为例,通过A2A协作,主(zhu)智能(neng)(neng)体(ti)(ti)可以(yi)(yi)在理解用户(hu)需求后(hou),以(yi)(yi)高效(xiao)准(zhun)确的(de)方式,与其他专业智能(neng)(neng)体(ti)(ti)互动,合作给出人选(xuan)建(jian)议。用户(hu)还可以(yi)(yi)参与到这一(yi)流程中,如(ru)指示(shi)智能(neng)(neng)体(ti)(ti)安排进一(yi)步的(de)面试。

这一协议给智能体配备了一张“名片”,让不同智能体看到彼此的功能。A2A还界定了智能体间沟通的固定方式,允许智能体相互发送消息,以传达上下文、回复、交付物或用户说明等信息。
A2A帮助智能体跨越孤立的数据系统和应用程序,完成协作,有望进一步提升智能体的自主性,并大幅提高其生产力,长期来看有望降低多智能体系统的使用成本。
目前,A2A协议已经获得了50多家企业与组织的技术支持(chi)和贡献,包括(kuo)PayPal、SAP、ServiceNow、埃森哲、德勤、毕(bi)马威等(deng)知名(ming)企业。
A2A协议与Anthropic的MCP(模型上下文协议)属于互补关系,前者关注智(zhi)能(neng)体间(jian)通信,后(hou)者将(jiang)智(zhi)能(neng)体与数据、资源和工具连接,让(rang)智(zhi)能(neng)体更好地与现实世界(jie)交互。
为了更直观的(de)讲解A2A的(de)原理及其与(yu)MCP协议的(de)互补(bu)关系,谷歌提供了一(yi)个生动的(de)案例:
假设存在一家汽车维修厂,这家店雇佣具备自主行为能力的员工,他们使用千斤顶、万用表和套筒扳手等工具来诊断和修复问题。工人经常不得不诊断和修复他们以前从未见过的问题。维修过程可能涉及与客户的对话、研究以及与零件供应商的合作。

可以将上述场景中的员工类比为智能体,MCP协(xie)(xie)议处理的是员(yuan)(yuan)(yuan)工对工具的调度,A2A协(xie)(xie)议处理的是员(yuan)(yuan)(yuan)工与员(yuan)(yuan)(yuan)工、员(yuan)(yuan)(yuan)工与客户(对应AI用户)间(jian)的沟(gou)通与协(xie)(xie)作。
具体来看,在修理厂(chang)场景中,MCP让员(yuan)工能使用工具,完成类似“将(jiang)汽车抬(tai)升50cm”、“将(jiang)扳手往右(you)拧4mm”这样的操(cao)作(zuo)。
而A2A协(xie)议则让(rang)(rang)用户(hu)或员工(gong)能与(yu)其他员工(gong)合作,通(tong)过持续的沟通(tong)和不断(duan)改善(shan)的计(ji)划(hua)以(yi)实现结果(guo)。在汽车修(xiu)理厂情境里,A2A协(xie)议让(rang)(rang)员工(gong)可以(yi)主动(dong)询问客户(hu)或者其他员工(gong):
“给我发一张左侧轮胎的照片。”
“我注意到液体泄漏,这种情况已经发生了多长时间?”
A2A还可以帮助汽车修理厂(chang)员工与外(wai)部员工合作,例(li)如他(ta)们(men)的零件供应商。
上述交互过程中,A2A协议促进了“客户端”智能体和“远端”智能体之间的(de)通信(xin)。客户端智能(neng)体负责制定和传(chuan)达(da)任务,而远端智能(neng)体负责处理(li)这(zhei)些(xie)任务,提供正确的(de)信(xin)息或采(cai)取(qu)正确的(de)动(dong)作。此交互涉(she)及几(ji)个关键功能(neng):
1、功能发现:智能(neng)(neng)体(ti)可(ke)以(yi)使用JSON格式的智能(neng)(neng)体(ti)卡(ka)(类似智能(neng)(neng)体(ti)的名(ming)片(pian))公布(bu)其(qi)功能(neng)(neng)与验证方式,让客户端智能(neng)(neng)体(ti)确定可(ke)以(yi)执行任务的最(zui)佳智能(neng)(neng)体(ti),并利(li)用A2A与远端智能(neng)(neng)体(ti)进(jin)行通信(xin)。
2、任务管理:客户端(duan)智(zhi)能体(ti)与(yu)远端(duan)智(zhi)能体(ti)之间的通信以任(ren)(ren)务(wu)完(wan)成为(wei)导向,双方通过协(xie)作满足终端(duan)用户的请求(qiu)。该协(xie)议(yi)定义(yi)的“任(ren)(ren)务(wu)”对(dui)(dui)象具有完(wan)整生(sheng)命周期——对(dui)(dui)于(yu)即(ji)时任(ren)(ren)务(wu)可(ke)快速完(wan)成;对(dui)(dui)于(yu)耗时较长的任(ren)(ren)务(wu),各智(zhi)能体(ti)将持续同(tong)步任(ren)(ren)务(wu)的最新执行(xing)状态(tai)。任(ren)(ren)务(wu)最终产(chan)出的结(jie)果(guo)被称为(wei)“交(jiao)付物”。
3、协作:智能体(ti)可以(yi)相互发送消息,以(yi)传达上下文(wen)、回(hui)复、交付物或用户说(shuo)明。
4、用户体验协商机制:每(mei)条消(xiao)息均包含(han)若干“内(nei)(nei)容(rong)单(dan)元”(如生成的图像等(deng)完(wan)整内(nei)(nei)容(rong)模块)。每(mei)个单(dan)元均标注特(te)定内(nei)(nei)容(rong)类型(xing),使客户端与远端智能体能够协商确定所需格式,并特(te)别涵盖UI能力的协调——包括(kuo)嵌入(ru)式框架、视频、网页表单(dan)等(deng)交互(hu)元素的适(shi)配。

谷(gu)歌与(yu)其(qi)合作伙(huo)伴将A2A建立在HTTP、SSE、JSON-RPC等广(guang)泛使用的现有标(biao)准之(zhi)上,这意味着它能与(yu)企业日常使用的IT基础设(she)施集成。A2A支持(chi)企业级(ji)身份验(yan)证与(yu)授权,其(qi)认证方案在发布时(shi)即与(yu)OpenAPI标(biao)准保持(chi)同步(bu)。
A2A协议支持包括音视频流在内的多种交互模态,并采用灵活设计,既能高效处理即时任(ren)务(wu),也能支持需要数小时甚至数天(含人工介入环节)的深度研究任务。
在整个过(guo)程中,A2A会向用户提供(gong)实时(shi)反馈、通知和状态更新。
结语:采用率未达临界点,将继续拓展用例和场景
在(zai)接(jie)受(shou)科技(ji)媒体VeatureBeat采访时(shi),谷歌(ge)云(yun)业务应用(yong)平台副总裁兼总经(jing)理(li)Rao Surapaneni称,目前A2A虽(sui)获得(de)50多家合(he)作伙伴的(de)采用(yong),但(dan)并未(wei)达到采用(yong)率的(de)“临界(jie)点(dian)”。
未(wei)来,A2A能(neng)否(fou)成(cheng)为(wei)一项易(yi)用、通行的(de)协议,或(huo)将在很(hen)大程度上(shang)取决于企业的(de)采(cai)用率。Surapaneni称(cheng),谷歌将为(wei)A2A寻(xun)找更为(wei)广阔(kuo)的(de)用例和场景(jing),实(shi)现持续增长(zhang)。
博客地址:
//developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/