智东西(公众号:zhidxcom)
作者 | 陈骏达
编辑 | 漠影
“我的数据库……没了(le)?”
今年(nian)7月,一(yi)(yi)位名为(wei)“Jason”的(de)网友在(zai)X平台上(shang)分享了(le)一(yi)(yi)场Vibe Coding灾难。他(ta)在(zai)开发平台Replit上(shang)使用(yong)其内置的(de)Agent辅助编程(cheng),在(zai)一(yi)(yi)次操作中,Agent在(zai)没有明确用(yong)户指(zhi)令的(de)情(qing)况下,竟错误地(di)执(zhi)行了(le)一(yi)(yi)个致命的(de)数据库(ku)命令。
顷刻之间,他长达80小时的工作成果被清空。这(zhei)无异(yi)于一(yi)位本应(ying)协(xie)助你的“数字员(yuan)工(gong)”,在未经允许的情况下,走进你的办公(gong)室,将你写了(le)数周的项目资料全部扔进了(le)碎纸机(ji)。

Jason的遭遇绝非(fei)孤例,这(zhei)揭示(shi)了(le)Agent从原型演示(shi)到投入(ru)生产环境之间尚(shang)未跨越的鸿沟,即底(di)层基础设施(Infra)的缺失(shi)。
当前,AI模型正在从被动(dong)的问答(da)工具(ju),转变(bian)为能够自主规划(hua)、执行任务的Agent数字员工。然(ran)而,如(ru)何(he)为这些(xie)员工提供足够强(qiang)大的算力(li)和(he)工具(ju),并(bing)赋予长期(qi)记忆,又如(ru)何(he)为它们设定权限红线,确保它们不会“误触红色按钮”,已成为Agent规模化普及(ji)前的巨大挑(tiao)战。
没有坚(jian)实(shi)可(ke)靠(kao)的(de)Agent Infra,再聪明的(de)Agent也无法成为(wei)可(ke)信赖的(de)生产力。Replit的(de)这次事故,正是这种(zhong)风(feng)险最(zui)生动的(de)注脚。
而(er)这也正(zheng)是阿里(li)云(yun)、AWS、谷歌云(yun)、微软Azure等云(yun)厂商争相发力Agent Infra的(de)(de)核心原因。他们试图打造(zao)的(de)(de)并非一(yi)个简单的(de)(de)工(gong)具集(ji),而(er)是一(yi)座(zuo)现代化的(de)(de) “智能车间”。
在(zai)这(zhei)里,每个AI Agent都将在(zai)安全的(de)(de)(de)环境中(zhong)工作(zuo),拥有清晰的(de)(de)(de)权限、稳定(ding)的(de)(de)(de)工具和足够的(de)(de)(de)数(shu)据,从而真正(zheng)从实验室(shi)的(de)(de)(de)原型(xing),转变为真实生(sheng)产环境中(zhong)可靠数(shu)字员工。
一、Agent规模化落地挑战大,配套Infra已成必选项
企(qi)业为(wei)何需(xu)要这样(yang)一座Agent智能(neng)车间呢?
要让Agent在生产场景中发挥作用,我们需(xu)要为其提供足够的(de)算力和数据(ju)(记忆),帮助(zhu)Agent解决水土(tu)不(bu)服的(de)问题。
例如,当Agent分析海量数(shu)据时,本(ben)地设备既无法承载庞大(da)的数(shu)据洪流(liu),也无法完(wan)成复杂的推理运算。这(zhei)时,云端(duan)算力的支(zhi)持(chi)就(jiu)成了理所当然(ran)的选择。
此外(wai),要让Agent做出正确的决(jue)策,就(jiu)需要为其(qi)提供全面、准确且实(shi)时的信息,否则,其(qi)决(jue)策将(jiang)基于不(bu)完整或过时的数据,导(dao)致(zhi)输出结果不(bu)可靠,甚至产生(sheng)错误。
但这仅仅是第一关,更大的隐患在(zai)于安全与(yu)权限控制的缺(que)失。今年,知(zhi)名(ming)AI搜(sou)索(suo)独角兽Perplexity旗下(xia)的Comet AI浏览器就曾爆出安全丑闻(wen)。
这款AI浏览器本质上(shang)就是一(yi)个能(neng)直接操纵用户设备的Agent,然而,由(you)于缺乏(fa)安全机(ji)制,它在阅读到网(wang)页上(shang)植入的恶(e)意指令(ling)后,能(neng)直接打(da)开用户邮(you)箱、收取验证(zheng)码,还(hai)把验证(zheng)码分(fen)享(xiang)给外部黑客,一(yi)条龙完成(cheng)盗号。

这(zhei)一事件暴露了将拥有高权限的(de)Agent直(zhi)接部署(shu)在开放环境中的(de)巨大风险,企业必须为Agent打(da)造配套(tao)的(de)基础设施。
然而,Agent Infra极为复杂,涉及底层算力调(diao)度、安全沙箱(xiang)、模型集成、记忆数据库、工具调(diao)用链路等一系列核心技术模块,企业自建成本高昂且技术门槛难以逾越,后续维护也需要持续投入顶尖的研发团队,并时刻应对层出不穷的新型安全威胁,堪称(cheng)一(yi)个(ge)填不满的技术深坑。

采用云厂商们(men)开发的(de)(de)(de)现成Agent Infra套件,对大(da)多数(shu)企业而(er)言是(shi)更(geng)为现实的(de)(de)(de)选择。例如,知名Agent产品(pin)Manus便是(shi)通过Agent Infra创企E2B打(da)造的(de)(de)(de)沙盒环境,让Manus的(de)(de)(de)Agent获得了完(wan)整的(de)(de)(de)终端访问(wen)权限(xian),也提(ti)供(gong)了持久(jiu)化的(de)(de)(de)工作空间,这对于Manus广(guang)为人知的(de)(de)(de)长链路任务而(er)言,十分重(zhong)要。
除了(le)E2B外,AWS、谷歌云、微软Azure等云厂商也都已打(da)造了(le)相关(guan)套(tao)件。
AWS的AgentCore提(ti)供记忆管(guan)理、身份(fen)验证、代码执行和浏览器工具等,强(qiang)调安全、可扩展(zhan)和多Agent协作;
谷歌(ge)云的Vertex AI Agents聚焦构建和(he)管理(li)多Agent系统,支持任务(wu)(wu)调(diao)度、跨Agent协(xie)作以及(ji)与企业数据和(he)云服务(wu)(wu)的集(ji)成;
微软(ruan)Azure的Agent Factory强调身份认证、治理、内容安全和可观(guan)测性(xing),同时结合Azure云服(fu)务(wu)和Copilot工具链,支(zhi)持企业快速落地智(zhi)能体应用。
总体来看,主流云厂商的思路均是:构建安全、可扩展、可组合(he)的Agent Infra,让企(qi)业开发(fa)者能在(zai)已有基础设(she)施和生态(tai)下(xia)快速(su)部署(shu)、管理(li)和监控多Agents系统(tong),形成差异化(hua)服(fu)务能力,同时降低企(qi)业上手(shou)门槛(jian)。
二、国产Agent Infra突围,让Agent学会自我进化
在Agent Infra的布局上,国内厂商也丝毫不落后。今年4月,阿里云开启Agent Infra开发套件——无(wu)影(ying)AgentBay的公测,迅速(su)吸引了大量开发(fa)者和(he)企(qi)业关注。
AgentBay的核心定位是为AI Agent打造的“超级(ji)大(da)脑”或“云上操作系统”。它能够动态(tai)调用(yong)云(yun)端算(suan)力、存储和工具链资源,将(jiang)复杂任务接入高性能云(yun)电脑,突破了(le)Agent在(zai)本地(di)设备上的(de)算(suan)力限(xian)制。

AgentBay不仅集成了云上沙箱环境、算力(li)调度(du)、持久化(hua)数据存储和企业级安全(quan)等核心功能,还内置了视觉理解、自然语言控制和任务解析等多项AI技术。尤其是云上沙箱环境,保障了Agent对本地环境的零侵入,给Agent执(zhi)行加了一道保险。
同(tong)时,它支(zhi)持(chi)原子化工具API、AI Agent API以及ASP远程串流协议等多种交互方式,极大地提(ti)升(sheng)了自动化执行(xing)效率,使开(kai)发者能够在高性能、安(an)全的云端(duan)环境中快速部(bu)署和管(guan)理AI Agent。
而在今年的云栖大会期间,AgentBay迎来重大升级,推出了自进化引擎、内存状态管理(li)、安全围栏(lan)等全新(xin)能力(li)。其中最引人(ren)关(guan)注的,是基于环境反馈的自(zi)进化引擎(qing)——Self-Evolving。
阿里云无影关注到了企业在利(li)用第三方AI Infra部署AI Agent时的一(yi)大关键挑(tiao)战。Agent并不能(neng)在执行任务过程中实现“自我(wo)提升”,最(zui)终其效果还需要人工调整,才能(neng)逐渐优化。这就好比你招募了一(yi)位员工,但他并不能(neng)主动从(cong)工作中总结经验(yan)和教训,始终未能(neng)进步。
对于AgentBay自进化引擎的工作原理,AgentBay产品经理屈立威向智东西解释(shi)道,自(zi)进(jin)(jin)化引擎可以理(li)解为(wei)广义(yi)的强化学习,但并不直接训练模型。自(zi)进(jin)(jin)化引擎会针对提示(shi)词、工作流、Agent架构、工具等多(duo)个(ge)方(fang)(fang)向进(jin)(jin)行能力优化,每个(ge)方(fang)(fang)向使用的方(fang)(fang)法或算法各不相同。

例(li)如在提(ti)示词优化方面,对(dui)(dui)于短序(xu)(xu)列任务,可以(yi)直接根据目(mu)标(biao)和实际结果进行(xing)修正;而对(dui)(dui)于长序(xu)(xu)列任务,由(you)于难(nan)以(yi)直接获(huo)得最终结果,则会采用多种算法来优化执行(xing)效果,比(bi)如基(ji)于文本梯度(text grad)或微(wei)调推理(mipro)的方法。
通过这种模块化(hua)、服务(wu)化(hua)的(de)设计,企业无需组(zu)建庞(pang)大AI团(tuan)队,也能(neng)让Agent在执行过程中不断自我优(you)化,提升与业务目标的匹(pi)配度(du)。
AgentBay自进化引擎能够在任务执行中自动分析Agent的失败(bai)案(an)例,并(bing)尝试(shi)生成和测试(shi)更(geng)优的提示词。它还能根据任(ren)务需求自主创建或封装新工具,不断(duan)拓展Agent能力边界。
这一机制(zhi)不仅(jin)关注单(dan)个Agent的流(liu)程优(you)化,也可在多Agent协作(zuo)网络中(zhong)智能(neng)部署最优(you)工作(zuo)流(liu),提高整体效率。
此外,平台的记忆策略使Agent具备“过目不(bu)忘”和(he)“选择性遗忘”的能力,可以对(dui)长期(qi)任务进行(xing)智能管理(li),适应(ying)复杂、长周期(qi)的应(ying)用(yong)场景。
三、Agent Infra加速发展,会成为下一代应用的跃升点吗?
AgentBay并非凭空出现,屈(qu)立威在采访中介(jie)绍道(dao),在云(yun)电脑(nao)时代,阿里积累(lei)了多项核心技术能力,而AgentBay的许多技术依赖(lai),与云(yun)电脑(nao)是“一脉(mai)相(xiang)承”的。
例(li)如(ru),云电(dian)脑(nao)需要高(gao)流(liu)畅(chang)性和清晰的操作体验,而阿里云此(ci)前已自研(yan)了ASP端云实(shi)时通信(xin)协(xie)议(yi),确保远程云环(huan)境(jing)操作体验接(jie)近本地,这也能让帮助Agent实(shi)现与云端执行环(huan)境(jing)之间(jian)的高(gao)效、实(shi)时交互。
大规模(mo)的资(zi)(zi)源(yuan)调度能力和性(xing)能保障,也(ye)是阿里云此(ci)前打(da)造云电脑时(shi)重点解(jie)决的问题。目前,AgentBay便依托阿里云的全球资(zi)(zi)源(yuan)池进行部署,用户可以就近接入(ru),保证了低延迟和高可用性(xing)。
然而,Agent也提出了新的(de)技术(shu)挑战和升级需(xu)求。屈立威(wei)称,首先,Agent需(xu)要(yao)更强(qiang)的(de)感知与控制(zhi)能力,不(bu)仅要(yao)像人一样“看(kan)懂画面”,判断鼠标点击、输入是否生效,还要(yao)支持文件(jian)系(xi)统操作(zuo)、命令行(xing)以及撰写RPA脚(jiao)本(ben)等多种工具操作(zuo)。
其次,其风控(kong)与安全(quan)要求(qiu)也更(geng)高,需要阻断敏感指令、过滤不安全(quan)内容、约束上网行为,保障企(qi)业私域安全(quan)。
此外,Agent任(ren)务的(de)执行(xing)方(fang)式(shi)呈(cheng)树状、多(duo)分支(zhi),每个节点(dian)都(dou)(dou)需打快(kuai)照(checkpoint)、支(zhi)持快(kuai)速回滚,并复制克隆环境以(yi)实现并行(xing)执行(xing),这(zhei)对(dui)状态(tai)管理和(he)多(duo)维度调度提出了更(geng)高要(yao)求,而这(zhei)些都(dou)(dou)是(shi)云电脑时(shi)代所未涉及的(de)关键能力,需要(yao)重点(dian)突破(po)。

为此,阿里云自研(yan)了持(chi)久化文(wen)件(jian)系统,让AgentBay能(neng)够动态(tai)(tai)地按需(xu)(xu)保(bao)留用户状态(tai)(tai)和(he)文(wen)件(jian),确保(bao)了任(ren)务执行(xing)的连续性和(he)状态(tai)(tai)的一致(zhi)性,这对于需(xu)(xu)要执行(xing)长链(lian)条、多步骤任(ren)务的复杂Agent至关重要。
安(an)(an)全(quan)方(fang)面,AgentBay则构建(jian)了端(duan)到(dao)端(duan)安(an)(an)全(quan)体系,包括沙箱隔离、数据加密与RBAC访问控(kong)制(zhi)、AI内(nei)容(rong)风险检测(ce)以及(ji)日志审计,保障任(ren)务(wu)安(an)(an)全(quan)、合规与可追溯。
除了(le)(le)给(ji)企业(ye)打造(zao)Agent Infra之外,阿里云还在云栖大会上,给(ji)个人用户也提供了(le)(le)一款跨终端、跨模态的智(zhi)能计(ji)算平台——无影Agentic Computer。
Agentic Computer是一个拥(yong)有(you)长期(qi)记忆的(de)个人助手,具(ju)备云端弹性(xing)算(suan)力与多(duo)任(ren)务并(bing)行能力。它(ta)内置垂直场景Agent,实现办公、设(she)计(ji)、研究等(deng)专业化支持(chi)。它(ta)将个人计(ji)算(suan)与云端智能协(xie)同起(qi)来,有(you)望让更多(duo)用(yong)户体验到Agent带(dai)来的(de)赋能作用(yong)。

从产(chan)业(ye)视角(jiao)来看,Agent Infra的发(fa)展(zhan)与移动互联网时代App生(sheng)态(tai)的兴起有一大共性(xing):基础设施成熟,为新形(xing)态(tai)产(chan)品快速(su)落地提供(gong)了支(zhi)撑。
移动互联(lian)网时代(dai),智能(neng)终端、网络和(he)云(yun)(yun)计算能(neng)力(li)的完善,使海量App得(de)以高效运行(xing)(xing)和(he)广泛普(pu)及,催生了丰富的应用生态;如(ru)今,AI Infra依托全(quan)球化云(yun)(yun)资源、弹性(xing)算力(li)调(diao)度和(he)全(quan)栈安全(quan)体(ti)系(xi),为(wei)AI Agent提供高性(xing)能(neng)、低延迟、可控的运行(xing)(xing)环境。
稳固的基础设施(shi)降低了(le)创(chuang)新(xin)门槛,推动Agent在企业自动化(hua)、内(nei)容(rong)生(sheng)成等多样化(hua)场景中迅速(su)落(luo)地,有望形成新(xin)一轮产业生(sheng)态和创(chuang)新(xin)循(xun)环。
结语:给Agent打好Infra地基,Agent离广泛落地又近一步
Agent Infra正逐(zhu)步成为新一(yi)代数(shu)字化、智能化基础设(she)施的(de)组成部(bu)分(fen),类似于移(yi)动互联网(wang)时代的(de)云和网(wang)络,为AI Agent生(sheng)态(tai)提供底层支撑(cheng)。
同时,Agent Infra的发展正在改变(bian)产业创新节奏(zou)和生态(tai)构建方(fang)式(shi)。企业不再需要(yao)自行搭建复杂底层架构,而是可以在统(tong)一、安全、可扩展的平台上试验多样化Agent应用。
随(sui)着工具链标准化和(he)安全机制完善,或许(xu)会有越(yue)来越(yue)多企业(ye)和(he)开(kai)发者(zhe)能够快速部(bu)署Agent,推动(dong)生产、服务和(he)研发环节的自动(dong)化与智能化,从而(er)催生新(xin)型业(ye)务模(mo)式和(he)产业(ye)应(ying)用。