阿里AgentBay揭秘,Agent Infra才是真护城河!

发布于 2025-10-10 07:01
浏览
0收藏

过去半年,几乎10个创业者有8个在做各种各样的Agent,但是Agent Infra绝对是被大多数人忽视的一个板块。

月初,给家人们以 AutoGLM2 切入,深挖了 Agent Infra 的核心要素,有朋友留言说智谱的AutoGLM2背后是阿里云无影AgentBay。

阿里云? 无影? 这2个词组合起来确实非常陌生。但是,今天在云栖大会上,刷到了,阿里云无影宣布Agent基础设施AgentBay迎来重大升级,并首次展示全新的个人计算产品——无影Agentic Computer。

无影AgentBay拥有了完善的任务执行沙箱、智能运维、持久化记忆等能力,可动态调用云上算力、存储及工具链资源。

深度挖掘了一下,原来国产 Agent Infra 还有这么多黑科技?今天给家人们进一步分享一下。

为什么需要Agent Infra?

要回答这个问题很简单。

我们现有的整个互联网世界,从操作系统到网页,都有一个巨大的前提:

默认屏幕前一定坐着一个聪明的人。

比如说,如果一个API返回,{"error":"check your config"}。

这对人来说可能够用,对Agent来说,这行字和乱码没太大区别。

浏览网页的时候,可能有个按钮,人一眼能看到,但它在代码里可能没有任何ID。

Agent只能靠视觉模型,去猜它大概在哪个坐标。

我们为人类设计的这一套规则,必然会成为Agent的最大枷锁。

云电脑不是终点,只是起点

要打破这个困局,很多人的第一反应是给Agent一个云电脑,让它在云端隔离运行。

阿里AgentBay揭秘,Agent Infra才是真护城河!-AI.x社区

Manus发布半年过去了,我发现,Agent Infra厂商已经进入了下一个level。

阿里AgentBay揭秘,Agent Infra才是真护城河!-AI.x社区

因为当模型真的在一个云上跑之后,他所有的思考过程,执行结果,工具调用情况,全都是可以跟实际的成功率挂钩的。

这意味着,可能天然的一个强化学习环境就出来了。

我查了下,以无影云为例,就有一个 Self-Evolving Engine(自进化引擎)的东西。可实现LLM行为优化、提示词优化和MCP工具优化,也就是说,企业根本不需要关心,Agent Infra就帮你做好了这种系统的进化。

阿里AgentBay揭秘,Agent Infra才是真护城河!-AI.x社区

持久化记忆 ≠ 存个Cookie

Infra的进化,还体现在记忆上。

我们人理解的记忆,可能只是记住登录密码。但AI需要的记忆,是记住整个交互宇宙。 比如:

上一次任务失败,是因为微博把发布按钮的文案从发布改成了发送。

那么下一次,Agent就应该直接定位新文案,而不是再次失败。

上一次成功绕过滑块验证码,是因为它识别出缺口在坐标(233, 455)。那么这次的滑动轨迹就应该被存成一个可复用的函数。

阿里AgentBay揭秘,Agent Infra才是真护城河!-AI.x社区

AgentBay 把这类记忆做成一种可挂载的环境快照。不仅包括Cookie、本地配置,还包括上一次成功的DOM路径、API调用序列,甚至包括自进化引擎生成的最优提示词和工具权重。

下一次任务启动,Agent的状态不再是重新登录,而是精准地回到上次离开的那一秒。

当Agent比一杯奶茶还便宜

最后,我们来聊聊成本。

一年前,AutoGLM在本地手机跑一次任务,成本差不多要5块钱。

这还没算上随时可能弹出的广告、系统更新、应用版本带来的失败风险。

现在,在AgentBay上跑一次呢?云手机、模型调用、加上自进化采样的完整任务,单次成本是0.2美元,大约1.5元人民币。

阿里AgentBay揭秘,Agent Infra才是真护城河!-AI.x社区

关键点不在于便宜,而在于可预测。

一个永远满血、永远标准化的环境,才让Agent的规模化应用成为可能。

当成本低于一杯蜜雪冰城时,Agent就正式从极客的玩具,变成了人人可用的基础设施。

最后

一个比较深刻的工程哲学可以分享给大家,当模型能力有上限时,与其死磕模型,不如优化环境。

考虑,各种应用版本,操作过程中的各种意外,不如全面拥抱Agent Infra,当所有的配置都是统一、固定的。带来的结果大概率就是任务成功率飙升~

本文转载自​​​探索AGI​​​,作者:猕猴桃

收藏
回复
举报
回复
相关推荐