一文看懂Agent下半场， Agent Infra 成为新的护城河！

探索AGI

发布于 2025-9-15 07:54

浏览

0收藏

前阵子，智谱AutoGLM还是挺刷屏的，它的核心理念是，给每个人配一个云端分身，7x24小时的帮大家干活~

今天想给家人们详细挖掘一下Agent Infra，随着模型的Agent能力越来越强，infra也变得越来越重要了！

为什么AI Agent 需要新的AI infra？

过去，我们谈论Agent，只讲他的大脑。

因为大脑负责思考，工具负责执行。但是，一个越来越不容忽视的组件是，Agent的身体。

因为Agent都存在一个致命缺陷：它们在你的个人电脑上运行。

这意味着：

抢占资源： Agent 一跑起来，你的电脑屏幕、CPU 就被占用了，你只能眼睁睁看着它操作，自己啥也干不了。
安全问题：不可能让一个AI在自己的电脑上有完全的控制权的！
中断就GG：任务执行到一半，电脑休眠了、断网了，或者手滑关掉了命令行窗口，那之前的一切努力都可能付诸东流。

就像现在的AI 浏览器，给Agent提供了一个隔离的环境，安全感能提升不少。

一文看懂Agent下半场， Agent Infra 成为新的护城河！-AI.x社区

Manus 之所以惊艳，同样也展示了一个在云端拥有稳定、隔离环境的 Agent 是多么强大。

但是Agent Infra，要做到的远不止一个隔离环境这么简单！

Agent Infra核心要素

类似于大模型infra，Agent infra也不是某一个技术，是一系列复杂的技术栈。

云原生执行与沙箱隔离

它的核心是 CCaaS (Cloud Computer as a Service for Agents)，也就是为智能体提供的云电脑服务。每一个 Agent 任务，都不再运行在你的本地电脑上，而是在云端启动一个完全隔离的、临时的“云电脑”或“云手机”实例。

一文看懂Agent下半场， Agent Infra 成为新的护城河！-AI.x社区

在AutoGLM里边每一次的任务提交，都会自动创建一个云电脑或者云手机。可以随时查看AI在干什么，随机接管手机操作。

一文看懂Agent下半场， Agent Infra 成为新的护城河！-AI.x社区

去年，AutoGLM第一波内测，那个时候还是基于手机的无障碍模式，来进行操作本地的手机，用起来挺心惊胆颤的。

但是到现在，国产Agent infra发展真的挺快，不确定是哪家的infra。AutoGLM2 包含模型调用和虚拟机资源的单次任务成本，被压缩到了约 0.2 美元（约 1.5 元人民币）。

这个价格，让 Agent 从少数人的奢侈品，变成了人人都能用得起的日用品。

MCP 协议

Agent生态做起来，其中很重要的一点就是MCP协议。

因为一个智能体要干活，就得调用各种工具（API、数据库等）。

当你有M个智能体和N个工具时，点对点的连接会变成一场M×N的集成噩梦。

所以通过MCP把所有工具统一接入、认证、管理，并转成智能体能理解的标准语言。这就非常方便了，不管是手机端、还是电脑端，即插即用。

随便跑一个任务，最少就要调用搜索+browser_use工具。

一文看懂Agent下半场， Agent Infra 成为新的护城河！-AI.x社区

持久化状态管理

这一点也非常的重要，比如说，你登陆微博、小红书，第一次你让用户去登录那肯定没问题。

但是要是每一次任务执行，拉起的云环境都要用户去登录配置，那这个应用注定要被用户diss。

可观测性与护栏

安全性、可溯源性、可调试，属于老生常谈的问题了。

操作被准确记录，哪些文件可以精准控制，哪些是红线。

最后

一个比较深刻的工程哲学可以分享给大家，当模型能力有上限时，与其死磕模型，不如优化环境。

如果AutoGLM的无障碍模式技术路线沿用的话，他就要考虑各种数据问题：

每个人的手机App版本、UI布局都不一样。
操作过程中随时可能弹出广告、通知。
手机型号千奇百怪，折叠屏、刘海屏……

让大模型去适配这种无限的混乱，成本太高，几乎是不可能完成的任务。

但是将AutoGLM2部署在云环境里。所有的配置都是统一、固定的。带来的结果就是任务成功率飙升~

标签

Agent

UI布局

AI infra

已于2025-9-15 07:54:22修改

相关推荐

AI迎来Uber时刻，初创公司如何构筑新护城河？

liutao988 • 3413浏览 • 0回复
一文深入了解AI Agent -- 组成、方法、案例及展望

angel • 2.3w浏览 • 0回复
无界AI算法总监邹国平:Midjourney领跑，没有标准答案的文生图，下半场还能怎么卷？

51CTO技术栈 • 3731浏览 • 0回复
一文看懂RAG的各种套路 | 综述：当RAG遇到大语言模型

大语言模型论文跟踪 • 5687浏览 • 0回复
一文彻底理解大模型 Agent 智能体原理和案例

玄姐聊AGI • 5832浏览 • 0回复
一文讲清什么是 AI Agent（智能体）？

wsp_ping • 7062浏览 • 0回复
一文彻底理解大模型 Agent 智能体原理和案例

玄姐聊AGI • 5422浏览 • 0回复
一文教会如何动手搭建AI Agent

数智飞轮 • 7642浏览 • 0回复
一文看懂：四种多Agent范式哪种最好

大语言模型论文跟踪 • 5155浏览 • 0回复
构建AI Agent必学的4种设计模式，一文了解

Baihai_IDP • 2940浏览 • 0回复
一文看懂Agentic AI、AI Agents和Agents：别再傻傻分不清了！

探索AGI • 6660浏览 • 0回复
一文揭秘MCP Server、Function Call与Agent的核心区别

九歌AI大模型 • 1.1w浏览 • 0回复
玩转智能体一站式AI Agent开发工具链攻破Manus护城河

数智飞轮 • 6293浏览 • 0回复
Agent模型能力哪家最强？一文选出最合适Agent大模型

石映飞云 • 7206浏览 • 0回复
OpenAI大佬：AI上半场忙着开发新训练方法和模型GPT-4/o1/o3，下半场呢？

PaperAgent • 1901浏览 • 0回复
人工智能进入 “下半场”，未来将走向何方？

十一月雨_55 • 2030浏览 • 0回复
AI 时代的“插头”与“插座”——一文看懂 MCP、A2A 与 ACP

Halo咯咯 • 3290浏览 • 0回复
单Agent已过时？一文看懂多智能体架构设计

Halo咯咯 • 4441浏览 • 0回复
当RAG遇上了推理：一文看懂 DeepResearch 背后的灵魂

大语言模型论文跟踪 • 1624浏览 • 0回复

探索AGI

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

一文看懂Agent下半场， Agent Infra 成为新的护城河！

为什么AI Agent 需要新的AI infra？

Agent Infra核心要素

云原生执行与沙箱隔离

MCP 协议

持久化状态管理

可观测性与护栏

最后

目录