Manus：三大核心策略，破解AI Agent上下文膨胀难题精华

发布于 2025-10-23 07:52

浏览

0收藏

当一个AI Agent完成一次任务平均要调用50次工具，海量工具结果不断涌入上下文窗口时，LLM的性能会不可避免地遭遇滑铁卢。Chroma的“上下文衰减”研究与Anthropic提出的“注意力预算耗尽”理论，都印证了这一痛点。

Manus作为当下热门的通用消费级AI Agent，其联合创始人兼首席战略官Yichao “Peak” Ji在 webinar 中，首次系统拆解了Manus的上下文工程核心逻辑。

Manus：三大核心策略，破解AI Agent上下文膨胀难题-AI.x社区

以下是我整理出了这份能直接复用的实践指南。

一、为什么上下文工程是AI Agent的“生命线”？

在理解Manus的方案前，先要明确一个关键定义：Anthropic将AI Agent定义为“LLM自主引导流程、调用工具，掌控任务完成路径的系统”，本质是LLM循环调用工具的过程。

而这个过程中，最大的隐患藏在“上下文窗口”里：

工具结果堆积：Manus单次任务平均触发50次工具调用，所有结果若全存进上下文，窗口会迅速被填满。
性能持续衰减：随着上下文内容增多，LLM的注意力会被分散，就像人面对杂乱无章的书桌无法高效工作——Chroma称之为“上下文衰减”，Anthropic则解释为“注意力预算被耗尽”。
行业共识明确：AI领域权威人物Karpathy直接点明，上下文工程的核心，就是“为Agent的每一步行动，精准填充上下文窗口所需的信息”。

Manus：三大核心策略，破解AI Agent上下文膨胀难题-AI.x社区

Manus为每个会话分配独立虚拟机，让Agent拥有文件系统和终端工具。在此基础上，它通过“减少、卸载、隔离”三大策略，实现上下文窗口的高效管理。

Manus为工具调用结果设计“完整版”和“精简版”两种形态：

Manus：三大核心策略，破解AI Agent上下文膨胀难题-AI.x社区

Manus：三大核心策略，破解AI Agent上下文膨胀难题-AI.x社区

当Agent接近上下文窗口上限时，系统会自动触发压缩机制：

很多开发者会为Agent配置大量工具，但这会导致两个问题：工具描述占用大量 tokens，且工具间的重叠、模糊会让LLM confusion。 Manus的解决方案是“分层行动空间”：

函数调用层：仅保留不到20个“原子函数”，如shell（执行终端命令）、text editor（读写文件）、search（搜索）等。这些函数功能通用，能覆盖绝大多数任务需求。
沙盒层：将大量工具（如语音工具、MCP CLI命令）转移到沙盒中，以终端命令形式存在。Agent无需记忆这些工具的细节，只需通过“--help”命令即可随时查看用法。

这种设计不仅减少了上下文窗口中工具描述的占用，还降低了LLM的认知负担——无需在众多工具中做选择，只需调用通用函数，再在沙盒中执行具体命令。

Manus：三大核心策略，破解AI Agent上下文膨胀难题-AI.x社区