
Manus蝴蝶效应与AI智能体泡沫 原创
Manus是蝴蝶效应公司(Butterfly Effect)推出的全球首款通用型AI智能体产品,其名称源自拉丁语“Mens et Manus”(意为“手脑并用”),强调将思考转化为实际行动的能力;近期,该公司因投资方压力撤离中国,引发广泛关注。
2025年AI Agent赛道涌现大量同类产品,但多数存在"Demo能飞、落地常摔"的现象。用户试用一次即放弃的比例居高不下,市场存在过度炒作现象。例如,内测邀请码曾被炒至数万元高价,但团队否认参与炒作。
Manus作为一款引起轰动效应的通用型AI智能体(AI Agent),定位为“数字员工”,旨在通过自主规划、执行和验证任务,替代人类完成复杂工作。Manus的多代理架构与Anthropic的"Computer Use"技术相似,其"自主规划"功能可能仅基于现有大模型的调用(如GPT-4),而非底层技术突破。其核心功能包括:
- 多任务处理能力:理解复杂指令并跨领域协同,例如自动生成PPT、筛选简历、分析股票数据或规划旅行行程,全程无需人工干预。
- 技术架构:采用“规划-执行-验证”三模块多智能体系统:
- 规划代理:拆解任务步骤(如将“商业策划”分解为市场调研、预算规划等)。
- 执行代理:调用工具链(如浏览器、代码编辑器)完成子任务。
- 验证代理:交叉核验结果准确性,确保交付完整成果。
- 性能表现:在GAIA基准测试(评估通用AI助手解决真实世界问题能力)中创下新纪录,复杂项目首次完成率达78%,远超同类产品。
第一阶段:入门 - 智能体是什么?
这个阶段的目标是建立对智能体的直观认知,理解其核心组成部分。
1. 核心定义:超越简单聊天机器人
- 简单比喻:如果一个大型语言模型是一个拥有丰富知识和强大逻辑的大脑,那么一个智能体就是一个拥有这个大脑,并具备了感知、规划、记忆和使用工具的完整机器人。
- 官方定义:AI智能体是一个能够感知环境、进行推理、制定决策并执行行动以实现特定目标的自治系统。
2. 智能体的“灵魂”四要素:这是理解任何智能体的框架,缺一不可。
- 规划:核心能力。智能体不是一步一步被指挥,而是能自主拆解复杂目标。例如,目标不是“回答这个问题”,而是“为公司写一份季度市场报告”。智能体会自己规划出:1. 搜集最新市场数据 2. 分析竞争对手动态 3. 总结用户反馈 4. 撰写报告草稿 5. 润色格式。
- 工具使用:关键能力。智能体可以调用外部工具来扩展能力边界。这包括:
a.搜索工具: 获取实时信息。
b.代码解释器: 进行数学计算、数据分析。
c.API调用: 发送邮件、操作数据库、控制智能家居。
- 记忆:智能体拥有短期记忆(当前任务的上下文)和长期记忆(存储用户偏好、历史交互记录、学到的知识),从而实现个性化的、连贯的持续服务。
- 行动:将规划好的步骤,通过调用工具,一步步执行出来,并观察结果,动态调整计划。
3. 一个经典例子:
- 任务:“帮我预订下周二从北京到上海的最便宜的非红眼航班,并选一个靠窗的座位。”
- 简单ChatGPT:可能会给你一些建议和航空公司网站链接。
- AI智能体:
- 规划:分解为:查询航班 -> 比价 -> 选择航班 -> 模拟选座 -> 完成预订。
- 工具使用:调用航班搜索API -> 调用航空公司选座API -> 调用支付系统(如果授权)。
- 记忆:记住你的偏好(“最便宜”、“非红眼”、“靠窗”)。
- 行动:执行上述所有步骤,最后告诉你:“已为您预订国航CA123,票价¥680,座位32A,靠窗。”
第二阶段:进阶 - 智能体的类型、技术栈与架构
这个阶段的目标是了解智能体的不同形态和背后的技术原理。
1. 智能体的分类:
- 按反应程度分:
a.反射式智能体: 基于当前状态直接做出反应(如IF-THEN规则),无长期规划。
b.模型式智能体: 维护一个内部世界模型,能预测行动后果。
c.目标型智能体: 围绕特定目标进行规划和行动(当前主流)。
d.效用型智能体: 在多个目标中做出最优选择,追求“满意度”最大化。
- 按应用场景分:
a.单智能体: 独立完成任务。
b.多智能体系统: 多个智能体协作(如一个负责设计,一个负责编码,一个负责测试)或竞争,模拟社会行为。
c.模拟智能体: 在虚拟环境中扮演角色,用于游戏、社会科学仿真等。
2. 核心工作流与架构:一个典型的智能体工作流是一个循环(Reasoning Loop):感知 -> 规划 -> 行动 -> 观察 -> 再规划...
- 规划技术:
a.思维链: 让模型一步步推理。
b.思维树: 在关键决策点探索多种可能性路径。
c.思维图: 更复杂的,将想法、步骤和结果构建成图,允许回溯和跳跃。
- 关键技术栈:
a.大脑: 强大的LLM(如GPT-4, Claude 3, Llama 3)。
b.框架: LangChain, LlamaIndex, AutoGen, CrewAI 等,它们提供了构建智能体的标准化工具和模块。
c.工具: 函数调用,让LLM能可靠地触发外部代码。
d.记忆: 向量数据库,用于存储和检索长期记忆。
第三阶段:精通 - 构建、优化与未来
这个阶段面向开发者和深度爱好者,涉及如何亲手构建和优化智能体,并洞察其未来。
1. 从0到1构建一个智能体:
- 第一步:定义目标。目标必须清晰、可衡量。例如:“一个能自动分析我Notion知识库并撰写周报的智能体”。
- 第二步:选择工具。它需要哪些能力?读取Notion API?搜索网络?生成文本?
- 第三步:设计工作流。它是先搜索再总结,还是先总结再搜索验证?
- 第四步:选择技术栈。使用LangChain还是AutoGen?使用哪个LLM?记忆存储在哪里?
- 第五步:实现与迭代。编写代码,进行大量测试,处理各种边界情况(如工具调用失败、网络错误等)。
2. 核心挑战与优化策略:
- 可靠性问题:智能体可能会“胡编乱造”工具的参数或结果。
对策: 严格的提示工程、为工具提供清晰的定义和示例、设置验证步骤。
- 效率与成本:复杂的规划需要多次调用LLM,成本高且速度慢。
对策: 使用更小、更专精的模型处理简单任务,优化工作流,减少不必要的步骤。
- “无限循环”风险:智能体可能在某个步骤卡住,不断重复失败的操作。
对策: 设置最大重试次数和超时机制,引入人工监督点。
- 安全性:智能体被恶意引导或工具被滥用。
对策: 对工具权限进行严格管控,对用户输入进行安全过滤。
3. 未来展望与前沿趋势:
- 自主智能体:能够长期运行、自我学习和进化的智能体(如AutoGPT的愿景)。
- 具身智能:智能体与物理机器人结合,在真实世界中执行任务。
- 超级智能体:由多个专家智能体组成的“董事会”或“公司”,协同解决极其复杂的问题。
- Agent-as-a-Service:未来我们可能像调用API一样,调用各种专业能力的智能体服务。
Manus的技术理念强调“更少的结构、更多的智能”(less structure more intelligence),主张通过优质数据、强大模型和灵活架构自然涌现能力,而非预设功能。Manus的发布推动AI智能体赛道爆发,同期涌现智谱AutoGLM、字节扣子空间等竞品,并带动A股AI概念股上涨。
从将AI智能体理解为 “会使用工具的AI”(入门),到理解其架构、工作流和技术栈(进阶),再到能够亲手构建并解决其核心挑战(精通),这条路径清晰地勾勒出了掌握这一变革性技术的全过程。
AI智能体指能够理解复杂指令、使用工具(如操作浏览器、调用API)、执行多步骤任务以实现目标的AI系统。它是当前AI创业和投资最火热的方向,这也导致了泡沫的形成。
- 资本狂热:巨大的想象空间(“取代白领工作”、“自动驾驶公司”)吸引了海量投资。
- 门槛降低:GPT等模型的出现,让构建一个“看起来”很智能的Demo变得异常简单。
- 同质化竞争:无数创业公司都在做类似的“客服智能体”、“写作智能体”、“数据分析智能体”,技术护城河不深。
- 落地难题:演示很酷,但达到稳定、可靠、能真正创造商业价值的“生产级”智能体非常困难。幻觉问题、成本问题、流程断裂问题比比皆是。
这个“泡沫”会持续多久?
这是一个动态过程,我们可以将其分为几个阶段来看:
第一阶段:狂热膨胀期(现在 - 未来1-2年)
- 特征:我们现在正处在这个阶段的顶峰或中后期。
a.资本持续涌入,故事一个比一个讲得好。
b.新的AI智能体创业公司层出不穷,估值居高不下。
c.“Manus蝴蝶效应”频繁发生,开发者们一边抱怨,一边不得不紧跟巨头的步伐。
- 驱动力:技术突破带来的无限遐想和FOMO(错失恐惧症)。
第二阶段:挤压与分化期(未来2-3年)
- 特征:泡沫开始被挤压,这是最关键的时刻。
a.资本降温:投资者开始要求看到真实的营收和用户增长,而不仅仅是用户数量。许多只会烧钱、无法盈利的项目将融不到下一轮资金。
b.大规模倒闭与并购:大量同质化、技术实力弱、产品找不到市场的初创公司会倒闭。巨头和幸存下来的头部公司会进行低价并购。
c.价值显现:真正有技术壁垒(如在特定领域有精调模型、有独特数据、有稳健工作流)、能解决实际痛点、并拥有清晰商业模式的公司会脱颖而出,价值变得更加坚实。
d.底层平台开始稳定:为了建立更健康的生态,“Manus”们会开始提供更稳定、版本管理更清晰的API服务,因为它们的利益也依赖于一个繁荣的应用生态。
第三阶段:理性发展与应用深化期(3年后及更远)
- 特征:“泡沫”成分基本挤出,行业进入健康发展阶段。
a.基础设施化:AI智能体技术像今天的云计算、数据库一样,成为企业软件的标配组件,而不再是一个吸引眼球的“概念”。
b.垂直领域深耕:通用的、万金油式的智能体减少,在医疗、法律、金融、教育等特定领域深度集成、高度专业的智能体成为主流。
c.商业模式成熟:SaaS订阅、按次收费、价值分成等模式变得清晰和可规模化的。
d.“蝴蝶效应”减弱:一方面底层模型迭代速度可能放缓;另一方面,应用层学会了通过抽象层、多模型策略等方式来规避单点依赖风险。
结论与展望
- “泡沫”不会瞬间破灭,而是会缓慢泄气:它不会像2000年互联网泡沫那样以戏剧性的方式崩溃,因为AI技术确实有坚实的生产力和创造力价值基础。更可能的过程是“挤泡沫”,即淘汰掉滥竽充数者,让真正的强者生存。
- “蝴蝶效应”与“泡沫”是共生关系:底层模型快速迭代的“蝴蝶效应”既是泡沫的催化剂(提供了创新的土壤),也是泡沫的挤压器(频繁的变化淘汰了适应能力弱的玩家)。当泡沫被挤压后,生态会找到共处的方式,“蝴蝶效应”的影响会相对减小。
- 持续时间预测:整个“挤泡沫”和行业分化的过程,大概需要2到4年时间。到2028年左右,我们可能会看到一个更加理性、稳固和强大的AI应用市场格局。届时,AI智能体将不再是“泡沫”,而是像今天的移动互联网应用一样,是数字经济中坚实的一部分。
AI智能体正将大语言模型从一个“百科全书式的大脑”转变为一个可以进入数字世界和物理世界、并为我们实际干活的“数字员工”。这不仅是技术的演进,更是人机交互范式的一次根本性革命。我们正处在一次技术革命浪潮的早期狂热阶段。混乱、依赖、泡沫都是这个阶段的典型特征,它不会永久持续,但它的终结不是AI的终结,而是AI真正开始深度融入并改造各行各业的新起点。
本文转载自数智飞轮 作者:天涯咫尺TGH
