
麦肯锡:如何真正交付不烂尾的 Agentic AI? 原创
编辑 | 云昭
关于 Agentic AI,大多数团队都做错了!你的Agent评估方式可能完全是垃圾!
上周,麦肯锡团队基于 50 多个自己牵头的代理 AI 项目,以及市场上的数十个案例,发布了一份现实研究报告《通过代理AI一年实践,总结出六大经验教训》,引起了圈内人士的积极围观和评论。
图片
报告中指出:大多数团队都做错了,并给出了几条避坑心得。
1.别急着造 Agent,先把工作流修好
最大错误是什么?沉迷于你那闪亮的新 AI Agent,却没有解决实际的业务问题。真正聪明的公司不会问“这个 Agent 有多酷?”而是会问:“Sarah 完成整个工作流能快多少?”
- 先绘制痛点图:在写任何一行代码之前,把目标工作流的每个步骤梳理清楚,找出人类浪费时间的地方。
- 为协作而设计:你的 Agent 不是替代人类,而是让人类在特定任务上变成“超人”。
- 编排思维:把 Agent 当作胶水,连接基于规则的系统、分析工具和生成式 AI,创造无缝体验。
2.你的 Agent 评估方式可能完全是垃圾
“上线然后放任不管”只会让用户抱怨“AI 很烂”。把你的 Agent 当作新员工,需要持续的反馈和绩效评估。
- 像命悬一线般构建评估体系:为任务成功率、准确率和偏差检测创建详细的评分标准。
- 让专家参与:领域专家可以为复杂 Agent 写下成千上万条正确输出。
- 监控每个环节:不仅要跟踪结果,还要跟踪每个决策点,这样才能快速调试失败。
3.并不是所有场景都需要 Agent
在你“Agent 化”一切之前,先问自己:“这真的是一个高方差的多步骤决策问题吗?”如果不是,你就是在过度工程化。
- 基于规则 + 结构化数据= 用自动化,不用 Agent
- 非结构化数据 + 简单提取= 用通用 AI 或 NLP,不用 Agent
- 分类 / 预测= 用预测分析或通用 AI,不用 Agent
- 创造性综合 + 判断= 用通用 AI,不用 Agent
- 多步骤决策 + 高方差= 这才需要 Agent
4.一次构建,永久复用
别再为每个任务造独特的 Agent。聪明的团队会构建模块化 Agent 组件,处理通用操作(比如数据提取、搜索、分析),然后在不同工作流中混合复用。
领先公司会创建带有验证服务、可复用代码模式和共享提示的集中平台。这样能减少 30-50% 的重复开发工作,让团队把精力放在真正推动业务的难题上。
5.人类依然在环中(只是角色改变了)
你的 Agent 会完成惊人的任务,但人类依然不可或缺:监督、处理边缘案例、做最终决策。关键在于明确人类判断在哪些环节最有价值。
- 法务团队依然需要批准 AI 生成的合同分析。
- 保险理赔员依然需要审核复杂的索赔。
魔力发生在你设计的工作流中:人类和 Agent 各自发挥优势,通过直观的可视化界面实现无痛协作,而不是彼此拖累。
6.经济可持续性
投资回报率必须可证明。如果没有成本控制,试点项目消耗资金的速度将超过创造价值的速度。
参考链接:https://x.com/aakashg0/status/1969597475762946483/photo/2
本文转载自51CTO技术栈,作者:云昭
