LLM的发展极大地推动了自然语言理解和决策制定的进步,展现了在推理、规划和工具使用方面的显著能力。
LLM时代,自主智能体已成为实现AGI的强大范式。然而,随着基于智能体系统的复杂性增加,智能体工作流(Agent Workflow)——一种结构化的编排框架——已成为实现可扩展、可控和安全AI行为的核心。

智能体工作流的目标是使智能体能够在涉及复杂多步骤任务的真实世界场景中完全自主地运行,Paper对智能体工作流系统进行了全面综述(论文链接在文末),核心是从两个关键维度比较了 20 余个代表性系统:功能能力和架构特性。

一、智能体工作流的定义与架构、关键组件与机制也都有介绍:
- 智能体工作流被定义为多个智能体按照一定顺序进行决策,通过与环境的交互使用可用工具来完成任务。
- 提出了一个典型的多层智能体工作流架构,包括用户界面层(UI/UX)、工作流管理层和智能体协作层。
- 智能体在工作流中的不同角色,如规划者、执行者、解析器/解释器、批评者/评审者等。
- 智能体工作流的关键组件,包括智能体的大脑(AI模型)和身体(内置能力和外部工具)。
- 在工作流管理方面,提出了多种工作流模式,如链式工作流、并行化工作流、路由工作流、编排者-工作者模式和评估者-优化器模式。
二、核心是智能体工作流的比较分析
对24种智能体工作流系统进行了比较分析,从功能能力和架构特征两个维度进行评估。
- 功能能力包括规划、工具使用、多智能体协作、记忆机制、图形用户界面(GUI)支持、API交互、自我反思、自定义工具、跨平台部署和开源性。

关键结论:
- 全面领先:Qwen-agent、AgentUniverse、CrewAI 等在多数指标上表现完整。
- 各有侧重:DeepResearch 仅支持 OpenAI API;ReAct、ReWoo 等早期框架在多智能体和 GUI 支持上较弱。
- 开源趋势:约 80% 系统开源,仅 DeepResearch 等个别闭源。
- 架构特征包括智能体角色、工作流执行结构、工作流表示形式、语言、协议和部署模式。

- 关键结论:
- 角色化:AutoGen(Commander-Worker-Critic)、ChatDev(CEO-CTO-Programmer)等明确划分角色。
- 表示形式:DAG(有向无环图)最常见(LangGraph、Meta-GPT),部分采用代码或 JSON 描述。
- 协议差异:REST/Function Schema 为主流,新兴协议如 MCP(Model Context Protocol)逐步出现。
- 部署灵活:多数支持本地部署,部分(如 Coze、Dify)提供 SaaS 或 Web 端。
- n8n:非 LLM 驱动,但具备工作流自动化特性(低代码、工具集成)。
- AutoGen:通过 Commander 协调 Writer 和 Safeguard 智能体,完成代码生成与调试。
- ReWoo:采用“先规划后执行”策略,降低 token 成本,提升推理效率。
- Agno:轻量级多模态框架,支持“团队模式”协作。
三、智能体工作流的优化策略
智能体工作流的优化策略,包括启发式算法、贝叶斯优化和生成式优化器。这些策略旨在提高工作流的效率,减少资源消耗,并优化多任务调度和多目标优化。
四、智能体工作流的应用领域
智能体工作流已在医疗保健、城市规划、金融、教育和法律等多个领域得到应用。例如,在医疗保健领域,TxAGENT利用多模态自适应模型动态生成个性化治疗计划;在金融领域,FinRobot平台模拟人类分析师的推理过程,优化任务执行。

https://arxiv.org/abs/2508.01186
A Survey on Agent Workflow -- Status and Future
本文转载自PaperAgent