鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

Agent 是一种思想，不是技术！

hm673c38238a021

发布于 2025-6-24 06:29

浏览

0收藏

最近很多人在提Agent，有人说它是大模型的下一步，有人说它是通往AGI的路径。但实际上，对于大多数做技术落地的人来说，Agent到底能干什么、适合解决哪些问题、怎么用才合适，反而是更值得关注的。

我的观点“先规划，再执行，还能自查”的过程，其实就是Agent的基本思想。Agent 是一种思想，不是技术！

一、先说最本质的一点：为什么会需要Agent？

我们先从现实出发。

大模型出来之后，最开始大家用它写点文案、改代码、问点问题，都挺方便，但问题也很明显：你每次都得手动喂信息，问一次答一次，像个高级搜索引擎。

这就带来几个局限：

做复杂任务时，每一步都要人盯着操作，很累；
一些工作流程，其实大模型是能处理的，但光靠Prompt不够；
你希望大模型“动起来”，自己一步步干事儿。

Agent就是为了解决这个问题的。它的核心，就是让大模型不只是“会答题”，而是“会做事”。

二、Agent到底是什么？用一句大白话说

Agent就是一套机制，让大模型具备“规划 → 执行”的能力。

举个很贴切的例子：

你上学写作文时，如果直接动笔，一口气写完，大概率写得乱七八糟；
如果你先列个提纲，想好开头、中间、结尾，再一点点写，中间还能修改检查，那写出来的质量就不一样。

这个“先规划，再执行，还能自查”的过程，其实就是Agent的基本思想。

大模型以前像是上来就写的那种，现在通过Agent，可以先规划，再一步步执行、优化。

三、Agent 的设计原理：不是更聪明，而是更能干活

很多人以为 Agent 就是“高级一点的大模型机器人”，其实不太对。

我们来看下面这张图：

Agent 是一种思想，不是技术！-AI.x社区

它展示的是一个 Agent 系统背后的核心设计理念。

说人话就是：怎么让大模型不仅会答题，还能主动思考、执行任务，自己干活。

Agent 的核心目标只有一个：让大模型少依赖你，多替你做事

大模型其实有“脑子”，但没“手脚”。

你问一句它答一句没问题，但要它自己去：

查资料；
调 API；
记住上下文；
规划步骤；
自我反思纠错……

它就歇菜了。

Agent 的设计，就是在大模型“大脑”之外，给它配上“记忆”“工具”“规划器”和“行动执行器”，让它像一个自己能跑流程的小工人。

这张图到底讲了什么？用一句话解释：

它是在模拟人做事时的思维闭环：记忆 → 计划 → 工具 → 行动 → 复盘。

每一块都干件正事：

模块	作用
Memory	记住它之前干过什么，避免重复、忘事
Planning	遇事先想步骤，再动手，不乱来
Tools	干不了的活，就找“外援”——天气接口、数据库、搜索工具都能接
Action	真正去跑代码、发请求
Reflection / Critic	做完了自己检查，错了就再来
大模型	提供逻辑推理，连接所有模块的“脑子”

具体例子：查“张三医生 2023 年发了几篇文章”

传统大模型的流程：

用户一句 Prompt → 模型胡乱猜 → 回一个大概率是错的数字。

Agent 的流程：

规划步骤：先确定人，再查文章，再统计；

调用工具：调医院查人、调数据库查文章、用代码统计；

记住过程：下次问他哪篇引用多，就不用重查；

复盘优化：发现查的是重名，主动过滤、重新查。

这就是真正的闭环。Agent 和大模型的区别就在于它能跑一整套流程，而不是单点应答。

四、Agent真的能落地吗？目前主流的做法是什么？

现在Agent这个方向确实很热，但也分不同层级的使用方式：

方案	适合人群	特点
COZE / Dify	产品团队做原型	快速集成，不需要开发能力
MetaGPT/AutoGen	有开发能力的团队	可定制、可扩展，可二次开发
LangChain/LangGraph	专职大模型开发者	灵活强大，工程能力要求高
自研	技术团队能力强	成本高，但自由度最大

简单讲：你可以用现成工具拼，也可以从底层框架写，但关键是要根据业务来选，别一上来就上LangChain。

五、O1模型的出现，为什么对Agent影响很大？

Agent本质是靠“大模型去思考并完成多步任务”，那模型本身的推理能力就特别关键。

O1模型之所以被讨论，是因为它的“解题能力”和“推理深度”在多个评测中都非常突出，比如能解奥数题、博士级物理问题等等。

这意味着，如果把O1接入Agent系统，Agent能做的事可能不只是“问答”或“流程执行”，而是能处理复杂、真实的“决策级任务”。

所以说，推理能力强的大模型，是Agent真正有价值的前提。

最后总结一句话：

Agent不是大模型的附属品，而是让大模型真正“动起来”的关键机制。

本文转载自大圣数据星球，作者：大圣

标签

赞

收藏

回复

举报

回复

相关推荐

未来人类只有母语一种语言

duhorse • 4044浏览 • 0回复
利用大语言模型增强网络抓取：一种现代化的方法

51CTO内容精选 • 6112浏览 • 0回复
介绍一种实用的RAG技术：父文档检索（PDR）

51CTO内容精选 • 3807浏览 • 0回复
一种模块化大模型Agent框架全栈技术综述

PaperAgent • 5967浏览 • 0回复
一种支持4种多模态RAG技术的引擎：VARAG

PaperAgent • 4569浏览 • 0回复
Binary Block Masking：加快稀疏 Attention 的一种新方法

amei2000go • 5725浏览 • 0回复
一种将RAG、KG、VS、TF结合增强领域LLM性能的框架

PaperAgent • 3865浏览 • 0回复
COLM 2024：一种新的深度学习架构——Monotone Deep Boltzmann Machines

AIGC最前线 • 3763浏览 • 0回复
TableRAG：一种增强大规模表格理解框架

大模型自然语言处理 • 3806浏览 • 0回复
HiQA：一种用于多文档问答的层次化上下文增强RAG

大模型自然语言处理 • 3242浏览 • 0回复
微软发布LLM2CLIP：一种新型AI技术，LLM成为CLIP视觉编码器的“老师”

Halo咯咯 • 5067浏览 • 0回复
一种基于学习的电池寿命预测（Python）

步惊云_32 • 3554浏览 • 0回复
多Agent思想显著提升小模型工具调用能力

arnoldzhw • 4409浏览 • 0回复
大模型提示词，事实上就是一种聊天技巧

AI探索时代 • 3307浏览 • 0回复
FlexTok-一种图像编码新方式

shizhi02 • 2780浏览 • 0回复
人工智能应用最大的问题是数据问题，而不是技术问题

AI探索时代 • 2292浏览 • 0回复
Google介绍了Agent2Agent（A2A）：一种新的开放协议，允许AI代理在生态系统中安全地合作

Halo咯咯 • 3691浏览 • 0回复
Agent 是一种思想，不是技术！

hm673c38238a021 • 1819浏览 • 0回复
对技术人员的一种劝告——关于技术至上的思考

AI探索时代 • 1487浏览 • 0回复

hm673c38238a021

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

2025 年国产大模型淘汰赛：DeepSeek、阿里、字节跳动、清华智谱谁将称王？ 2025-07-29 00:15:20发布
这才是大模型蒸馏本质！ 2025-05-28 06:48:19发布

热门推荐

2025年五大本地大模型，程序员必看！ 0回复

智能体主流框架深度研究报告：功能特性、用户群体、技术架构与商业化路径分析 0回复

阿里通义重磅开源 DeepResearch：让 AI 具备 “人类级研究能力” 的技术架构全景解析 0回复

可灵AI数字人来了！快手重磅发布Kling-Avatar，面向多模态指令理解与控制的数字人长视频生成新范式 0回复

NeurIPS'25 智能体最新技术即时洞察：6大方向、代表论文、发展趋势 0回复

上一篇：这才是大模型蒸馏本质！

下一篇： 2025 年国产大模型淘汰赛：DeepSeek、阿里、字节跳动、清华智谱谁将称王？

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载