公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

玄姐聊AGI

LV.7

5年连续创业者，融资超亿元｜ AI 大模型资深应用专家

帖子 183

声望 1848

关注 0

粉丝 16

社区头条作者热门内容榜上榜作者

私信

关注

主帖 183

回帖

七种 RAG AI 智能体架构设计剖析

原创精华

在检索增强生成（RAG）不断发展的世界中，并非所有AI智能体都生而平等。有些充当智能路由器，有些是总规划师，还有一些同时处理记忆、工具和逻辑。以下是一个关于智能RAGAI智能体类型的架构设计剖析，每种类型都配有实际用例，展示它们在实践中如何表现。企业在实际业务场景落地中，发现许多这些AI智能体不仅仅是检索文档——它们还会采取行动。它们会规划、路由、验证，甚至会根据用户反馈实时调整。下文我们详细剖析之。一、7...

1天前 368浏览 0点赞 0回复 0收藏

基于 AI Agent 的操作系统架构设计详解

原创

历史总是在众目睽睽之下隐藏其最大的变革。当MSDOS安静地变成Windows3.1时，很少有人会想到它将定义个人计算数十年。当iOS在2008年带着一个小巧的应用商店推出时，它不仅为手机提供动力，还解锁了整个行业。现在，我们再次正处于另一次变革的边缘：基于AI的操作系统平台的崛起，这些平台从一开始就以AI为主要参与者，而不是人类。利害关系巨大，控制主导AI操作系统的公司不仅会销售软件，还将控制自主智能的数字神经系统。下文...

2天前 552浏览 0点赞 0回复 0收藏

LLM、RAG、Workflow、Agent，AI 大模型应用落地该选哪个？

原创

关于AI大模型应用的落地方案选型，最近一年多，围绕LLM（大语言模型）、RAG（检索增强生成）、Workflow（工作流）、Agent（智能体）、MultiAgent（多智能体）孰优孰劣，各方观点吵得可谓是天翻地覆：围绕大模型上下文窗口持续扩容，RAG是否已失去存在价值？围绕模型工具调用能力，LangChain更相信Workflow架构的可控性优势；OpenAI力推Agent的自主决策潜力，到底谁说得对？围绕Agent落地的技术路线，Devin（Cognitio旗下自动编...

3天前 833浏览 0点赞 0回复 0收藏

AI 智能体到底是如何工作的？

原创精华

社区头条

本文是关于AI智能体的工作原理，我用了一个很形象的比喻——把AI智能体比作一个五层蛋糕，每一层都有特定的功能，信息在这些层之间流动，就像一个组织良好的协作团队一样。下文我们详细剖析之。一、AI智能体的5层技术架构剖析想象一下，AI智能体就像一个五层蛋糕，每一层都有特定的工作。信息在这几层之间上下流动，就像在繁忙的办公楼里传递消息一样。1、第一层：用户界面你的前门这是你和AI智能体相遇的地方，就像酒店的前台...

6天前 1185浏览 0点赞 0回复 0收藏

12张动图全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技术

原创

本文通过12张动图全面剖析MCP、RAG、Agent、Cache、Finetuning、Prompt、GraphRAG等AI大模型应用核心技术。下文我们详细剖析之。一、12张动图全面剖析AI大模型应用核心技术1、函数调用和MCP在LLM中的应用在MCP流行之前，AI大模型应用工作流程依赖于传统的函数调用来访问工具。现在，MCP（模型上下文协议）正在改变开发者为AI智能体构建工具访问和编排的方式。2、从头开始训练LLM的四个阶段这张图涵盖了从零开始构建LLM并将其应...

6天前 1112浏览 0点赞 1回复 0收藏

AI 智能体的记忆系统架构设计和落地实现

原创

想象一下，如果你有一个朋友，他忘记了你曾经说过的所有事情。每一次对话都从零开始。没有记忆，没有上下文，没有进展。这会让人感到尴尬、疲惫和不亲切。不幸的是，这正是今天大多数AI智能体系统的行为方式。它们确实聪明，但缺少了一样至关重要的东西：记忆。下文我们详细剖析之。一、AI智能体的记忆系统架构设计和落地实现1、引言：当今AI中的虚假记忆像GPT5或编程副驾驶这样的工具，在你发现自己不得不一遍又一遍地重复指令...

8天前 706浏览 0点赞 0回复 0收藏

基于 MCP 实现 AI 智能体的新架构设计

原创

社区头条

如果你最近一直在深入研究大模型，那么你很可能听说过两个术语：AI智能体和MCP（模型上下文协议）。这两个术语听起来很相似，甚至有重叠之处，但它们解决的是完全不同的问题。今天，我将深入剖析这两个概念：它们是什么，各自的优势在哪里，以及为什么理解它们的区别对我们构建更持久的AI系统至关重要。下文我们详细剖析之。一、基于MCP实现AI智能体的新架构设计1、AI智能体：思考、行动、重复AI智能体是一个利用大语言模型来思...

8天前 1180浏览 0点赞 0回复 1收藏

2025 年 AI 大模型应用面试必问的 10 个架构设计题

原创

最近很多去面试的AI大模型应用工程师架构师的同学反馈：企业面试只关注一件事：当事情变得复杂时，你能否像研究人员、产品负责人或AI大模型应用工程师架构师一样思考？今天，我将带你了解10个精选的AI大模型应用架构设计的面试问题，没有废话，没有“什么是大模型”这种无聊问题。只有真实场景、深度思考以及经得起推敲的解决方案！下文我们详细剖析之。一、10个精选AI大模型应用架构设计面试问题剖析1、面试题一：解释你会如何...

2025-08-11 05:58:03 2806浏览 0点赞 0回复 0收藏

多 AI 智能体协同架构设计与落地实践

原创精华

随着GPT5发布，你最近可能会发现一个奇怪的现象。尽管有各种炒作，但大多数AI智能体系统，甚至是最先进的系统，在面对真正复杂的真实世界任务时，往往会卡壳。当然，它们可以流畅地聊天、撰写论文，甚至编写代码。但如果你要求一个单一模型来规划一次多城市的商务旅行，同时考虑会议日程、签证要求、个人偏好和天气预报，你很快就会发现它无能为力。问题不在于智能，至少不是传统意义上的智能。问题在于任务过载。因此AI多智能...

2025-08-11 05:39:22 955浏览 0点赞 0回复 0收藏

AI 智能体记忆机制和架构设计详解

原创

是否觉得和AI助手聊天就像在重复昨天的故事？你刚和它分享了重要的事情，转眼间它就忘得一干二净。很长一段时间里，这几乎是所有AI助手的通病——它们虽然聪明绝顶，但记忆却像金鱼一样短暂。不过，这种局面正在被打破。如今，AI助手不仅能记住上周的对话，还能想起你的喜好，并且会从长期的互动中不断学习。这正是当下AI领域最前沿的研究方向之一，也是我今天想要重点探讨的话题：AI智能体记忆能力的奥秘。接下来，就让我们一...

2025-08-11 05:31:10 1042浏览 0点赞 0回复 0收藏

构建多模态 Agentic RAG 架构设计与代码实现

原创

科技巨头们每天都在生产环境中使用多模态RAG（RetrievalAugmentedGeneration，检索增强生成）系统。比如：Spotify用它来回答音乐相关的问题；YouTube用它把文字提示词变成音乐；AmazonMusic用它根据提示词创建歌单。今天，我们来学习如何构建一个能通过语音查询文档和音频文件的多模态AgenticRAG系统。下文我们详细剖析之。一、多模态AgenticRAG架构设计和代码实现1、多模态AgenticRAG技术栈AssemblyAI：用于语音转文字。Milvus...

2025-08-11 05:21:30 1124浏览 0点赞 0回复 0收藏

64张图全面剖析 AI 智能体的架构设计和关键技术

原创精华

基于大语言模型（LLM）的AI智能体正在变得越来越普遍，似乎正在取代我们熟悉的“常规”对话式LLM。这些令人惊叹的能力并非轻易就能实现，需要许多组件协同工作。在这篇文章中，我们将通过64张图，探索AI智能体的架构设计、关键技术、主要组成部分、以及多智能体框架。具体包括14项关键技术：什么是LLM智能体、记忆、短期记忆、长期记忆、工具、Toolformer、模型上下文协议（MCP）、规划、推理、推理与行动、反思、多智能体协作...

2025-08-07 07:41:23 3633浏览 0点赞 0回复 0收藏

构建靠谱的 Agentic RAG 工作流架构和落地实践

原创

RAG系统生成不准确无用回答是很常见的。今天，我们来看看如何使用CleanlabCodex来改进这一点。CleanlabCodex通常用于生产系统中，可以自动检测并解决RAG的不准确问题。下文我们详细剖析之。一、AgenticRAG工作流架构设计第一、AgenticRAG工作流使用的技术栈使用LlamaIndex进行编排；使用Milvus作为自托管的向量数据库；使用CleanlabCodex验证回答；使用OpenRouterAI访问最新的Qwen3C。第二、AgenticRAG工作流架构设计LLM处理查...

2025-08-06 06:16:17 1499浏览 0点赞 0回复 0收藏

AI 智能体的八种记忆系统架构设计与落地

原创精华

没有记忆的AI智能体像金鱼，三秒就忘了。记忆太满的AI智能体像大象，步子慢还喘。如何既记且省？下面8种记忆系统架构设计和落地一次讲透，每种记忆系统都配完整思路、优缺点、代码、踩坑、调参建议，方便你直接落地。下文我们详细剖析之。一、AI智能体8种记忆系统架构设计与落地1、全量记忆系统：最直男的“我全都要”第一、架构设计把用户输入和模型回复按时间顺序追加到一个list，下次推理时整包塞给LLM。第二、代码示例第三...

2025-08-05 06:13:43 1636浏览 0点赞 0回复 0收藏

浅显易懂的上下文工程技术指南

原创

什么是上下文工程？为什么大家都在谈论它？今天我们来了解一下！上下文工程正在迅速成为AI大模型应用新架构师工程师的一项关键技能。它不再仅仅是巧妙地提示词，而是关于系统性地组织上下文。目前存在的问题是：大多数AI智能体（或大语言模型应用）之所以失败，并不是因为大模型本身不好，而是因为它们缺乏成功所需的正确上下文。例如，一个典型的检索增强生成（RAG）工作流程通常是80%的检索和20%的生成。所以：好的检索即使搭...

2025-08-05 06:12:16 588浏览 0点赞 0回复 0收藏

AI 智能体应用落地八层技术架构剖析

原创精华

社区头条

以前的AI就是按指令办事，现在不一样了，AI智能体能自己做决定、定目标、独立行动。它不再是简单的“你问我答”，而是有计划、有反思的“小能手”。搞清楚它的技术架构，就能更好地用它在企业里进行落地。AI智能体技术架构一共有8层：基础设施层、智能体互联网、协议层、工具和增强层、认知和推理层、记忆和个性化层、应用层、运维和治理层，下文我们详细剖析之。一、AI智能体八层技术架构剖析0、AI智能体的八层架构：让AI在复...

2025-08-05 06:11:52 1566浏览 0点赞 0回复 0收藏

基于 MCP 的 AI 智能体应用新架构设计新范式剖析

原创

社区头条

在当今数字化时代，AI大模型正以前所未有的速度改变着我们的生活和工作方式。AI智能体作为智能应用的核心，承载着企业创新和效率提升的重任。然而，随着业务需求的复杂化，AI智能体的开发和部署面临着诸多挑战。传统开发模式下，每个AI智能体都需要独立寻找接口、解析数据、编写适配代码，导致开发效率低下、重复工作量大，严重限制了AI智能体应用的规模化发展。为了解决这些问题，基于MCP（ModelContextProtocol，模型上下文协...

2025-07-31 08:49:25 919浏览 0点赞 0回复 0收藏

AI 智能体企业落地，其实90%都是工程架构设计，只有10%才是真正的 AI 大模型

原创

越来越多企业已经落地AI智能体应用，我们会不约而同的发现，AI智能体应用在企业落地90%的工作都是工程架构设计（软件工程），只有10%是真正的AI大模型。AI智能体在企业落地中的每一个组件都是模块化的，而且逐步达成到了行业标准：比如：LangChain、SpringAIAlibaba开发编排框架，MCP通信交互协议等等，这些构成了AI智能体的生态系统。AI智能体应用落地的生态系统包含14层，从下到上分别为：CPUGPU提供商层、基础设施基础层、数...

2025-07-31 08:30:16 948浏览 0点赞 0回复 0收藏

Claude Code 遭深度逆向工程！ AI 编程智能体核心架构设计曝光

原创

ClaudeCode是Anthropic公司的AI编程方面最拿出手的AI智能体产品。最近ClaudeCode被一个民间高手做了深度逆向工程，曝光了ClaudeCode的核心多层AI智能体技术架构、实现机制和运行逻辑等，为理解现代AI智能体系统的工程架构设计实现提供了宝贵的技术参考。下文从ClaudeCode整体架构设计、ClaudeCode十三大关键技术详细剖析之。一、ClaudeCode整体架构设计剖析1、ClaudeCode系统架构全景图ClaudeCode系统架构由用户交互层、Agent核...

2025-07-28 09:26:33 2314浏览 0点赞 0回复 0收藏

九种 MCP 架构设计模式剖析

原创精华

MCP是AI应用与能力（tools、prompts、resources）之间的通用连接器，类似于USBC为电子设备之间的连接提供了标准化接口。MCP把原来获取数据的M×N集成问题，通过统一、标准化的接口打破了这种模式，优化为M+N集成问题，大大简化了架构设计和提升了效率。在企业级实际落地中，MCP有9种常见的架构设计模式，下文我们详细剖析之。一、MCP9种架构设计模式1、架构设计模式一：完全本地的MCPClientMCPClient是AI应用（比如：Cursor）中...

2025-07-28 09:17:02 1374浏览 0点赞 0回复 0收藏

获得成就

已积累 15.0w 人气

获得 4 个点赞

获得 15 次收藏