构建AI智能体的过程,已经被像LangChain、SpringAIAlibaba等开发框架大大简化了,然后这些框架往往隐藏了驱动AI智能体运行的底层逻辑,比如:ReAct(ReasoningandActing),让大模型(LLM)思考问题,并使用工具对任务采取行动。但很多时候,仅依赖预包装的库而不了解它们的内部工作原理,可能会导致困惑。下面的例子就展示了AI智能体在产生回应之前,会经历一系列的思考活动。在本文中,我们将通过深入剖析ReAct架构设计模式,...
MCP是AI应用与能力(tools、prompts、resources)之间的通用连接器,类似于USBC为电子设备之间的连接提供了标准化接口。MCP把原来获取数据的M×N集成问题,通过统一、标准化的接口打破了这种模式,优化为M+N集成问题,大大简化了架构设计和提升了效率。在企业级实际落地中,MCP有9种常见的架构设计模式,下文我们详细剖析之。一、MCP9种架构设计模式1、架构设计模式一:完全本地的MCPClientMCPClient是AI应用(比如:Cursor)中...
多年来,我们一直通过SELECT–FROM–WHERE这种格式与数据库进行交流,从简单的报表生成到复杂的财务分析,再到用户行为的查询,SQL已经成为我们与数据库沟通的默认语言。有趣的是,即使是那些最初声称要颠覆SQL的NoSQL数据库,最终也纷纷引入了对SQL的支持。但是,仅仅因为SQL支持一直如此,就意味着它永远正确吗?据Gartner的预测,到了2026年,大多数企业将会优先考虑使用自然语言作为数据库查询的接口,SQL将从一个必备技能...
多智能体系统(MutiAgents)是能够自己思考、计划、找出相关信息来源并从中提取信息、采取行动,甚至在出错时还能自我纠正的自动系统。OpenAI推出了Swarm开源框架,用来以一种非常灵活的方式来管理和协调多智能体系统。本文我们基于OpenAI推出的Swarm开源框架,来实现多智能体系统。内容包括:多智能体案例架构设计;多智能体案例代码级实现。下文我们详细剖析之。1、多智能体案例架构设计今天,我们来做个实际的操作演示。我们...
RAG(检索增强生成)是企业AI大模型应用落地的主要应用形态之一,特别是在智能问答、报告生成、内容审核、Text2SQL、流程自动化和AI编程等领域大规模应用和落地RAG架构。图片从技术本质来分析,RAG架构设计是由两部分构成:数据工程和信息抽取。其中数据工程是最重要的部分,它的目的是把多模态的数据转化为结构化的知识。数据工程在优化RAG效果过程中至关重要,数据工程质量直接决定了最终的检索和生成效果。无论采用何种文档...
RAG(检索增强生成)是企业AI大模型应用落地的主要应用形态之一,特别是在智能问答、报告生成、内容审核、Text2SQL、流程自动化和AI编程等领域大规模应用和落地RAG架构。从技术本质来分析,RAG架构设计是由两部分构成:数据工程和信息抽取。其中数据工程是最重要的部分,数据工程的最重要的工作之一是对文档进行分块(Chunking)。因为要处理的文档可能会相当大,所以第一步还包括“分块”,就是把一个大文件分成更小的、更容易...
大语言模型(LLM)在理解和生成连贯对话方面取得了显著成就。但是,它们存在一个内在的“记忆缺陷”,即它们拥有的上下文窗口是有限的,这严重限制了它们在多轮次、多会话的长期交互中维持一致性的能力。当对话内容超出了上下文长度时,LLM可能会像一个“健忘”的伙伴一样,忘记用户的喜好、重复提问,甚至与之前确认的事实相冲突。设想这样一个场景:你告诉一个AI助手你是一个素食者,不食用乳制品。然而,几天后当你向它询问...
构建具备自主规划、执行以及适应复杂任务能力的AI智能体,关键在于其“思考”能力。AI智能体思考框架的出现,正是为了赋予AI智能体结构化的推理与决策能力。这些框架为AI智能体提供了一套完整的方法论,指导其如何理解目标、分解任务、运用工具、处理信息,并依据环境反馈来调整自身行为。一个优秀的思考框架,能够显著增强AI智能体的鲁棒性、提升其效率以及拓展解决问题的泛化能力。接下来,我们将深入探讨3种主流的AI智能体思...
本文首先分享AI智能体的3阶段架构设计演进:LLMAgent、AIAgent、MutiAgent。然后对比剖析AI智能体的3大关键技术:FunctionCalling、MCP、A2A。下文详细剖析之。1、AI智能体3阶段架构设计演进AI智能体架构设计阶段一、LLMAgent自2023年大模型兴起后,AI智能体作为新兴事物迅速激发了大众的浓厚兴趣。鉴于泛娱乐场景最能吸引C端用户的关注,这一阶段的智能体多以社交和娱乐为切入点。借助提示词工程为智能体注入灵魂(即设定人设...
2025-06-24 09:59:21 1392浏览 0点赞 0回复 0收藏
最近关于AI大模型应用落地到底选用单智能体架构还是多智能体架构?业界争论很多,特别是Anthropic公司和Devin公司分别主张和使用了不同的智能体架构设计路线,Anthropic公司认为多智能体架构才是AI大模型应用扩展性能的关键,详见《性能提升90%,Anthropic首次公开多智能体架构构建全流程》,而Devin公司认为:“Don'tBuildMultiAgents.”,并直接批评OpenAI和微软的开发框架Sarm和AutoGen方向搞错了,详见《...
2025-06-20 10:12:28 505浏览 0点赞 0回复 0收藏
在构建多AI智能体系统架构时,许多现有的框架并不理想,通过我们自己的实践经验和试错,提出了一些构建AI智能体的原则,并解释了为什么一些看似吸引人的想法在实际中可能并不好用。在这篇文章中,我将分享以下内容:上下文工程的原则构建长期运行AI智能体的架构设计应用这些架构设计原则下文详细剖析之。1、上下文工程的原则我们先来谈谈以下原则:共享上下文行为隐含决策为什么需要原则?HTML于1993年问世。2013年,Facebook向...
2025-06-20 06:34:43 780浏览 0点赞 0回复 0收藏
Anthropic6月13日分享了关于构建多智能体系统的架构设计,几乎是毫无保留地展示了如何从零开始打造一个强大的多智能体(MultiAgent)DeepResearch系统,也就是Claude目前内置的Research功能。整个内容干货满满,涵盖了架构设计、Prompt提示词工程、效果评估,以及在生产环境中可能遇到的各种问题,可以说毫无保留。下文对要点详细剖析。1、多智能体系统的优势为什么不用单个强大的AI智能体,而是要搞复杂的“多智能体”架构呢?...
2025-06-20 06:33:19 1821浏览 0点赞 0回复 0收藏
当下,多数AI助手和开发工具各自独立运行,一旦会话结束,上下文就会消失,这严重影响了使用体验和效率。而OpenMemoryMCP来了,它是一款开源工具,能够解决AI工具记忆的痛点,并且实现不同工具之间共享上下文信息。比如,你可以通过OpenMemoryMCP用Claude规划路线图,再用Cursor执行任务,两个工具之间可以共享上下文信息,让数据得到延续。OpenMemoryMCP是一个由Mem0提供支持的本地内存设施,就像一个“记忆背包”,能让您把记...
2025-06-18 06:42:59 1418浏览 0点赞 0回复 0收藏
AI智能体架构设计的9大核心技术包括:AI智能体、AgenticAI、WorkFlow、RAG、Finetuning、FunctionCalling、MCP、A2A、AGUI等,下文详细剖析之。1、AI智能体架构的9大核心技术AI智能体架构设计核心技术一:AI智能体AI智能体是一种具备自主意识的软件,它能够感知环境、进行逻辑推理和决策,并实施相应动作。它可以被比作一位高效的个人助手,不仅能够执行命令,更重要的是能够理解任务的上下文、规划执行方案,并在遇到挑战时灵...
2025-06-18 06:41:09 2112浏览 0点赞 0回复 0收藏
首先我们回顾下智能体的本质是什么?如上图所示,智能体的核心在于其如何接收指令、执行任务并做出决策。以下是其关键组成部分:Prompt(提示)Prompt是指导大语言模型(LLM)如何行动的指令,它定义了LLM可以使用的“工具”。Prompt的输出是一个JSON对象,用于描述工作流程中的下一步操作,例如“工具调用”或“函数调用”。Switch语句Switch语句根据LLM返回的JSON内容决定后续操作。这是整个流程中的一个重要环节,用于解析LL...
2025-06-18 06:38:11 872浏览 0点赞 0回复 0收藏
通过将原始输入转化为固定维度的高维向量以捕捉语义信息,Embedding(嵌入)模型在构建RAG、推荐系统,甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来,OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对Embedding模型研发的投入。以OpenAI为例,其最新推出的textembedding3small模型能够生成1536维向量,在保持高语义表达能力的同时,实现了更低的延迟和更小的模型体积,非常适合对性能要求较高的大规模语义检索...
2025-06-12 06:37:08 1772浏览 0点赞 0回复 0收藏
OpenAI早在2023年06月就推出了FunctionCalling,为大模型提供了工具调用功能。Anthropic在2024年11月推出了MCP,旨在标准化AI大模型与外部工具和数据源的交互。MCP是否要取代FunctionCalling?下文详细剖析。1、FunctionCalling架构设计FunctionCalling是由OpenAI等公司推动的一种技术,它允许大语言模型(LLM)通过自然语言指令与外部工具和服务进行交互,从而将自然语言转换为具体的API调用。这一技术解决了大语言模型在训练...
2025-06-11 07:07:02 1884浏览 0点赞 0回复 0收藏
SpringAIAlibaba1.0GA正式发布,它是专属Spring开发者的AI框架,兼具提示词模版、函数调用、格式化输出等低层次抽象与RAG、Agent、对话记忆等高层次抽象,通义系列模型驱动,深度集成网关、配置中心、可观测等云原生基础设施生态,让Java智能体开发迎来一款生产可用的企业级框架与解决方案,助力企业智能体开发进入一个新阶段。Github地址:https:github.comalibabaspringaialibaba官网地址:https:java2ai.com...
2025-06-11 07:06:45 1709浏览 0点赞 0回复 0收藏
今天想和大家深入探讨一下检索增强生成(RAG)中的一个重要环节——重排序(Rerank)。RAG技术一直以来都备受关注,尤其是当它与大模型(LLM)结合后,人们都满怀期待地认为:这下终于可以轻松解决那些复杂的问答任务了!然而,现实往往并不如人意。很多开发者在完成一个RAG流程后,都会感到困惑:为什么它的效果并没有达到预期呢?其实,和大多数工具一样,RAG的使用虽然简单,但想要真正精通却并非易事。事实上,RAG并不仅仅...
2025-06-06 10:40:11 1546浏览 0点赞 0回复 0收藏
在AI大模型技术迅猛发展的当下,我们目睹了AI应用架构模式的多样化进程。特别是,AIAgent智能体和AIWorkflow工作流这两种截然不同的理念,正在重新定义我们对AI应用的理解。这两种模式犹如一枚硬币的正反两面:一面追求创新与灵活性,另一面则强调稳定与效率。接下来,我们将深入探讨这两种架构模式的核心差异、应用特性以及它们未来的发展趋势,旨在帮助大家更好地掌握和运用这些技术。一、AIAgent智能体与AIWorkflow工作流区...
2025-06-06 10:34:36 1309浏览 0点赞 0回复 0收藏