在人工智能浪潮的推动下,智能问答系统正日益成为企业服务、在线教育、智能客服等领域的核心交互工具。其中,基于检索增强生成(RetrievalAugmentedGeneration,简称RAG)的技术架构,因其能够有效结合外部知识、缓解大模型“幻觉”问题、并保持信息的实时性,而受到了广泛青睐。在探讨RAG的优化之道时,我们往往会接触到诸如问题改写、重排序、混合检索等多种精妙的技巧。这些技术方案在很大程度上是“可复用”的通用组件。然...
“大模型从任务类型分类主要分为文本,音频,视频和多模态模型。”在人工智能领域,大模型技术是目前主要的研究方向,但面对市面上各种各样的模型,很多时候我们都搞不明白这些模型都是干什么的,有什么区别和联系。其实这个就涉及到模型的分类问题,原因在于人工智能技术涉猎范围比较广,不但有各种基于深度神经网络实现的大模型各行其道,还包括传统的机器学习模型,以及各种模型的变种。并且,从不同的维度模型又有不同的分...
“人工智能技术的出现,意味着互联网行业进入一个新的快速发展期,其终将会再次颠覆现有的商业模式。”最近发现一个问题,除了业内人士之外,很多人都认为人工智能技术的发展和他们无关,甚至很多人到现在都不知道人工智能到底是什么,有什么用。但是,人工智能技术作为互联网技术的一个分支,并且目前处于互联网时代的浪潮之下,不了解人工智能或者说不了解互联网,往往代表着被时代所抛弃。因此,在当前国家大力推行数字化转...
“智能问答是基于RAG技术实现的724小时在线问答系统,可以帮助你解决日常业务咨询等问题。”还在为:文档太多、员工找资料全靠翻;客服重复回答一堆相似问题;产品知识没人整理、客户问不清;或者想做一个企业内部知识问答系统,却不知道从哪下手而发愁吗?我最近在做一个基于RAG(检索增强生成)技术的智能问答系统,可以让AI像你的专属知识助手一样,自动从你的文档、数据库、网页中找到信息,并用自然语言准确回答问题。简单...
“知识库的质量才是RAG系统的核心,任何优化手段都是建立在高质量知识库的基础之上。”在目前大模型应用场景中智能问答应该是一个主流的应用方法,在很多领域智能问答已经部分取代人工,不但大大降低了企业的人工成本,而且能够做到724小时在线,能够及时解决用户问题。而具体的应用场景有智能客服,业务咨询,医疗教育,金融投资等等多种行业;但目前为止很多人可能还认为AI只适用于那些大型互联网公司,和中小企业以及传统企...
“基于大模型的RAG多轮对话功能,其检索增强的流程和实际业务的场景可能会存在一定的冲突,而这个平衡点却很难把握。”在之前的文章中有讲过一个RAG检索优化的方法论,简单来说就是通过对问题进行改写和优化;比如说用户输入一个问题query,但由于我们无法控制用户的行为,因此用户输入的内容query可以是任何东西,包括可能存在错别字,语义错误,甚至是一些无意义内容。面对这种情况,特别是在多轮对话过程中会导致一个很严重...
“技术的发展大都是润物细无声,除了业内人士之外很少有人能明显感受到技术发展的速度;但等你发现时,机会已经离你越来越远了。”作者最近一两年一直在从事人工智能相关的工作,从刚开始什么都不懂的小白,到现在对人工智能应用有一定了解,这其中经历过很多困难,但也发现了很多问题。从技术人员的角度来看,我们主要关注点都在技术上,但如果从市场的角度来看,技术的关注点应该是应用场景;但由于接触人工智能时间比较多,...
概述数据召回是RAG(检索增强生成)系统中的核心环节,负责从向量数据库中检索与用户查询最相关的知识片段。本流程通过多阶段处理确保召回结果的准确性、相关性和完整性,同时结合对话记忆管理来维持多轮对话的连贯性。核心处理模块详解查询优化模块功能描述:对原始用户查询进行语义增强和扩展,提升检索覆盖率。处理策略:查询改写:生成多个语义相同但表述不同的查询变体假设性回答:基于问题生成可能的回答,反向推导相关关...
2025-10-10 06:45:07 895浏览 0点赞 0回复 0收藏
“RAG召回时最好进行多次过滤,这样才能大大提升召回文档的质量。”关于RAG数据召回技术,大家都都知道现在普遍使用的是相似度(语义)召回方式;但对没有真正实际操作过的人来说,可能会认为RAG只能进行相似度召回;但在真正的业务场景中,标量召回的效果可能会比相似度召回更好。原因在于,RAG的目的是为了更准确的召回与问题相关的内容,但并没有限制具体的召回方式,不论是传统的字符匹配,分词技术(如es),还是现在爆火的相...
2025-10-09 06:56:54 349浏览 0点赞 0回复 0收藏
“RAG的机制决定了其执行流程比较死板,而Agent更符合人类的思维模式。”在RAG检索增强系统中,有一个很重要的概念就是语义相似度检索,其流程根据用户问题先去知识库中检索相关文档,然后再丢给模型做增强。但在真实的业务实践过程中发现了一个问题,具体表现上是多轮对话的关联性问题,实际上是语义理解问题;这个问题产生的场景就是在多轮对话过程中无法准确理解每次对话之间的关系,但这个是由RAG的流程所决定的,无法避免...
2025-10-09 06:54:48 433浏览 0点赞 0回复 0收藏
“数据通讯是系统开发中的重要环节,而Langgraph有其特有的设计哲学。”在项目开发中,数据传递一直是一个很重要的环节,毕竟任何系统的开发逻辑最终的目的都是实现数据的有效操作,包括查询,修改,新增等。而在大模型应用场景中,数据的传递又是什么样的呢?怎么解决?langgraph中的数据传递在Langgraph中State是贯穿整个生命周期的数据结构,其作用就是用来保存智能体执行过程中的数据;因此,在Langgraph中的几个重要组件中...
2025-10-09 06:52:05 569浏览 0点赞 0回复 0收藏
“Langgraph对模型功能进行了适度封装,有些可能乍一看很不合理,因此我们要多看其官网说明。”前一段时间在学习使用Langgraph开发框架时,由于对框架理解不够深刻,以为发现了一个bug,然后今天才发现这不是bug,而是框架本身就是这么设计的。这个bug就是,在智能体的流式输出的时候,会一块输出工具节点调用模型结果;之所以发现这个问题就是在具体的工具中又调用了模型进行数据处理,但在打印输出的时候发现工具的执行过程也...
2025-10-09 06:50:01 338浏览 0点赞 0回复 0收藏
“要想做好一个RAG系统,需要在实践中不断地优化和调整,很难做到一蹴而就。”昨天遇到了一个小问题,就是在数据召回的时候有部分应该召回的数据但没有显示出来;所以不确定到底是因为数据本身没有被召回,还是被召回之后由于某种原因被过滤掉了。因此,今天就查了一下这个问题产生的原因,然后就发现了一些问题;目前系统中,不同的数据是分在多个不同的向量库中,然后在召回的时候发现每个库中都可以召回数据,但理论上来说跟...
2025-09-28 07:29:34 843浏览 0点赞 0回复 0收藏
“Langgraph的核心功能点在Nodes节点和Edges边,Nodes负责执行任务,Edges负责任务流程。”在使用Langgraph开发框架的过程中发现一个问题,其官方文档给的案例都是比较简单的案例,虽然能让我们弄明白其运作机制,但无法真正解决业务问题;因为实际的业务场景要远比官方案例复杂的多。所以,在学习框架的使用过程中感觉好像没什么难度;但等到真正结合实际业务时才发现好像束手束脚,有点无从下手。之所以产生这种问题的原因就...
2025-09-28 07:28:06 883浏览 0点赞 0回复 0收藏
“引言部分,总领全篇文章的中心内容。”在Langgraph中的三个核心组件中,State是用来传递数据的;在使用Langgraph构建智能体时,不论是简单还是复杂,归根结底都是通过节点(nodes)和边(edges)来构建一个完整的图(graph)。但LangGraph的核心从来不在于如何去界定节点与边,而是在于如何高效地管控各个节点的输入和输出,以确保图能够持续稳定地运行。LangGraph的底层图算法依托消息传递机制来定义和执行图中的交互流程,在这一...
2025-09-25 14:22:28 1073浏览 0点赞 0回复 0收藏
“智能体的基础是大模型的函数调用,而框架只是对其能力的封装。”我们首先要明确一个概念,即智能体是基于大模型应用设计的一套机制,其本质是大模型提供的函数调用功能(functioncall),包括现在的MCP服务;而框架只是对这些原生能力的封装,便于开发人员进行功能开发,而不用去处理太多细节性问题。所以,在做大模型开发时,虽然要学好框架的使用,但更重要的是要搞明白智能体的运行机制,已经框架在其上做了哪些完善和增强。...
2025-09-25 14:19:55 1166浏览 0点赞 0回复 0收藏
“多智能体协同将是未来智能体的主要开发形式,其相对于单智能体更灵活更强大。”技术是一项重实践而轻理论的东西,但我们很多时候容易陷入重理论轻实践;总觉得理论我懂了,做出来肯定很简单,但事实上理论很容易懂,但真正做出来却很难。知行合一,在知中行,在行中知;知行是一体的,而不是割裂的。怎么做好一个智能体之前学习过一段时间智能体的实现,使用的是Langgraph框架,但当时只是做了一些简单的Demo,并没有真正应用...
2025-09-25 14:18:32 641浏览 0点赞 0回复 0收藏
“智能体开发过程中存在很多细节性问题,而这些问题决定着智能体的质量。”最近要把RAG系统优化成智能体实现,因此又深入研究了一下智能体的实现方式,开发框架使用的是Langgraph;然后在工具执行的时候出了一点问题。智能体工具节点智能体简单来说就是会使用工具的大模型,主要由大模型(Model)+工具(Tool)+提示词(Prompt)构成;其原理就是通过让大模型理解用户问题,然后自己根据工具说明,生成调用参数执行工具,最终获取执行...
2025-09-22 09:24:07 978浏览 0点赞 0回复 0收藏
“增强生成的处理会直接影响到模型生成质量,如果做不好,哪怕你文档处理的再好,召回的质量再高,也没什么用。”最近也写了很多关于RAG系统的内容,大部分都是在讲述文档处理和文档检索两部分内容;而RAG既然被称为检索增强,那么我们今天就从增强的角度讲一下怎么进行增强,有哪些注意点和问题。在RAG中大部分人的关注点可能都在文档处理和文档召回上,也会用大量的时间来优化这两部分内容;因此,往往忽视了增强这一块功能。...
2025-09-22 09:13:05 996浏览 0点赞 0回复 0收藏
“大模型并不是无所不能的,在其能力之外我们需要一些工程化能力来解决问题。”最近有一个功能是根据数据库表结构生成类似于API说明文档的功能;但业务需求是让模型生成文档之后,还需要对文档进行审核,也就是说模型生成,模型审核,最终在人工确认。关于业务需求的合理性就不多说了,我们只单纯的讨论一下技术实现。模型生成与审核从需求端来说,让模型根据库表结构生成说明文档能够大大提升处理效率,并且节约人工成本,这个...
2025-09-22 09:09:58 852浏览 0点赞 0回复 0收藏