最近在折腾AI项目的时候,偶然发现了一个平台Composio。这个平台上集成了很多tool,可以很方便地帮助构建Agent。composio的本质说实话,刚开始接触Composio的时候我有个误解。我以为它是那种"一站式代理服务"——就是说,我只要有了Composio的key,就能直接调用所有工具,比如TAVILY搜索、Perplexityai之类的,不用再去各个平台申请API密钥了。结果实际用起来才发现,Composio只是帮你管理和调用各种第三方服务,但该配置的API密...
今天浏览Dify的GitHub仓库时,发现版本已经更新到1.5.1了,这个版本最令人惊喜的升级就是大幅增强了工作流调试功能。过去调试工作流时,只能在"预览"模式下查看执行结果。一旦刷新页面或回退操作,就只能看到最终输出,完全看不到中间的执行过程。这意味着稍有不慎就要重复运行整个流程,往往需要调试好几遍才能定位问题。更麻烦的是,每次调试特定节点时,还需要手动准备各种变量数据。特别是遇到复杂的嵌套结构变量时,稍不注...
在目前AI市场上,RAG技术已经成为大语言模型应用的重要组成部分,而GraphRAG作为RAG的进化版本,通过引入图结构来处理复杂的知识关系,正在受到越来越多的关注。但面对市面上众多的GraphRAG变种,我们该如何选择最适合自己应用场景的方案呢?最近,一项名为GraphRAGBench的评估研究为我们提供了答案。它系统性地评估了总共九种主流GraphRAG方法,包括RAPTOR、LightRAG、GraphRAG、GRetriever、HippoRAG、GFMRAG、DALK、KGP和ToG...
现在各种工作流框架太多了,看不过来,也没有什么精力去学习。最近无意中刷到一个微型框架:PocketFlow,这个框架非常小巧,看了下只有100行左右的代码,很容易看懂。我非常喜欢,写个教程介绍一下。对比其他框架抽象应用特定包装器供应商特定包装器代码行数大小LangChainAgent,Chain很多(例如,QA,摘要)很多(例如,OpenAI,Pinecone等)405K+166MBCrewAIAgent,Chain很多(例如,FileReadTool,SerperDevTool)很多(例如,OpenAI,Ant...
目前团队研发已全面采用Cursor作为主力工具。虽然ClaudeCode和ArgumentCode在功能上更胜一筹,但考虑到成本因素和网络问题,Cursor仍是我们的首选。然而我们发现,尽管使用相同的工具,团队成员的工作效率和体验却存在显著差异——关键在于对Cursor的掌握程度。本文将分享日常工作中的最佳实践,帮助大家充分发挥Cursor的潜力。cursor开发全流程要让Cursor充分发挥其潜力,达到我们的预期效果,需要系统性地结合以下四个关键要...
2025-06-25 10:02:32 1073浏览 0点赞 0回复 0收藏
特定领域的QA系统不仅需要生成流畅的回答,还需确保基于专业知识的高事实准确性。尽管检索增强生成(RAG)框架改进了上下文调用能力,但在异构数据整合与推理一致性方面仍存在不足。为此,清华大学提出DORAG,一种可扩展、可定制的混合QA框架,融合多级知识图谱构建与语义向量检索技术。DORAG采用创新的AgenticCoT架构,从多模态文档中提取结构化关系,构建动态知识图谱以提升检索精度。在查询阶段,它结合图谱与向量检索结果生...
2025-06-24 06:05:12 1674浏览 0点赞 0回复 0收藏
在早年阅读网上的技术博客时,我习惯一边看文章一边在语雀笔记中画思维导图。然而,回过头来看,这种方式其实效率不高。有了AI后,我们可以先让AI为我们生成相应的思维导图,以便我们对知识有个初步认识,再去深入阅读文章,这样会更有效。在这篇文章中,我将分享如何使用dify自动生成文章的思维导图,以提高我们吸收知识的速度。安装插件先在dify的插件市场安装如下两个插件:Markdown转换器:用于生成html文件Agent策略插件:...
2025-06-23 06:43:10 1244浏览 0点赞 0回复 0收藏
在基于大模型的Agent中,长期记忆的状态维护至关重要,在OpenAIAI应用研究主管LilianWeng的博客《基于大模型的Agent构成》中,将记忆视为关键的组件之一,下面我将结合LangChain中的代码,分享7种不同的Agent记忆维护方式在不同场景中的应用。获取全量历史对话在电信公司的客服聊天机器人场景中,如果用户在对话中先是询问了账单问题,接着又谈到了网络连接问题,ConversationBufferMemory可以用来记住整个与用户的对话历史,可...
2025-06-20 06:40:03 982浏览 0点赞 0回复 0收藏
2025年6月17日,谷歌正式宣布其Gemini2.5混合推理模型家族迎来重大更新,包括Gemini2.5Pro、Gemini2.5Flash以及全新轻量级模型Gemini2.5FlashLite。这一系列升级不仅强化了AI的推理能力,还在性能、成本与适用场景上进行了深度优化,标志着谷歌在多模态AI领域的进一步突破。Gemini2.5FlashLite基准测试表Gemini2.5Pro:复杂推理任务的终极选择作为谷歌AI技术的旗舰产品,Gemini2.5Pro在多项基准测试中表现卓越,甚至超越OpenAI...
2025-06-19 08:20:03 2490浏览 0点赞 0回复 0收藏
Claude现在拥有研究功能[1],可以在网络、GoogleWorkspace和任何集成中进行搜索,以完成复杂的任务。这个多智能体系统从原型到生产的旅程教会了我们关于系统架构,工具设计和prompt工程的关键教训。多代理系统由多个代理(LLMs在循环中自主使用工具)组成。我们的研究功能涉及一个代理,它根据用户查询计划研究过程,然后使用工具创建同时搜索信息的并行代理。具有多个代理的系统在代理协调、评估和可靠性方面引入了新的挑战。...
2025-06-19 08:19:46 1047浏览 0点赞 0回复 0收藏
背景在我们之前的文章中,我们对比了dify,ragflow和n8n这三个工具的使用场景及其差异。实际上,在企业中,这些工具通常会被结合起来使用,以便充分发挥各自的优势。例如,尽管ragflow也具备一些智能功能,但是与dify相比,它在这方面的表现力还有待提高。然而,当谈到解析和检索的能力时,ragflow却显著超过了dify。在今天的文章中,我们将探讨如何有效地将这两个工具结合使用。RAGFlow核心功能我觉得RAGflow最大的一个亮点就...
2025-06-18 06:37:25 1906浏览 0点赞 0回复 0收藏
背景在当今AI应用蓬勃发展的时代,内容安全与合规性已成为开发者不可忽视的重要环节。比如用户在客服场景中,可以通过敏感词审查过滤用户的辱骂性语言,并返回预设的礼貌回复。Dify作为一款开源的大语言模型应用开发平台,其内置的敏感词审查机制为开发者提供了强大的内容安全保障。本文将深入解析Dify的敏感词审查模块(moderation)的工作原理,并通过源码分析揭示其实现细节,帮助开发者更好地理解和应用这一功能。dify如何开...
2025-06-13 09:36:45 1199浏览 0点赞 0回复 0收藏
在AI技术高速发展的当下,企业想要高效、安全且低成本地落地AI应用,开源工具成为了重要选择。以下为你详细介绍Dify、RAGFlow、n8n这三款开源工具的核心能力、应用场景及优势,助你理清企业AI落地的实践路径。dify作为"AI应用操作系统",Dify旨在为企业提供从开发到运营的一站式生成式AI解决方案。其名称融合了"Define"和"Modify"的含义,体现了持续优化AI应用的核心理念。coverv5optimized工具链:Dify平台包含生产级AI应用构建...
2025-06-12 06:46:44 2847浏览 0点赞 0回复 0收藏
身为一名AI工程师,我过去的工作主要集中在应用层开发,对算法的理解并不深入。然而,近期我开始对算法产生了浓厚的兴趣,并转向研究模型微调。在众多微调算法中,Lora以其普遍应用引起了我的关注,我计划在本文中对它进行详细介绍。将Lora仅仅视为一种算法可能并不准确,它更像是一种精妙的技巧或策略。下文将围绕几个核心问题,全面探讨和解析Lora技术,希望这些内容能为对模型微调感兴趣的你提供有用的参考和帮助。Lora是什...
2025-06-11 09:41:53 6970浏览 1点赞 0回复 0收藏
2024年,Anthropic[1]发布Claude3[2]系列的同时推出了MCP[3](ModelContextProtocol),定位更底层:不是“调函数”,而是“定义模型理解系统的结构协议”。在企业级应用场景下,对于一些私有环境,MCP服务器可能不需要严格的身份认证。但如果在企业级别进行部署,对这些接口的安全性和权限管理就显得至关重要。MCP服务器可以通过两种方式运行:stdiohttp+sse这两种运行方式的权限控制策略各不相同。在深入讨论MCP服务器的权限...
2025-06-05 06:15:34 3199浏览 0点赞 0回复 0收藏
上一篇文章我分享了AutoGen的基础使用AutoGen从入门到高阶系列一:如何从零开始构建你的第一个智能体?,这一篇文章来分享一下AutoGen里面的智能体。内置了哪些智能体UserProxyAgent:一个智能体,接收用户输入并将其作为响应返回AssistantAgent:这是一个通用的智能体,它利用大型语言模型(LLM)进行文本生成与推理,还可通过工具(tools)扩展其能力。CodeExecutorAgent:一个可以执行代码的智能体...
2025-05-21 06:37:07 1896浏览 0点赞 0回复 0收藏
最近团队里的小伙伴都在讨论AutoGen,作为一个去年还在手搓智能体的"老派"开发者,我也决定跟上技术潮流。经过一段时间的实践,我发现这个框架确实能极大提升开发效率。今天开始,我将通过一系列文章,带大家从零开始掌握AutoGen。文章大致目录是这么安排的:基础入门内置智能体自定义智能体及高级技巧智能体到底是如何进行团队协作的状态管理swarm模式分布式智能体作为开篇,我们先来认识这个强大的工具。初识AutoGen想象一下...
2025-05-20 06:31:22 2232浏览 0点赞 0回复 0收藏
MCP能解决什么问题我们之前开发LLM应用的时候,这个应用不仅基于已有的知识库对话,还和外部连接访问数据和使用工具:访问google进行内容检索访问youtube进行视频检索调用公司内部的CRM接口我们在LLM应用内部做了很多的粘合工作,在之后如果我们要新开一个LLM应用,如果还需要使用这些工具怎么办呢?我们可以引入一个中间层,把这些能力放在中间层中,LLM应用只负责和中间层打交道。这其实就是MCP做的事,MCP可以用来简化LLM应...
2025-05-06 06:45:14 2544浏览 0点赞 0回复 0收藏
AI领域迎来了一则重磅消息——DeepSeek正式开源了其最新数学推理大模型DeepSeekProverV2671B!这款拥有6710亿参数的“数学大脑”究竟有多强?它又将如何改变数学研究、教育甚至整个AI行业?让我们一探究竟!一、数学推理领域的“AlphaGo时刻”DeepSeekProverV2671B是DeepSeek团队专为数学定理证明和复杂推理任务打造的“专业选手”。从命名中的“Prover”(证明者)就能看出,这不是一个普通的通用大模型,而是专为解决数学难题...
2025-05-06 06:41:40 1536浏览 0点赞 0回复 0收藏
2025年4月29日凌晨,阿里巴巴正式开源了其新一代通义千问大模型Qwen3系列,这一发布不仅登顶全球开源模型性能榜首,更以创新的"混合推理"架构重新定义了大型语言模型的效率边界。作为国内首个集成"快思考"与"慢思考"能力的开源模型,Qwen3在性能全面超越DeepSeekR1、OpenAIo1等顶尖模型的同时,将部署成本降低至竞品的13。阿里巴巴还公开了两个MoE模型的权重:Qwen3235BA22B和Qwen330BA3B。前者是一个具有2350亿总参数和2200亿...
2025-04-29 11:25:27 3123浏览 0点赞 0回复 0收藏