在这篇文章中,我将介绍一个基于LangGraph构建的全面GraphRAG多智能体系统,它作为一个智能的食物助手。虽然我选择了膳食规划作为演示领域,但这个架构是一个多功能的框架,适用于需要复杂、多维度查询的结构化知识检索的众多行业。这个系统能处理三种关键领域的复杂场景:•根据饮食限制发现食谱•为特定食谱生成购物清单•在超市内映射商店产品的位置通过结合语义搜索(semanticsearch)进行模糊匹配和精确的Cypher查询进行结...
作为一名对AI和机器学习充满热情的人,我花了不少时间研究怎么让强大的语言模型更好地完成特定任务。今天,我想分享一份详细的指南,教你如何用Python微调LLM(大型语言模型),然后用Ollama这个工具在本地运行微调后的模型。这份指南基于我看到的一个实际操作教程,但我会加上详细的解释和例子,让它更全面、更适合新手。什么是LLM微调?想象一下,你请了个世界级大厨,他啥菜都会做,但还得学会你家的独门菜谱。你不用从头教...
五年前,打造一个AI驱动的产品通常意味着选一个API,从你的应用里调用它,然后祈祷输出结果够好。现在?游戏规则变了。到了2025年,自主AI代理不再只是吐出文本——它们会推理、规划,还能执行现实世界的行动。不过,能力越强,复杂度越高。协调这些代理、给它们记忆、实现多模态理解、监控性能、让它们与网络互动,这些都需要合适的工具。这篇文章是你的一份精选指南,列出了20个对AI开发者来说最强大的开源工具——经过开发者...
在构建基于知识图谱的RAG系统或使用LangChain的代理时,最大的挑战之一是从非结构化数据中准确提取节点和关系。特别是当使用较小的、量化的本地LLM时,这一点尤其困难,结果往往是AI系统表现不佳。LangChain提取功能的一个关键问题是它依赖严格的JSON解析,即使使用更大的模型或非常详细的提示模板,也可能失败。相比之下,BAML使用一种模糊解析(fuzzyparsing)方法,即使LLM的输出不是完美的JSON格式,也能成功提取数据。在这...
2025-08-27 06:46:38 743浏览 0点赞 0回复 0收藏
了解HierarchicalNavigableSmallWorld(HNSW)算法如何为当今的RAG系统提供动力RetrievalAugmentedGeneration(RAG)是为LargeLanguageModels(LLMs)添加外部知识的重要工具。几乎每个RAG系统都包含一个向量数据库,用于执行semanticsearch。在这种搜索中,存储在向量数据库中的documentembeddings会与用户的queryembedding进行比较。一个基本的RAG系统包括一个embeddingmodel、一个vectordatabase和一个LLM。文档的embeddings会提前...
2025-08-27 06:39:08 710浏览 0点赞 0回复 0收藏
大家把AI说得比实际复杂多了。他们总爱抛出一些高大上的词,比如“提示工程”啊,“多模态微调”啊(这些词到底啥意思?)。但对我来说,真正改变游戏规则的?一个听起来超无聊的小技能:JSON提示。不,这不是写代码。你也不需要啥技术背景。简单来说,就是用一种超级明确的方式告诉AI你想要啥,不留一点猜的空间。啥是JSON提示简单点说:别用普通英语写你的需求,换成一种结构化的格式。就像这样:{"task":"总结这篇文章","aud...
2025-08-27 06:31:42 777浏览 0点赞 0回复 0收藏
OpenAI正式发布GPT5了。公司称这是一个统一的系统,能自己决定回答问题前需要思考多久。SamAltman说,GPT5就像是你可以“向一个真正的专家、博士级别的专家提问任何问题”,然后得到靠谱的回答。新模型正逐步向全部7亿ChatGPT用户开放——是的,哪怕你没花钱买订阅也能用。看完一小时的发布会后,问题很简单:GPT5真有比之前模型大进步,还是被炒过头了?在这篇文章里,我会详细聊聊GPT5是什么、新功能有哪些、性能数据如何,以...
2025-08-14 07:29:17 1518浏览 0点赞 0回复 0收藏
LargeLanguageModels(LLMs)擅长推理,但现实世界的应用往往需要有状态、多步骤的工作流。这就是LangGraph的用武之地——它让你可以通过由LLM驱动的节点图来构建智能工作流。但如果你想把这些工作流暴露为APIs,让其他应用(或用户)可以调用呢?这时候FastAPI就派上用场了——一个轻量级、高性能的PythonWeb框架。在这篇指南中,你将学习如何将LangGraph工作流封装在FastAPI中,变成一个生产就绪的endpoint。为什么选择LangGrap...
2025-08-14 07:26:26 1401浏览 0点赞 0回复 0收藏
图片最近,OpenAI展示了他们打造深度研究AI代理的理想场景……关键考量工具和AI代理的数量之间存在一个最佳平衡点。确实,所有这些AI代理可以合并成一个拥有多种工具的AI代理。但工具数量和AI代理数量之间有一个最佳平衡点——当一个AI代理的工具过多时,工具选择可能会出问题。对此,NVIDIA在微调语言模型以实现精准工具选择方面做了很棒的研究。OpenAI的总体思路似乎是多个AI代理协作与编排。建立上下文和多个AI代理的协作非...
2025-07-30 06:17:52 858浏览 0点赞 0回复 0收藏
我已经在终端里摸爬滚打好几年了。那是我最舒服的地盘——写功能、调试、代码重构、审查PR。终端又快又专注,还没啥干扰。不过最近,我的开发流程里悄悄混进了一种新玩意儿:活在命令行里的AI助手。不是IDE里那种花里胡哨的代码补全copilot。我说的是真正的、能执行任务的编码助手,直接在你的终端里干活。给它们一个目标,它们就能生成代码、编辑文件、提交更改,有时候还能跑测试——全都在你的shell里。我当然得试试:这些家...
2025-07-30 06:14:06 2446浏览 0点赞 0回复 0收藏
虽然大型语言模型(LLMs)已经重新定义了AI的可能性,但它们依然有个根本性的局限:无法与外部世界互动,知识停留在训练时的时间点,能力也局限于文本生成。在这篇文章中,我将探讨如何通过微调LLMs来让它们使用工具,突破这一局限。我会先从概念上讲解这是怎么实现的,然后通过一个具体的Python代码示例带你一步步操作。。工具调用(ToolCalling)的现状现在,像GPT4.1、Claude和Llama3这样的模型都已标配工具调用功能。你只需...
2025-07-30 06:09:13 1681浏览 0点赞 0回复 0收藏
从滑动窗口到类操作系统记忆的测试与解析9种技巧优化AI代理记忆的9种技巧:从入门到高级优化AI代理的一种方法是设计多子代理架构以提升准确性。然而,在对话型AI中,优化远不止于此——memory变得尤为关键。随着你与AI代理的对话越来越长、越来越深入,它使用的memory会越来越多。这是因为AI依赖于诸如历史上下文存储、工具调用、数据库搜索等组件。在这篇博客中,我们将编写代码并评估9种从入门到高级的memoryoptimization技巧...
2025-07-18 14:26:42 1303浏览 0点赞 0回复 0收藏
我们正式进入了AI智能体的时代!但现在已经不再是单打独斗的机器人时代了——2025年是个转折点,AI智能体之间的协作正成为主流,而不是例外。如果你一直在关注最新趋势,可能已经听说过多智能体系统(MAS)——这个领域正在悄无声息地改变从研究自动化到任务编排的一切。但打造这些系统可不简单。你需要能协调内存、上下文、模型多样性以及智能体间推理的框架。最重要的是,你肯定想要开源工具,这样才能自由灵活地开发。我深入...
2025-07-16 09:10:09 6350浏览 0点赞 0回复 0收藏
想象一下,你能打造一个AI驱动的系统,秒速搜索海量数据,像人类一样理解语境,还能对复杂问题给出精准又聪明的回答。听起来像魔法?其实不然——这就是FAISSDB和Langchain,两种正在改变人工智能版图的前沿技术。如今,数据量爆炸式增长,传统搜索方法已经跟不上信息的庞大体量和复杂性。FAISSDB(FacebookAISimilaritySearch)横空出世,彻底革新了数据搜索与检索的方式。FAISS是一个专为快速、基于相似度的搜索设计的强大库...
2025-07-16 09:07:23 4475浏览 0点赞 0回复 1收藏
1.引言关于ChatGPT(或者更广义的AenerativeAI)的讨论,如今已经演变成了AgenticAI。ChatGPT主要是个能生成文本回复的chatbot,而AI代理则能自主执行复杂任务,比如完成一笔销售、规划一次旅行、预订机票、雇佣承包商干家务活,甚至点个披萨。下面的图表展示了AgenticAI系统的演变。比尔·盖茨最近设想了一个未来:我们将拥有一个能处理自然语言、完成多种任务的AI代理。以旅行规划为例,传统上你得自己订酒店、机票、餐厅等。...
2025-07-09 07:46:45 1209浏览 0点赞 0回复 0收藏
引言想打造一个生产就绪的RAG(RetrievalAugmentedGeneration)系统?那可不是件简单的事儿!得一步步来,精心设计,反复迭代。咱们得先把数据收拾干净,然后试试不同的分块策略——逻辑分块和传统分块都得试试,找到最适合你的场景。接着,还要匿名化数据,减少那些模型“胡思乱想”的情况(也就是所谓的hallucination)。为了让检索更精准,可以用子图(subgraphs)来聚焦最相关的信息,过滤掉那些没用的“噪音”。在检索层之...
2025-07-09 07:42:55 1680浏览 0点赞 0回复 0收藏
AgentZero框架简介AgentZero是一个基于Python的开源智能体框架,用来构建个人AI助理和各种自动化工具。和那些太抽象或太死板的框架不同,AgentZero更灵活、实用且完全透明——你可以看到它的每一部分,修改它,扩展它,全都由你掌控。什么是AgentZero?AgentZero是一个“私人定制、自然进化、高度动态”的智能体框架。它的核心目标是创建这样的AIagent:•能够帮你解决实际问题•在使用中不断学习和进化•把复杂任务拆解给多个s...
2025-06-25 06:30:51 2810浏览 0点赞 0回复 0收藏
将PDF转成文本这件事,过去是“能做到”,现在是“轻松做到”。最近我搭建了一个图数据库(GraphDataStore),用于RAG系统——换句话说,我们做了一个GraphRAG。为什么用GraphRAG?相比常见的向量数据库支持的RAG,GraphRAG有个巨大优势——推理能力更强。比如:问题A:「XYZ公司去年CFO是谁?」这种问题,向量搜索就能搞定,因为年报里通常直接写了。但换成这样:问题B:「XYZ公司有哪两位董事是同一所学校毕业的?」如果年报...
2025-06-25 06:28:01 1103浏览 0点赞 0回复 0收藏
1.引言关于ChatGPT(广义上为生成式AI)的讨论现已演变为AgenticAI。ChatGPT主要是一个生成文本响应的聊天机器人,而AIAgents则能够自主执行复杂任务,例如完成销售、计划旅行、预订航班、雇佣承包商进行房屋工作、订购披萨等。图1展示了AgenticAI系统的演变。比尔·盖茨(BillGates)最近设想了一个未来,人们将拥有一个能够处理和响应自然语言并完成多种不同任务的AIAgent。盖茨以计划旅行为例。通常,这需要你亲自预订酒店、...
2025-06-12 00:07:56 1432浏览 0点赞 0回复 0收藏
我大部分时间都在构建和改进RetrievalAugmentedGeneration(RAG)应用。我相信RAG可能是最受欢迎的AI应用之一。它无处不在,从聊天机器人到文档摘要。我也相信,由于各种原因,许多RAG应用最终未能部署,其中很多并非技术原因。然而,我希望自己早知道一些技术方面的知识,以创建更有效的RAG。但这就是我们学习新事物的方式。没有比构建并失败更好的工程学习方法了。从我的失败中,我学到了一些宝贵的经验教训,这些经验对首次构...
2025-06-12 00:02:07 1286浏览 0点赞 0回复 0收藏