PyTorch研习社
LV.3
打破知识壁垒,做一名知识的传播者
声望 353
关注 0
粉丝 0
私信
主帖 40
回帖
学习如何结合Neo4j知识图谱和LangChain,打造精准、可解释、适合生产环境的RetrievalAugmentedGeneration(RAG)系统。RetrievalAugmentedGeneration(RAG)已经迅速成为让LargeLanguageModels(LLMs)在生产环境中真正发挥作用的首选架构。RAG不再仅仅依赖LLM的内部记忆,而是将其与外部知识源连接起来。虽然大多数教程展示的是使用Pinecone、Weaviate或FAISS等向量数据库的RAG,但在现实世界的问题中,单靠语义相似度往往不够。你需...
8天前 2458浏览 0点赞 0回复 0收藏
你有没有纳闷过,为什么你的RAG系统总是返回一堆无关的结果,或者漏掉显而易见的答案?你不是一个人!很多开发者一开始用vectorsearch,然后一脸懵地发现,他们的“智能”AI连一个简单的产品代码都找不到。如果你试过搭建一个RetrievalAugmentedGeneration(RAG)系统,可能也撞过我一样的南墙。你的chatbot有时候回答得很棒,但有时候完全答非所问,返回一些概念上相似但实际没用的信息。问题出在哪儿?大部分RAG教程只关注那些...
8天前 760浏览 0点赞 0回复 0收藏
阿里巴巴悄然发布了AgentScope。这是一个用于构建多代理AI应用的开源Python框架。老实说,如果你一直在玩AIagents,这玩意儿挺酷的。我花了点时间挖了挖它,我的收获是:感觉终于有人试着做了一个不跟你对着干的agents框架。大多数框架藏得太深,或者把你锁死在一种工作方式里。AgentScope的卖点正好相反;一切都保持可见,你保持控制。没有黑箱魔法。为什么它吸引了我的注意AgentScope背后的那些人似乎痴迷于一个想法:透明度...
8天前 1072浏览 0点赞 0回复 0收藏
使用TenorshareAI轻松检测AI生成的文本并改写,让它绕过AI文本检测器。我用过的最棒的AI文本人性化工具如果说现代大型语言模型(LLMs)有什么特别擅长的,那就是预测它们接下来要说的词。这种能力让聊天机器人能以自然的方式回应几乎任何问题,甚至还能通过联网进行深入研究。不过,大多数LLMs的原始输出还是很容易被认出是AI生成的。作为一名有四年出版编辑经验的人,我通常一眼就能看出文章是人工写的还是机器生成的。那么,...
2025-09-17 00:06:58 1046浏览 0点赞 0回复 0收藏
我遇到个麻烦:手头有几十(好吧,实际上是几百)个PDF文件——研究论文、API文档、白皮书——散落在各个文件夹里。搜索慢得要死,浏览更烦。所以我搞了个PDF问答引擎,能把文件吃进去、分块、嵌入、用FAISS索引、找最佳段落,还能给个简洁的回答(而且有不用API的备选方案)。这篇文章把所有东西都给你——端到端的代码,用大白话解释清楚。你能得到啥•本地PDF加载(不用云)•更聪明的分块(保留上下文)•用sentencetransfo...
2025-09-17 00:02:45 698浏览 0点赞 0回复 0收藏
现代AI聊天机器人常常依赖RetrievalAugmentedGeneration(RAG),也就是检索增强生成技术。这种技术让机器人能从外部数据中提取真实信息来支撑回答。如果你用过“与你的文档聊天”之类的工具,你就见过RAG的实际应用:系统会从文档中找到相关片段,喂给大语言模型(LLM),让它能用准确的信息回答你的问题。RAG大大提升了LLM回答的事实准确性。不过,传统RAG系统大多把知识看成一堆互不关联的文本片段。LLM拿到几段相关内容后,得...
2025-09-17 00:01:42 4428浏览 0点赞 0回复 0收藏
让我跟你说——大部分AI工具就像那个满嘴跑火车但啥也干不成的同事。不会写代码,不会做报表,连上网浏览都会崩。如果你现在就在用这种破工具,那真是选错了。不过好消息是:市面上还真有能干活的AI工具!我来带你看看10个靠谱的家伙,涵盖了编码、语音、研究、数据处理和网页操作,全都基于你给我的信息。编码工具1.GoogleJules—免费Jules就像你那个会把你的菜谱从头看到尾,还能自己烤一盘饼干的哥们儿。它能深入你的代码项...
2025-09-03 00:09:14 3766浏览 0点赞 0回复 0收藏
随着基座模型的不断更新成熟,智能体工作流(AgenticWorkflow)已成为AI领域的热点,它将AI智能体(AIAgent)的推理能力与结构化工作流结合,实现复杂任务的半自主执行。AI智能体结合了大型语言模型(LLM)的推理、工具交互和记忆能力,赋予工作流动态性和适应性。与传统的确定性工作流或非智能体AI工作流相比,智能体工作流能处理更高复杂度的任务。今天我将系统解析其核心概念,并通过实际模式和应用案例展示其价值。希望能给...
2025-09-03 00:05:41 1487浏览 0点赞 0回复 0收藏
RetrievalAugmentedGeneration(RAG)是一种结合信息检索和大型语言模型(LLMs)来回答用户查询的方法。传统上,这涉及将检索器直接连接到生成流水线。然而,通过LangGraph和LangChain,我们可以进一步模块化这个过程,将检索器暴露为一个可调用的工具。在这篇博客中,我将展示如何在LangGraph中使用工具调用实现一个RAG系统。我将模拟一个餐厅助理代理,回答关于BellaVista餐厅的问题。目标构建一个基于RAG的代理,能够:•将...
2025-09-03 00:01:04 1548浏览 0点赞 0回复 0收藏
引言在之前我们聊过MCP革命的宏观话题,这篇文章咱们来聚焦一下,专门对比一下ModelContextProtocol(MCP)和AgentCommunicationProtocol(ACP)以及AgenttoAgent(A2A)协议的核心区别。我们的目标是聊聊这几个框架各自的独特优势,并且说明在很多应用场景下,MCP提供的抽象层级刚刚好,不需要ACP或A2A那种更复杂的结构。我们会深入探讨MCP如何通过把工具看作无状态的函数(这些函数本身也可以是智能体)来实现这一点,从而构建动态...
2025-08-22 07:22:22 1310浏览 0点赞 0回复 0收藏
在构建基于知识图谱的RAG系统或使用LangChain的智能体时,最大的挑战之一是从非结构化数据中准确提取节点和关系。特别是当使用较小的、量化的本地LLM时,这一点尤其困难,结果往往是AI系统表现不佳。LangChain提取功能的一个关键问题是它依赖严格的JSON解析,即使使用更大的模型或非常详细的提示模板,也可能失败。相比之下,BAML使用一种模糊解析(fuzzyparsing)方法,即使LLM的输出不是完美的JSON格式,也能成功提取数据。在...
2025-08-22 07:15:03 1514浏览 0点赞 0回复 0收藏
模型上下文协议(ModelContextProtocol,MCP)正在彻底改变我们与人工智能的交互方式,它让从数据科学家到业余爱好者的每个人都能轻松地为AI助手接入真实世界的数据,从而大幅提升其能力。举个例子,你可以像和同事聊天一样与AI对话,毫不费力地让它深入分析复杂数据集、发现隐藏模式、进行数值计算,甚至实时抓取网络上的市场趋势——整个过程自然流畅,就像普通对话一样。MCP就像一个通用连接器,弥合了现代AI模型强大能力与...
2025-08-22 07:05:46 1075浏览 0点赞 0回复 0收藏
大型语言模型(LLMs)正在改变我们与技术的互动方式,从聊天机器人到代码助手,功能无所不包。但要高效运行这些模型可不是件小事,尤其是在需要速度、可扩展性和高吞吐量应用的稳定性时。如果你一直在用Ollama进行本地LLM实验,现在想转向vLLM以获得生产级性能,这篇文章的主要目的是讲解这两个框架的区别,探讨选择正确框架的重要性,并提供一步步的指导。1.为什么选择合适的LLM框架很重要把部署LLM想象成开餐厅。如果只是给小...
2025-08-21 10:12:23 3801浏览 0点赞 0回复 0收藏
混合智能体(MixtureofAgents,MoA)框架正在重新定义我们如何将大语言模型(LLM)推向更高的准确性、推理深度和可靠性水平——而无需承担扩展单一巨型模型所带来的高昂成本。MoA并不依赖于一个“通才型”的大语言模型,而是协调一组专业化的模型,以结构化的层级进行协作,逐步优化输出结果。这种方法即使使用开源模型,也已在多个基准测试中展现出最先进的(SOTA)性能,甚至超越了如GPT4Omni等顶级专有大语言模型。大语言模型...
2025-08-12 06:55:21 2345浏览 0点赞 0回复 0收藏
OpenAI正式发布GPT5了。公司称这是一个统一的系统,能自己决定回答问题前需要思考多久。SamAltman说,GPT5就像是你可以“向一个真正的专家、博士级别的专家提问任何问题”,然后得到靠谱的回答。新模型正逐步向全部7亿ChatGPT用户开放——是的,哪怕你没花钱买订阅也能用。看完一小时的发布会后,问题很简单:GPT5真有比之前模型大进步,还是被炒过头了?在这篇文章里,我会详细聊聊GPT5是什么、新功能有哪些、性能数据如何,以...
2025-08-12 06:42:59 1207浏览 0点赞 0回复 0收藏
在一个技术正在重塑我们生活的时代,自然语言处理(NLP)与深度学习的融合正站在创新的最前沿。这一强大的组合正在弥合人类交流与机器理解之间的鸿沟,创造出一个设备能够理解我们的语言并作出相应回应的世界。本文将探索自然语言处理与深度学习这一令人着迷的领域。我们将回顾其发展历程、核心技术、广泛的应用领域,以及这一动态组合的未来前景。我们还将深入了解大型语言模型,以及它们如何正在重塑全球各行各业。无论你是技...
2025-07-24 07:32:14 3512浏览 0点赞 0回复 0收藏
本文翻译整理自 Yichao“Peak”Ji于2025年7月18日发表的文章《ContextEngineeringforAIAgents》,并结合dev.to社区和rMachineLearning讨论进行补充。https:medium.compeakjicontextengineeringforaiagentslessonsfrombuildingmanus71883f0a67f2一、ContextEngineering胜于重训模型在Manus项目早期,团队面临两个方向选择:训练专属Agent模型,还是基于最先进LLM做“上下文工程”。历史告诉我们:BERT微调时代迭代慢、成本高,G...
2025-07-24 07:25:57 2342浏览 0点赞 0回复 0收藏
来认识一下KimiK2!MoonshotAI在2025年7月11日发布的最新MixtureofExperts(MoE)大型语言模型,简直是个大杀器!关键信息一览:•架构:总共1万亿参数,每次前向传播激活320亿参数。•预训练:用了15.5万亿tokens,靠着全新的MuonClip优化器,训练过程零不稳定。•用途:“Agentic”设计,不光会回答问题,还能主动用工具、写代码、浏览网页、跑命令,超全能!•性能:在coding(LiveCodeBench、SWEbench)、推理(ZebraLogic、G...
2025-07-24 07:24:03 6003浏览 0点赞 0回复 0收藏
“AI将在2026年取代所有程序员。”AndrejKarpathy(OpenAI联合创始人)和SteveYegge(前亚马逊与谷歌资深工程师)站出来,分享了他们对未来的真正看法。而他们的观点?彻底颠覆了这个流行的说法。他们认为,大家都搞反了方向。这几个月来,我一直在密切使用各种AI编程工具。当Karpathy和Yegge不约而同地得出相同结论时,我意识到——这事儿值得深入挖掘。他们所说的,不只是与那些末日论截然不同,而是完全相反的方向。Karpathy...
2025-07-18 11:56:28 3783浏览 0点赞 0回复 0收藏
人工智能(AI)已经不再只是个时髦词,它正在改变我们解决实际问题的方式。从聊天机器人到自动化工作流,AI智能体是这些创新的核心。但要打造一个可靠、可扩展、随时能上线的AI智能体可不是件容易事。这时候,LangGraph登场了!它是LangChain的一个强大框架,能帮你轻松构建复杂、状态化的AI智能体,处理各种棘手的任务。这篇文章咱们就来聊聊如何用LangGraph打造生产就绪的AI智能体,还会通过一个实际案例,配上代码、工作流和...
2025-07-18 11:50:36 4477浏览 0点赞 0回复 0收藏
获得成就
已积累 2.3w 人气
获得 0 个点赞
获得 1 次收藏