PyTorch研习社
LV.3
打破知识壁垒,做一名知识的传播者
声望 252
关注 0
粉丝 0
私信
主帖 27
回帖
混合智能体(MixtureofAgents,MoA)框架正在重新定义我们如何将大语言模型(LLM)推向更高的准确性、推理深度和可靠性水平——而无需承担扩展单一巨型模型所带来的高昂成本。MoA并不依赖于一个“通才型”的大语言模型,而是协调一组专业化的模型,以结构化的层级进行协作,逐步优化输出结果。这种方法即使使用开源模型,也已在多个基准测试中展现出最先进的(SOTA)性能,甚至超越了如GPT4Omni等顶级专有大语言模型。大语言模型...
8天前 1361浏览 0点赞 0回复 0收藏
OpenAI正式发布GPT5了。公司称这是一个统一的系统,能自己决定回答问题前需要思考多久。SamAltman说,GPT5就像是你可以“向一个真正的专家、博士级别的专家提问任何问题”,然后得到靠谱的回答。新模型正逐步向全部7亿ChatGPT用户开放——是的,哪怕你没花钱买订阅也能用。看完一小时的发布会后,问题很简单:GPT5真有比之前模型大进步,还是被炒过头了?在这篇文章里,我会详细聊聊GPT5是什么、新功能有哪些、性能数据如何,以...
8天前 675浏览 0点赞 0回复 0收藏
在一个技术正在重塑我们生活的时代,自然语言处理(NLP)与深度学习的融合正站在创新的最前沿。这一强大的组合正在弥合人类交流与机器理解之间的鸿沟,创造出一个设备能够理解我们的语言并作出相应回应的世界。本文将探索自然语言处理与深度学习这一令人着迷的领域。我们将回顾其发展历程、核心技术、广泛的应用领域,以及这一动态组合的未来前景。我们还将深入了解大型语言模型,以及它们如何正在重塑全球各行各业。无论你是技...
2025-07-24 07:32:14 2404浏览 0点赞 0回复 0收藏
本文翻译整理自 Yichao“Peak”Ji于2025年7月18日发表的文章《ContextEngineeringforAIAgents》,并结合dev.to社区和rMachineLearning讨论进行补充。https:medium.compeakjicontextengineeringforaiagentslessonsfrombuildingmanus71883f0a67f2一、ContextEngineering胜于重训模型在Manus项目早期,团队面临两个方向选择:训练专属Agent模型,还是基于最先进LLM做“上下文工程”。历史告诉我们:BERT微调时代迭代慢、成本高,G...
2025-07-24 07:25:57 1598浏览 0点赞 0回复 0收藏
来认识一下KimiK2!MoonshotAI在2025年7月11日发布的最新MixtureofExperts(MoE)大型语言模型,简直是个大杀器!关键信息一览:•架构:总共1万亿参数,每次前向传播激活320亿参数。•预训练:用了15.5万亿tokens,靠着全新的MuonClip优化器,训练过程零不稳定。•用途:“Agentic”设计,不光会回答问题,还能主动用工具、写代码、浏览网页、跑命令,超全能!•性能:在coding(LiveCodeBench、SWEbench)、推理(ZebraLogic、G...
2025-07-24 07:24:03 3704浏览 0点赞 0回复 0收藏
“AI将在2026年取代所有程序员。”AndrejKarpathy(OpenAI联合创始人)和SteveYegge(前亚马逊与谷歌资深工程师)站出来,分享了他们对未来的真正看法。而他们的观点?彻底颠覆了这个流行的说法。他们认为,大家都搞反了方向。这几个月来,我一直在密切使用各种AI编程工具。当Karpathy和Yegge不约而同地得出相同结论时,我意识到——这事儿值得深入挖掘。他们所说的,不只是与那些末日论截然不同,而是完全相反的方向。Karpathy...
2025-07-18 11:56:28 3273浏览 0点赞 0回复 0收藏
人工智能(AI)已经不再只是个时髦词,它正在改变我们解决实际问题的方式。从聊天机器人到自动化工作流,AI智能体是这些创新的核心。但要打造一个可靠、可扩展、随时能上线的AI智能体可不是件容易事。这时候,LangGraph登场了!它是LangChain的一个强大框架,能帮你轻松构建复杂、状态化的AI智能体,处理各种棘手的任务。这篇文章咱们就来聊聊如何用LangGraph打造生产就绪的AI智能体,还会通过一个实际案例,配上代码、工作流和...
2025-07-18 11:50:36 2422浏览 0点赞 0回复 0收藏
AI智能体(像OpenAIOperator这样的)能帮你自动完成网上找产品、管理浏览器标签等任务,简直是解放双手!但要让这些智能体真正派上用场,挑战可不小。这篇文章会聊聊AI智能体在网页互动中的现状、痛点,以及一个叫AgenticWebInterfaces(AWIs)的新解决方案。引言AI智能体想在网页上干点有意义的事儿,远比处理简单搜索复杂得多。虽然MCP(ModelContextProtocol)网页服务器能帮忙搞定搜索操作,但更大的问题是,网页是为人类设计的...
2025-07-03 00:54:27 1066浏览 0点赞 0回复 0收藏
如果你想跻身AI工程师的顶尖1%,别再浪费时间了,赶紧看看这份清单!我知道这看起来有点多,一下子学完肯定不现实。但慢慢来,你得搞懂这些库的功能,以及在项目中啥时候用它们。AI行业变化快得像坐火箭,半年前的热门技术可能现在已经过时了。公司急需能打造生产级系统的AI工程师。很多开发者卡壳,是因为他们只追逐炫酷的玩意儿,比如最新的GPT包装器或社交媒体上炒得火热的新框架,却忽略了那些真正区分专业选手和业余玩家的...
2025-07-03 00:49:15 1064浏览 0点赞 0回复 0收藏
函数调用(functioncalling)是一种机制,允许大语言模型(LLM)通过调用外部函数或API执行特定的、预定义的任务。可以将其视为一种功能,让LLM将它无法独立完成的工作“委托”出去。例如,假设您向LLM发送以下提示:“特斯拉当前的股价是多少?”没有函数调用的基本LLM可能会根据其训练数据中的模式“幻觉”出一个答案,例如“可能在200美元左右”。经过RLHF优化的模型可能会更诚实地说:“我没有实时数据,所以无法告诉你。”...
2025-06-19 07:16:48 1342浏览 0点赞 0回复 0收藏
2025年的RAG大反思我们的目标不是抨击RAG(它仍有其用武之地!),而是通过一个实际案例来探索2025年的技术趋势。我们将构建一个传统上会使用RAG的系统,但采用一种完全不同的、越来越流行的方法。通过本文,你将了解:•为什么“直接访问源数据”的方法(gotosource)因工具调用(toolcalling)和模型上下文协议(MCP)而逐渐受到关注。•RAG仍然适用的场景(剧透:比你想象的少)。•如何构建一个用户喜爱的实用替代方案。•...
2025-06-19 07:03:13 1323浏览 0点赞 0回复 0收藏
在网络拥有HyperTextTransferProtocol(HTTP)之前,在电子邮件拥有SimpleMailTransferProtocol(SMTP)之前,我们受困于定制化集成、碎片化系统和脆弱的工作流程。直到开放协议和共享基础设施出现,互联网才真正实现规模化,解锁了现代网络、全球通信和整个经济体系。如今,AI代理正处于类似的预标准化阶段。它们功能强大、能力卓越且数量迅速增长,但它们无法协同工作。一个代理分析数据,另一个起草代码,第三个自动化CRM工作流...
2025-06-06 10:17:17 1210浏览 0点赞 0回复 0收藏
AI代理简介你可能听说过“生成式AI”这个术语——但什么是AI代理?本质上,它们是利用高级语言模型来更自主地处理任务的下一代工具。它们能够解析用户查询,挑选相关信息,并以结构化的方式与外部服务交互。上图展示了AI如何从基本的生成模型发展到能够与各种工具协作的复杂AI代理。PydanticAI简介PydanticAI是一个Python代理框架,旨在简化利用生成式AI开发生产级应用的流程。由Pydantic背后的团队开发——Pydantic是许多Pytho...
2025-05-26 01:32:09 1667浏览 0点赞 0回复 0收藏
随着大语言模型(LLM)的发展,AI的「推理能力」正以前所未有的速度突破。然而,很多企业级检索系统却依旧停留在简单的关键词匹配阶段,难以支持真正意义上的“深度知识发现”。LightOn最新发布的开源模型ReasonModernColBERT,正是为了解决这一瓶颈——让检索系统具备推理能力,支撑AgenticRAG与深度研究场景。检索系统的“三个进化阶段”你了解吗?信息检索系统的发展,其实可以划分为三个阶段:1️⃣Level1:关键词匹配(Key...
2025-05-26 01:25:18 2369浏览 0点赞 0回复 0收藏
今天给大家分享一篇非常出色的综述论文,总结了当前MultiAgentEmbodiedAI(多智能体具身智能)的研究进展。这篇文章不仅回顾了超过300篇相关论文,还从多个角度探讨了这个快速演化的领域将如何影响我们对智能体未来的构建方式。为什么MultiAgentEmbodiedAI很重要?当前的大多数研究仍然集中在单一智能体的范式上。但我们所生活的真实世界却远比“一个智能体”复杂得多——它是开放的、异质的、动态变化的。这篇综述论文强调了协...
2025-05-12 07:20:56 1391浏览 0点赞 0回复 0收藏
在众多RAG方法中,NodeRAG以其独特的图结构框架脱颖而出。NodeRAG通过异构图结构和先进的检索机制,为LLM提供更精准、更高效的外部知识支持。本文将深入介绍NodeRAG的核心特性、优势及其在多个领域的卓越表现。什么是NodeRAG?NodeRAG是一种以图为中心的RAG框架,旨在通过异构节点结构化基于图的检索增强生成。它将文档和LLM提取的信息分解为多种类型的节点(如实体、关系、语义单元、属性、高层次元素、概览和文本),并利用图...
2025-04-27 00:17:05 1543浏览 0点赞 0回复 0收藏
当前,我们正处在Agent开发的‘工程化转折点’。打造一个真正“可上线”的Agent系统,不再只是拼接组件,而是围绕四个核心模块进行有机组合。在大模型持续进化的今天,Agent成为很多人眼中的“超级助手”,从代码编写到数据分析、从网页问答到知识检索,它无所不能。但如果你尝试亲自“造一个Agent”,很快会发现一个现实问题:框架太多,套路太杂,效果却难以复用上线。这是因为,大多数教程和开源项目,讲的是功能拼接,但真...
2025-04-27 00:13:44 3625浏览 0点赞 0回复 1收藏
在这篇文章中,我将介绍如何使用LangGraph、AgenticRAR、NanoGraphRAG以及Claude3.7Sonnet来创建一个基于智能推理(AgenticRAR)的聊天机器人,看完这篇文章之后你就学会了如何为你的业务打造一个强大的智能推理聊天机器人。我首先向你展示一下聊天机器人的效果:“生成代码,检查以下数字是否为回文数:123、121、12321、12345、123454321。”当用户提出问题时,初始推理Agent会对其进行分析,识别需要哪些专业Agent,并检测特...
2025-04-15 06:54:22 1970浏览 0点赞 0回复 0收藏
在当前生成式模型与信息检索技术快速发展的背景下,如何有效结合二者,提升问答系统的准确性与实用性成为技术探索的焦点。为了寻找最佳解决方案,我尝试了18种不同的RAG(RetrievalAugmentedGeneration)技术,从最基础的方法到复杂的多模型融合。经过大量实验,数据表明AdaptiveRAG凭借动态调整策略和出色的检索效果,以最高得分0.86成为本次实验中的大赢家。接下来,我将详细介绍每种RAG技术的核心思想、实现细节以及优缺点,...
2025-04-02 00:36:54 2265浏览 0点赞 0回复 0收藏
AI系统正逐步获得在现实世界中独立行动的能力。过去一年,我们在推理、计算机控制和记忆系统方面取得了重大进展,这些技术推动了这一转变。本文分析了这些发展的技术基础、不同领域中AIAgent的现状,以及确保其可靠性所需的基础设施。我们将探讨推动这一变革的技术进步,以及尚待解决的挑战。第一部分:巨大的转变——从模型到Agent2024年,我们见证了AIAgent关键能力的崛起。OpenAI的o1和o3模型表明,机器可以分解复杂任务。Cl...
2025-03-21 07:51:26 2860浏览 0点赞 0回复 0收藏
获得成就
已积累 1.4w 人气
获得 0 个点赞
获得 1 次收藏