鸿煊的学习笔记
LV.2
包括但不限于机器学习、深度学习、数据挖掘、自然语言处理等
声望 152
关注 0
粉丝 0
私信
主帖 15
回帖
一、Qwen3Embedding系列模型介绍二、Qwen3Reranker系列模型介绍三、Qwen3Embedding和Qwen3Reranker的优势6月6日凌晨,阿里巴巴开源了Qwen3Embedding系列模型,包括Embedding(文本表征)和Reranker(排序)两个模块,旨在为文本检索、语义匹配等任务提供强大支持。该系列模型基于Qwen3基础模型进行训练,在多项基准测试中展现出卓越性能,尤其在多语言支持方面达到行业领先水平。官方数据显示,Qwen3Embedding系列在多语言文本...
9天前 1212浏览 0点赞 0回复 0收藏
在大模型技术爆发的今天,AIAgent(人工智能代理)正成为连接技术与场景的核心枢纽。它不仅是提升效率的「智能助手」,更是解锁复杂任务的「万能钥匙」。本文结合多篇行业干货,提炼出5种主流AIAgent模式,带您看透智能时代的底层逻辑。一、AIAgent:重新定义人机协作的「智能体」简单来说,AIAgent是基于大模型构建的自主智能体,能像人类一样「感知环境→规划决策→执行反馈」。核心特点:自主性:无需人工干预,自动分解任务...
9天前 458浏览 0点赞 0回复 0收藏
1.引言在人工智能领域,MultiAgent系统正逐渐成为解决复杂问题、实现高效协作的关键技术。CrewAI作为一款强大的多Agent协作工具,为开发者提供了便捷的方式来构建智能协作系统。本文将详细介绍如何基于CrewAI构建MultiAgent系统。2.CrewAI核心概念详解2.1代理(Agent)2.1.1Agent的定义与功能Agent是CrewAI中的自主单元,具备执行任务、做出决策和与其他代理通信的能力。它们如同团队中的成员,各自承担特定角色,如研究员、作...
2025-05-27 06:19:40 705浏览 0点赞 0回复 0收藏
今天给大家分享一个超厉害的库——LLMReasoner,它就像给大模型开了“智慧外挂”,能让任何大语言模型(LLM)都像OpenAIo1和DeepSeekR1一样深入思考!不管你是AI技术控,还是想提升大模型使用体验的小伙伴,都别错过~1.LLMReasoner是啥“宝藏”?LLMReasoner本质是个库,致力于打破大模型给出“黑箱答案”的局面。以往,大模型输出结果时,咱根本不知道它是怎么思考的,就像拆盲盒,充满未知。但有了LLMReasoner,这一切都变啦...
2025-05-13 00:04:54 652浏览 0点赞 0回复 0收藏
在大语言模型(LLMs)的训练领域,LowRankAdaptation(LoRA)技术堪称一项重大突破。它就像给模型训练开启了一条“高速通道”,让我们能更高效地为特定任务训练大语言模型。如今,LoRA在众多应用场景中广泛使用,并且引发了一系列改进研究,催生出了许多变体,这些变体从不同角度优化LoRA,提升训练速度、性能,或者两者兼得。今天,咱们就来深入了解一下LoRA及其家族成员的奥秘。1.LoRA:基础概念与核心优势LoRA的核心做法是在...
2025-04-27 00:35:57 2343浏览 0点赞 0回复 0收藏
在大语言模型(LLMs)的飞速发展进程中,DeepSeekR1凭借出色的性能脱颖而出,吸引了无数目光。而它背后的“秘密武器”——GRPO(GroupRelativePolicyOptimization)强化学习算法,更是成为大家热议的焦点。今天,咱们就用通俗易懂的方式,深入剖析一下这个让DeepSeekR1大放异彩的GRPO算法!1.GRPO诞生的“前因后果”在大语言模型的微调环节,强化学习(RL)起着举足轻重的作用。一直以来,近端策略优化(PPO)算法都是LLM微调的...
2025-04-15 07:34:27 2624浏览 0点赞 0回复 0收藏
MCP全称是ModelContextProtocol,也就是模型上下文协议。可别小瞧它,它可不是“另一个类似API的东西”,要是你这么想,那说明还没真正get到它的精髓。说起传统API,大家应该不陌生。它就像一套固定的工具套装,通过固定和预定义的端点来提供功能,像常见的products(产品相关接口)、orders(订单接口)、invoices(发票接口)这些。但这也带来了不少麻烦。比如说,你想给API添加新功能,就得新建端点或者修改现有端点。这一改...
2025-04-02 00:57:11 1452浏览 0点赞 0回复 0收藏
大语言模型(LLM)正以前所未有的速度改变着我们的生活和工作方式。“awesomellmapps”这个精心策划的仓库,为开发者和研究者们提供了丰富多样的大语言模型应用示例。1.仓库概述“awesomellmapps”是一个汇聚了众多使用检索增强生成(RAG)和人工智能代理构建的大语言模型应用程序的仓库。它涵盖了多种基于不同大语言模型构建的应用,包括OpenAI、Anthropic、Google的模型,以及DeepSeek、Qwen、Llama等开源模型,并且用户可以...
2025-03-21 08:41:34 1963浏览 0点赞 0回复 0收藏
在当今人工智能的浪潮中,RAG(检索增强生成)技术大放异彩,像是RAGFlow、Qanything、Dify、FastGPT等RAG引擎,逐渐走进大家的视野。在这些强大的RAG引擎背后,有一个关键组件起着不可或缺的作用,它就是嵌入模型(EmbeddingModel)。今天,就让我们一起深入了解一下这个神秘的嵌入模型吧!1.Embedding究竟是什么?在了解嵌入模型之前,得先搞清楚Embedding的概念。简单来说,Embedding是一种“神奇魔法”,能把离散的非结构化...
2025-03-11 02:00:02 2895浏览 0点赞 0回复 0收藏
大语言模型(LLM)的发展可谓日新月异。大家都知道,LLM的训练过程很复杂,其中有两个关键阶段:预训练和后训练。今天咱们就来深入聊聊在这一过程中发挥重要作用的近端策略优化(PPO)算法和组相对策略优化(GRPO)算法。这俩算法不仅在学术圈备受关注,在实际应用中也有着举足轻重的地位,理解它们,能让你更懂LLM是如何一步步变得这么“聪明”的!一、从LLM训练说起LLM的训练如同一场漫长而复杂的旅程,主要分为预训练和后训...
2025-02-19 11:54:37 7051浏览 0点赞 0回复 0收藏
DeepSeekR1模型的出现引起了广泛关注,众多开源复现项目纷纷涌现(OpenR1、simpleRLreason、TinyZero、MiniR1等)。然而,受GPU条件的限制,有些小伙伴可能无法顺利运行这些项目。今天,我们就来介绍一个神奇的工具——UnslothAI,它可以帮助我们在有限的资源下训练自己的DeepSeekR1推理模型,特别是通过GRPO(GroupRelativePolicyOptimization)技术,实现了资源的大幅降低。1.UnslothAI的神奇之处1.1GRPO技术简介GRPO是一种强...
2025-02-12 13:13:42 3112浏览 0点赞 0回复 0收藏
嵌入(Embedding)技术作为基石,广泛应用于自然语言处理(NLP)、搜索引擎、推荐系统等多个关键领域,发挥着不可或缺的作用。尽管嵌入技术历经持续发展并取得诸多显著成果,但传统嵌入方法始终受困于模型规模庞大、计算资源消耗严重、推理速度迟缓等难题,这些问题犹如枷锁,限制了其进一步的拓展与应用。在此背景下,Model2Vec的全新嵌入技术为行业带来了突破性的解决方案。它凭借创新性的设计,成功实现了嵌入模型规模缩小15...
2025-02-04 18:12:45 2738浏览 0点赞 0回复 0收藏
1.背景大型推理模型如OpenAIo1、QwenQwQ等通过大规模强化学习,在科学、数学、编码等复杂领域展现出了强大的逐步推理能力。它们以“慢思考”模式生成长思维链条,有效解决复杂问题,增强了推理的逻辑性和可解释性。然而,这也带来了显著弊端,在长链式推理过程中,模型常常遭遇知识不足的困境。这使得推理链条容易出现错误传播,严重影响最终答案的质量。例如,在处理一些复杂的科学问题时,模型可能会因为对某些关键知识点的缺...
2025-01-20 10:57:57 2074浏览 0点赞 0回复 0收藏
2024年,AIAgents成为热门概念,2025年则有望成为其爆发元年。AIAgents在企业场景中的应用日益广泛,但在落地过程中也面临着诸多挑战。本文将基于Langbase的研究报告,探讨AIAgents的发展现状,包括LLM提供商的选择、应用场景、落地制约因素以及所需的配套基建等方面。1.研究背景与参与者Langbase对来自100多个国家的3400多位专业人士进行了调查,涵盖C级高管(46%)、工程师(26%)、客户支持(17%)、市场营销(8%)、IT(3%...
2025-01-10 12:28:44 2168浏览 0点赞 0回复 0收藏
1.LLMAgent是什么大语言模型智能体是一种程序,其执行逻辑由其底层模型控制。大语言模型智能体与少样本提示或固定工作流程等方法的区别在于,它能够定义和调整执行用户查询所需的步骤。通过使用一组工具(如代码执行或网络搜索),智能体可以决定使用哪个工具、如何使用它,并根据输出对结果进行迭代。这种适应性使系统能够以最小的配置处理各种用例。智能体架构存在于一个范围内,从固定工作流程的可靠性到自主智能体的灵活性...
2025-01-02 12:20:43 2885浏览 0点赞 0回复 0收藏
获得成就
已积累 7686 人气
获得 0 个点赞
获得 0 次收藏