51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
LLM
算家云
什么是主动学习?
原创
如果数据是无标签的,我们很难构建一个监督学习系统。使用无监督技术是一种可行的解决方案,但它们能完成的任务类型有限。另一种可能的方法,是依赖自监督学习。自监督学习是指我们有一个无标签的数据集,但我们通过某种方式能够从中构建一个监督学习模型。这通常依赖于任务的固有属性。例如,ChatGPT自回归地基于当前词预测下一个单词。这样我们就可以简单地将文本左移一位在海量文本上构造训练数据集。输入:"Thecatsaton"标...
鱼虫子
0回复
2961浏览
自监督学习
主动学习
LLM-R:基于RAG和层次化Agent落地案例解析
原创
在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。为了应对这一挑战,一个革命性的方法——LLMR应运而...
恰似惊鸿
0回复
3147浏览
LLM-R
RAG
Agent
如何使用BART模型和Hugging Face Transformers总结文本?
原创
若要使用HuggingFace的BART模型总结文本,请加载模型和分词器,输入文本,随后模型就会生成简洁的摘要。BART是一个帮助总结文本的工具。它可以使长文章变得更短,更容易阅读。这有助于你快速找到要点。BART的工作原理是,分析整段文本以理解其上下文。然后,它通过保留重要的部分并删除不太重要的部分来生成摘要。有了BART,你可以总结文章、报告及其他文本。它侧重于关键信息,以创建清晰简洁的版本。HuggingFaceTransformers...
51CTO内容精选
0回复
3512浏览
BART模型
总结文本
分词器
提示工程中的代理技术:构建智能自主的AI系统
今天,我们将进入一个更加复杂和动态的领域:提示工程中的代理技术。这种技术允许我们创建能够自主决策、执行复杂任务序列,甚至与人类和其他系统交互的AI系统。让我们一起探索如何设计和实现这些智能代理,以及它们如何改变我们与AI交互的方式。1.代理技术在AI中的重要性在深入技术细节之前,让我们先理解为什么代理技术在现代AI系统中如此重要:任务复杂性:随着AI应用场景的复杂化,单一的静态提示已经无法满足需求。代理可...
芝士AI吃鱼
0回复
2971浏览
自主
AI
系统
微软五大Agent联手,这下厉害了!
近期,微软推出了一款创新性的通用MultiAgent框架——MagenticOne。这个开源项目致力于处理各类复杂的开放性任务,涵盖范围包括网络浏览操作、本地文件管理、Python代码编写与执行、市场研究分析以及学术论文撰写等多个方面。该框架由五个核心智能体构成:总体协调的Orchestrator、负责网络任务的WebSurfer、管理文件系统的FileSurfer、专注编程的Coder,以及处理终端操作的ComputerTerminal。在这个体系中,Orchestrator作为核...
探索AGI
0回复
3172浏览
微软
Agent
AI
一文读懂LLMs的幻觉问题和对策
什么是大模型幻觉(LLMHallucination)指大语言模型在生成文本时,给出似是而非、虚构或不准确信息的现象,简单来说就是一本正经的胡说八道。要点:大模型幻觉包括生成的文本与事实矛盾、上下文矛盾、与prompt不一致、编造事实和荒谬回复等问题幻觉产生的原因有数据质量问题、多样性缺乏、训练过拟合、生成过程随机性、提示工程不足和微调过程控制不当幻觉会带来严重后果,阻碍大模型应用1).事实性幻觉(FactualityHallucination...
数字化助推器
0回复
3593浏览
大模型
多模态
优雅谈大模型:一文读懂LoRA/DoRA/MoRA
Microsoft于2021年推出的LoRA是一种经济型微调模型参数的方法。现在大模型的参数规模动不动都在10亿级别以上,微调大模型(微调这里代表着SFT,例如读者将某个大模型拿到自身领域,想使用自身领域的知识再次训练和精校大模型,就属于模型微调的领域。)的全面微调模式下,需要调整所有的参数,因此所需要的资源和时间巨大。LoRA提出了一种微训练模型的新方法,在冻结大部分的模型参数之余,仅仅更新额外的部分参数。同时它的性...
鲁班模锤1
0回复
4810浏览
模型
LoRA
MoRA
一文详解MHA、GQA、MQA原理
原创
前言本文回顾一下MHA、GQA、MQA,详细解读下MHA、GQA、MQA这三种常见注意力机制的原理。图1MHA、GQA、MQA一览selfattentionselfattention在自注意力机制中,输入通常是一个统一的输入矩阵,而这个矩阵后续会通过乘以不同的权重矩阵来转换成三个不同的向量集合:查询向量Q、键向量K和值向量V。这三组向量是通过线性变换方式生成:1.查询向量(Q):QXWQ2.键向量(K):KXWK3.值向量(V):VXWVWQ,WK和WV是可学习的权重矩阵,分别对应于查...
大模型自然语言处理
0回复
5701浏览
大语言模型
自然语言处理
实现了个ChatGPT趋动的游戏,玩得乐此不疲
精华
今天给大家带来一篇《简单实现一个ChatGPT驱动的游戏》文章,来自知乎九号(已授权)。今年四月份读了斯坦福GenerativeAgent的论文,觉得特别好玩,花几天时间实现了这个demo。后来拿着这个demo去参加hackathon,竟然拿了二等奖还帮我赢了1300多刀。最近提到这个demo,同事表示很有兴趣,于是仔细整理了一下,分享给大家。知乎:https:zhuanlan.zhihu.comp664009161Github:https:github.comliyucheng09ChatGPTAgent0.让LLM驱动...
NLP工作站
0回复
3263浏览
ChatGPT
demo
react
R²AG:将检索信息融入RAG,提升问答系统准确性
文章指出,传统RAG通过向量检索排序召回与Query相关的片段,通过prompt生成回复,LLMs与检索器之间存在语义鸿沟(LLMs难以有效利用检索器提供的信息)。下面来看看这篇文章引入检索信息增强RAG性能的trick。RAG和的比较。采用可训练的Former来弥合检索器和LLM之间的语义鸿沟方法模型架构检索特征提取这样存在一个问题,这些表示不能直接使用,因为单一的表示无法捕捉到用于LLM生成的交互特征。因此,为了适应各种检索器,需要将...
大模型自然语言处理
0回复
2608浏览
RAG
斯坦福大学:VideoAgent基于大语言模型的视频QA系统
架构图片上图是VideoAgent的概览图,VideoAgent通过搜索、聚合视频信息来完成长视频QA。整个系统包括一个核心LLM、VLM(视觉大语言模型)和CLIP工具。作者受到人类理解长视频的启发,提出了VideoAgent,通过基于Agent的系统来模拟这一过程的系统。将视频理解过程形式化为一系列状态、动作和观察,其中LLM作为代理控制这个过程。首先,LLM通过浏览从视频中均匀抽样的一组帧来熟悉视频内容的背景。在每次迭代中,LLM评估当前信息(...
大语言模型论文跟踪
0回复
2949浏览
视频
QA
系统
浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG
原创
AssisTRAG通过集成一个智能信息助手来提升LLMs处理复杂推理任务的能力。该框架由两个主要组件构成:一个冻结的主语言模型和一个可训练的助手语言模型。AssisTRAG与之前的RAG对比1.组件主语言模型(MainLLM):负责根据提供的信息生成答案。这个模型是固定的,不进行训练。助手语言模型(AssistantLLM):负责信息管理,包括记忆管理和知识管理。这个模型是可训练的。可以看出,相比之前的RAG,该框架主要创新点是引入一个Assist...
大模型自然语言处理
0回复
2775浏览
RAG
HunYuan MoE:聊一聊 LLM 参数量、计算量和 MFU 等
一、背景最近在看腾讯最新混元大模型的Paper时([2411.02265]HunyuanLarge:AnOpenSourceMoEModelwith52BillionActivatedParametersbyTencent[1]),看到了如下关于计算Budget的公式由于我们的工作中也会经常根据计算资源Budget评估LLM预训练时间,而该公式与我们平常的计算方式不太一致;此外,如下图所示,我们也看到很多文章中将上述公式中的第二项理解为长序列情况下Attention的额外计算开销,而将6ND>9.6ND看成Router引入的...
sbf_2000
0回复
8712浏览
LLM
参数量
LoRA或许暗藏玄机 | 数字也会骗人?GPT-4都会说9.11>9.9,人工智能的"数学残障"有救了吗?
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文:LoRA或许暗藏玄机数字也会骗人?GPT4都会说9.11>9.9,人工智能的"数学残障"有救了吗?1、LoRA或许暗藏玄机近期,一项重磅研究揭示了AI训练中广受欢迎的LoRA方法可能存在隐患。虽然LoRA能让模型训练时节省90%以上的显存,在目标任务上表现堪比完整微调,但研究人员发现这种"看似完美"的方法背后,或许并不如表面那么美好。研究...
sbf_2000
0回复
2571浏览
LoRA
GPT-4
AI
PHP程序员学习AI的学习心得
原创
作为一名拥有10年经验的PHP程序员,我深知技术迭代的速度之快,以及不断学习新技能对于保持职业竞争力的重要性。最近,我踏上了学习人工智能(AI)的旅程,这一决定不仅拓宽了我的技术视野,也对我的日常工作产生了深远的影响。初识AI,我被其强大的数据处理和模式识别能力所吸引。在PHP开发中,我们经常需要处理大量的数据,并从中提取有价值的信息。而AI技术,特别是机器学习和深度学习,为我们提供了一种全新的、更加高效的...
庞然大悟
0回复
2378浏览
AI,程序员
FineTuneBench:商业精细调整API能够如何融入LLMs中的新知识?
研究背景这篇文章研究了商业微调API在将新知识注入大型语言模型(LLMs)和更新现有知识方面的效果。尽管OpenAI和Google等提供商提供的商业LLMs微调API具有灵活的应用适应性,但其有效性尚不清楚。该问题的研究难点包括:微调方法的不透明性、缺乏统一的基准评估、用户对超参数优化的限制以及模型在处理新知识和更新知识时的泛化能力有限。相关工作:该问题的研究相关工作包括监督微调、强化学习从人类反馈、检索增强生成等方法...
AI论文解读
0回复
2686浏览
API
LLMs
商业
NeurIPS`24 | 超25万对助力具身智能!3D场景大规模多模态情境推理数据集MSQA | BIGAI
精华
文章链接:https:arxiv.orgpdf2409.02389项目链接:https:msr3d.github.io亮点直击引入了MSQA,这是一个大规模的3D情境推理数据集,包括251K个情境问答对,利用可扩展的自动化数据生成流程,在多样化的真实场景中采集。提出使用交替多模态输入设置进行模型学习和评估,建立了两个全面的基准测试任务,MSQA和MSNN,以评估模型在3D场景中进行情境推理和导航的能力。本文进行了全面的实验分析,将现有模型与本文提出的基准模型MSR3...
angel
0回复
4212浏览
模型
数据集
关于大模型的使用——提示词工程
原创
“学会写提示词,就类似于学会使用电脑的鼠标和键盘,这是学习和使用大模型必备的技能之一。而提示词工程就是让你学会怎么和大模型说话”最近断断续续一直有人通过后台留言或加微信的方式,来咨询大模型的应用问题;比如,怎么用大模型优化文本,或者怎么才能从大模型得到更好的回答等问题。这些零零散散的问题,其实归根结底都属于大模型的应用问题,而大模型的应用目前最常用,也是最重要的手段就是提示词工程。简单来说,...
AI探索时代
0回复
4249浏览
提示词工程
大模型
大模型应用
Text2SQL 新一代解决方案Tool-SQL,基于LLM和Agent智能体实现,效果提升显著
原创
精华
在互联网时代,数据爆发式增长,如果高效的分析数据成为一个亟待解决的问题。SQL是数据分析师的常用工具,编写高效的SQL需要用户具备一定的IT基础,对于普通人员来说存在一定门槛。TexttoSQL技术可以实现自然语言转换成SQL,用户只需要用自然语言描述自己的目标,TexttoSQL工具就可以自动生成对应的SQL,大大降低SQL编写的门槛和效率。为了提高TexttoSQL的效果,北航提出了一个基于LLM和智能体的TexttoSQL框架。实验表明,新...
AI博物院
0回复
7248浏览
Text2SQL
LLM
Agent
Anthropic研究团队提出新技术,引入Contextual Retrieval让RAG再进化,大幅降低检索失败率
原创
在当前的知识检索领域,RAG技术正引领着最新潮流,它的目标是为大型语言模型(LLM)提供丰富而精确的上下文信息。然而,传统RAG方法在处理信息时经常会忽略上下文细节,这限制了其从知识库中提取相关信息的能力。解决如何有效保存上下文信息的问题,已成为该领域的重点。针对这一挑战,Anthropic的研究团队提出了一种名为“上下文检索”的创新技术,使得在这一领域取得了重大突破。他们最近发表的研究详细介绍了这一技术,展...
AI博物院
0回复
3127浏览
大模型
RAG
暂无内容
1
213
214
215
216
217
218
219
220
221
客服