51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
算家云
AI
LLM
RAG 或 Fine Tume - 为您的用例选择正确方法的权威指南
精华
序幕随着对大型语言模型(LLMs)的兴趣激增,许多开发人员和组织正忙于构建应用程序,以利用他们的力量。但是,当预训练LLMs的开箱即用没有按预期或希望执行时,关于如何提高LLM应用程序性能的问题就来了。最终,我们到了问自己的地步:我们应该使用检索增强生成(RAG)还是模型微调来改善结果?在深入研究之前,让我们揭开这两种方法的神秘面纱:RAG:这种方法将检索(或搜索)的能力集成到文本生成中LLM。它结合了一个检索器...
sulu637
0回复
2725浏览
RAG
微调
LLM
基于Gemini 2.0和LangGraph实现自主多工具AI代理
原创
本文旨在探讨基于Gemini2.0和LangGraph构建一个自主型多工具AI代理的关键过程,并提供示例程序的完整代码。简介当今,LLM应用非常出色——它们可以记住大量信息、回答一般知识问题、编写代码、生成故事,甚至还可以纠正语法错误,等等。然而,它们并非没有局限性。它们会产生幻觉,知识断点可能从几个月到几年不等,并且仅限于生成文本,无法与现实世界互动。显然,这限制了它们在需要实时数据、来源引用或文本生成以外功能的任...
51CTO内容精选
0回复
3334浏览
Gemini 2.0
LangGraph
LLM
什么是自然语言处理——NLP,其解决了什么问题?
原创
“自然语言处理是一门让机器理解人类语言的技术,是人和机器交流的桥梁”自然语言处理(NaturalLanguageProcessing,NLP)是人工智能(AI)的一个分支,旨在让计算机能够理解、生成和处理人类的自然语言(如中文、英文)。NLP的目标是让计算机能够像人类一样理解和使用语言,从而实现人机自然交互、自动化信息处理等功能。自然语言处理自然语言处理的技术实现原理NLP技术主要依赖于语言学知识、统计方法和深度学习技术,逐渐从基...
AI探索时代
0回复
3792浏览
自然语言处理
NLP
AI智能体FastGPT重塑应用新篇章
原创
在人工智能技术的飞速发展中,FastGPT以其卓越的自然语言处理能力和广泛的应用场景,正逐步成为大模型应用的新标杆。本文将带您走进FastGPT的世界,了解其技术特点、应用场景以及对未来AI技术发展的影响。一、FastGPT技术概览FastGPT是一种基于LLM(大型语言模型)的知识库问答系统,它利用先进的自然语言处理技术,通过学习和训练,能够模拟人类的语言表达方式,生成流畅自然的文本内容。FastGPT不仅具备强大的文本生成能力,...
数字化助推器
0回复
4838浏览
AI智能体
FastGPT
华为、阿里、腾讯、百度、京东、商汤、快手等众一线大牛AI应用打造心得公开:实际在做两件事!
原创
编辑云昭、伊风观点《AIGC实战派》特约嘉宾2024,大模型开始走出“不落地”的樊笼,接受“市场老大哥”的捶打与教育。跟2023年不同的是,云厂商、大模型厂商、算力厂商、大模型六小龙、新一代的AI应用创客,独立开发者,一时间群雄并起,都在为新的增长机会放手一搏,蔚为壮观。一个有意思的现象是,虽然2024年大模型的进化依旧是主旋律,但是尤其进入下半年以来,大家讨论“射程”的话题越来越多。谁能更早摘得低垂的果实?如...
51CTO技术栈
0回复
3533浏览
华为
AI
应用
DeepSeek-R1-Distill-Qwen-1.5B 在某些基准测试中超越了 GPT-4o
原创
精华
01、概述随着人工智能领域的快速发展,推理能力已经成为了衡量大规模语言模型(LLMs)性能的一个重要指标。为了推动推理能力的极限,我们迎来了DeepSeekR1系列模型的诞生。这个系列包括了两个重要版本:DeepSeekR1Zero和DeepSeekR1,它们分别在强化学习(RL)和传统的监督微调(SFT)方法中找到了新的平衡,展示了前所未有的推理能力。DeepSeekR1Zero突破了传统的训练方式,直接通过大规模的强化学习进行训练,而没有依赖预先的...
Halo咯咯
0回复
1.3w浏览
大语言模型
选择合适的AI框架:生成式AI与智能代理AI的对比
原创
01、概述在快速发展的人工智能领域中,生成式AI(GenerativeAI)与智能代理AI(AgenticAI)是两种备受瞩目的技术。它们不仅在功能上各自独立,还在应用场景和行业需求上展现出不同的优势。随着2025年的到来,企业和开发者对AI的需求逐渐从“创造”转向“决策”和“执行”,这就让我们不得不思考:在面对生成内容与自动决策时,我们应如何选择适合的AI框架?02、什么是生成式AI与智能代理AI?在深入探讨之前,我们需要明确这两种...
Halo咯咯
0回复
3714浏览
生成式AI
智能代理AI
Good Fire AI 针对 Llama 3.1 8B 和 Llama 3.3 70B 的开源稀疏自动编码器 (SAE)
原创
01、概述随着OpenAI的GPT和Meta的LLaMA等大规模语言模型(LLMs)不断突破技术瓶颈,我们已经见证了自然语言处理领域的巨大进步。然而,伴随着这些技术进步的,是对计算资源和存储空间的巨大需求。这使得许多资源有限的组织在部署和优化这些庞大模型时面临不小的挑战——如何在内存效率、推理速度和可访问性之间找到平衡,成了摆在研究人员和开发者面前的一道难题。在这种背景下,GoodFireAI提供了一种切实可行的解决方案——开...
Halo咯咯
0回复
2640浏览
框架
大语言模型
字节要亲手打造AGI了!神秘“Seed Edge”项目被曝光,已设置5大研究方向,探索下一代AI技术,算力不用愁!
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)中国大厂开始发力AGI了!据媒体报道,字节跳动AGI研究团队浮出水面,揭开了字节AGI的秘密布局!报道称:1月下旬,字节正式设立代号为“SeedEdge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的AGI前沿研究。好家伙,感觉中国的几家大厂,字节是最先明牌要搞AGI的,有钱有资源的“宇宙厂”这下又走在最前列了。接近字节的知情人士透露,SeedEdge的目标是探索AGI的...
51CTO技术栈
0回复
3008浏览
AGI
AI
技术
DeepSeek-R1 + RooCline:极佳的强化学习AI编码代理!对标o1、蒸馏小模型本地部署
Hi,这里是Aitrainee,欢迎阅读本期新文章。DeepseekR1正式发布。不是之前的Light版本,而是完整的R1。性能与o1相当,还采用MIT开源协议,可以商用。现在能在Deepseekchat平台用,也提供API。模型分两个版本:主力R1,和面向研究的R1Zero。R1Zero没有监督微调,直接RL,是一个未经过对话偏好对齐监督微调的版本,专门为研究人员或希望自行微调模型的人提供。正式发布的R1还是用了SFT阶段。R1是671B参数的大模型,激活参数只有37...
老蛀虫
0回复
4459浏览
DeepSeek
AI
编码
基于CogVideoX-2B,视觉一致和语义对齐超越最新SOTA!南洋理工等发布RepVideo
文章链接:https:arxiv.orgpdf2501.08994项目链接:https:vchitect.github.ioRepVidWebpage亮点直击研究了视频扩散模型中的transformer表示,揭示了各层注意力图的显著变化导致了空间语义的碎片化和时间一致性的降低,这对视频质量产生了负面影响。提出了RepVideo,一个利用特征缓存模块和门控机制来聚合和稳定中间表示的框架,增强了空间细节和时间一致性。大量实验表明,RepVideo在时间一致性和空间质量方面都取得了竞争力的表...
angel
0回复
3353浏览
模型
AI
视频生成
基于 Gemini AI 实现音频和视频解析
GeminiAI,谷歌最新推出的多模态AI模型,凭借其强大的语言理解能力和多模态处理能力,正在彻底改变我们与音频和视频内容的互动方式。它不仅能识别和理解音频和视频中的信息,还能进行更深层的解析,提取关键信息,生成摘要,甚至进行内容创作。本文将深入探讨GeminiAI在音频和视频解析方面的强大功能,并展示其在不同场景下的应用案例。超越文字识别:理解音频和视频内容传统语音识别技术只能将语音转化为文字,而GeminiAI则更...
丢翅膀的鱼
0回复
3920浏览
Gemini
AI
视频
RAG升级二维战士!通义实验室放大招
📜摘要检索增强生成(RAG)在开放域问答任务中表现出色。然而,传统搜索引擎可能会检索浅层内容,限制了大型语言模型(LLM)处理复杂、多层次信息的能力。为了解决这个问题,我们引入了WebWalkerQA,一个旨在评估LLM执行网页遍历能力的基准。它评估LLM系统性地遍历网站子页面以获取对应信息的能力。同时我们提出了WebWalker,一个通过explorercritic范式模拟人类网页导航的multiagent框架。广泛的实验结果表明,WebWalkerQA具有...
NLP前沿1
0回复
2343浏览
RAG
编程
搜索
SenseNova 大揭秘:商汤如何打造多模态处理 “全能王”?
在人工智能的浩瀚星空中,多模态大模型正成为最为璀璨的星座之一,引领着技术发展的新潮流。商汤科技于2025年1月重磅推出的“日日新”融合大模型(SenseNova),宛如一颗耀眼的超新星,以其原生融合模态的卓越特性,在多模态信息处理领域掀起了巨大波澜。本文将深入剖析SenseNova的方方面面,从项目架构到技术内核,从功能应用到实践操作,为读者全方位呈现这一前沿技术的魅力与价值,助力大家紧跟人工智能发展的时代步伐。一、...
穿越时空111
0回复
3310浏览
SenseNova
多模态
OpenCompass
看了这么多文章,终于理解了 Scaling Law
精华
你有没有想过,是什么让AI模型变得如此强大?为什么有些AI能够写诗作画,有些却只能做简单的问答?这其中,ScalingLaw(规模法则)扮演着至关重要的角色,它就像AI模型的核心,揭示了模型性能提升的奥秘。ScalingLaw是什么?简单来说,ScalingLaw指的是当我们增加模型的规模(例如模型包含的参数越多,模型就越大)、训练数据量和计算资源时,模型的性能就会随之提升。(感觉这是符合直觉的,但ScalingLaw最核心的在于量化给出...
芝士AI吃鱼
0回复
7561浏览
Scaling
OpenAI
函数
LLM之后,Agent的未来是RL!
嘿,大家好!这里是一个专注于AI智能体的频道今天给家人们聊一期播客总结,四十二章经最新一期播客请到了在Meta工作了七年的应用强化学习组负责人朱哲清Bill。作为斯坦福大学强化学习专业博士,现在创业做Agent的他,抛出了一个巨大的反共识观点:"LLM只是一个翻译官,真正的Agent核心应该是RL。"等等,这是什么意思?在2024年,我们见证了GPT4掀起的Agent热潮。Claude、GPTs、Copilot...几乎所有大公司都在用LLM构建Agent。但B...
探索AGI
0回复
4852浏览
LLM
Agent
RL
图解新颖LLM的CoPE位置编码
1.快速总览研究人员提出了一种新颖的位置编码方法,称为上下文位置编码(下文称之为CoPE),它有别于基于标记的传统位置编码范式。它以上下文依赖的方式测量位置,在按位置寻址时会更加自由它在如下的任务中获得不错的收益:FlipFlop,SelectiveCopy,Counting,LanguageModeling,andCodeModelingtasks它优于现有方法,尤其是在域外泛化场景它有可能改善其他领域的编码,例如视频和语音。在这些领域,基于Token位置的编码不太合适...
鲁班模锤1
0回复
2491浏览
CoPE
LLM
编码
我构建了一个自动生成提案的LLM,并拿到GitHub上开源了它
原创
现有的大模型无法解决我的问题,于是我自己构建了一个开源工具,用于高效地自动生成提案。最近,我没有像以前那样频繁地更新开源文章,倒不是由于我停止写文章,而是由于开源商业化方面的进展很大,没完没了地起草提案这项任务消耗了我的太多时间。作为一家本土的开源商业公司,WhaleOps雇佣的大多是工程师。要求这些开源贡献者编写提案浪费了他们的开发时间,他们的提案并不总是符合质量标准。与大公司的管理不同,身为初创公...
51CTO内容精选
0回复
2295浏览
LLM
大模型
ChatGPT
深扒星际之门主角团:中东皇室也参与了!奥特曼搭上特朗普,至少5000亿开搞“星际之门”!
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)太炸裂了!一早上刷到OpenAI奥特曼和特朗普同框了!特朗普大手一挥,宣布了一个疯狂燃烧经费的AI项目——星际之门计划,将投资"至少"5000亿美元!!由OpenAI主导运营,在美国大搞AI基建。这个数字啥概念呢?粗略估计下大概是建设1.5个三峡大坝这样恐怖的工程量。图片而且,这还不是一个简单的画饼——"星际之门"立刻就要投入1000亿美元。特朗普说,他计划从德克萨斯州开始大规模建...
51CTO技术栈
0回复
2498浏览
AI
基建
星际之门计划
Kimi发布最新模型k1.5,技术报告也干货满满
大家好,我是刘聪NLP。就在今晚,Kimi发布了最新模型k1.5,先来看榜单效果,简直爆炸。在长推理上,k1.5在数学能力上,无论是纯文本还是视觉多模态上,都远超openai的o1模型;在codeforces与其持平,LiveCode上略差,但相比于QVQ和QWQ有较大的优势。在短推理上,k1.5的数学能力真实遥遥领先,无论是gpt4o还是claude3.5sonnet都远不如k1.5,尤其是在AIME榜单上,k1.5有60.8,而最高的deepseekv3只有39.2,堪称断层式碾压。这个应...
NLP工作站
0回复
4288浏览
Kimi
视觉
多模态
暂无内容
1
178
179
180
181
182
183
184
185
186
客服