51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
算家云
AI
LLM
人形机器人全能运动革命:HUGWBC实现多模态步态精细调控与实时操控(上交&上海AI lab)
论文链接:https:arxiv.orgpdf2502.03206项目链接:https:hugwbc.github.io亮点直击一个扩展的通用指令空间,结合高级训练技术,以实现细粒度的人形机器人步态控制。在单一策略下(除单脚跳步态外),可精准跟踪四种不同步态下的八种不同指令。一个基础的人形机器人控制器,支持外部上半身干预,并能够执行更广泛的运动操作一体化(locomanipulation)任务。总结速览解决的问题当前的人形机器人行走系统单一、被动,缺乏可扩展...
angel
0回复
3248浏览
机器人
训练
AI
让创意起飞!用户可控的电影级图像到视频生成方法!港中文&Adobe发布MotionCanvas
精华
论文链接:https:arxiv.orgpdf2502.04299git链接:https:motioncanvas25.github.io亮点直击将电影镜头设计引入图像到视频的合成过程中。推出了MotionCanvas,这是一种简化的视频合成系统,用于电影镜头设计,提供整体运动控制,以场景感知的方式联合操控相机和对象的运动。设计了专门的运动条件机制,以控制信号引导基于DiT的视频扩散模型,这些信号捕捉相机和对象的运动。结合了一个运动信号翻译模块,将描绘的场景空间运动意...
angel
0回复
2951浏览
模型
训练
数据
简单有效的企业多模态RAG问答框架-MuRAR
原创
企业知识库中的模态数据不止文本一个模态,传统的RAG无法解决多模态场景下的问答,问题提出:如何检索到与用户问题相关且有用的多模态数据?以及如何将这些数据整合成一个连贯的多模态答案?来看一个简单有效的多模态RAG框架MuRAR。MuRAR框架在MuRAR框架的设计中,目标是生成一个高质量的多模态答案(multimodalanswer),该答案通过整合与用户问题相关的多模态数据来提供连贯且信息丰富的内容。用户界面设计:用户输入问题;显...
大模型自然语言处理
0回复
2660浏览
RAG
多模态
自然语言处理
DeepSeek中的多头潜在注意力(MLA)浅尝
原创
MLA是MHA的变体,因此先来看看MHA。MHA(多头注意力)MHA通过将输入向量分割成多个并行的注意力“头”,每个头独立地计算注意力权重并产生输出,然后将这些输出通过拼接和线性变换进行合并以生成最终的注意力表示。Transformer编码器块内的缩放点积注意力机制和多头注意力机制MHA计算过程MHA能够理解输入不同部分之间的关系。然而,这种复杂性是有代价的——对内存带宽的需求很大,尤其是在解码器推理期间。主要问题的关键在于...
大模型自然语言处理
0回复
3156浏览
DeepSeek
大语言模型
自然语言处理
DeepSeek 爆了,普通人如何3小时完全从0训练自己的大模型
原创
这个春节,DeepSeek实在太火了,无须赘述。今天要向大家推荐一个极具实用价值的开源项目——MiniMind。这个项目使得我们只需利用普通电脑,就能在短短3小时内打造出一个精简版的DeepSeek!为了避免误解,特别说明一下,“最快3小时”是基于你的硬件配置优于我本人的情况下。具体的硬件规格要求将在下文中详细说明。1、为什么这个项目这么特别?市场上的大语言模型(LLM)通常拥有上百亿参数,其训练成本相当高昂。对于想要学习...
玄姐聊AGI
0回复
8309浏览
DeepSeek
AI
大模型
DeepSeek没反应?那就在本地部署更好用 Mac和PC都能可视化
原创
最近大火的国产AI大模型Deepseek大家应该都不陌生。除了在手机上安装APP或通过官网在线体验,其实我们完全可以在Windows电脑上进行本地部署,从而带来更加便捷的使用体验。本地部署AI模型有很多好处,比如:隐私安全——所有数据都保存在本地,不用担心泄露敏感信息;响应速度快——官方或第三方服务由于访问量大,常常会导致卡顿,而本地部署能避免这种延迟问题。否则,突然火得一塌糊涂,谁也扛不住,经常发个提问:得益于其...
数字化助推器
0回复
4098浏览
DeepSeek
AI
大模型
新的训练范式可以防止机器学习模型学习虚假相关性
原创
记忆感知训练(MAT)这种训练范式通过修改模型逻辑以防止机器学习模型学习虚假相关性,提高了泛化能力,缩小了平均准确率(AVG)和最差群组准确率(WGA)之间的差距。机器学习领域长期存在的问题之一是错误相关性的记忆。例如:假设开发人员正在开发一个深度神经网络对陆地鸟类和海洋鸟类的图像进行分类。他们使用数千张标记过的图像训练模型,这个模型在训练集和测试集上的表现都非常出色。然而,当向模型展示一张在兽医那里接...
51CTO内容精选
0回复
2136浏览
机器学习
神经网络
大型语言模型
5000字揭秘!DeepSeek-R1-Zero自我进化的3大特点和3大基石
当前AI在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。在传统的AI训练中,模型对大量监督数据的依赖是一个显著问题。监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。然而,获取高质量的标注数据往往需要耗费大量的人力、物力和时间。以图像识别为例,为了训练一个能够准确识别各种动物的AI模型,需要人工对大量的动物图像进行标注,标记出图像中动物的种...
智驻未来
0回复
3499浏览
DeepSeek-R1
人工智能
OpenAI
DeepSeek火遍中国汽车圈!吉利、东风最激进,李斌何小鹏打气,上汽官宣打造全球首个DS实装量产汽车品牌!
原创
出品51CTO技术栈(微信号:blog51cto)继各大腾讯、阿里等各大AIInfra厂商火速接入DeepSeek后,这款“国民AI”的热度已经席卷到了汽车圈。图片首先是吉利,主打的是语音主动交互场景。2月6日,吉利汽车宣布其自研的星睿大模型与DeepSeekR1深度融合,具体来讲就是利用DeepSeekR1模型对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。吉利汽车介绍,融合后的AI系统不仅能精准理解用户的模糊意图,准确调用约...
51CTO技术栈
0回复
2553浏览
DeepSeek
吉利
模型
奥特曼最新AGI断言:人工智能的成本每 12 个月下降约 10 倍,但推动AI能力边界的成本不会变便宜
原创
出品51CTO技术栈(微信号:blog51cto)本周巴黎人工智能行动峰会之前,许多科技界知名人士都提前亮出了他们对人工智能未来的愿景。OpenAI首席执行官SamAltman也不例外,今天更新了个人博客,提出了一些新概念或者新提法:比如“计算预算”(computebudget),再比如“2035年,任何人都应该能够调动与2025年所有人的智能总和”。“技术进步的历史影响表明,我们关心的大多数指标(健康结果、经济繁荣等)在平均水平和长期来看都...
51CTO技术栈
0回复
1937浏览
AGI
人工智能
AI
一个强大的集成学习算法:梯度提升树!
一、算法介绍梯度提升树(GradientBoostingTrees,GBT)是一种强大的集成学习方法,它通过迭代地添加弱预测模型来构建一个强预测模型。在每一轮迭代中,新的模型会试图纠正前序模型产生的错误。GBT可以用于回归和分类问题,并且在许多实际应用中表现优异。二、算法原理三、案例分析为了展示梯度提升树的实际应用,我们将使用提供的数据集来预测机器是否会发生故障。首先加载数据,并进行必要的预处理。3.1数据预处理与模型建立im...
宝宝数模AI
0回复
2596浏览
学习算法
梯度
提升树
【PaperDaily】谷歌推出AlphaGeometry2,超过金牌选手,称霸IMO
1.GoldmedalistPerformanceinSolvingOlympiadGeometrywithAlphaGeometry2我们推出了AlphaGeometry2,这是对Trinh等人在2024年提出的AlphaGeometry的重大改进版本,如今它在解决奥林匹克几何问题方面的能力已经超过了普通金牌得主。为了实现这一突破,我们首先对原有的AlphaGeometry语言进行了扩展,使其能够处理涉及物体运动的更难题型,以及包含角度、比例和距离的线性方程的问题。这些改进以及其他新增内容,显著提高了AlphaG...
AIPaperDaily
0回复
2650浏览
谷歌
LLMs
R 语言
AI.com域名改跳 DeepSeek,蹭热度
网传假消息:现在ai.com跳转到Deepseek,而不是ChatGPT了。该域名自ChatGPT推出后一开始先被OpenAI买下跳转到ChatGPT,后被xAI买下跳转到xAI,然后又被OpenAI买下跳转到ChatGPT。现在被Deepseek买下跳转到Deepseek了。实际上:OpenAI、xAI、Deepseek压根没人承认购买过这域名.天天改跳转地址左右横跳,搁这儿钓凯子域名ai.com的注册信息AI.com:频繁跳转的幕后逻辑最初,坊间传言OpenAI斥巨资收购AI.com以导流至ChatGPT.com,然而...
云原生AI百宝箱
0回复
2594浏览
DeepSeek
AI
趋势
各AI大厂官方指令库大公开!照着抄秒变AI大神!
你以为写AI提示词需要代码思维?要学"结构化""语义压缩"?——错!官方早就把"标准答案"喂到你嘴边了!操千曲而后晓声,观千剑而后识器这些覆盖300+场景的官方模板库,就是你的AI速成秘籍!虽然官方示例各有偏向,但是它们绝大多数都是通用的,你可以拿其他家的示例直接在DeepSeek中测试运行!👇手把手教学现在开始,文末附链接🔗👇🌟Google:职场人效率核武器[职场神器合集]•周报生成器:自动整理工作进展+数据可视化•PPT大...
草台AI
0回复
3978浏览
AI
Google
数据可视化
图文详解:带你读懂 DeepSeek-R1 的核心原理
原创
精华
编者按:DeepSeekR1到底有什么特别之处?它为什么能在推理任务上取得如此出色的表现?这背后的训练方法又蕴含着怎样的创新?当我们需要模型处理数学题、编程任务,或是进行逻辑分析时,高质量的推理能力显得尤为重要。然而,传统的训练方法往往需要耗费大量人力物力,这对许多研究团队和企业来说都是不小的负担。今天这篇深度解析DeepSeekR1训练方法的文章,将展示一个令人耳目一新的解决方案:如何通过创新的强化学习方法,在...
Baihai_IDP
0回复
6842浏览
LLM
AI
推理模型
ReFT:通过强化微调增强LLMs
原创
01、概述近年来,随着大规模语言模型(LLMs)的迅猛发展,如何让这些模型更高效地适应特定任务和领域成为了人工智能领域的热点话题。在这场竞赛中,强化微调(ReinforcedFineTuning,ReFT)脱颖而出,为语言模型的优化提供了一种创新性的解决方案。无论是OpenAI还是字节跳动,均采用了不同的路径对这一技术进行了深入探索,展示了ReFT在提升推理能力、优化性能上的巨大潜力。今天,我们将带你全面了解ReFT技术的背景、核心机制...
Halo咯咯
0回复
3335浏览
LLMs
大语言模型
强化微调
ReFT
Google AI发布Gemini 2.0 Flash Thinking 模型
原创
01、概述随着人工智能技术的飞速发展,我们见证了它在诸多领域的卓越表现。然而,即使是当下最先进的AI系统,在某些核心挑战上仍显不足,尤其是涉及多模态推理与规划能力的任务。当任务需要抽象推理、科学理解或精确的数学计算时,这些缺陷就愈发明显。与此同时,AI在实际应用中的扩展也带来了更多复杂需求,例如分析包含数百万字节的长文档。如何突破这些限制,决定了AI能否在教育、科研和产业等领域释放更大的潜力。在这一背...
Halo咯咯
0回复
3226浏览
大模型
Gemini 2.0
Google AI
如何高效转换PDF为Markdown:构建优质Graph RAG的第一步
原创
01、概述在信息驱动的时代,基于图的RAG(GraphRAG)正迅速成为一种强大的工具,超越了传统依赖向量存储的RAG应用。它不仅提供语义相似性检索,更具备强大的推理能力。例如,向量存储能轻松回答“XYZ公司去年的CFO是谁?”这种基于显式信息的问题,但对于“XYZ公司哪两位董事毕业于同一所学校?”这样需要隐式推理的问题,图RAG更胜一筹。但问题在于,如何构建图数据库以支持这种高级检索?更进一步,如何从复杂的年报中提取信...
Halo咯咯
0回复
3053浏览
RAG
Graph RAG
PDF
Markdown
“几十块”从零复现deepseek-R1–zero“顿悟时刻”不可能实验验证
原创
最近各种营销号鼓吹基于qwen的模型几十块钱复现deepseekR1zero,坑坏了算法工程师,笔者实验验证下这个夸张说法,因为实验仅仅是快速的实现,无过多的优化,下面实验数据仅供参考,欢迎指正。实验过程DeepSeekR1Zero过程DeepSeekR1Zero是一个纯RL(无SFT)来探索模型推理能力的过程(基于GRPO的RL优化过程)。RewardModel是基于规则的奖励过程(RuleBaseRM),R1Zero阶段只关注数学、程序类推理问题,都是能简单通过规则判别答...
大模型自然语言处理
0回复
2874浏览
LLM
大模型
RAG范式演进及Agentic-RAG总结综述
原创
RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前,系统先从外部数据源(如数据库、API或互联网)动态检索相关上下文,再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。rag三大组件检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息。相关技术:如BM25关键词匹配、密集向量搜索等。增强器(Augm...
大模型自然语言处理
0回复
4381浏览
RAG
暂无内容
1
172
173
174
175
176
177
178
179
180
客服