51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
字节的这个新模型,牛了!
社区头条
热门内容榜
• 最近上榜
“用AI画一张‘穿着汉服的猫在月球上打太极’?”放在过去,这得先找参考图、调风格、修细节,没个半小时搞不定。现在,我只用了一句话+3秒,Seedream4.0就给我出了张能直接当海报的2K高清图。这不是魔法,是我上周在Seedream4.0里真实体验到的画面。1.Seedream4.0是什么?简单说,它是字节跳动Seed团队刚发布的新一代多模态图像创作模型,支持:✅文生图图生图多图合成✅4K直出,秒级生成✅支持中文提示词,甚至能写对“螺蛳粉...
NLP前沿1
0回复
3757浏览
字节
模型
Seedream 4.0
字节 RhythmRL:基于投机采样+长度预测的 RL 加速
一、背景最近一直在关注RLInfra相关的工作,尤其是RL性能优化,后续会逐渐介绍一下该领域的相关文章,本文先简单介绍一下字节新发布的RhymeRL。对应的论文为:[2508.18588]HistoryRhymes:AcceleratingLLMReinforcementLearningwithRhymeRL二、摘要RL成为提升LLMReasoning能力的关键方法,与传统预训练不同,RL包含多个阶段:Rollout、Reward、Training,需要多种类型的Worker协同配合;除此之外,为了效率也可能引入异步训练方...
amei2000go
0回复
1592浏览
字节
RhythmRL
投机采样
机器学习 | 大模型为什么会出现"幻觉"?
最近OpenAI发表了一篇文章《WhyLanguageModelsHallucinate》,解释为什么会出现"幻觉",周末我读了一下,总结这篇文章。什么是"幻觉"?幻觉是语言模型生成了似是而非的答案,即使很简单的问题,但是模型可能给出一些不符合事实的答案,比如:问题:请用一句话回复,其中第三个词是“dog”回答:Ihaveadog.词列表:I,have,dog,a.以上就是一个"幻觉"错误,dog并不是第三个词。幻觉分类:内在幻觉(IntrinsicHallu...
周末程序猿
0回复
1455浏览
大模型
机器学习
预训练数据
《2025机器精度与人类直觉的融合:人机理解新纪元》研究报告
社区头条
一份来自全球咨询巨头凯捷(Capgemini)的最新报告指出,人工智能的下一次浪潮将不再仅仅是内容生成,而是向更深层次的“人机理解”(HumanMachineUnderstanding,HMU)演进。这项变革预示着一个新时代的到来:机器将不再仅仅是执行命令的工具,而是能够实时感知、理解并适应人类行为、意图乃至情感状态的真正“队友”。这不仅将重塑产业格局,也将对人类的工作与生活方式产生深远影响。自生成式人工智能(GenerativeAI)展现出...
欧米伽未来研究所
0回复
2413浏览
人工智能
AI系统
HMU
如何实现大模型的降本增效?浅析LLMs场景中缓存的作用
首先缓存这个词大家应该都比较清楚了,无论是在应用服务、数据处理等技术中都会用到缓存技术,用于加速数据查询效率,减少底层额外计算资源的消耗,是一个非常重要且强大的技术。简单来说:用于将频繁访问的数据或计算存储在更快、更易于访问的位置。这使得信息检索更加迅速,减少了重复执行相同操作或获取相同数据的需要。本质上,缓存充当一种短期记忆,有助于提高系统性能和效率。通常意义上,缓存对服务带来的好处有几点:...
DataForAI
0回复
872浏览
LLM
缓存
RAG
从单一场景到复杂场景,聊聊LLMs中Function calling到MCP的技术演进
对于使用大模型(LLMs)的人来说,可能更熟悉的是MCP多一些,而对于Functioncalling其实更偏于技术层面的东西,但是从应用场景上二者还是有些相似之处。或者简单来说,在没有MCP协议之前,想要通过构建一个AI应用需要依赖的就是Functioncalling,简单来说它就是函数调用,这个函数可以是你所期望读取信息的任何接口,比如要调用微信公众号的开放接口,就可以定一个Functioncalling来通过http来调用。Functioncalling的核心能力...
DataForAI
0回复
1002浏览
LLMs
MCP
JSON
Reddit高赞:氛围编程这台老虎机,正在制造脑残程序员!
原创
社区头条
编辑|云昭“AI编程的体验,本质上是一个老虎机式奖励系统!”半年多来,VibeCoding几乎重写了开发者的工作方式。盯着屏幕苦思冥想似乎成了过去式,现在只需要把需求丢进Claude、GPT或Cursor,然后在几分钟后就得到能运行的结果。生产力看似翻倍,GitHub提交曲线一片碧绿。但另一个问题却悄悄浮现:没有挣扎,没有洞见,没有成长。我们是不是正在变“脑残”?近日,一篇名为“氛围编程正在制造脑残程序员”的文章在Reddit上引起...
51CTO技术栈
0回复
753浏览
Reddit
AI
Cursor
你被LLM“忽悠”过吗?代码报错、史实乱编、一本正经的胡扯
前段时间,我专程前往杭州阿里云谷的人工智能研发中心,与阿里大模型团队的架构师们展开了一场深度技术交流。从模型训练的数据治理到落地场景的风险控制,我们聊了很多行业痛点,其中“大模型幻觉”被反复提及——它不是某类模型的“小毛病”,而是所有大模型从实验室走向产业应用时,都绕不开的核心挑战。今天,我们就结合这次交流的一手信息,聊聊幻觉的本质、行业应对思路,以及普通开发者能用上的避坑方法。你有没有过这种...
坦途于胸
0回复
1162浏览
AI幻觉
吴恩达发帖:编程Agent确实会作妖!奖励黑客模型、甚至直接删掉了整个项目代码
原创
社区头条
编辑云昭出品51CTO技术栈(微信号:blog51cto)“首先要承认,编程Agent确实会‘作妖’!”今天一早,AI大佬吴恩达针对目前火热的编程Agent产品发表了自己的观点。虽然这个赛道很热,但吴恩达丝毫没有掩饰自己内部团队的真实使用体验。一个代理在工作目录中执行了rm.py,直接删除了整个项目的所有代码(幸好我们有GitHub备份)。最气人的是,当我们追问时,代理还道歉并承认“这是一个极其愚蠢的错误”。虽然这让我们心里稍微好...
51CTO技术栈
0回复
680浏览
Agent
Agentic
模型
可灵AI数字人来了!快手重磅发布Kling-Avatar,面向多模态指令理解与控制的数字人长视频生成新范式
精华
社区头条
热门内容榜
• 最近上榜
让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。观众看到的不再只是嘴在动,而是整个人在表演。这种表现不仅限于几个片段,而是能够稳定地延续到分钟级长视频中,在整段时间里保持动作自然、镜头流畅。近日,快手可灵团队把这一构想带到了现实。全新数字人功能已在可灵平台正式上线(h...
快手技术
0回复
5936浏览
数字人
人工智能
可灵
可灵AI
AI 大语言模型LLM局限性评估
原创
社区头条
一、LLM发展现状及局限性1.1LLM发展现状近年来大语言模型(LLM)进入爆发期,20232025年呈现三大核心特征:技术突破:参数规模从“千亿级”迈向“万亿级”——GPT4参数约1.8万亿,GoogleGeminiUltra达1.5万亿;多模态能力成为标配,GPT4V、GeminiPro能同时理解图片、文字,比如看到一张机械图纸就能生成维修文案,识别手写笔记后直接转换成代码。行业应用:已深度融入日常生产,据Gartner《2025AI技术成熟度曲线》,92%的营销文...
坦途于胸
0回复
3039浏览
LLM
大模型局限性
具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?
原创
社区头条
编辑云昭一觉醒来,又是amazing的一天!芯片三巨头,一家竟然入股另一家了!昔日竞争对手,一朝握手成盟友!妥妥一件芯片界的地震级大事。三国叙事,不断上演。双英这次可以说是破天荒的要做一件双赢的事!1.50亿美元合作,两家股价飙涨就在几个小时前,英伟达黄仁勋与英特尔CEO陈立武,两位相交30年的老朋友宣布了一个地震级的大事:英伟达将投资英特尔50亿美元!图片在双方宣布合作后的一次电话会上,黄仁勋非常兴奋:“我们...
51CTO技术栈
0回复
1047浏览
英伟达
英特尔
AI
快手端到端生成式搜索框架OneSearch,让搜索“一步到位”!
还有一个月,一年一度的“双十一”就要来了!作为消费者,你平时是怎样寻找心仪商品的呢??当你满怀期待在搜索框输入关键词,却发现商品列表并不符合心意——这背后到底是什么原因导致的?这一切,还要从电商平台常用的传统搜索架构说起。目前主流系统采用召回>粗排>精排”的级联式架构。召回层:比如你搜索“红色连衣裙”,系统会迅速从数亿商品中筛选出上万个包含“红色”“连衣裙”关键词的商品。这步追求快和全,但精度不...
快手技术
0回复
1958浏览
生成式强化学习
大模型
onesearch
每周七亿人使用 ChatGPT!他们究竟在用它做什么?
原创
社区头条
当你听到“ChatGPT”这个词时,脑海中会浮现出什么画面呢?是能高效撰写邮件、梳理报告、编写代码的专业数字助手,还是可倾诉日常烦恼、陪伴交流的智能伙伴?这款由OpenAI研发的对话式人工智能产品,自2022年11月正式推出后便展现出惊人的增长势能——上线仅五天,用户规模便突破100万;截至2025年7月,其每周活跃用户数已超7亿,这一数字约占全球成年人口总量的10%,堪称人工智能领域的现象级产品。【ChatGPT用户量增长趋势】...
51CTO内容精选
0回复
2786浏览
ChatGPT
人工智能
OpenAI
可信AI的七大特征和数据可信空间
原创
早期AI发展主要关注“能不能做”(能力),例如:“算法准确率能否更高?”“模型能否处理更大数据?”。但随着AI深度融入社会,人们发现仅仅有能力是不够的,还必须关注“应不应该做”(责任)。不可信的AI会带来巨大风险:偏见与歧视:招聘AI可能歧视女性,司法评估AI可能对特定种族更苛刻。黑箱决策:AI拒绝你的贷款申请,却无法给出令人信服的理由。安全漏洞:自动驾驶汽车因一个不起眼的贴纸(对抗性攻击)而误判,引发事...
数智飞轮
0回复
1389浏览
可信AI
人工智能
数据可信空间
阿里通义重磅开源 DeepResearch:让 AI 具备 “人类级研究能力” 的技术架构全景解析
原创
精华
社区头条
热门内容榜
• 最近上榜
当AI从“信息检索工具”向“自主研究者”进化时,阿里通义实验室推出的TongyiDeepResearch(以下简称“DeepResearch”)给出了突破性答案。作为基于WebAgent演进的下一代深度研究智能体,它不仅能像人类专家一样拆解复杂问题、规划研究路径,还能通过动态学习持续优化结论——这背后,是一套围绕“类人研究逻辑”构建的全栈技术架构。Github地址:https:github.comAlibabaNLPDeepResearch本文将从底层设计、核心技术、...
玄姐聊AGI
0回复
1.5w浏览
阿里通义
开源
DeepResearch
通过强化学习让多模态大模型自主决策图像token压缩的新思路-VisionThink实现思路及奖励函数设计
原创
VLMs性能的持续提升,视觉token的消耗呈指数级增长。例如,一张2048×1024的图片在LLaVA1.5中需要576个视觉token,而在Qwen2.5VL中则需2678个视觉token。因此,避免过度使用视觉token显得尤为重要。大多数方法使用预定的Threshold来修剪或合并固定数量的视觉Token。然而,不同问题和图像中的冗余程度各不相同。因此,是否真的应该在所有场景中应用统一的Token压缩比例?下图探讨了简单地降低了图像分辨率以减少视觉token的数量...
大模型自然语言处理
0回复
1799浏览
强化学习
多模态大模型
VLMs
【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程!
一、什么是GPT4orealtimepreview模型?GPT4orealtimepreview是OpenAIGPT4系列的升级版,主打多模态全能性和实时交互能力。它不仅能处理文本,还支持音频、图像、视频四种模态的混合输入输出,且响应速度快到令人惊讶。1.多模态全能性传统AI模型通常只能处理单一模态,比如文本或语音。而GPT4orealtimepreview打破了这个限制,我们可以直接用语音提问,模型不仅能理解语音内容,还能感知语气、情绪,甚至结合图片进行解释,真正...
唐克
0回复
5281浏览
GPT-4o
API
模型
大模型推理瓶颈的新解法:MoonshotAI 开源 Checkpoint-Engine,让权重更新快到离谱
原创
精华
社区头条
在部署大语言模型(LLM)的时候,有一个常常被忽视但致命的问题:如何快速更新模型权重。尤其是在强化学习(RL)和人类反馈强化学习(RLHF)的场景里,模型更新非常频繁,如果每次更新都需要几分钟甚至更久,那么整个系统的吞吐量就会被拖垮。MoonshotAI最近开源的CheckpointEngine,就是针对这个痛点的轻量级中间件。它的目标很直接:在数千张GPU上同步更新超大规模模型权重,而且几乎不影响推理服务的连续性。更夸张的是,它...
Halo咯咯
0回复
2195浏览
大模型推理
开源
大语言模型
LLM
深度揭秘 MobileLLM-R1:训练效率惊人,轻量化模型真的能取代大模型吗?
原创
社区头条
最近,圈子里总有人在讨论“大模型究竟还要多大才够用”。参数量一个比一个夸张,从百亿到千亿,仿佛没有“大”就没有未来。但就在这个大家都在比拼规模的时代,MetaAI悄悄扔出了一枚“小炸弹”——MobileLLMR1。它没有走传统的大模型路线,不追求什么“万能通用”,而是专注于一个核心目标:在边缘设备上,把数学、代码和科学推理这些硬核任务做到极致。最让人震惊的是,MobileLLMR1家族中最大的模型,参数量还不到10亿。但它...
Halo咯咯
0回复
1673浏览
轻量化模型
大模型
Meta AI
暂无内容
1
20
21
22
23
24
25
26
27
28
客服