51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
OpenTSLM:突破AI的时序盲区
原创
近日斯坦福大学联合苏黎世联邦理工学院(ETHZurich)、GoogleResearch和Amazon的研究团队,推出了OpenTSLM——一个专为时间序列数据设计的语言模型家族。这一创新解决了当前大语言模型(LLMs)在处理连续医疗时间序列数据时的根本性缺陷,即使是GPT4o这样的前沿模型也难以有效处理心电图(ECG)、脑电图(EEG)和可穿戴传感器数据流。一、LLM的"时序盲点"医学诊断的本质是基于时序,准确的诊断高度依赖于追踪生命体征、生物标志物和复杂信...
鲁班模锤1
0回复
417浏览
OpenTSLM
AI
时序盲区
优雅谈大模型:DeepStack是什么?
原创
当Qwen3VL发布,一项名为DeepStack的技术浮出水面。今天就跟随着小编一起来看看这项技术是否有过人之处。想象你在欣赏一幅画作。你的视线会从画布的纹理质感,游移到人物的表情神态,最后领会整幅画的意境氛围。这是一个自然而连贯的多层次认知过程。然而,传统的AI视觉模型却像是望远镜看画——只能看清远处的整体轮廓,却丢失了笔触、色彩过渡等近处的细腻之处。DeepStack的出现,正是尝试弥补这一缺憾。1.传统视觉语言模型在...
鲁班模锤1
0回复
369浏览
DeepStack
大模型
LLaVA
DeepSeek团队开源新模型DeepSeek-OCR,用3B参数量实现10倍文本压缩的多模态突破
原创
社区头条
热门内容榜
• TOP2
2025年10月20日,DeepSeekAI团队开源的DeepSeekOCR模型凭借"上下文光学压缩"技术惊艳业界。这款参数量仅3B的模型,通过将文本转化为视觉模态进行压缩,用少量视觉token即可承载海量文本信息,不仅刷新了OCR任务的性能基准,更为大语言模型(LLM)长上下文处理难题提供了全新解法。本文将从技术原理、架构设计、性能表现到实际应用进行全方位解析。一、技术背景:为什么需要"视觉压缩"?当前LLM在处理长文档时面临致命瓶颈:文本...
坦途于胸
0回复
2473浏览
DeepSeek
破5亿用户!国产AI模型成功逆袭,成为AI普及浪潮主角
原创
社区头条
五亿用户正在拥抱智能工具,而国产模型成为了这场变革的主角。 10月18日,在2025(第六届)中国互联网基础资源大会上,中国互联网络信息中心(CNNIC)发布的《生成式人工智能应用发展报告(2025)》揭示了我国AI产业发展的新里程碑。  截至2025年6月,我国生成式人工智能用户规模已达5.15亿人,普及率达到36.5%。在短短半年时间内,用户规模激增2.66亿人,增速高达106.6%,实现了翻倍增长。 其中,中青年和高...
算家计算
0回复
665浏览
人工智能
国产大模型
算家计算
算家云
租算力,到算家云
图灵奖得主联手前谷歌CEO,发布全球首份AGI“成绩单”!GPT-5仅获58分,最大缺陷是“金鱼脑”
原创
社区头条
编辑听雨出品51CTO技术栈(微信号:blog51cto)“什么是AGI?”这是所有科技公司都在喊的口号,却也是一个模糊得几乎无法定义的词。OpenAI说它要“追求AGI”;Anthropic宣称Claude是“朝向AGI的安全智能体”;谷歌和Meta则都声称自己“正在逼近AGI”。但——什么才算真正的AGI?没人说得清。直到现在。由图灵奖得主YoshuaBengio、前谷歌CEO埃里克・施密特、纽约大学教授GaryMarcus等30多位顶级科学家联合撰写的论文《ADefinitio...
51CTO技术栈
0回复
338浏览
谷歌CEO
AGI
GPT-5
CC成功的秘诀到底是什么?遵循Unix 哲学、核弹级生产力:我用ClaudeCode+Obsidian,造了一个“第二大脑”
原创
社区头条
编辑听雨出品51CTO技术栈(微信号:blog51cto)AI工具千千万,但能让人上瘾的,只有ClaudeCode。最近,小编关注到一篇拍案叫绝的文章——作者是Alephic(一家以AI为核心的咨询公司)的联合创始人NoahBrier。他坦言:“ClaudeCode不只是一个写代码的工具,而是一种全新的操作系统思维。”他用ClaudeCode打造了一个属于自己的“AI操作系统”——它能写代码、能记笔记、能自己思考,还能帮他打理邮件、整理知识、规划行程。简单来...
51CTO技术栈
0回复
461浏览
Unix 哲学
ClaudeCode
Obsidian
PyTorch 如何用 “灵活” 改写 AI 框架格局
原创
要是把PyTorch比作AI圈的“后起之秀”,那它的故事里藏着太多“无心插柳”和“顺势而为”的巧劲儿。从诞生时的“小透明”到如今成为顶流框架,这十几年的路,就像看一个技术极客从车库创业走到行业中心——带着点叛逆,又藏着对“好用”的极致追求。前世:从Torch到PyTorch,一场“换皮”引发的革命故事得从2002年说起。那会儿还没有“深度学习框架”的概念,纽约大学的杨立昆(YannLeCun)团队捣鼓出一个叫Torch的工具包,用Lu...
坦途于胸
0回复
419浏览
PyTorch
企业云+AI融合的未来图景与应对策略
社区头条
作者孙杰审校重楼引言:AI浪潮驱动云战略转型随着人工智能技术的迅猛发展,尤其是大模型应用的广泛落地,企业对云计算的需求已从基础设施的“资源上云”逐步转向业务与智能不断融合的“深度用云”。据Canalys统计,2024年中国云服务总支出达400亿美元,同比增长13%,而DeepSeek于2025年初推出的高性能低成本大模型DeepSeekR1,更是进一步点燃了市场对“云+AI”融合的热情。调研显示,已有33%的中国企业认识到,云与AI的深度融...
51CTO内容精选
0回复
460浏览
企业云
AI
云计算
视频生成实时拖拽一切!南洋理工DragStream实现拖一下就能改大片,告别从头渲染!
论文链接:https:arxiv.orgpdf2510.03550REVEL任务示例上图所示的流式视频处理结果包括编辑和动画,并带有对象平移("Trans")、变形("Defor")和旋转("Rot")等拖动效果,均由我们的DragStream方法生成。亮点直击流式拖拽导向交互视频操作(REVEL),这是一项新任务,使用户能够在视频生成过程中随时拖动任何对象,从而通过拖拽式操作实现对视频生成模型(VDMs)输出的流式细粒度控制无训练范式下解决REVEL有两个关键挑战:i...
zhangyannni
0回复
484浏览
AI
视频生成
模型
AI合影毫无违和感!复旦&阶跃星辰重磅开源WithAnyone:可控、高保真多身份生成SOTA!
社区头条
热门内容榜
• TOP5
论文链接:https:arxiv.orgpdf2510.14975项目链接:https:dobyxu.github.ioWithAnyone亮点直击MultiID2M:一个包含50万张包含多个可识别名人的团体照片的大规模数据集,每个名人有数百张参考图片,展现各种多样性以及额外的150万张未配对的团体照片。这一资源支持多身份生成模型的预训练和评估。MultiIDBench:一个综合性基准测试,提供标准化评估协议用于身份定制,能够系统地和内在地评估多身份图像生成方法。WithAnyone:一...
zhangyannni
0回复
1242浏览
AI
视频生成
模型
智能问答的基石:为何知识库构建是RAG系统中“重中之重”的匠心工程
原创
在人工智能浪潮的推动下,智能问答系统正日益成为企业服务、在线教育、智能客服等领域的核心交互工具。其中,基于检索增强生成(RetrievalAugmentedGeneration,简称RAG)的技术架构,因其能够有效结合外部知识、缓解大模型“幻觉”问题、并保持信息的实时性,而受到了广泛青睐。在探讨RAG的优化之道时,我们往往会接触到诸如问题改写、重排序、混合检索等多种精妙的技巧。这些技术方案在很大程度上是“可复用”的通用组件。然...
AI探索时代
0回复
430浏览
智能问答
RAG
检索增强生成
文本 音频 视频 多模态等不同模型之间的区别和联系
原创
“大模型从任务类型分类主要分为文本,音频,视频和多模态模型。”在人工智能领域,大模型技术是目前主要的研究方向,但面对市面上各种各样的模型,很多时候我们都搞不明白这些模型都是干什么的,有什么区别和联系。其实这个就涉及到模型的分类问题,原因在于人工智能技术涉猎范围比较广,不但有各种基于深度神经网络实现的大模型各行其道,还包括传统的机器学习模型,以及各种模型的变种。并且,从不同的维度模型又有不同的分...
AI探索时代
0回复
398浏览
大模型
文本模型
音频模型
视觉模型
多模态模型
Dr.LLM:大语言模型中的动态层路由
论文(Dr.LLM:DynamicLayerRoutinginLLMs)介绍了一种巧妙的技术,在提高准确率的同时降低大语言模型的计算量。路由器在提高准确率的同时,每次查询可减少约3到11层的计算。论文的方法是可改装的,为冻结的大语言模型添加逐层路由器,决定跳过、执行或重复每个模块。路径通过对层编辑进行简短的蒙特卡洛树搜索进行离线监督,然后在线执行时无需搜索。在平均节省层数的同时,提高了逻辑和数学任务的准确率。啥是Dr.LLM:附加在每一...
sbf_2000
0回复
315浏览
动态层路由
大语言模型
Dr.LLM
Inoculation Prompting:让大模型在训练时“学坏”,测试时更听话
论文(InoculationPrompting:InstructingLLMstomisbehaveattraintimeimprovestesttimealignment)提出了一种反直觉的对齐方法:免疫式提示(InoculationPrompting)问题:大语言模型(LLM)从训练数据中学到了不良行为。解决方案:在再训练时,明确地提示模型去“作恶”。这种方法反直觉,但效果显著:它能减少奖励黑客(rewardhacking)、拍马屁式回答(sycophancy)等问题,同时不损害模型的能力学习。假设训练数据中既有良好行...
sbf_2000
0回复
409浏览
大模型
免疫式提示
LLM
让强化学习不再烧冤枉算力:Meta提出可预测的RL扩展公式 ScaleRL
这篇来自Meta的论文(TheArtofScalingReinforcementLearningComputeforLLMs)是迄今为止关于强化学习(RL)在大语言模型(LLM)中如何随规模扩展的最深入研究之一。论文耗费了超过40万GPU小时的实验,找到了一个可预测的扩展规律和一套稳定可复现的训练配方(ScaleRL),能够在计算资源增加时持续奏效。可以将其视为一份实用指南——适用于任何想用RL训练推理或对齐模型的人。洞见:RL的进步遵循可预测的曲线:当你将模型性能与计...
sbf_2000
0回复
379浏览
RL
ScaleRL
GPU
AI Agent落地必读:深度解读OpenAI 姚顺雨 的T-bench,如何评测智能体的“真功夫”
社区头条
大家好,我是HxShine,今天继续来分享OpenAI姚顺雨的一篇文章,这篇文章探讨了Agent实际落地时该如何评测,他在thesecondhalf里面也提了这篇文章,是Agent真正落地到客服等领域必须要进行的一些评测工作,推荐给大家~论文名字是Title:Tbench:ABenchmarkforToolAgentUserInteractioninRealWorldDomains(Tbench:一个用于真实世界领域中工具智能体用户交互的基准测试)。现有基准大多不测试智能体与人类用户的动态交互能力,也...
arnoldzhw
0回复
354浏览
AI
Agent
OpenAI
一篇92页大模型Vibe Coding技术全面综述
热门内容榜
• 最近上榜
今天分享中科院计算所&杜克大学等首篇VideCoding技术最新全面综述。随着GPT4ClaudeSonnet4等模型出现,编码智能体(CodingAgent)已能端到端完成提交、测试、修复。开发者只需用自然语言描述需求,“感觉”结果对就收货,故称VibeCoding——一种以“氛围结果”为导向的AI原生开发范式。VibeCoding全面技术分类传统开发VibeCoding人写每一行代码人只写“提示”,AI自动生成逐行调试只看运行结果(vibe)代码评审看语法代码评审看...
PaperAgent
0回复
1063浏览
Vibe Coding
Agent
AI
ACL 2025 | GALLa:给代码大模型装上“透视眼”,看懂程序的“骨架”!
社区头条
你的AI编程助手,真的“读懂”你的代码了吗?它可能只是“看”到了表面文字,却错过了代码背后真正的逻辑骨架。今天,我们带来了一项被ACL2025主会录用的创新工作——GALLa。这项由蚂蚁集团×上海交通大学合作的研究,通过一种巧妙的方式,让代码大模型(CodeLLM)学会理解程序的深层结构,实现代码理解能力的精准跃升!⚡核心亮点速览注入结构化知识代码不仅是文本,更是严谨的图结构(如AST、DFG)。我们利用图神经网络(GNN...
PaperAgent
0回复
856浏览
代码
大模型
LLM
Vision-Zero:零数据VLM自我进化!陈怡然团队提出零监督训练新范式
背景介绍尽管目前VLM在多模态任务上表现突出,但训练过度依赖人工标注的数据与精心设计的强化学习奖励。这种依赖带来数据稀缺问题:多模态标注成本高昂,限制了训练数据的规模与多样性。同时存在知识天花板:模型能力受人类监督边界限制,难以突破人类已有知识和策略。曾经AlphaGo所使用的自博弈技术通过模型与自身副本竞争交互并自动获取反馈,把计算转变为数据的同时消除了对人工监督的依赖,这使得它能够持续推动模型进步并...
PaperAgent
0回复
619浏览
零数据
VLM
零监督
刚刚!AI 圈顶流 Karpathy 三连击:开源、泼冷水、AI 教育~
总结一下10月「Karpathy三连」nanochat开源→100美元复刻ChatGPT,全民LLM时代降临AGI十年论→给行业泼冷水,Agent智能体道阻且长Eureka教育→把复杂AI拆成「斜坡」,让普通人也能一路滑进核心代码我开源,冷水我泼完,课我也准备好了。下一步,轮到你上场。——AndrejKarpathy1.nanochat:「贫民窟版」ChatGPT开源了!前OpenAI联合创始人、特斯拉AI总监AndrejKarpathy在10月13日深夜扔下一颗炸弹:nanochat——一个只用100美元...
PaperAgent
0回复
221浏览
AI
AI 教育
开源
暂无内容
1
2
3
4
5
6
7
8
9
10
客服