51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
大模型
AIGC 算力如何重塑产业价值链条
一、智能制造:从质检革命到全流程优化1.实时质检的颠覆性创新劲速云为某新能源车企部署的边缘中心协同质检系统,通过YOLOv8模型实现每秒2000件产品的实时检测,缺陷识别率达99.2%,检测速度达200ms幅。系统将异常数据同步至中心集群生成点云修复方案,指导机器人自动修复,使单条产线年增效3000万元。这种"检测分析修复"闭环,较传统人工质检效率提升5倍,漏检率下降两个数量级。2.预测性维护的产业革新在某油田的设备运维中,...
AI算力补给站
0回复
1485浏览
劲速云
数字人动画革命!全球首创4D运动建模技术,超越第二名65%的爆款黑科技MTVCrafter来了
论文链接:https:arxiv.orgpdf2505.10238代码链接:https:github.comDINGYANBMTVCrafter亮点直击MTVCrafter,首个直接建模原始4D动作(而非2D渲染姿态图像)用于开放世界人像动画生成的流程,实现了复杂三维世界中的动画生成。4DMoT,一种新颖的4D动作tokenizer,能够将原始人体动作数据编码为紧凑而富有表现力4D动作token,相较于2D图像表示提供了更稳健的时空引导。设计了MVDiT,一种具备运动感知能力的视频DiT模型,配备了独...
zhangyannni
0回复
1664浏览
数字人
生成
4D
突破Prompt瓶颈:链式思维+双阶段奖励,港大等开源GoT-R1让多物体合成更神准!
论文链接:https:arxiv.orgpdf2505.17022Git链接:https:github.comgogoduanGoTR1亮点直击GoTR1框架,该框架通过强化学习增强视觉生成中的语义空间推理能力,使模型能够自主发现有效的推理策略,而不仅仅依赖预定义的模式。设计了一个全面的双阶段多维度奖励框架,从多个角度评估中间推理过程和最终视觉输出,有效应对视觉生成中强化学习所面临的独特挑战。在T2ICompBench基准测试上展示了显著的性能提升,尤其是在需要精确空间关...
zhangyannni
0回复
1307浏览
模型
生成
开源
自然语言理解中的词向量发展历史
词向量技术作为自然语言处理(NLP)的核心基础,其发展历程深刻反映了人工智能领域对语言本质认知的演进。从早期基于统计的符号化表示,到深度学习驱动的分布式语义建模,再到预训练语言模型时代的动态上下文感知,词向量的技术革新始终围绕着"如何让计算机理解人类语言"这一核心命题展开。一、理论奠基与早期实践(19502000)1.分布式语义假设的提出1954年,英国哲学家JohnFirth提出"词的语义由其上下文决定"的分布式假设,这...
每天五分钟玩转人工智能
0回复
1739浏览
自然语言
NLP
人工智能
这才是大模型蒸馏本质!
社区头条
最近不少人在聊“大模型蒸馏”,但说实话,很多介绍都太学术、太高深,让人一看就头大。其实这件事背后的逻辑没那么复杂,本质上就是想办法让大模型变得更轻、更快、更好用。我觉得蒸馏不是缩小模型,是提炼能力!一、先说微调,是“教大模型学点你的事儿”现在很多大模型(比如ChatGPT、DeepSeek)都是通用模型,它们懂得挺多,但不一定了解你具体要解决的问题。比如:它没看过你公司内部的数据;它不知道你要的回答格式;它对...
hm673c38238a021
0回复
977浏览
大模型
蒸馏
工具
6行代码节省超千万成本——记一次字段治理的“巧渡金沙江”
导读:本文回顾了关于快手的核心数据对象“Photo”存储系统的一次巧妙降本增效的故事。通过充足细致的前期调研分析,以极少的人力投入取得了相当可观的收益。文中对有巨大UGC历史数据存量的平台型公司如何应对挑战有一些思考和总结。一、引言Prematureoptimizationistherootofallevil(oratleastmostofit)inprogramming.——DonaldKnuth快手作为国民级短视频平台,历史上短视频的总量已达千亿级,每日新增短视频作品超过4000万。...
快手技术
0回复
871浏览
存储系统
降本增效
AI搜索+DeepResearch=?
最近,AIAgent、MCP、DeepSearch、DeepResearch、BrowserComputerPhoneUse、超级搜索、混合推理、沉思等新词层出不穷,你是不是对这些buzzword(时髦术语)感到很懵?Manus、Neo、Genspark、Lovart、IIAgent、SkyworkSuperAgents、MiniMaxAgent、Medeo、GitHubCodingAgent、心响、AutoGLM沉思、扣子空间、问小白研报、Qbot等AIAgent不断涌现,你是不是陷入了选择困难症?图来自我周末在上海分享的PPT明明2024年,Agent还是一个...
沃垠AI
0回复
1463浏览
AI搜索
DeepResearch
MCP
Spring AI 1.0 GA 正式发布!!支持 MCP 很炸裂!!
原创
社区头条
北京时间2025年5月20日,SpringAI官方团队宣布1.0GA版本正式发布,并采用了全新的Logo。SpringAI1.0GA功能集剖析第一、Prompt提示词创建正确的Prompt(即传递给大模型的内容)是一项重要技能。掌握几种模式可以充分利用AI大模型的推理能力,从而获得最佳结果。第二、模型增强(TheAugmentedLLM)不过,在现实世界的AI应用中,对于大模型的需求已经不仅限于与无状态的AI大模型API进行简单的请求和响应交互。为了开发出高效的AI应...
玄姐聊AGI
0回复
4826浏览
Spring AI
Agent
智能体
基于 Spring AI Alibaba 的 RAG 架构调优实践
原创
RAG(RetrievalAugmentedGeneration,检索增强生成)是一种结合数据工程、信息抽取和文本生成的技术范式。SpringAIAlibaba是阿里巴巴开源的AI应用开发框架,基于SpringAI构建并提供了更高层面的抽象,帮助开发者快速构建AI应用。1、RAG的四大核心步骤第一、文档切割与智能档案库的建立核心任务是将大量文档转化为易于检索的知识碎片,这一过程类似于将厚重的词典拆解成单词卡片。通过采用智能分块算法,保持语义连贯性,同时给...
玄姐聊AGI
0回复
4283浏览
RAG
Ollama平替!LM Studio本地大模型调用实战
0.前言可像Ollama通过暴露本地端口,实现本地客户端调用。1.选择模型在LMStudio的“开发者”选项卡中选择模型:2.端口暴露设置暴露的端口(默认1234):启用CORS后,可对接网页应用或其他客户端工具。3.启动服务点击状态选项卡:控制台会显示运行日志和访问地址:2025042620:55:13[INFO][LMSTUDIOSERVER]Success!HTTPserverlisteningonport12342025042620:55:13[INFO]2025042620:55:13[INFO][LMSTUDIOSERVER]Supportedendpoints...
JavaEdge1
0回复
1764浏览
Ollama
Studio
本地大模型
开源数字人克隆神器HeyGem:1秒视频生成4K超高清AI形象,用AI重塑数字人创作生态!
在虚拟形象与数字内容需求激增的当下,传统3D数字人制作的高昂成本(动辄数十万美元)与复杂流程,让许多行业望而却步。而今天,一款由Duix.com团队打造的开源AI项目HeyGem,正以颠覆性技术打破这一壁垒,重新定义数字人创作范式。开发者可基于其框架二次开发,拓展更多应用场景(如医疗问诊、虚拟偶像等)。随着社区贡献者的加入,这一项目有望成为数字人领域的“Android系统”,推动整个行业向低成本、高效率、普惠化方向发展...
AIGCStudio
0回复
5605浏览
HeyGem
AI
形象
30年码龄程序员4年未解之谜,Claude 4用几小时轻松解决!
社区头条
近日,一位拥有30年编程经验、曾参与过NASA火星探测器代码优化的资深工程师,在社交平台发布了一条帖子:困扰他四年的核心算法bug,被Claude4在几小时内精准定位并修复。帖子发布,迅速引发大家的热烈讨论。四年前,这位名为ShelZuuz,曾在Meta、亚马逊、苹果等硅谷巨头任职的资深C++工程师,因为重构项目中一个只在特定着色器以特定方式使用时才会触发的边界条件错误,开启了一段长达四年的技术困扰。这个被命名为“白鲸bug”...
算家计算
0回复
1622浏览
Claude 4修复bug
AI编程
算家云
人工智能
租算力,到算家云
好马配好鞍,好模配指南 | Claude 4发布了,业界反响很好,其行为指南“系统提示词”也被全文公开
在大语言模型(LLM)的进化之路上,我们熟知两大基石:预训练,如同海量知识的灌输,让模型博闻强识;微调(无论是监督学习还是强化学习),则更像行为塑造,教会模型如何“得体”地回应,比如习得特定的对话风格。这两种方式,都在潜移默化中改变着模型的“内在记忆”——也就是那些神经网络的参数。一种LLM缺失的重要学习方式——“系统提示学习”?反观人类的学习,似乎还存在一种更为直接、更为“显性”的模式。想象一下,...
后向传播
0回复
1364浏览
Claude 4
业界
系统提示词
AI“神医”的开源盛宴?谷歌医疗大模型MedGemma来了!
嘿!各位科技爱好者、医疗界的朋友们,以及所有对未来充满好奇的伙伴们!最近AI圈又炸锅了,但这次的主角有点特别——它不光能写诗作画,还能“看病”和“读片”!没错,说的就是谷歌刚刚官宣开源的医疗大模型:MedGemma!这可不是随随便便丢点代码出来玩玩,谷歌是直接把他们基于自家强大Gemma3架构训练出来的医疗AI“高材生”放了出来。想象一下,一个在海量医学数据里摸爬滚打、身怀绝技的AI,现在向全世界敞开大门,任凭你...
墨风如雪小站
0回复
1198浏览
AI
谷歌医疗
大模型
字节跳动炸开AI新边界!开源多模态模型BAGEL:这颗“魔法贝果”有多能打?
AI圈的热闹,恐怕连最资深的吃瓜群众都快跟不上了。几乎每天都有新模型、新突破的消息冒出来。而最近,字节跳动又端出了一盘,哦不,是“炸”出了一个有点特别的家伙:开源多模态基础模型——BAGEL!别看名字可爱,这个“贝果”可不是普通的食物。它是一个能同时看懂图、读懂文,还能自己“画”出来、甚至“P”得天衣无缝的多模态AI神器。字节跳动这回,真是把AI的“理解”、“生成”、“编辑”能力,狠狠地揉进了一个模型里,...
墨风如雪小站
0回复
1674浏览
字节跳动
开源
多模态
AI 自动生成知识库!零基础搭建双向链接学习系统
现在AI时代了,我们不应该让AI自动来替我们创建这些笔记文件吗?顺便在概念之间自动建立起双向链接关系,以便我们浏览和学习,甚至再用一些记忆曲线之类的东东帮我们记忆和复习。岂不美哉!根据这些需求,我们大致选择工具和方案:用AI提取知识点概念;用AI自动编程工具来给我们写Markdown文件,并建立双向链接;用随机抽查或者记忆曲线之类的方法帮我们时不时温故知新。这样的工具有很多,本篇我们主要选用如下几个:当红大模...
机器学习与数学
0回复
1319浏览
AI
双向链接
学习系统
Claude 4一战封神!前大厂开发者自述:四年投入了200个小时没发现,别的模型都没做到!
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)今天,一篇Reddit上的帖子走红了,光看题目就很有料:ClaudeOpus帮我解决了一个我四年来都找不到的“白鲸级bug”图片发帖人是一位有30年经验的前FAANGC++工程师,是团队里负责给bug清场的大佬级角色。但这一次,他坦言被ClaudeOpus“彻底震撼了”。这个Bug有多棘手?它来自4年前的一次架构级重构,涉及约6万行代码。虽然解决了一堆历史问题,却也悄悄埋下了一个极边缘的逻辑隐患:某个shad...
51CTO技术栈
0回复
1377浏览
Claude 4
架构
模型
Github MCP被曝严重安全漏洞!一个恶意问题,开发者私有仓库裸奔,Agent成内鬼!检测方法来了!提防中招!
社区头条
编辑云昭出品51CTO技术栈(微信号:blog51cto)MCP虽然火,但安全问题其实一直不容忽视,就连大名鼎鼎的、与Claude打得火热的GithubMCP服务器也出事了!刚刚得到消息,昨天,一家名为Invariant的安全的公司,突然披露了一个有关GitHubMCP集成(在GitHub上拥有1.4万星标)的严重漏洞。图片这个漏洞允许攻击者通过精心构造的GitHubIssue“劫持”开发者的智能代理(如ClaudeDesktop中的Claude4Opus),并诱导它主动泄露私有仓库的...
51CTO技术栈
0回复
1148浏览
MCP
Agent
AI
LiteLLM:用于统一大模型访问的开源网关
原创
社区头条
LiteLLM允许开发者像调用OpenAIAPI那样集成各种大语言模型(LLM),并支持故障转移、预算控制、速率限制以及对API调用的实时监控。不同提供商发布的大语言模型(LLM)层出不穷——包括Anthropic、谷歌、Meta、微软、英伟达、OpenAI等等——这为开发者提供了丰富的选择,但也令复杂性一路攀升。每家提供商都有其独特的API特性和响应格式,使得在同一个应用中切换模型或支持多个后端变得愈发困难。作为一个开源项目,LiteLLM提供...
51CTO内容精选
0回复
1677浏览
LiteLLM
大语言模型
LLM
如何设计Agent的记忆系统
最近看了一张画Agent记忆分类的图我觉得分类分的还可以,但是太浅了,于是就着它的逻辑,仔细得写了一下在不同的记忆层,该如何设计和选型先从流程,作用,实力和持续时间的这4个维度来解释一下这几种记忆:1.短期记忆(ShortTermMemory,STM)流程:Input(输入)→Encode(编码)→Store(存储)→Erase(清除)作用:在进行活动时保持临时细节,类似于我们在对话中临时记住的信息。示例:保存最近的交互信息,比如刚刚发送的...
熵减AI
0回复
1301浏览
Agent
记忆系统
STM
暂无内容
1
107
108
109
110
111
112
113
114
115
客服