51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
Excel 迎来“AI函数”:COPILOT 正式上线,公式也能开挂了
原创
在企业日常办公里,Excel一直是不可替代的生产力工具。无论是财务报表、用户调研、还是运营数据分析,几乎所有环节都离不开这张熟悉的表格。但有一个痛点始终困扰着我们:数据量大,分析复杂,重复操作耗时又耗力。如果你也曾在表格里手动标记上百条用户反馈,或反复调试函数来生成分析报告,那么这一次,你可能会被微软带来的COPILOT函数惊艳到。没错,从今天开始,AI不再是外挂,而是直接成为Excel公式的一部分。1.COPILOT函...
Halo咯咯
0回复
4224浏览
Excel
AI函数
COPILOT
从负载特性到硬件匹配:七牛云R6的Redis/Memcached实践
社区头条
在现代应用架构中,Redis和Memcached作为核心的内存数据库(InMemoryDatabase),承担着缓存、会话管理、消息队列等关键角色,其性能直接决定了整个应用的响应速度和用户体验。然而,许多开发者在部署时,往往只关注CPU核数和内存大小,却忽略了一个更深层次的问题:为什么同样配置的Redis,在不同类型的云服务器上,性能表现会天差地别?这个问题并非纸上谈兵。在电商秒杀、在线游戏这类高并发场景下,缓存响应慢几十毫秒,就...
七牛云行业应用
0回复
997浏览
Redis
Memcached
云服务器选型
七牛云
性能优化
售价3499美元,英伟达Jetson Thor实现机器人与物理世界的实时智能交互
原创
黄仁勋曾公开表示,机器人是英伟达在人工智能之外的最大增长机会。在2025年1月初开幕的CES2025上,老黄更是高喊「AI的下一个前沿是物理」,就像当年押注OpenAI一般,他如今的选择是PhysicalAI引领的机器人赛道。当地时间周一(8月25日),英伟达宣布JetsonAGXThor开发套件正式上市,起售价3499美元,量产模块ThorT5000也已面向企业客户开放供应。英伟达将JetsonAGXThor称为「机器人大脑」,目标是赋能制造、物流、交通、医疗、...
HyperAI超神经
0回复
1454浏览
Physical AI
英伟达
机器人
智能交互
实时交互
AI算力提升7.5倍!英伟达发布新一代机器人超级计算机Jetson Thor,驱动物理AI革命
原创
 今天,NVIDIA宣布其专为物理AI和机器人打造的新一代机器人计算机JetsonThor正式发售。其中,JetsonAGXThor开发者套件售价为3499美元(约合人民币2.5万元)。  NVIDIA创始人兼首席执行官黄仁勋表示:“JetsonThor专为全球数百万开发者打造,助力他们构建可与物理世界交互、甚至改变物理世界的机器人系统。它具备无与伦比的性能与能效,还能够在边缘设备上同时运行多个生成式AI模型。作为一款卓越的超级计算机,J...
算家计算
0回复
1026浏览
英伟达
物理AI
人形机器人
算力
算家云
企业级AIoT应用:如何构建高响应、低延迟的语音交互?
社区头条
传统的语音交互链路普遍依赖云端处理,这导致了几个核心瓶颈:网络延迟:语音数据的往返传输耗时,直接影响交互的流畅性。隐私安全:用户语音数据上传至云端,引发了数据隐私与合规的担忧。网络依赖:在弱网或无网环境下,设备功能严重受限。运营成本:海量设备的并发请求对云端计算和带宽资源造成巨大压力。端侧AI的崛起为解决上述问题提供了新思路,但同样面临挑战,主要是端侧设备在算力、功耗和存储上的限制,难以独立运行参数...
七牛云行业应用
0回复
1279浏览
智能语音交互
七牛云
AT-AI-002
灵矽AI
MCP协议
用 Topos 探索 LLM 的新架构
尽管对GPT5褒贬不一,行业共识是并未达到期待的超级智能,根因或许来自Transformer边际效用降低。前天DeepSeek悄悄上线V3.1,不是万众期盼的R2,基准测试提升可圈可点,不过同样伴随着业界对模型架构的疑虑。统一视角下的概率流建模之外,是否还有其他创新思路?近期,Adobe研究院学者Sridhar尝试用Topos来回答这一问题,提出了一种全新的GenAI架构【文献1】。一、Topos笔者将Topos看成一个可以自定义“集合”、“逻辑”、“函数...
ceesoft
0回复
1254浏览
Topos
LLM
架构
企业级 MCP + A2A 整合架构设计与落地案例实现
原创
社区头条
1、A2A与MCP:AI智能体生态的完美搭档如果将MCP视为AI智能体的“工具箱”,那么Agent2Agent(A2A)协议就是促进AI智能体之间“相互协作”的沟通语言。这两种协议的结合正在重新塑造AI智能体的合作方式,从独立作业转变为团队合作。2、A2A协议:实现AI智能体间的对话Agent2Agent协议是什么?A2A是由Google主导开发的开源协议,专门用于解决AI智能体间的通信与协作问题。它使得不同框架、不同公司、运行在不同服务器上的AI智能体能...
玄姐聊AGI
0回复
2089浏览
MCP
A2A
训练神经网络的过程中常见问题及其解决方案的详细分类和说明
在训练神经网络的过程中,可能会遇到多种问题,这些问题可能影响模型的性能、训练效率或稳定性。以下是常见问题及其解决方案的详细分类和说明:图片1.梯度消失与梯度爆炸问题:梯度消失:在深层网络中,反向传播时梯度逐层衰减,导致浅层参数更新缓慢(常见于SigmoidTanh激活函数)。梯度爆炸:梯度逐层累积,导致参数更新过大,模型不稳定(常见于RNN或长序列数据)。解决方案:使用ReLU、LeakyReLU等激活函数替代SigmoidTanh...
每天五分钟玩转人工智能
0回复
1290浏览
训练神经
网络
性能
4D生成爆款来了!南洋理工&上海AI Lab发布4DNeX: 单图生成4D动态世界,效率碾压
论文链接:https:arxiv.orgpdf2508.13154项目链接:https:4dnex.github.io亮点直击4DNeX,首个用于图像到4D生成的前馈框架,能够从单张图像生成动态点云;构建了4DNeX10M,一个具有高质量4D标注的大规模数据集;引入了一套简单但有效的微调策略,用于将预训练的视频扩散模型适配到4D生成任务中。总结速览解决的问题现有的4D(动态3D)场景生成方法普遍依赖计算密集型的优化过程或多帧视频输入,导致效率低、泛化能力差,且难以...
zhangyannni
0回复
2716浏览
4D
AI
图像生成
多模态大模型Ovis2.5核心技术改进点、训练方法
原创
前面介绍了《多模态大模型Ovis核心技术点、训练方法、数据细节》,最近看到更新了Ovis2.5,来看下有哪些改进及策略。改进点概述:Ovis2采用固定分辨率ViT,需将图像分割为固定大小的子图(tiling)处理,这会破坏复杂视觉内容的全局布局连贯性和细粒度细节,Ovis2.5直接以图像原始分辨率(无需分块)输入,支持448²1792²像素。(从代码看,原生分辨率直接从qwen2.5vlcopy过来的)升级LLM为qwen3,增加思考推理能力...
大模型自然语言处理
0回复
1822浏览
多模态大模型
Ovis2.5
LLM
不止于搜索!Perplexity Labs深度解析:以项目为核心的 AI 工作流!
0前言Perplexity推出全新功能Labs,专为Pro订阅用户设计,旨在支持更复杂的任务,功能超越了传统的问答服务。这一重大更新标志着Perplexity从以搜索为核心的交互模式,转向由生成式AI驱动的结构化、多步骤工作流。1交互模式PerplexityLabs让用户可在一个统一界面完成多种任务,包括生成报告、分析数据、编写和执行代码、构建轻量级网页应用等。用户可以通网页和移动端的新模式切换器进入Labs,桌面端支持也即将上线。2适用场景...
JavaEdge1
0回复
1197浏览
Perplexity
Labs
AI
浙大重磅推出统一虚拟试穿框架OmniTry:突破服装局限,实现多品类可穿戴物品虚拟试穿无蒙版新跨越
在虚拟试穿(VTON)领域,现有研究多聚焦于服装,这在一定程度上限制了其应用范围。浙江大学团队提出了一个统一框架OmniTry,该框架将VTON的应用范畴拓展至服装之外的各类可穿戴物品,像珠宝、配饰等,还提供无蒙版设置以贴合实际应用场景。面对扩展物品类型时数据管理获取配对图像的难题,团队设计了独特的两阶段流程,巧妙利用大规模未配对图像和少量配对图像训练微调模型。经基于综合基准的评估,OmniTry在物体定位和身份保...
AIGCStudio
0回复
1745浏览
OmniTry
框架
模型
迈向 Agent 时代的第一步!DeepSeek-V3.1 重磅发布,多维度升级超惊艳,开启智能推理新体验
社区头条
2025年8月21日,DeepSeekV3.1正式发布。它采用混合推理架构,一个模型支持思考与非思考两种模式。相比前代,DeepSeekV3.1Think思考效率大幅提升,能更快作答。经PostTraining优化,其Agent能力增强,工具使用和智能体任务表现更出色。官方App与网页端同步升级,用户用“深度思考”按钮就能切换模式。DeepSeekAPI也同步更新,deepseekchat和deepseekreasoner对应不同模式,上下文扩至128K,还支持strict模式FunctionCalling。Dee...
AIGCStudio
0回复
1.0w浏览
Agent
DeepSeek-V3.1
多维度
AI在远古细菌中发现杀灭“超级细菌”的新抗生素 | 了解LLM就能看懂
大家可能听说过(希望没有感受过)“超级细菌”感染的可怕。几年前,我的一个同事讲述其父亲在一个有淤泥的池塘里不小心划伤了腿,最终演变成了对多种抗生素都耐药的“超级细菌”感染。老人因此被送进ICU,与死神搏斗了数周,经历了巨大的煎熬,最终吉人天相。但那段经历的凶险,应该会让身边的人至今心有余悸。这个故事,正是我们这个时代正面临的一场危机的缩影:抗生素耐药性。曾被视为医学奇迹的抗生素(如青霉素),正逐渐...
后向传播
0回复
1185浏览
AI
LLM
预测
写点代码 | 从头编写GRPO、DrGRPO、GSPO,800行代码实现完整训练和验证流程
在大型语言模型(LLM)的强化学习(RL)领域,一个很有潜力的方向是利用可验证的奖励(VerifiableRewards)进行模型优化,即RLVR。传统的强化学习依赖于人类反馈(RLHF)或者一个专属的价值模型(ValueModel),这可能主观又昂贵。而RLVR通过程序化的、客观的奖励函数来指导模型学习,例如,在数学问题上,答案是否正确是可以通过计算验证的。这种方法为我们提供了一条更高效、可扩展的路径,来增强模型的推理等复杂能力。在RLV...
后向传播
0回复
3565浏览
GRPO
DrGRPO
GSPO
Google公开与Gemini大模型聊一次耗能 ≈ 电视播放9秒 或 微波炉运行1秒 | 且看他怎么算的
大模型在服务时的能源消耗一直备受关注,但具体的能耗数据,尤其是来自头部公司的数据,长期处于未知状态。这两天,Google发布了一篇研究论文,首次系统性地披露了其Gemini大模型在真实生产环境中,与用户聊一次(也就是响应一次用户提示,即常说的Prompt)的能源消耗——约0.24瓦时(Wh)。为了让这个数字更具实感,论文将其与日常活动进行了对比:这大致相当于一台现代电视机播放9秒,或是一台家用微波炉运行1秒所消耗的电能,...
后向传播
0回复
1300浏览
Google
Gemini
大模型
硬核拆解DeepSeek V3.1:当6850亿参数学会“分身术”
就在大家还在争论闭源与开源的未来时,DeepSeek毫无征兆地在HuggingFace上扔出了一颗重磅炸弹——V3.1Base模型。别看名字只是个“.1”的迭代,这次的升级,在我看来,与其说是参数的堆砌,不如说是一场关乎“效率”与“架构”的精妙胜利。今天,不谈空泛的商业前景,咱们就以一个开发者的视角,像拆解一块精密的机械表那样,一层层剥开V3.1的外壳,看看它的心脏究竟是如何跳动的。128K上下文:不只是把内存条加大了首先,最引人...
墨风如雪小站
0回复
3044浏览
DeepSeek V3.1
内存条
AGI
80亿参数撬动科学界,Intern-S1-mini不止是平替
当大家还在为通用聊天模型的“智商”和“情商”争论不休时,上海人工智能实验室悄悄扔出了一张王牌,直接杀入了最硬核的赛道——科学研究。这张牌,就是InternS1mini。别被它名字里的“mini”迷惑了。这可不是什么玩具,而是一把锋利、精准、专门为科学家和工程师打造的手术刀。一把解剖刀,而非一把瑞士军刀我们见过太多号称“无所不能”的瑞士军刀式模型,它们什么都能聊上几句,但真要钻进专业领域,往往就显得力不从心。Int...
墨风如雪小站
0回复
1170浏览
Intern-S1-mini
AI
vllm
P图终结者?阿里通义新作,一句话让文字和像素俯首称臣
曾几何时,我们以为AI绘画的终点是“以假乱真”。但很快,所有内容创作者和设计师都遇到了同一个瓶颈:AI能画出完美的图,却改不好一张图。仅仅是想把海报上的“夏季大促”改成“秋季上新”,就足以让最先进的模型束手无策,要么文字扭曲,要么风格尽毁。这个创作流程中的“最后一公里”,似乎成了一道天堑。直到2025年8月19日,阿里巴巴通义千问团队将一块重磅拼图——QwenImageEdit,放在了世界的桌面上。它似乎在说:从现在...
墨风如雪小站
0回复
2006浏览
?阿里
通义
Qwen2.5
旧金山初创CEO自曝数月研究:CC主控制仅1个循环,大量使用小模型,惊呼:简单到爆,肝一份深度复刻指南
原创
社区头条
编辑云昭世界上最好用的编程工具,ClaudeCode,又被人深度研究了!它背后,竟然只保留了一个主控制循环,系统逻辑竟然简单到爆。管AI代理如此复杂,但这款最令人愉悦的AI编程工具,却保持了极其简单的方式。“我高度怀疑:大多数应用可能真不需要多Agent系统。”近日,CC的一家重度用户,MinusX团队经过煞费苦心的研究,终于发现了背后的秘密。事情是这样婶儿的。MinusX是一家去年成立的、位于美国旧金山的初创公司,核心愿景就...
51CTO技术栈
0回复
1.7w浏览
CC
小模型
LLM
暂无内容
1
39
40
41
42
43
44
45
46
47
客服