51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
大家都在谈Agentic RAG到底是什么?一文看懂概念、应用和工具
原创
社区头条
什么是AgenticRAG?过去两年里,RAG(RetrievalAugmentedGeneration,检索增强生成)几乎成为大模型应用的标配,它能把模型的生成能力与外部知识库结合,避免“胡编乱造”。但传统RAG也有瓶颈:面对模糊问题、复杂多跳推理或脏数据时,效果往往不理想。AgenticRAG就是在RAG的基础上引入“智能体(Agent)”的能力。它不仅能检索,还能像一个小助手一样自主规划步骤、调用工具、反思和修正,直到产出更精准、更符合语境的结果。...
Halo咯咯
0回复
1665浏览
Agentic RAG
RAG
开源框架
LangGraph
风格与主体终于完美融合!字节USO模型打破AI绘画‘二选一’困境,开源界新爆款诞生
文章链接:https:arxiv.orgpdf2508.18966Git链接:https:github.combytedanceUSO亮点直击概念:现有的风格驱动和主体驱动方法仅专注于各自任务内的孤立解耦,忽略了它们之间的潜在互补性,从而导致次优的解耦效果。首次提出了一种新颖的跨任务协同解耦范式,该范式统一了风格驱动和主体驱动任务,实现了相互增强,并为两者带来了显著的性能提升。技术:引入了USO,一个统一的定制架构,它结合了渐进式风格对齐训练、内容风格解耦...
zhangyannni
0回复
2358浏览
AI
模型
训练
细粒度图像分类的黄金训练方案大揭秘
原创
社区头条
本文提出一种优化的细粒度图像分类训练方案。通过整合大批量训练、学习率预热、TrivialAugment增强、余弦退火、标签平滑、随机擦除及EMA等现代训练技术,显著提升了ResNet50等通用骨干网络在斯坦福汽车数据集上的性能,证明了高效训练流程的关键作用,无需依赖特定架构改进。简介在过去一年里,我在Multitel的研究主要集中在细粒度视觉分类(FGVC)上。具体来说,我致力于构建一个可在边缘设备上实时运行的鲁棒性强的汽车分类器...
51CTO内容精选
0回复
962浏览
细粒度图像分类
FGVC
细粒度视觉分类
手把手教你为Claude Code准备代码库
本文围绕ClaudeCode的核心配置流程展开,通过三个关键步骤,助力ClaudeCode完整理解你的项目架构与业务逻辑。在此基础上,既能最大化提升该工具的实用价值,也能增强其上下文感知能力,为后续高效开展开发协作筑牢基础。步骤一:ClaudeCode基础配置首先,建议使用init命令完成ClaudeCode的基础配置。导航至项目根目录cdyourproject初始化ClaudeCodeclaude生成项目文档init执行上述命令后,会生成一个CLAUDE.md...
小虎哦哦
0回复
3094浏览
Claude Code
代码库
MCP
腾讯开源了一个通用智能体,又刷榜了GAIA!
腾讯优图实验室悄摸摸开源了Youtuagent,在较复杂的的深度搜索和工具使用benchmark上表现不错,今天给家人们分享一下他的亮点。不依赖GPTClaude的SOTA最值得一提的是,上面的评测都是使用的DeepSeek!!!!以后不能随便说,现在的Agent离开Claude,啥也不是了?所以他的框架到底有些什么亮点呢?最大的亮点:像聊天一样生成Agent对新手来说,配置Agent很烦人。他们搞了一个自动智能体生成的功能。别的框架是,你可能要...
探索AGI
0回复
2241浏览
通用智能体
AI
智能体
两周干成一天!毕马威用100页Prompt落地企业Agent
要让一个LLM成为顶尖行业专家,需要多长的Prompt?毕马威给出的答案是:100页。作为四大咨询巨头之一的毕马威,搞出来一个新闻。说他们打造了一款名为TaxBot的税务AI助手,直接把过去需要两周的专业咨询工作,压缩到了一天内完成,效率提升超过10倍!从封杀到Allin,从巨长Prompt到未来的AgentRuntime,毕马威这套操作,几乎把企业落地Agent该踩的坑、该走的路,都趟了一遍。今天,给家人们分享一下这个框架思路。毕马威的故事2...
探索AGI
0回复
1272浏览
Prompt
Agent
毕马威
英伟达放话:小模型才是Agent的未来!
这几天,英伟达的一篇论文非常火,标题很直接,小模型才是AgenticAI的未来整个内容,主要是论证了为什么要考虑SLM?以及如何从LLM迁移成SLM的六步教程,并论证了开源Agent框架替换成SLM,带来的结果。今天给家人们分享一下论文内容。为什么说LLM做大了还不行?目前行业主流的万事皆用LLM的Agent构建模式,是一种巨大的资源浪费。AIAgent的大部分子任务,其实是重复、有范围、非对话式的,用一个庞大的、无所不能的LLM去处理,就...
探索AGI
0回复
1066浏览
英伟达
小模型
Agent
智能体主流框架深度研究报告:功能特性、用户群体、技术架构与商业化路径分析
精华
社区头条
本报告对当前主流智能体框架进行全面剖析,涵盖开源与闭源解决方案的技术特性、用户分布、应用场景及盈利模式。通过对LangGraph、CrewAI、AutoGen、LangChain、SemanticKernel、Dify、MetaGPT等7个核心框架的对比分析,揭示智能体技术在金融、制造、医疗等行业的渗透路径,量化评估各框架的技术优势与商业化潜力。研究基于多篇权威行业报告(如IDC、头豹研究院)、典型企业应用案例(如国信证券×HiAgent)及技术评测数据,构建...
芝士AI吃鱼
0回复
1.2w浏览
智能体
技术
架构
AIGC 内容合规挑战:UGC 平台内容审核的技术选型与实践
随着国家网信办等四部门联合发布的《人工智能生成合成内容标识办法》明确于2025年9月1日起施行,所有UGC(用户生成内容)平台都将迎来一次深刻的治理能力大考。新规要求平台对AI生成内容进行核验和标识,这不仅是一项合规任务,更对平台的内容审核体系提出了全新的、系统性的挑战。AIGC内容的鉴别与管理,是内容治理体系中一个新增的高级模块。然而,在构建这个高级模块之前,我们必须首先审视并加固整个体系的基石——一个能够...
七牛云行业应用
0回复
1386浏览
AIGC新规
UGC平台
内容审核
内容标识
平台治理
从炼金术到工程学:在AI浪潮中,我们如何告别RAG,拥抱真正的“上下文工程”?
我至今还记得RAG(检索增强生成)这个词刚火起来时的情景。那感觉,就像是哥伦布发现了新大陆。一夜之间,所有人都成了RAG的信徒。它简单、直接,承诺了一个美好的未来:只要把你的私有数据“喂”给大模型,它就能无所不知、无所不晓。AI应用开发的门槛,仿佛瞬间被夷为平地。那时候,大家都在谈论RAG,会议室里、技术论坛上,到处都是它的身影。它像一个万能公式,简单到只需要两个步骤:检索(Retrieval),然后生成(Generat...
芝士AI吃鱼
0回复
971浏览
RAG
上下文工程
AI
分层反思+ 主动探索 = SOTA:MobileUse 在 AndroidWorld 刷出 62.9% 新纪录
随着人工智能技术的飞速发展,多模态大语言模型(MLLMs)在理解视觉输入和遵循用户指令方面取得了显著进展。这为移动设备上的复杂任务自动化带来了新的可能性。然而,将这些模型应用于现实世界的移动场景仍面临诸多挑战,例如长时任务执行、错误恢复困难以及在不熟悉环境中启动时的冷启动问题。为了解决这些挑战,MadeAgents团队推出了MobileUse项目,旨在通过分层反思架构和主动探索模块,实现移动设备上的鲁棒性和自适应任务...
穿越时空111
0回复
1770浏览
SOTA
AndroidWorld
MobileUse
手敲命令Out了!Chaterm语音识别+AI Agent,运维会议现场演示嗨翻全场
在云计算和开发运维(DevOps)日益普及的今天,运维人员和开发人员常常需要在复杂的命令行环境中进行操作,这不仅效率低下,还容易出错。为了改善这一现状,Chaterm应运而生。一、项目概述Chaterm是一款开源的智能、安全的AI终端工具,由一群DevOps专家开发,专为云从业者和开发运维人员设计。它基于AIAgent,让用户能够用自然语言代替复杂的命令行操作,提供基于个人知识库的智能补全功能,支持高精度语音命令输入,具备跨平台...
穿越时空111
0回复
1054浏览
SOTA
Chaterm
Agent
阿里达摩院偷偷放大招!RynnEC让机器人“看懂世界”只需一句话
随着人工智能技术的飞速发展,具身智能成为了当前研究的热点领域之一。具身智能强调智能体通过身体与环境的交互来实现对世界的理解和任务执行。在这一背景下,阿里达摩院推出了RynnEC世界理解模型,为具身智能的发展注入了新的动力。一、项目概述RynnEC是阿里巴巴达摩院推出的一款专为具身认知任务设计的视频多模态大语言模型(MLLM)。它能够从位置、功能、数量等11个维度全面解析场景中的物体,支持物体理解、空间理解以及视...
穿越时空111
0回复
1874浏览
RynnEC
机器人
智能
我是如何玩转Claude100 万 Token上下文的?(附代码实战)
原创
社区头条
编辑云昭出品51CTO技术栈(微信号:blog51cto)进入8月后,Anthropic推出了一个相当让开发者兴奋的更新!那就是:ClaudeSonnet4现在支持100万token的上下文窗口——这相当于在一次对话中处理75万个单词,或7.5万行代码。(1个token相当于0.75个单词,1行代码大概10个单词长度。)对一些开发者来说,这个概念可能有点抽象。我们可以这样理解:一次性丢给Claude:一整本小说(大约18万tokens)、一份配套的深入分析、研究资料,以...
51CTO技术栈
0回复
1115浏览
Claude
Token
上下文
企业级语音AI架构:GPT-Realtime的技术与成本考量
社区头条
对于每一位致力于构建生产级语音AI应用的开发者而言,OpenAI发布的GPTRealtime是一个值得关注的重要进展。除了其流畅的对话体验,我们更需要深入其技术内核,从架构师的视角审视其API能力、性能提升,以及随之而来的成本控制新挑战。构建一个成功的语音AI,不仅是追求单一的低延迟,它更是一场涉及技术集成、性能优化与成本控制的系统工程。API能力解析,从“可用”到“易用”的演进GPTRealtime通过其RealtimeAPI,提供了一系列...
七牛云行业应用
0回复
1359浏览
GPT-Realtime
大模型API
Token成本管理
七牛云
模型调度
不止于“think with image”!快手Kwai Keye发布Thyme,赋予模型超越图像思考的超能力!
社区头条
导读:快手KwaiKeye团队提出Thyme(ThinkBeyondImages)的新范式,并围绕它构建了一整套技术方案。旨在突破现有方法的限制,赋予开源模型一种更强大、更自主、功能更全面的“超越图像思考”的能力。OpenAI推出的o3推理模型,首次将图像直接融入推理过程,开创了视觉文本联合推理的新范式。该能力(ThinkwithImage)自发布以来,受到业界与学术界的广泛关注,多项研究开始探索如何在推理中引入视觉信息以增强模型感知与推理...
快手技术
0回复
1576浏览
llm
大模型
推荐大模型
快手发布SeamlessFlow框架:完全解耦Trainer与Agent,时空复用实现无空泡的工业级RL训练!
社区头条
近日,快手Kwaipilot团队发布了SeamlessFlow技术报告,这是对团队所使用的工业级规模强化学习(RL)训练框架的详细介绍。该框架通过创新的数据平面架构,对RL的训练逻辑和Agent做了彻底解耦,用以支持多智能体、在线强化学习训练等复杂场景;更进一步,针对RL计算资源分配问题,团队提出了“标签分配机制”,统一了该领域最广泛的两种设计模式(训推共卡、训推分离)。以标签分配的思路为出发点,在业界首个提出“时空复用pipel...
快手技术
0回复
1722浏览
人工智能
AI硬件智能体架构设计:从封闭功能到开放平台
在今年的深圳国际文创展上,那些能够与人流畅对话的AI硬件无疑成为了全场瞩目的焦点。观众们惊叹于它们快速、自然的交互能力。但当最初的新鲜感褪去,一个更深层次的问题浮出水面:除了聊天,它们还能做什么?一个只能讲故事的AI玩偶,或是一个只能开关灯的语音助手,其价值天花板是显而易见的。当用户的新需求出现时,这些功能固化的设备便无法满足。这揭示了当前AI硬件领域的核心挑战:如何从一个封闭的“对话玩具”,进化为...
七牛云行业应用
0回复
1320浏览
智能体开发
灵矽AI
低延迟技术
MCP协议
七牛云
从3s到600ms:实时AI语音交互的架构演进
社区头条
相信每一位与智能硬件深度交互的用户,都体验过那种微妙的尴尬:你满怀期待地与AI音箱或智能玩具对话,说完后,却是一段长达数秒的沉默,然后才传来机器合成的回答。正是这“慢半拍”的延迟,成为了隔在人与机器之间,一道影响自然交流的无形屏障。在今年的深圳国际文創展上,能够进行流畅、实时对话的AI硬件备受瞩目。这背后反映出一个强烈的行业信号:解决延迟问题,实现真正类人的语音交互,已成为智能硬件体验升级的核心。...
七牛云行业应用
0回复
1999浏览
AI语音交互
智能硬件
七牛云
低延迟技术
流式计算
输入成本接近免费,推理根本不烧钱!ChatGPT毛利超5倍,Claude赚麻溢价20倍!大佬起底:别被忽悠了!
原创
社区头条
编辑|云昭出品51CTO技术栈(微信号:blog51cto)OpenAI的ChatGPT也好、Claude也好,国内的DeepSeek也好,到底在推理上是烧钱,亏钱,还是挣钱?ChatGPTPro的毛利高达56倍;Claude做开发者的生意更赚钱:ClaudeCodeMax的毛利润率竟高达1220倍溢价。怪不得大家都下场卷编程赛道!而API的利润率接近100%,堪比软件。就在刚刚,一位资深业界人士、同时也是刚成立一年的初创公司的联合创始人忍不住替我们揭开了真相。大家口口声声说...
51CTO技术栈
0回复
1921浏览
ChatGPT
Claude
API
暂无内容
1
35
36
37
38
39
40
41
42
43
客服