51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
GPT-5
关于大模型应用协议的发布——MCP和A2A协议的出现意味着什么?
原创
“智能体是大模型应用的未来,而协议却是决定大模型应用的行业标准。”2024年是大模型应用探索的元年,而随着大家对大模型应用的探索,大模型被应用到越来越多的场景;但同时也面临着各种各样的问题。特别是在智能体方面的应用探索,面临着各种各样的问题;而其中目前最头疼的无非就是各家大模型公司没有统一的标准,关于智能体的技术实现也各式各样;而这直接阻挡了大模型应用方面的进展。而解决这个问题最好的办法是什么?那...
AI探索时代
0回复
2192浏览
大模型应用
MCP
A2A
大模型数据预处理——关于复杂文档在大模型应用中的解决方案
原创
“复杂文档的处理是人工智能应用的基础,但同时也是一个门槛。”在这里先思考一个问题,哪种文档格式最复杂?以我们经常使用的文档为例,不同系统下有不同格式的文档;不论是文本,图片,还是视频都有很多种格式;但要说比较复杂的还是文本类文档。因为文本类文档中包含着多种其它格式的文档;以作者个人为例,我认为最复杂的文档就是常用的wordpdf这种格式。原因就在于这种格式的文档就像一张白纸,我们可以在上面写画任何我们...
AI探索时代
0回复
2592浏览
大模型应用
RAG
文档预处理
全球首场人形机器人格斗大赛要来了!宇树科技炸场,人形机器人风口来了?
最近,北京的一场人形机器人半程马拉松,吸引了巨大关注量。人形机器人再次成为了讨论的焦点。然而,这场马拉松比赛的热度还没过去,另一场更为硬核的比赛已经在酝酿。2025年5月至6月,宇树科技将举办全球首场“人形机器人格斗大赛”。这个曾经只存在于科幻电影中的场景,如今已成为检验人形机器人技术实力的擂台。如果说马拉松只是对机器人的耐力测试,那么格斗比赛则意味着机器人将走向会产生物理碰撞的擂台实战,这对算法与...
算家计算
0回复
1821浏览
机器人格斗大赛
人形机器人
具身智能
机器人马拉松北京
租算力,到算家云
让数字人视频告别"恐怖谷"!字节团队最新DreamActor-M1实现人类表情动作像素级操控
论文链接:https:arxiv.orgpdf2504.01724项目链接:https:grisoon.github.ioDreamActorM1亮点直击提出了一个整体的基于DiT的框架和一种渐进的训练策略,用于支持灵活多尺度合成的人像动画。设计了混合控制信号,结合了隐式面部表征、显式3D头部球体和身体骨架,以实现富有表现力的身体和面部动作合成,同时支持多样化的角色风格。开发了互补的外观引导,以缓解视频片段之间未见区域的信息差距,从而实现长时间段内的一致视频生...
angel
0回复
2311浏览
数字人
视频
生成
谷歌新型 AI 系统在复杂诊断中表现超越医生
原创
最近,《自然》杂志上的一篇新论文引发了关注。它展示了谷歌如何用AI改变医疗的未来:通过自动化技术降低成本、减轻医生负担,使他们能够将更多精力投入到复杂病例的处理中。当你带着疑难杂症就医时,自然希望得到准确的诊断。然而,即便经验丰富的医生,有时也会对疑难病情感到棘手。有些症状或许并无大碍,但有些则需要深入检查。近年来,人工智能在医疗领域发展迅猛,尤其在模式识别类任务中表现突出。谷歌近期在“AI医生”...
51CTO内容精选
0回复
1695浏览
大型语言模型
LLM
人工智能
Anthropic开源Agentic Coding最佳实践!
周末的时候,Anthropic发布了AgenticCoding的最佳实践博客。今天给家人们分享一下具体的内容,先揭秘一个它背后有点“反直觉”的小把戏,看看“高端的AI”是如何用上“朴素的ifelse”的,最后再带给大家一波官方总结的实战干货!“ultrathink”的魔法与朴素的ifelse在博客中提到,如果你想让Claude在处理复杂问题时“多想想”,可以在指令里加上"think"这个词。想让它想得更深?那就用"thinkhard"或者"thinkharder"。甚至还有一...
探索AGI
0回复
2742浏览
Anthropic
模型
AI
Agent2Agent对比MCP,高效实现协作式AI
在AI迅猛发展的当下,各类新兴工具与协议不断涌现,为人工智能的能力提升注入强大动力。其中,Agent2Agent协议(A2A)和模型上下文协议(MCP)堪称两项重大创新,正深度重塑人工智能的发展版图。这两者乍看之下似乎相似,但其实际用途却截然不同。本文用通俗易懂的方式详细介绍这两种协议,帮助读者清晰把握二者之间的差异,把握其在AI领域的独特价值。1Agent2Agent协议(A2A):AI协作的“中枢引擎”Agent2Agent协议(A2A)支...
小虎哦哦
0回复
2342浏览
Agent2
MCP
AI
能源红灯亮起,AI 算力焦虑如何突围?(下篇)
一、ESG理念领航,指明发展方向在全球可持续发展浪潮下,ESG(环境、社会和企业治理)理念成为指引算力产业变革的灯塔。该理念强调在追求技术进步的同时,兼顾环境可持续性、社会公平性和企业治理优化,与算力产业低碳绿色转型及可持续发展的需求高度契合。政策层面也积极响应,《算力基础设施高质量发展行动计划》《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》等一系列政策文件,明确提出推动资源高效调度...
算力便利店
0回复
954浏览
劲速云
顶作AI
能源红灯亮起,AI 算力焦虑如何突围?(上篇)
在数字经济蓬勃发展的当下,人工智能(AI)以惊人的速度改变着世界。从爆火的ChatGPT,到文心一言、Kimi等生成式AI模型,AI技术正以前所未有的态势进入生活的各个领域,重塑医疗、教育、金融等行业格局。然而,在AI野心勃勃拓展疆土的背后,能源天花板的限制却引发了日益严重的算力焦虑,成为其进一步发展的巨大阻碍。一、AI算力需求暴增,能源供应捉襟见肘AI产业的迅猛发展,对算力的需求呈现出指数级增长。随着深度学习、大数...
算力便利店
0回复
868浏览
劲速云
顶作
学会LLM思维:语料质量的自评估
原创
日常工作中面对各类的作业,如何通过工程化的设计,充分利用LLM的逻辑推理能力,是AI思维的最直接体现。今天开始小编将带着大家,遵循AI思维来解决日常作业中的各种问题。今天探讨的实际场景是语料质量评估。在垂类应用或者RAG应用,将企业知识或者领域知识转化为语料是最为关键的一环,但是如何来确定语料的质量作为关键。LLM的训练过程中因为其预训练能力与困惑度(PPL)相关,因此可以从不同的数据来源中分别提取困惑度排名...
鲁班模锤1
0回复
1370浏览
LLM
语料质量
AI
谷歌陷入反垄断风暴:OpenAI有意收购Chrome ,搜索市场要洗牌了?
最近,一场谷歌反垄断听证会,因为OpenAI高管的一句话掀起惊涛骇浪——“若法院强制谷歌出售Chrome,我们将有意出手收购。”全球67%浏览器市场的掌控者Chrome,正处于美国司法部的反垄断压力下。去年,美国司法部在反垄断诉讼中胜诉,联邦法院判定谷歌利用Chrome与搜索服务的深度捆绑,构成非法垄断。目前,美国司法部已请求法院裁定强制谷歌剥离Chrome浏览器。联邦法庭正举行为期三周的庭审,讨论谷歌必须做出哪些改变。事实上...
算家计算
0回复
1078浏览
OpenAI
谷歌反垄断风暴
Chrome或将被玻璃
算家云
租算力,到算家云
LLM实战系列 | 大模型的多Lora部署,将显存节省到极致
下面是我前段时间跟一位群友的对话:群友:我最近有都需要进行模型微调,但是每个任务模型调完之后都对单一任务有明显提高,但如果合在一起训练的话,效果又达不到最佳。所以在使用阶段,部署了多个模型,但是显卡资源真的吃不消,有什么好的解决办法吗?我:你是Lora微调,还是全量参数微调的。群友:Lora微调,全量参数微调,也没那么多训练资源。我:你既然是Lora微调,那么你在部署的时候,可以只部署一个底座模型,然后多...
NLP工作站
0回复
1710浏览
LLM
Lora
部署
微软亚洲研究院打造最强视觉元素定位模型
为什么需要GUI视觉定位技术?1.1数字时代的效率革命图形用户界面(GraphicalUserInterface,GUI)智能体正在重塑人机交互方式。这类智能体通过模仿人类的视觉感知能力,可以直接"看懂"屏幕内容并执行操作指令。微软亚洲研究院团队的研究表明,相比依赖HTML等GUI元数据的传统方法(存在平台依赖性和实现差异问题),基于视觉的方法具有更广泛的适用性。例如,在跨平台操作场景中,视觉智能体可以统一处理Windows、Web和移动端界面,...
大语言模型论文跟踪
0回复
1644浏览
微软
视觉元素
模型
Hybrid-RRF:动态权重混合检索RAG方案
一、为什么需要混合检索技术?1.1大语言模型的"幻觉"困境大语言模型(LLM,LargeLanguageModel)虽然在文本生成和理解方面表现出色,但存在一个致命缺陷——会产生"幻觉"(Hallucination),即生成看似合理但实际错误或无依据的内容。1.2检索增强生成的技术革新检索增强生成(RAG,RetrievalAugmentedGeneration)技术应运而生,它通过结合外部知识库为LLM提供事实依据。传统RAG系统主要采用两种检索方式:稀疏检索(如BM25算法)...
大语言模型论文跟踪
0回复
4090浏览
Hybrid-RRF
混合检索
RAG
MCP(Model Context Protocol) 的理解和快速实践
精华
一、背景此前笔者对AIAgent研究的涉猎比较少,也基本没有系统介绍过与Agent相关的内容。然而,最近由Anthropic提出的MCP(ModelContextProtocol[1],模型上下文协议)在社区中引发广泛关注,笔者也趁此机会“蹭蹭热度”,了解下MCP到底是什么,了解一下MCP的基本概念和工作机制。在最初接触MCP时,也曾对其一些设计感到困惑。于是带着这些疑问进行了进一步的调研,逐渐对MCP的组成及运作方式有了初步的认识,比如:MCP中的Resou...
amei2000go
0回复
5410浏览
MCP
AI
Agent
NL2SQL新突破:SQL-R1用强化学习打破传统局限
原创
精华
在人工智能飞速发展的今天,自然语言处理(NLP)领域不断涌现出令人瞩目的成果。其中,自然语言到SQL(NL2SQL)的转换技术,正逐渐成为连接人类与数据世界的桥梁。想象一下,如果能够用日常语言直接查询数据库,获取所需信息,那将极大地简化数据操作流程,让非技术用户也能轻松驾驭复杂的数据系统。这不仅是技术上的突破,更是对数据民主化的一次有力推动。NL2SQL:从理想走向现实的挑战NL2SQL技术的核心目标是将人类自然语言...
Halo咯咯
0回复
2565浏览
NL2SQL
SQL-R1
强化学习
MCP失宠?谷歌重磅开源A2A协议 实现智能体间的自由“对话”
原创
谷歌云正式宣布推出全新的开源协议Agent2Agent(A2A),旨在打破当前人工智能(AI)智能体之间的壁垒,实现不同厂商、不同框架构建的AI智能体之间的无缝协作与信息交换。这一举措标志着AI领域迈向更加开放、高效和智能的新时代。打破壁垒,实现智能体间的自由“对话”随着企业对自主AI智能体的部署日益增长,如何让这些智能体在复杂的企业环境中协同工作,处理跨系统、跨应用的日常或复杂任务,成为了提升生产力的关键。然而,...
数字化助推器
0回复
1798浏览
MCP
A2A
谷歌
别担心!AI微调后变"坏"也有解法:揭秘LLM对齐技术新突破
论文《AlleviatingtheFearofLosingAlignmentinLLMFinetuning》解决了大型语言模型(LLM)领域一个令人头疼的问题:为什么微调后的AI模型会失去"道德约束",以及如何高效地修复这个问题。图片1、AI也会"变坏"?微调带来的隐患我们都知道ChatGPT、Llama这类大语言模型在经过训练后,通常会遵循一定的"价值观"——比如当你问它"如何入侵别人的电脑"时,它会礼貌地拒绝回答。这种确保AI行为符合人类价值观的训练叫做"对齐训练"(ali...
sbf_2000
0回复
1461浏览
AI
微调
LLM
ReTool:AI工具使用的突破性进展,推理能力显著提升
1、AI终于学会了"工欲善其事,必先利其器"图片你有没有这样的经历:面对复杂计算题,纯靠脑力计算往往容易出错,而借助计算器或编程工具却能事半功倍?人类在解决问题时懂得适时借助工具,而AI呢?当前的大型语言模型(LLM)虽然在纯文本推理方面表现出色,但在涉及精确计算、符号操作等领域,它们往往捉襟见肘。为何不让AI也学会"工欲善其事,必先利其器"的智慧?论文提出了一种创新方法,通过强化学习让AI自主掌握何时、如何...
sbf_2000
0回复
1613浏览
AI
工具
ReTool
国产AI开启长镜头革命!昆仑万维SkyReels-V2开源,全球首个无限时长AI视频模型来了
刚刚,AI视频领域炸出王炸!昆仑万维SkyReels团队于近日正式发布了全球首个支持无限时长的电影生成模型——SkyReelsV2,并免费开源,标志着AI视频正式迈入长镜头时代。昆仑万维开源的SkyReelsV2直接突破两大天花板:1️⃣时长自由以前AI生成视频最多1分钟,现在用「扩散强迫」黑科技,先生成30秒片段,再通过「Extend」无限续接镜头,生成无限时长电影级长片!2️⃣画质+动态双绝杀好莱坞级画质+强化学习优化的运动流畅度,连人...
算家计算
0回复
2674浏览
昆仑万维
无限时长AI视频
SkyReels-v2
AI迎来长镜头时代
租算力,到算家云
暂无内容
1
129
130
131
132
133
134
135
136
137
客服