51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
大模型
METR发现 AI 编码的“摩尔定律”?指数级增长或颠覆软件开发
精华
还记得2023年初ChatGPT刚出来时,让它30秒写一个“冒泡排序”都觉得很新鲜?弹指之间,今天的AIagent已经能自主几分钟内啃下人类程序员需要一小时乃至一天才能完成的需求了。感觉AI进步太快跟不上?这可不是错觉。专注于AI能力评估的METR机构扔出重磅研究:AI系统能搞定的编码任务复杂度(以人类所需时间衡量)正以惊人的指数速度增长,其“时间范围”(TimeHorizon)——即AI能达到50%成功率的任务时长——大约每7个月就翻一番...
Syrupup
0回复
2163浏览
METR
AI
摩尔定律
DeepSeek如何用MTP逆天改命?
DeepSeekV3的MultiTokenPrediction到底在做什么?这个问题在大模型面试中经常被问到,属于DeepSeek的高频面试题。所以这篇文章我们就来看看,如果你在面试现场被问到这个问题,应该如何作答?1.面试官心理分析首先老规矩,我们还是来分析一下面试官的心理,面试官问这个问题,它其实主要是想考察你3个方面:第一,为什么要做MTP?你是否知道这个算法背后的动机?第二,之前的工作MTP是怎么做的?DeepSeek肯定不是这个方法的首创...
丁师兄大模型
0回复
2250浏览
DeepSeek
MTP
google
揭秘Google A2A协议:原理、应用与未来
精华
一、A2A协议的核心原理A2A协议的设计基于五个核心原则,这些原则确保了协议的灵活性、安全性和广泛适用性。以下是对这些原则的详细解析,并结合技术机制进行说明。1.拥抱智能体特性(EmbraceAgenticCapabilities)A2A协议专为具有自主性和复杂推理能力的AI智能体设计。不同于传统的工具调用(如API或数据库查询),A2A允许智能体以自然、结构化的方式进行协作,而无需共享内存、工具或上下文。这种设计支持智能体在分布式环境中...
zhcs333
0回复
3652浏览
A2A
协议
智能体
ChatDiT:一个用于任务无关自由形式聊天的无训练基线扩散变换器
原创
摘要最近的研究表明,预训练的扩散变换器(DiTs)具备inherentincontext生成能力,能够通过最小或无需架构修改即可适应多种视觉任务。这些能力通过连接多个输入和目标图像的自注意力token,并结合分组和掩码生成pipeline来实现。基于这一基础,我们提出了ChatDiT,这是一个零样本、通用、交互式的视觉生成框架,利用预训练的扩散变换器,无需额外的调整、适配器或修改。用户可以与ChatDiT交互,创建交错的图文文章、多页图画书...
AIRoobt
0回复
1233浏览
ChatDiT
扩散变换器
微调
大型语言模型容易被无关上下文分散注意力(ICLM)
原创
摘要大型语言模型在各种自然语言处理任务中取得了令人瞩目的性能。然而,它们主要在所有输入上下文信息都与任务相关的情况下进行评估。在本研究中,我们探讨了大型语言模型的分心问题,即模型解决问题的准确性如何受到无关上下文的影响。具体而言,我们引入了带有无关上下文的小学数学(GSMIC),这是一个包含无关信息的算术推理数据集。我们利用这一基准测试来衡量大型语言模型的最新提示技术,并发现当包含无关信息时,模型性...
AIRoobt
0回复
1499浏览
大型语言模型
GSM-IC
自然语言处理
OpenING:用于评估开放式交错图文生成的综合基准
原创
摘要多模态大型语言模型(MLLMs)在视觉理解和生成任务中取得了显著进展。然而,生成交错的图文内容仍然是一个挑战,这需要集成多模态理解和生成能力。尽管统一模型的进展提供了新的解决方案,但现有基准由于数据规模和多样性的限制,不足以评估这些方法。为了填补这一空白,我们引入了OpenING,这是一个综合基准,包含56个真实世界任务的5400个高质量人工标注实例。OpenING涵盖了旅游指南、设计和头脑风暴等多样化的日常场景,...
AIRoobt
0回复
1586浏览
OpenING
多模态
大语言模型
基础智能体的进展与挑战:自进化机制和构建群体MAS系统
原创
FoundationAgent不再将智能体视为LLM的简单应用,而是将其看作一个由认知、记忆、学习、感知、行动等多个核心组件构成的复杂、有机的系统。其核心意义在于提供了系统性框架,强调了自主性,关注协作与生态,并突出了安全与对齐。然而,实现这一愿景也面临着技术复杂度高、需要庞大计算资源、评估困难、自进化可控性问题以及安全与对齐的根本性难题等巨大挑战。论文链接:https:arxiv.orgabs2504.01990拥有完善的认知架构只是第...
数字化助推器
0回复
2711浏览
大模型
智能体
多模态
基础智能体的进展与挑战:智能体的七个核心组件构建认知基石
原创
大型语言模型(LLMs)凭借其在自然语言理解、多模态处理、推理和内容生成方面的卓越能力,为AI领域带来了革命性变革。这些模型通过海量数据集训练后,展现出推理、上下文学习乃至基础规划等自发能力。尽管LLMs代表了智能机器发展的重要里程碑,但它们尚未完全具备智能生物的全部特性。自人工智能研究初期以来,研究者们一直致力于开发真正"智能"的系统——能够学习、规划、推理、感知、交流、行动、记忆,并表现出类人的能力与...
数字化助推器
0回复
1926浏览
智能体
LLM
多模态
关于RAG应用中怎么高质量的进行数据召回——召回策略的研究
原创
“数据召回是RAG技术的重要领域,而不同的召回策略甚至会产生完全不同的效果。”RAG技术的核心原理很简单,本质上就是在外部维护一个资料库,在进行大模型问答之前,先从资料库中找到相关的内容,然后一起输入到大模型中。但由于文档的复杂性,在进行文档处理时很难真正做到高质量的数据处理;因此,在做数据召回时就会面临着各种各样的问题。所以,怎么进行高质量的数据召回,就成为RAG必须要研究的一个课题;而今天,我们就来...
AI探索时代
0回复
2204浏览
数据召回
召回策略
RAG
关于基于RAG技术的智能客服系统解决方案
原创
“构建一个合格好用的智能客服是很多中小企业急需的市场需求。”客服系统在现代商业体系中扮演着重要的角色,不论任何领域任何行业都离不开客服的存在;虽然客服系统经过多年的实践与发展,但依然存在各种各样的问题。而随着互联网技术的发展,特别是目前基于自然语言处理的大模型技术的发展,为客服系统提供了新的解决方案;其主要优势就在于基于大模型的智能客服系统能够快速响应,快速回复,能够做到724小时不间断待命状态,...
AI探索时代
0回复
2091浏览
RAG
智能客服
大模型应用
刚刚,Qwen3强势登顶,成开源新王!国内首个混合推理模型,235B击败R1、o1!源神火力全开
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)源神Qwen3赶在五一假期前重磅上线!这次Qwen3直接放出了一整个“全家桶”——总共8个模型,包括2个MoE(稀疏专家)模型和6个稠密模型,规模从0.6B到235B不等,阵容堪称豪华。图片其中,旗舰模型Qwen3235BA22B强势登顶,成为新一代开源之王!在编码、数学、通用能力等多个基准评测中,表现可与DeepSeekR1、o1、o3mini、Grok3和Gemini2.5Pro等顶尖模型媲美。图片不仅大模型强,小型...
51CTO技术栈
0回复
2694浏览
Qwen3
混合推理模型
R1
一文带你了解【SFT微调】与【Unsloth】
在当下流行的几种大模型微调方法中,大家经常会看到谈论SFP与Unsloth的文章,那我们应该如何了解它们?它们的技术特点又有哪些?各自应用在哪些模型微调的场景呢?本篇我们带着这些问题,一起来了解一下。一、SFT微调技术介绍监督微调(SupervisedFinetuning,SFT)是一种迁移学习(TransferLearning)技术,指的是在已经预训练好的模型(例如大语言模型中的GPT、BERT等)基础上,使用带有人工标注标签的监督数据,对模型进行进...
码农随心笔记
0回复
2634浏览
SFT微调
Unsloth
开发
【一文了解】大模型的思维链技术(CoT)
在机器学习领域中,ChainofThought(思维链)技术是一种在大语言模型(LLM)推理任务中非常重要的方法,它诞生的目的是使模型能够像人类一样,通过一系列中间推理步骤来得出最终答案,而不是简单地给出一个直接的答案。这种能力对于提升模型的解释性、可信度和解决复杂问题的能力至关重要,尤其是在涉及逻辑推理、数学计算、问答等需要多步推理的应用场景中。本篇我们一起来了解一下CoT技术。一、什么是思维链技术1.基本概念思...
码农随心笔记
0回复
3184浏览
大模型
思维链技术
CoT
算力租赁:撬动 AI 算力市场新未来(上篇)
在当今数字化与智能化浪潮汹涌澎湃的时代,人工智能(AI)无疑是科技领域最耀眼的明星。从日常触手可及的智能语音助手,到医院中辅助医生精准诊断的医疗影像分析系统,再到逐渐从想象走入现实的自动驾驶汽车,AI正以超乎想象的速度重塑着我们生活的每一个角落。而在这场波澜壮阔的AI革命背后,AI算力,作为运行AI算法的核心计算能力,宛如AI的“心脏”,其重要性不言而喻,直接决定着AI技术的发展进程与应用边界,也由此引发了...
算力便利店
0回复
1197浏览
劲速云
算力租赁:撬动 AI 算力市场新未来(下篇)
如今,算力市场正经历前所未有的变革,新技术与新需求交织碰撞,催生出无限可能。接下来,我们将从市场格局、技术融合、行业趋势等维度,展望算力租赁市场的未来图景,探索劲速云算力的发展机遇与使命担当。一、市场格局:竞争与创新并存当前,算力市场正处于快速变革和发展的关键阶段。头部科技企业凭借资金、技术和资源优势,纷纷布局云算力服务,在市场中占据先发地位。与此同时,以劲速云算力为代表的专业AI算力服务企业异...
算力便利店
0回复
1059浏览
劲速云
一文了解:大模型 Agent 开发框架有哪些?它们的区别是什么?
引言随着大模型技术的爆发,AIAgent(智能代理)逐渐成为落地应用的核心载体。它不仅能理解语言,还能自主规划、调用工具、执行任务,真正让大模型从“语言模型”升级为“行动助手”。然而,面对市面上众多的Agent开发框架,开发者该如何选择?本文梳理了9大主流框架,解析其核心特性与差异,助你快速找到适合的工具!一、主流Agent开发框架盘点1.LangChain核心定位:行业标杆级框架,支持复杂任务链设计,集成能力极强。特点:...
AI小新
0回复
3545浏览
大模型
Agent
开发框架
一文了解:为什么大模型 Agent框架(A2A)采用 JSON-RPC 2.0?
引言在AI技术蓬勃发展的今天,大模型Agent(如GPT4、Claude等)需要频繁与外部工具、其他Agent甚至云端服务交互。如何高效、安全地完成这些通信?答案藏在JSONRPC2.0这一看似“古老”却焕发新生的协议中。本文将解析为何JSONRPC2.0成为大模型Agent传输协议的“宠儿”,并揭秘其核心优势。一、JSONRPC2.0是什么?JSONRPC2.0是一种基于JSON的轻量级远程过程调用(RPC)协议,诞生于2010年。它通过简单的请求响应机制,允许客户端...
AI小新
0回复
2173浏览
大模型
Agent
框架
AI多模态场景对数据管理带来的挑战有哪些?
在数据应用场景中,数据源属于数据管理是非常的一个环节,包括数据源、数据集成、生命周期、数据地图、数据标注、数据安全、主数据等等等,数据管理也是整个数据治理体系中最核心的部分之一,面向智算领域的数据能力,对于AI数据治理会有一些新的挑战。在过去数十年的大数据领域发展过程中,结构化数据和半结构化数据处理都是其中绝对的主角,结构化和半结构化数据由业务流程产生,与商业价值高度相关,这些数据与企业的流程业...
DataForAI
0回复
1705浏览
AI
多模态
场景
计算机视觉五大核心算法解析
一、卷积神经网络(CNN):视觉特征的自动提取器技术原理CNN通过模拟人类视觉系统的层级特征提取机制,利用卷积层、池化层和全连接层逐层抽象图像特征:卷积层:通过滤波器(如3×3矩阵)对输入图像进行滑动窗口式计算,捕捉局部特征(如边缘、纹理)。池化层:通过降采样(如最大池化)减少参数数量,增强平移不变性。全连接层:将高层特征映射到分类或回归任务。发展历程LeNet5(1998):首次将CNN应用于手写数字识别,奠定基...
每天五分钟玩转人工智能
0回复
2087浏览
核心
算法
SLAM
这才是MCP 爆火的原因!
现在很多人让大模型调用外部工具,最常见的做法就是FunctionCalling。乍一看,能调起来没问题。但真要接多个服务、跑一个完整流程,FunctionCalling就显得太粗糙了——定义繁琐、结构不统一、模型换一个就得重写一遍。本质上,它解决的只是“能不能调用”,但没解决“怎么标准、高效地调用”。而MCP出现,就是为了解决这个“工程化不成体系”的问题。我认为FunctionCalling更像是“你教模型怎么用某个函数”;而MCP,是“你把这...
hm673c38238a021
0回复
1956浏览
MCP
Agent
RAG
暂无内容
1
124
125
126
127
128
129
130
131
132
客服