51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
GPT-5
RAG系统中的“幕后英雄”:重排器如何提升信息检索的精准度?
原创
在信息爆炸的时代,我们每天都在海量的数据中穿梭,试图找到真正有价值的信息。而RetrievalAugmentedGeneration(RAG)系统的出现,就像是一盏明灯,照亮了我们在信息海洋中的前行之路。但你有没有想过,RAG系统之所以能够精准地为我们提供有用的信息,背后其实有一个关键的“把关人”——重排器(Reranker)。今天,就让我们一起深入探索重排器的世界,看看它是如何在RAG系统中发挥着不可或缺的作用。一、什么是RAG中的重排器...
Halo咯咯
0回复
2995浏览
RAG
重排器
LLM
DeepSeek对RAG技术的优化与落地影响:技术深度调研报告
1.RAG技术现状与核心挑战1.1技术架构解析RAG(RetrievalAugmentedGeneration)系统采用双阶段架构:检索模块:基于稀疏检索(BM25)、密集检索(DPR、ANCE)或混合检索,使用FAISSHNSW构建向量索引生成模块:基于Transformer架构的预训练语言模型(如ChatGPT、Qwen),通过CrossAttention融合检索结果典型RAG伪代码示例retrieverDenseRetriever(indexfaissindex)generatorT5ForConditionalGeneration.frompretrained(...)defrag...
芝士AI吃鱼
0回复
2576浏览
DeepSeek
RAG
技术
2025年,企业如何选择最适合的AI代理构建器?
原创
在数字化浪潮的推动下,AI技术正以前所未有的速度改变着企业的运营方式。AI代理(AIAgents)作为其中的关键应用,正在帮助企业实现从客户服务到流程自动化的全方位升级。然而,面对市场上众多的AI代理构建器,企业该如何做出最佳选择呢?今天,我们就来深入探讨这一问题,并为你揭晓2025年最值得企业关注的四大AI代理构建器。一、AI代理:企业数字化转型的新引擎在深入了解AI代理构建器之前,我们先来了解一下什么是AI代理。简...
Halo咯咯
0回复
1767浏览
AI代理
AI Agents
YourGPT
英伟达押注Agent新基建!AI专属搜索引擎问世
嘿,大家好!这里是一个专注于前沿AI和智能体的频道还记得Google刚出现时那种"真TM牛逼"的感觉么?到现在,当我们习惯了“问啥搜啥”的节奏,搜索引擎的革命又来了——不过这次,它不是为人类设计的!今天要介绍的Exa,是专为AIAgent打造的搜索引擎,重新定义AI时代的搜索基础设施。2024年7月完成了2200万美金的A轮融资,由Lightspeed领投,英伟达、YC等跟投,ARR超千万美金。人类搜索VSAgent搜索:差别到底在哪?人类搜索:"机...
探索AGI
0回复
2376浏览
英伟达
Agent
AI
只需5分钟,教你用Python搭建MCP Server
精华
大语言模型(LLMs)能力强大,能生成各类文本,精准回答知识疑问,还可用于机器翻译、代码编写等场景。然而,大语言模型也存在明显短板,无法获取实时数据,在面对需最新信息的问题时,难以给出准确答案。为攻克这一难题,Anthropic推出了模型上下文协议(ModelContextProtocol,简称MCP)。这一标准将大语言模型与实时工具、APIs和自定义资源相连,拓展其能力,让它能处理更多实时信息任务,补齐短板。本文教大家如何搭建MCP服...
小虎哦哦
0回复
1.1w浏览
Python
MCP Server
语言模型
扒一扒最近较火的MCP
原创
MCP正在成为一种标准,可帮助开发人员构建AI系统,使这些系统能够与其他外部应用程序进行有效通信。Microsoft最近宣布将MCP集成到其CopilotStudio中,以简化AI应用程序和代理访问工具的方式。此外,OpenAI还宣布在其产品中支持MCP,例如AgentsSDK和ChatGPT的桌面应用程序。封面的图片很直观的阐述了MCP,它是一种开放协议,MCP是一个开放协议,用于标准化应用程序向大语言模型提供上下文的方式。MCP由Anthropic公司在2024年底推...
鲁班模锤1
0回复
2695浏览
MCP
开放协议
LLM
刚刚!谷歌最强AI全家桶上线!自家主干网络都要公开对外用了!黄仁勋站台,最新TPU性能猛涨3600倍
原创
编辑|云昭4月10凌晨,谷歌CEO皮查伊带着一系列重磅的发布亮相拉斯维加斯Next2025,可谓从底层的TPU芯片到上层的Agent构建,都有让人眼前一亮的新品。1.性能提升3600倍,专为推理而生的TPU正式发布谷歌第七代TPUIronwood,它专为推理而设计。皮查伊介绍道,相较于第一代云TPU,Ironwood性能提升了3600倍,效率提升了29倍。Ironwood将于今年晚些时候上市。图片谷歌作为唯一一家拥有超过十年...
51CTO技术栈
0回复
2215浏览
谷歌
AI
网络
大模型面经:RAG与Long context“相爱相杀”背景下,如何设计最优解决方案?
原创
本篇分享RAG与longcontext结合的实践方案。本篇始于一个老生常谈的话题,“一旦大模型的ContextLength变大,RAG还有没有存活的必要?”RAG主要通过问题从知识库中找相关答案,然后把检索到的内容再用大模型总结;Longcontext相当于把全部文本内容输入给大模型,利用大模型查找或总结。这两者评估的维度包括成本、是否使模型变得更智能、是否可以混合检索和推理、是否可以缓存、推理时间等等。其实两者之争也相当于左右手之争,...
shizhi02
0回复
2106浏览
大模型
RAG
【模型测试】基于OpenCompass构建Dify应用的自定义评测体系
原创
背景随着我们在Dify平台上不断开发新的Agent,我们需要对Agent的能力是否满足预期进行评估。因此,本章内容主要介绍我们设计Agent评测数据集体系思路以及具体实施方案。目标建立一个评估Dify平台上Agent基础能力的评测体系。方案假设我们在Dify平台上开发了一个专利辅助助手Agent,如果我们要对该Agent进行能力评估,那么评估维度大致分为两层:基础能力层基础能力评估层,主要是Agent的通用能力进行评估,大体评估项以及评估指...
一起AI技术
0回复
3540浏览
模型测试
大模型评测
大模型
英伟达开源15T数据集:32万个机器人训练轨迹
全球AI领导者英伟达开源了,用于实体机器人和自动化驾驶的超大训练数据合集——NVIDIAPhysicalAIDataset。这个数据集一共15T,涵盖了超过320,000个机器人训练轨迹,以及多达1,000个通用场景描述,还包括一个SimReady集合。此外,用于支持端到端自动驾驶汽车(AV)开发的专用数据即将推出,这些数据将包括来自美国1,000多个城市和欧洲二十多个国家的多样化交通场景的20秒剪辑,这对于训练自动化驾驶非常珍贵。开源地址:http...
Aceryt
0回复
2227浏览
英伟达
机器人
开源
使用人工智能幻觉评估图像真实感
原创
本文提出了一种使用人工智能幻觉来评估图像真实感的新方法,对此方法的实现原理进行详细阐述,并给出详细的实验结果证明。引言最近,俄罗斯的一项新研究提出了通过一种非常规方法来检测不切实际的人工智能生成的图像。这种方法的主要思想是:不是通过提高大型视觉语言模型(LVLM)的准确性,而是通过有意利用它们产生幻觉的倾向。这种新方法使用LVLM提取有关图像的多个“原子事实”,然后应用自然语言推理(N...
51CTO内容精选
0回复
2168浏览
人工智能
语言模型
幻觉评估
Llama4 模型细节 & 效果实测
MetaAI发布了Llama4模型,终于来啦!开源社区也是等了很久。本次共两系列模型Scout和Maverick模型,两个模型均为MoE架构模型,DeepSeek得含金量还在提高,哈哈哈!榜单效果反正是杠杠滴。HF模型路径:https:huggingface.cocollectionsmetallamallama467f0c30d9fe03840bc9d0164模型的总体信息如上图所示,模型MoE架构中,无论是Scout还是Maverick,激活的路由专家数据均为1,有点奇怪,之前MoE架构一般激活路由专家数据都是2或更...
NLP工作站
0回复
2224浏览
Llama4
模型
开源
万字综述 LLM 训练中的 Overlap 优化:字节 Flux 等7种方案
一、背景在大规模分布式训练场景中,计算和通信的重叠(Overlap)一直是一个关键的研究热点。随着硬件性能的提升,计算能力和通信带宽之间的差距日益显著。如下图所示,硬件算力每2年大约扩大3x,而通信带宽每2年只提升1.4x,这种差距带来的影响在大规模训练任务中愈加明显。例如,在使用H100和A100集群进行LLM训练时,H100的通信开销占比通常会高于A100。这种情况下,通信可能成为了系统性能的瓶颈,因此,如何在计算和通信之...
amei2000go
0回复
2725浏览
LLM
Overlap
优化
字节 TileLink:编译生成高效的计算和通信 Overlap Kernel
一、背景笔者之前的文章(万字综述LLM训练中的Overlap优化:字节Flux等7种方案)中详细介绍过各种计算与通信Overlap的方案,这里进一步介绍字节最近发表的TileLink,其中提到的大部分工作已经包含在我们之前的综述中,建议优先阅读,比如CoCoNet、Centauri、Flux等。对应的论文:[2503.20313]TileLink:GeneratingEfficientComputeCommunicationOverlappingKernelsusingTileCentricPrimitives[1]二、摘要大规模深度学习模型通常...
amei2000go
0回复
3785浏览
字节
TileLink
编译
多智能体(Multi Agent)AI系统:企业智能化转型的未来
原创
在当今数字化时代,人工智能(AI)已经不再仅仅是一种工具,它正在演变为一个智能劳动力,由众多能够自主规划、推理和执行任务的AI智能体组成。多智能体系统(MultiAgentSystems,简称MAS)的兴起正在彻底改变企业的运营方式,通过让专业化的AI智能体无缝协作,攻克IT、人力资源、客户服务等多个领域的复杂工作流程。从单一任务自动化向协调决策的AI智能体转变,这不仅仅是一种新兴趋势,更是一种战略必然。如今,“代理型AI(A...
Halo咯咯
0回复
2524浏览
多智能体
Multi Agent
智能体转型
RAG进阶技术!这十种方法你一定要知道
原创
在当今这个信息爆炸的时代,AI系统已经深入到我们生活的方方面面,从医疗健康助手到教育辅导工具,再到企业知识管理机器人,AI正在帮助我们更高效地获取和处理知识。但随着应用场景的复杂化,传统的AI系统面临着诸多挑战:如何生成真正相关的回答?如何理解复杂的多轮对话?如何避免自信地输出错误信息?这些问题在基于RAG(RetrievalAugmentedGeneration,检索增强生成)的系统中尤为突出。RAG结合了文档检索的强大能力与语言...
Halo咯咯
0回复
2365浏览
RAG
AI
【模型测试】ai-eval-system在线评测系统v0.2预览版本介绍
原创
aievalsystem这是一个基于OpenCompass的模型评测系统,该系统提供了前端页面UI以方便用户自助开展评测工作。项目地址https:github.comdomonic18aievalsystem版本发布v0.2:支持API方式进行Dify平台应用的评测优化评测任务创建时的交互过程,包括APIURL等信息的输入、数据集的选择、评测信息的确认优化评测任务页面的显示,区分我的评测和全部评测优化评测任务终止时使用Celery原生方法不稳定的问题服务进行Docker化,方...
一起AI技术
0回复
2092浏览
模型测试
大模型
大模型评测
突破传统数学批改!这个AI系统能给你的每一步解题过程打分
1、开篇:你是否曾有过这样的困惑?图片还记得那些被老师批改得密密麻麻的数学作业吗?"答案对了,但过程错了"的批注可能曾让我们感到困惑。在传统教学中,教师们往往需要花费大量时间批改学生的习题,尤其是对解题步骤的评判更是耗时耗力。而当面对大量作业时,老师们很难对每个学生的每一步解题过程都给予详细的反馈。如今,AI教育技术正在悄然改变这一切。最新研究提出的StepAMC系统能够自动分析学生解题的每一个步骤,识...
sbf_2000
0回复
2220浏览
传统数学
批改
AI系统
MedSAM2: 3D医疗图像和视频的全能分割模型、DeepResearcher: 通过真实环境强化学习实现深度研究
今日目录1、MedSAM2:3D医疗图像和视频的全能分割模型2、DeepResearcher:通过真实环境强化学习实现深度研究3、APIGenMT:通过模拟代理人类互动生成高质量对话数据4、更大的语言模型是否意味着更好的推理能力?预训练推理缩放规律5、何时求解,何时验证:计算最优问题求解与LLM推理的生成验证6、突破传统数学批改!这个AI系统能给你的每一步解题过程打分1、MedSAM2:3D医疗图像和视频的全能分割模型图片MedSAM2模型通过在超过45.5...
sbf_2000
0回复
2202浏览
MedSAM2
3D
医疗图像
中国科大认知全重实验室发布Agent-R1训练框架,支持自主思考与工具调用!
什么是AgentR1AgentR1是由中科大认知智能全国重点实验室开发的智能体强化学习训练框架,致力于推进强化学习与智能体技术的融合发展。框架采用端到端强化学习方法,突破了依赖人工设计工作流的传统智能体开发瓶颈,让AI直接从与环境的交互中学习最优策略,实现自主决策与行动。开发者只需定义特定领域的工具和奖励函数,即可将AgentR1扩展到各种应用场景,无需编写复杂的工作流程。背景随着大型语言模型(LLM)技术的快速发展,智...
arnoldzhw
0回复
2145浏览
Agent-R1
训练
框架
暂无内容
1
136
137
138
139
140
141
142
143
144
客服