51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
算家云
智能体
Anthropic 狂揽融资 35 亿美元,估值达到 615 亿美元;去年收入猛增10倍,近60倍估值溢价
原创
出品51CTO技术栈(微信号:blog51cto)Anthropic今天宣布,该公司完成了35亿美元的E轮融资,估值达到615亿美元。该轮融资由光速创投(LightspeedVenturePartner)出资10亿美元领投,柏尚投资(BessemerVenturePartners)、思科(CiscoInvestments)、D1CapitalPartners等新老投资方共同参与。相比去年,Anthropic的估值大概在184亿至185亿美元,这次身价直接翻了三倍!由此,Anthropic总筹集金额达到182亿美元。这笔钱,用来做...
51CTO技术栈
0回复
2809浏览
Anthropic
硅谷
OpenAI
一文读懂 RAG-Gym:用过程监督优化推理与搜索智能体
精华
传统的检索增强生成(RAG)架构依赖于静态检索,这使得它们在处理需要顺序信息搜索的复杂问题时,效果大打折扣。虽然智能推理和搜索提供了一种更具适应性的方法,但现有的大多数方法在很大程度上都依赖于提示工程。为了解决这一问题,本文介绍了RAGGym,这是一个统一的优化框架,它通过在每个搜索步骤进行细粒度的过程监督,来提升信息搜索智能体的性能。核心贡献引入RAGGym,这是一个利用过程监督优化智能RAG的统一框架。提出R...
AI论文解读
0回复
2621浏览
RAG
搜索
智能体
allenai开源多模态的文档智能解析大模型(OLMOCR)方法、效果浅析
原创
先说结论,实际体验一般,如果是下游rag文档的元素不是特别复杂可以用一用这个端到端的多模态模型,如果版式元素丰富,还是老实进行文档解析吧。但通过pdfparser工具结合prompt结合的方式值得一看。在线demo:https:olmocr.allenai.org开源权重地址:https:huggingface.coallenaiolmOCR7B0225previewpaper:EfficientPDFTextExtractionwithVisionLanguageModels,https:arxiv.orgpdf2502.18443v1code:https:github.comallenaio...
大模型自然语言处理
0回复
4825浏览
大语言模型
自然语言处理
多模态
LMEDR对话模型:引入自然语言推理数据提升对话模型的连贯性和一致性
一、概述title:YouTrulyUnderstandWhatINeed:IntellectualandFriendlyDialogueAgentsgroundingKnowledgeandPersona论文地址:https:aclanthology.org2022.findingsemnlp.75代码地址:https:github.comdlawjddn803INFO1.1Motivation以前的研究将知识或个人资料混合融入预先训练的语言模型。其同时考虑知识和人物角色的能力仍然是有限的,导致生成结果出现幻觉,并且使用人物角色的方法也很被动。1.2Methods提出一种有效的agent...
arnoldzhw
0回复
2793浏览
LMEDR
对话
模型
什么是工作流?如何创建和编排AI智能体工作流
原创
智能体工作流是一种利用人工智能智能体(AIAgent)来自动化和优化业务流程的技术。AI智能体通过理解和分析数据,执行任务,并根据需要与人类协作提升工作效率、减少错误,帮助企业更快速地响应市场需求。2024年8月,知名AI专家吴恩达在演讲中探讨了AI智能体工作流的趋势。吴恩达认为,智能体工作流将在未来三到五年内成为企业数字化转型的核心技术,尤其是在提升流程效率和推动创新方面具有不可替代的价值。1、什么是智能体工作...
数字化助推器
0回复
8099浏览
智能体
大模型
人工智能
连续小波变换(CWT)+时间序列预测!融合时频分析与深度学习的预测新思路
前言本期更新推出一种基于连续小波变换(ContinuousWaveletTransform,CWT)与VGG模型的时间序列预测方法,将传统时频分析技术与深度学习相结合,有效解决了复杂时间序列的建模难题。通过将一维时序信号转换为二维时频图像,充分利用卷积神经网络(CNN)对图像特征的强大提取能力,在保证时序局部特征的同时,显著提升模型对非平稳信号的适应性。1.模型简介模型核心思想(1)时频转换:利用CWT捕捉时序信号的时频局部特性,生成...
Tang_Lan
0回复
4261浏览
CWT
时间序列
预测
HippoRAG 2发布,GraphRAG退位!
为解决现有检索增强生成(RAG)系统在模拟人类长期记忆的动态和关联性方面的局限性,一种新型框架HippoRAG2提出并将开源!在三个关键维度上评估持续学习能力:事实记忆、感知构建和关联性。HippoRAG2在所有基准类别中均超越了其他方法(RAPTOR、GraphRAG、LightRAG、HippoRAG),使其更接近真正的长期记忆系统。HippoRAG2框架的核心思想:HippoRAG2基于HippoRAG的个性化PageRank算法,通过深度段落整合和更有效的在线LLM使...
PaperAgent
0回复
3056浏览
HippoRAG
GraphRAG
RAG
2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
文本丰富的图像(如文档、图表、场景图等)在现实场景中扮演着重要角色,准确理解这些图像对于自动化信息提取和优化用户交互至关重要。文本丰富图像理解(TextrichImageUnderstanding,TIU)领域涉及两个核心能力:感知(如文本检测、识别)理解(如信息抽取、视觉问答)多模态大语言模型(MLLMs)的出现为文本丰富的图像理解(TIU)领域带来了新的维度,系统地分析了该领域MLLMs的时间线、架构、训练流程、数据集与基准测试。TI...
PaperAgent
0回复
5897浏览
大模型
场景
MLLMs
中科院、百度提出新架构:突破参数限制,实现高效推理
有不少研究证明,大模型在不断增加参数的情况下,其性能提升却逐渐趋于饱和,特别是在受限的数据可用性和计算资源预算下,这种情况非常明显。为了解决这一难题,中国科学院信息工程研究所、百度、北京师范大学AI学院的研究人员联合提出了InnerThinkingTransformer架构(简称ITT),通过动态分配计算资源给单个标记,增强了测试性能而无需增加参数。ITT的设计基于一个关键假设:Transformer的每一层可以被视为对输入信息的一次隐...
Aceryt
0回复
2332浏览
模型
训练
AI
工作流代理新突破:FlowAgent的合规性与灵活性解析
在对话系统研究领域,工作流代理的设计与实现始终充满了挑战与机遇。传统的任务导向对话系统(TOD)通常采用模块化流水线架构,将自然语言理解(NLU)、对话状态跟踪(DST)以及自然语言生成(NLG)功能分离开来。但是这种方法由于误差传播问题,效率往往不高。随着大型语言模型(LLMs)的兴起,基于LLMs的端到端对话系统逐渐成为主流,通过工作流引导的互动进行整体对话管理,显著提高了任务成功率。对话系统从模块化流水线到...
xuxiangda
0回复
3055浏览
FlowAgent
灵活性
NLU
CVPR 2025 | 多模态六边形战士Magma:会点按钮会搬砖,标注竟让AI长出"时空大脑"
文章链接:https:www.arxiv.orgpdf2502.13130项目链接:https:microsoft.github.ioMagma模型链接:https:huggingface.comicrosoftMagma8B亮点直击提出了Magma,第一个不仅具备多模态理解能力,还具备空间时间推理能力的基础模型,能够在数字和物理环境中完成智能体任务。提出了使用SetofMark(SoM)和TraceofMark(ToM)技术,显著增强了空间时间智能,用于行动定位和规划,并使Magma能够在大规模异构数据集上进行有效的预训练。构...
angel
0回复
2811浏览
模型
智能体
生成
人工智能驱动的科学研究创新,迈向AI协同科学家
在现代科学研究过程中,科学家们面临着许多挑战,假设生成和实验验证的复杂性使得研究进程变得相当缓慢,科学发现依赖于科学家提出新颖的假设,并通过严格的实验验证这些假设。但是生成具有原创性且可验证的研究假设往往需要耗费大量的时间和资源。随着科学领域的不断扩展,科学家们需要在更广泛的知识背景下进行研究,这进一步增加了难度。同时,科学研究中多学科交叉和大规模数据的处理也带来了新的挑战。现代科学问题往往涉...
xuxiangda
0回复
2619浏览
人工智能
驱动
AI
当爱情遇上算法,人工智能将永远爱你吗?研究浪漫AI伴侣的隐性偏见
AI陪伴者作为一种新兴的数字技术现象,逐渐进入我们的生活,从简单的数字助手到情感陪伴者,其应用范围越来越广泛。数字助手如AmazonAlexa和Siri,早已成为许多家庭中的一部分,而更具人性化的情感陪伴者,如Replika等AI聊天机器人,更是在全球范围内吸引了数百万用户。这些AI系统不仅能够完成基本的任务,还能够与用户进行复杂的对话,甚至在一定程度上参与到情感交流中。但是随着人与AI互动的深入,一些隐性偏见问题逐渐浮现...
xuxiangda
0回复
3379浏览
人工智能
AI
技术
马斯克最新预言:AI毁灭世界的概率为20%!星舰全程复用后成本将砍99%!
原创
精华
整理伊风出品51CTO技术栈(微信号:blog51cto)3月1日,马斯克再次做客《TheJoeRoganExperience》播客节目,语出惊人!“还有一个更高级的阶段——当AI比所有人类加在一起还要聪明。坦白说,我觉得这个节点可能会出现在2029或2030年,基本上刚好赶上《终结者》的时间线。”而到那时候,我们有80%的概率会获得好的结局。而20%的概率,AI会像《终结者》中的“天网”终结人类文明。上图:马斯克说AI将“走向极端”,它要么会超级好...
51CTO技术栈
0回复
3319浏览
马斯克
AI
火星殖民
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!
原创
编辑言征出品51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。此外,进入2025之后,大模型的五六个主流玩家都怎么样了?要想突破OpenAI的绝对领先的日活数据,都有哪些突破口?3月2日,硅谷知名投资人BillG...
51CTO技术栈
0回复
2682浏览
大模型
OpenAI
马斯克
一键开启大模型评估:LangChain下场给出最佳实践
🚀评估体系为何重要?在构建基于LLM的生产级应用时,系统化评估(evals)是确保可靠性的关键。LangChain全新推出的OpenEvals与AgentEvals工具包,为开发者提供标准化评估框架与预置评估器,让复杂评估变得简单易行。真实痛点警示:某金融企业因未做轨迹评估,导致智能体误调敏感API造成百万损失一、评估体系双核引擎:数据×指标的化学反应1.📖数据质量决定评估效度需构建场景化测试数据集(推荐510个高质量样本)数据应反映真...
ermulong
0回复
3511浏览
大模型
评估
LangChain
专门针对时间序列分类任务的时序大模型
今天给大家介绍一篇华为最近发表的时间序列分类大模型工作,填补了专门用于时间序列分类的大模型工作空白,借鉴了VisionTransformer的训练方式和模型结构,迁移到时间序列分类任务中,在多种类型的数据集上取得了不错的效果。推荐阅读:2024时序预测都有哪些经典工作——汇总篇,2024时间序列预测相关最新SOTA工作汇总,涉及模型结构、表示学习、频域信息、扩散模型10余个专题。论文标题:Mantis:LightweightCalibrat...
海因斯DK
0回复
5120浏览
时间序列
时序
大模型
Agent只是手段,工作流才是内容!
原创
精华
编辑|言征出品51CTO技术栈(微信号:blog51cto)现代企业中有一个无名英雄:工作流程。它有时被称为规则引擎、流程流、单状态机或软件定义的工作流程。在用户界面(UI)中,它是一个“向导”。开发者通常(有些轻蔑地)称它为“业务逻辑”。各位这里不妨花点时间来欣赏这个无名英雄的独特威严,因为我们即将把硅谷炙手可热的关注之光投向它的门槛:AI代理。关于AI、大型语言模型(LLMs)和代理应用程序已经有很多的讨论,很难...
51CTO技术栈
0回复
2564浏览
Agent
代理
应用程序
CVPR 2025 | 扩散模型炼出新绝技!注意力蒸馏技术:图像生成效果全面碾压传统方法
论文链接:https:arxiv.orgpdf2502.20235项目链接:https:xugao97.github.ioAttentionDistillation亮点直击分析了之前即插即用注意力特征方法的局限性,并提出了一种新颖的注意力蒸馏损失,用于重现参考图像的视觉特征,取得了显著优越的结果。开发了attentiondistillation引导采样,这是一种改进的分类器引导方法,将注意力蒸馏损失整合到去噪过程中,大大加快了合成速度,并支持广泛的视觉特征转移和合成应用。生成效果一览给...
angel
0回复
4684浏览
模型
视觉
生成
什么是检索增强生成 (RAG)?
原创
01、概述在人工智能的飞速发展中,大型语言模型(LLMs)凭借卓越的文本生成能力,成为自然语言处理领域的明星。然而,这些模型仍然面临一些关键问题,比如如何理解用户意图、提供精准且上下文相关的回答。为解决这些痛点,一个全新的技术框架——检索增强生成(RetrievalAugmentedGeneration,RAG)横空出世,它通过结合检索与生成两种能力,为AI的未来打开了更大的可能性。02、什么是RAG?RAG是一种革命性的AI框架,它将检索式...
Halo咯咯
0回复
2907浏览
检索增强生成
RAG
暂无内容
1
160
161
162
163
164
165
166
167
168
客服