51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
大模型
性能提升90%,Anthropic 首次公开多智能体架构构建全流程
原创
精华
社区头条
Anthropic6月13日分享了关于构建多智能体系统的架构设计,几乎是毫无保留地展示了如何从零开始打造一个强大的多智能体(MultiAgent)DeepResearch系统,也就是Claude目前内置的Research功能。整个内容干货满满,涵盖了架构设计、Prompt提示词工程、效果评估,以及在生产环境中可能遇到的各种问题,可以说毫无保留。下文对要点详细剖析。1、多智能体系统的优势为什么不用单个强大的AI智能体,而是要搞复杂的“多智能体”架构呢?...
玄姐聊AGI
0回复
2421浏览
多智能体
AI智能体
AI Agents-7 | Muti-Agent的架构解析
原创
在当今快速发展的AI领域,多智能体架构正逐渐成为解决复杂任务的强大工具。从简单的单智能体系统到复杂的多智能体协同,我们看到了AI在任务管理、资源分配和决策效率上的巨大潜力。今天,就让我们深入探讨多智能体架构的魅力,看看它是如何通过不同的模式和策略,为我们的生活和工作带来变革的。一、单智能体与多智能体架构:选择适合的路径在AI的世界里,单智能体架构就像是一个“全能型选手”,它试图用一个智能体来完成所有...
Halo咯咯
0回复
1148浏览
AI Agents
Muti-Agent
混合随机数技术在AI芯片设计中的原理与应用探索
精华
社区头条
1.背景1.1AI芯片设计的当前挑战与新兴计算范式概览人工智能(AI)的飞速发展,特别是以Transformer为代表的深度学习模型的广泛应用,对计算硬件提出了前所未有的要求。传统的冯·诺依曼架构在处理这些大规模、高并行的AI负载时,其性能和效率日益受到“功耗墙”(powerwall)和“架构墙”(architecturewall)的根本性制约。随着模型规模的持续膨胀,其计算复杂度和内存需求呈爆炸式增长,这迫使学术界和工业界必须跳出传统思维...
上堵吟1
0回复
2336浏览
AI
芯片
随机数
80亿参数的MiniCPM4:为边缘AI量身定制的高效语言模型
原创
精华
在当今数字化时代,语言模型已经成为人工智能系统的核心组件,广泛应用于多语言翻译、虚拟助手和自动化推理等任务。然而,这些功能强大的模型通常需要强大的云端基础设施来支持其训练和推理过程。这种依赖不仅会导致延迟和高昂的成本,还会引发隐私问题,限制了它们在资源受限的边缘设备上的部署。例如,像GPT和LLaMA这样拥有数十亿参数的模型,由于其庞大的体积和复杂的训练推理过程,无法在本地硬件上高效运行。它们对大规模...
Halo咯咯
0回复
1654浏览
边缘AI
MiniCPM4
LLM
国产视频大模型霸榜全球!海螺02特效炸裂,好莱坞级大片10秒生成
原创
社区头条
前天深夜,MiniMax正式发布视频生成模型Hailuo02(海螺02),凭借惊人的物理特效,为视频生成领域带来了新的突破。  在ArtificialAnalysisVideoArena最新排名中,Hailuo02一举拿下全球第二,将谷歌Veo3、快手可灵2.0等巨头甩在身后。  值得一提的是,榜单前五名中,中国AI就占了四席——字节跳动Seedance1.0、MiniMaxHailuo02、快手可灵、生数科技。 极限物理表现惊艳全网 官方发布的预览视频呈...
算家计算
0回复
2810浏览
MiniMax
Hailuo 02
AI视频生成模型
国产大模型
大神Karpathy再谈氛围编程!AI开启软件重写潮!做通用Agent是炫技,所有AI应用要向Cursor学习
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)软件开发因AI有了根本性转变?刚刚,带火“VibeCoding”风潮的前OpenAI大佬AndrejKarpathy,在YC的演讲刷屏出圈!这是一场足以改变你对编程、对大模型、对未来软件形态理解的深度分享。Karpathy一开场就掷地有声地说:“软件正在再次发生根本性的变化。”这句话引爆了HackerNews社区热议——哪怕最初发布的只是一份错漏百出的转录稿,依旧挡不住大家的疯狂转发与评论。图片而在X上,YC创始...
51CTO技术栈
0回复
1812浏览
AI
Cursor
Agent
DeepCoder-14B:提升开发者生产力与创新的开源AI模型
原创
社区头条
人工智能(AI)正在改变软件的开发方式。AI驱动的代码生成器已成为重要的工具,帮助开发者更高效地编写、调试和完成代码。在这些新型智能助手中,DeepCoder14B不仅因其强大的技术能力,也因其开源性质而受到关注。与许多流行但封闭且专有的AI模型不同,DeepCoder14B公开分享其设计、训练数据和源代码。这种开放性有助于世界各地的开发者自由探索、改进和使用该模型。通过这样做,DeepCoder14B正在为软件开发开辟新的可能性,并鼓...
51CTO内容精选
0回复
899浏览
人工智能
AI
DeepCoder-14B
阿里推出 LingShu AI医生:统一多模态医学理解与推理的通用基础模型
社区头条
核心速览多模态大型语言模型(MLLMs)在理解常见视觉元素(如风景、家居用品和公共事件)方面展现了令人印象深刻的能力,这主要归功于其大规模数据集和先进的训练策略。然而,由于医学场景中的数据和任务与一般领域存在固有差异,它们在医学应用中的有效性仍然有限。具体来说,现有的医学MLLMs面临以下关键限制:(1)对医学知识(超出影像学范围)的覆盖有限;(2)由于数据策展流程不佳,容易产生幻觉;(3)缺乏针对复杂医学...
知识图谱科技
0回复
2258浏览
多模态
LingShu AI
MLLMs
FinLoRA:在金融数据集上微调LLM的基准LoRA方法,性能提升36%
大型语言模型(LLMs)在金融、医疗、法律、教育和科学发现等领域表现出色,但在专业金融任务中仍存在性能不足。本文提出FinLoRA基准,评估不同LoRA变体在复杂金融任务中的表现。创建19个金融数据集,包括4个新XBRL分析数据集,支持LoRA方法的评估。实施并比较五种LoRA方法,平均提高36%准确率,验证低秩适应和量化的有效性。摘要FinLoRA项目基于LoRA方法,评估其在金融领域的应用,特别是CFA考试和SEC文件分析。研究中使用了19...
灵度智能
0回复
1231浏览
LLM
LoRA
FinLoRA
金融多模式大模型综述:进展、前景和挑战
金融大语言模型(FinLLMs)在金融服务的某些领域显示出巨大的潜力。多模态金融基础模型(MFFMs)可以理解多模态金融数据,包括基础数据、市场数据、数据分析、宏观经济和替代数据(例如,自然语言、音频、图像和视频)。本文在MFFMWorkshop上介绍了多模态金融基础模型(MFFMs)的进展、前景和挑战,强调了哥伦比亚大学SecureFinAI实验室的FinAgents研究。列出了多模态金融数据和数据中心方法,描述了多模态金融应用,展望AI代理...
灵度智能
0回复
1546浏览
金融
多模式
大模型
什么是神经网络---LSTM模型实例讲解
LSTM的关键在于它的“记忆单元”,能够选择性地记住或者忘记信息。其核心组件包括三个门和一个记忆单元:1.遗忘门(ForgetGate):决定应该丢弃哪些信息。2.输入门(InputGate):决定更新哪些新的信息。3.输出门(OutputGate):决定当前状态如何影响输出。数学公式解释遗忘门:ftσ(Wf⋅[ht−1,xt]+bf)遗忘门决定了上一时刻的状态Ct−1中,哪些信息需要保留,哪些需要丢弃。值域为[0,1],1表示完全保留,0表示完全丢弃。输入...
人工智能训练营
0回复
1878浏览
神经网络
LSTM
模型
XGboost算法详解(原理+公式推导)
XGBoost是华盛顿大学博士陈天奇创造的一个梯度提升(GradientBoosting)的开源框架。至今可以算是各种数据比赛中的大杀器,被大家广泛地运用。接下来,就详细介绍一下XGBoost的原理和公式推导。XGBoost其实是一个树集成模型,他将K(树的个数)个树的结果进行求和,作为最终的预测值。好比接下来有两颗决策树:tree1和tree2。小男孩的回归预测分数是tree1叶子结点的权重和tree2叶子结点的权重相加:2+0.92.9。爷爷的预测分数同...
人工智能训练营
0回复
2813浏览
Xgboost
算法
集成模型
Anthropic 工程实践《如何构建多智能体研究系统》
一、多智能体系统的优点应对研究工作的不可预测性:研究工作通常面临开放性问题,难以提前预知所需步骤。多智能体系统能够根据调查过程中出现的新线索动态调整研究方向,与人类研究者类似,自主决策探索路径,适应复杂多变的研究主题,避免了线性、一次性流程的局限性。促进信息压缩与专注:子智能体通过并行处理不同问题方面,利用各自独立的上下文窗口,同时探索问题的多个维度,之后提炼出重要信息传递给主研究智能体,实现...
CourseAI
0回复
1445浏览
Anthropic
工程
多智能体
蚂蚁多模态统一框架Ming-Omni:能看懂世界、会说话、还能画画
一、多模态训练的诸多难点多模态模型在处理不同模态数据时(如文本、图像、音频和视频)需要面临许多挑战:模态间的表示差异:不同模态的数据在特征表示上存在显著差异。例如,图像数据通常是像素级的二维信息,而文本数据是离散的符号序列,音频数据则是连续的时间序列。这种差异使得在单一模型中融合多种模态变得困难。训练过程中的收敛速度不一致:不同模态的数据量和复杂度不同,导致模型在训练过程中,各模态的收敛速度不...
CourseAI
0回复
1391浏览
多模态
Ming-Omni
Agent
Next-Level Agents:释放动态上下文(Dynamic Context)的巨大潜力
原创
精华
编者按:本文深入探讨了如何通过优化动态上下文信息(DynamicContext)来提升AIAgents的工作效率和准确性。文章首先概述了五种常见的技术策略,包括信息标识(MessageLabeling)、针对不同需求设定不同上下文、优化系统提示词(SystemPrompts)、精简RAG系统中冗余信息,以及其他处理上下文的高级策略。随后,作者分享了一些技术实施细节和经验教训,这些教训虽然源自与Multiagent团队在实际生产环境中的长期合作实践,但对于single...
Baihai_IDP
1回复
5193浏览
LLMs
人工智能
AI Agents
白海科技
28岁华裔天才身价百亿,却呼吁抵制中国AI
社区头条
前不久,扎克伯格花148亿美元收购了一家初创企业——ScaleAI。手笔之大,堪称目前AI领域最大一笔投资之一。而这家公司的创始人,是一名年仅28岁的天才华裔亚历山大·王。  他出生在新墨西哥州一个学术氛围浓厚的家庭中,19岁时,已凭借超凡的计算机天赋在麻省理工学院崭露头角,成为硅谷猎头们竞相追逐的对象。但这位天才少年却如同曾经的科技神话比尔盖茨,选择了一条出人意料的道路:中断学业,创立了专注数据标注...
算家计算
0回复
1092浏览
亚历山大王
Scale AI
Meta
中国AI
算家云
视频去物“魔法橡皮擦”来了!MiniMax-Remover:新SOTA方法告别CFG,六步搞定
论文链接:https:arxiv.orgpdf2505.24873项目链接:https:minimaxremover.github.io亮点直击提出了一种轻量且高效的基于DiT的视频目标移除架构。MiniMaxRemover。受到“文本提示并不适合目标移除任务”这一观察的启发,用可学习的对比tokens(contrastivetokens)替代了文本条件,用于控制移除过程。这些tokens被直接集成到自注意力流中,能够移除预训练视频生成模型中的所有交叉注意力层。在第一阶段中,本文模型参数更少,并...
zhangyannni
0回复
1467浏览
视频生成
模型
训练
AI记忆革命:能否突破数据牢笼,媲美人脑的适应性?
原创
社区头条
本文旨在全面介绍开源框架Titans。Titans是一种为LLM配备受人类启发的记忆的新架构,它能够在测试期间进行自我学习和更新。本文要讨论什么内容?Meta公司努力开发出的CoCoMix(ContinuousConceptMixing:连续概念混合,出自Jihoon等人2025年发表的论文,见【引文1】)框架实现了概念学习,即学习单词背后的概念而不是仅仅预测下一个标记,从而使其具有极强的可操控性和可解释性。但是,依然存在一个核心问题:即使是...
51CTO内容精选
0回复
1581浏览
LLM
Titans
AI
亚马逊首席执行官:Agent化的未来对于亚马逊格外重要!谁能精通,谁就能在这家公司产生巨大的影响力
原创
社区头条
编辑|云昭当地时间本周二,亚马逊首席执行官AndyJassy在给员工的一份备忘录中表示:Agent化的未来,对亚马逊而言格外重要;接下来几个月,我们会进一步加码,让开发Agent变得更容易。而同时,生成式AI和Agent的落地公司的工作方式必然发生改变。“某些岗位会减少,新的岗位也会出现。具体最终会是怎样的平衡还不好判断,但可以确定的是,未来几年,随着AI大规模应用,我们的企业职能员工数量将有所下降。”Jassy表示自己在28年...
51CTO技术栈
0回复
850浏览
Agent
亚马逊
人工智能
AI智能体协议全面综述:从碎片化到互联互通的智能体网络
《人工智能智能体协议调研》是上海交通大学杨映璇、柴华灿、宋远逸等学者撰写的一项综合性研究报告。该报告首次对现有的AI智能体协议进行了全面分析,提出了一个系统的二维分类框架,区分了面向上下文的协议与智能体间协议,以及通用型与特定领域的协议。报告指出,随着大型语言模型(LLM)的快速发展,LLM智能体已在客户服务、内容生成、数据分析和医疗等多个行业广泛部署,但由于缺乏标准化的通信协议,使智能体之间难以有效协...
欧米伽未来研究所
0回复
912浏览
AI
智能体
网络
暂无内容
1
94
95
96
97
98
99
100
101
102
客服