51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
模型
80亿参数的MiniCPM4:为边缘AI量身定制的高效语言模型
原创
精华
在当今数字化时代,语言模型已经成为人工智能系统的核心组件,广泛应用于多语言翻译、虚拟助手和自动化推理等任务。然而,这些功能强大的模型通常需要强大的云端基础设施来支持其训练和推理过程。这种依赖不仅会导致延迟和高昂的成本,还会引发隐私问题,限制了它们在资源受限的边缘设备上的部署。例如,像GPT和LLaMA这样拥有数十亿参数的模型,由于其庞大的体积和复杂的训练推理过程,无法在本地硬件上高效运行。它们对大规模...
Halo咯咯
0回复
795浏览
边缘AI
MiniCPM4
LLM
Qwen3 Embedding 深度解析
在检索增强生成(RAG)技术成为企业级AI应用核心架构的2025年,阿里巴巴通义实验室开源的Qwen3Embedding系列模型以70.58分登顶MTEB多语言排行榜,其80.68分的代码检索成绩更超越GoogleGemini模型8.1%。这一技术突破背后蕴含着从模型架构到训练范式的全面创新,本文将深入技术底层,解析Qwen3Embedding如何通过多维度技术创新重塑文本嵌入与重排序技术格局。一、简介Qwen3Embedding是基于Qwen3基础模型构建的新一代文本嵌入与重排...
鸿煊的学习笔记
0回复
771浏览
Qwen3
AI
模型
Qwen3 Embedding 数据生成技术深度解析:从 LLM 驱动合成到领域适配优化
精华
在Qwen3Embedding的技术体系中,数据生成模块通过大模型驱动的结构化合成框架突破了传统文本嵌入模型的训练数据瓶颈。这一创新不仅使模型在MTEB多语言排行榜以70.58分登顶,更在代码检索等专业领域实现80.68分的突破。以下结合官方技术报告与开源实践,详解数据生成的全流程技术细节。一、两阶段数据生成架构:从语义建模到查询生成1.1配置阶段:三维语义空间定义Qwen3采用Qwen332B大模型为文档生成结构化语义配置,通过三大维...
鸿煊的学习笔记
0回复
625浏览
Qwen3
数据生成
LLM
国产视频大模型霸榜全球!海螺02特效炸裂,好莱坞级大片10秒生成
原创
社区头条
前天深夜,MiniMax正式发布视频生成模型Hailuo02(海螺02),凭借惊人的物理特效,为视频生成领域带来了新的突破。  在ArtificialAnalysisVideoArena最新排名中,Hailuo02一举拿下全球第二,将谷歌Veo3、快手可灵2.0等巨头甩在身后。  值得一提的是,榜单前五名中,中国AI就占了四席——字节跳动Seedance1.0、MiniMaxHailuo02、快手可灵、生数科技。 极限物理表现惊艳全网 官方发布的预览视频呈...
算家计算
0回复
1089浏览
MiniMax
Hailuo 02
AI视频生成模型
国产大模型
大神Karpathy再谈氛围编程!AI开启软件重写潮!做通用Agent是炫技,所有AI应用要向Cursor学习
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)软件开发因AI有了根本性转变?刚刚,带火“VibeCoding”风潮的前OpenAI大佬AndrejKarpathy,在YC的演讲刷屏出圈!这是一场足以改变你对编程、对大模型、对未来软件形态理解的深度分享。Karpathy一开场就掷地有声地说:“软件正在再次发生根本性的变化。”这句话引爆了HackerNews社区热议——哪怕最初发布的只是一份错漏百出的转录稿,依旧挡不住大家的疯狂转发与评论。图片而在X上,YC创始...
51CTO技术栈
0回复
813浏览
AI
Cursor
Agent
真实世界AI造假惊现克星!清华GenWorld:用“物理一致性”让虚假视频无处遁形!
论文链接:https:arxiv.orgpdf2506.10975git地址:https:chenwl20.github.ioGenWorld亮点直击高质量真实场景数据集:GenWorld首次专注于现实世界场景(如自动驾驶),提供多样化、高逼真度的生成视频,弥补领域空白。物理合理性驱动检测:提出通过3D多视角一致性(而非传统像素瑕疵)区分生成视频,适应生成技术快速发展的挑战。简单有效的模型设计:SpannDetector仅需结合立体重建和时序模块即实现显著性能提升,为可解释检...
zhangyannni
0回复
759浏览
AI
视频生成
模型
大模型只是一个可插拔组件,提示词才是大模型应用的核心——提示词在大模型应用中扮演的重要角色
原创
“大模型只是一种可插拔组件,提示词才是核心。”关于提示词的重要性应该没什么好说的了,可以说现在所有的基于大模型构建的应用都是以提示词作为核心切入点;不管是RAG还是智能体,无外如是。对从事大模型应用的开发者来说,重要的不是大模型的部署和运维,其核心是怎么写好提示词;以目前市面上的开发框架或开源项目来看,大模型都是一个可插拔的组件,只要配置好模型参数,在业务场景中可以随意切换不同的模型。模型只是可插...
AI探索时代
0回复
459浏览
大模型
提示词
大模型应用
谷歌Gemini 2.5家族全面升级:Pro、Flash与Flash-Lite正式发布,AI推理能力再进化
原创
热门内容榜
• TOP3
2025年6月17日,谷歌正式宣布其Gemini2.5混合推理模型家族迎来重大更新,包括Gemini2.5Pro、Gemini2.5Flash以及全新轻量级模型Gemini2.5FlashLite。这一系列升级不仅强化了AI的推理能力,还在性能、成本与适用场景上进行了深度优化,标志着谷歌在多模态AI领域的进一步突破。Gemini2.5FlashLite基准测试表Gemini2.5Pro:复杂推理任务的终极选择作为谷歌AI技术的旗舰产品,Gemini2.5Pro在多项基准测试中表现卓越,甚至超越OpenAI...
AI博物院
0回复
1535浏览
谷歌
Gemini 2.5
AI推理
90.2%性能提升的背后: Claude 多智能体架构设计全解析
原创
社区头条
Claude现在拥有研究功能[1],可以在网络、GoogleWorkspace和任何集成中进行搜索,以完成复杂的任务。这个多智能体系统从原型到生产的旅程教会了我们关于系统架构,工具设计和prompt工程的关键教训。多代理系统由多个代理(LLMs在循环中自主使用工具)组成。我们的研究功能涉及一个代理,它根据用户查询计划研究过程,然后使用工具创建同时搜索信息的并行代理。具有多个代理的系统在代理协调、评估和可靠性方面引入了新的挑战。...
AI博物院
0回复
717浏览
Claude
多智能体
架构设计
DeepCoder-14B:提升开发者生产力与创新的开源AI模型
原创
社区头条
人工智能(AI)正在改变软件的开发方式。AI驱动的代码生成器已成为重要的工具,帮助开发者更高效地编写、调试和完成代码。在这些新型智能助手中,DeepCoder14B不仅因其强大的技术能力,也因其开源性质而受到关注。与许多流行但封闭且专有的AI模型不同,DeepCoder14B公开分享其设计、训练数据和源代码。这种开放性有助于世界各地的开发者自由探索、改进和使用该模型。通过这样做,DeepCoder14B正在为软件开发开辟新的可能性,并鼓...
51CTO内容精选
0回复
367浏览
人工智能
AI
DeepCoder-14B
阿里推出 LingShu AI医生:统一多模态医学理解与推理的通用基础模型
社区头条
核心速览多模态大型语言模型(MLLMs)在理解常见视觉元素(如风景、家居用品和公共事件)方面展现了令人印象深刻的能力,这主要归功于其大规模数据集和先进的训练策略。然而,由于医学场景中的数据和任务与一般领域存在固有差异,它们在医学应用中的有效性仍然有限。具体来说,现有的医学MLLMs面临以下关键限制:(1)对医学知识(超出影像学范围)的覆盖有限;(2)由于数据策展流程不佳,容易产生幻觉;(3)缺乏针对复杂医学...
知识图谱科技
0回复
935浏览
多模态
LingShu AI
MLLMs
FinLoRA:在金融数据集上微调LLM的基准LoRA方法,性能提升36%
大型语言模型(LLMs)在金融、医疗、法律、教育和科学发现等领域表现出色,但在专业金融任务中仍存在性能不足。本文提出FinLoRA基准,评估不同LoRA变体在复杂金融任务中的表现。创建19个金融数据集,包括4个新XBRL分析数据集,支持LoRA方法的评估。实施并比较五种LoRA方法,平均提高36%准确率,验证低秩适应和量化的有效性。摘要FinLoRA项目基于LoRA方法,评估其在金融领域的应用,特别是CFA考试和SEC文件分析。研究中使用了19...
灵度智能
0回复
433浏览
LLM
LoRA
FinLoRA
金融多模式大模型综述:进展、前景和挑战
金融大语言模型(FinLLMs)在金融服务的某些领域显示出巨大的潜力。多模态金融基础模型(MFFMs)可以理解多模态金融数据,包括基础数据、市场数据、数据分析、宏观经济和替代数据(例如,自然语言、音频、图像和视频)。本文在MFFMWorkshop上介绍了多模态金融基础模型(MFFMs)的进展、前景和挑战,强调了哥伦比亚大学SecureFinAI实验室的FinAgents研究。列出了多模态金融数据和数据中心方法,描述了多模态金融应用,展望AI代理...
灵度智能
0回复
770浏览
金融
多模式
大模型
都在搞MCP,但是我还是要讲一下大模型的函数调用
函数调用(functioncalling)是一种机制,允许大语言模型(LLM)通过调用外部函数或API执行特定的、预定义的任务。可以将其视为一种功能,让LLM将它无法独立完成的工作“委托”出去。例如,假设您向LLM发送以下提示:“特斯拉当前的股价是多少?”没有函数调用的基本LLM可能会根据其训练数据中的模式“幻觉”出一个答案,例如“可能在200美元左右”。经过RLHF优化的模型可能会更诚实地说:“我没有实时数据,所以无法告诉你。”...
PyTorch研习社
0回复
690浏览
MCP
大模型
函数
不需要RAG!在30分钟内构建一个问答AI智能体
社区头条
2025年的RAG大反思我们的目标不是抨击RAG(它仍有其用武之地!),而是通过一个实际案例来探索2025年的技术趋势。我们将构建一个传统上会使用RAG的系统,但采用一种完全不同的、越来越流行的方法。通过本文,你将了解:•为什么“直接访问源数据”的方法(gotosource)因工具调用(toolcalling)和模型上下文协议(MCP)而逐渐受到关注。•RAG仍然适用的场景(剧透:比你想象的少)。•如何构建一个用户喜爱的实用替代方案。•...
PyTorch研习社
0回复
658浏览
RAG
AI
智能体
什么是神经网络---LSTM模型实例讲解
LSTM的关键在于它的“记忆单元”,能够选择性地记住或者忘记信息。其核心组件包括三个门和一个记忆单元:1.遗忘门(ForgetGate):决定应该丢弃哪些信息。2.输入门(InputGate):决定更新哪些新的信息。3.输出门(OutputGate):决定当前状态如何影响输出。数学公式解释遗忘门:ftσ(Wf⋅[ht−1,xt]+bf)遗忘门决定了上一时刻的状态Ct−1中,哪些信息需要保留,哪些需要丢弃。值域为[0,1],1表示完全保留,0表示完全丢弃。输入...
人工智能训练营
0回复
1052浏览
神经网络
LSTM
模型
XGboost算法详解(原理+公式推导)
热门内容榜
• TOP8
XGBoost是华盛顿大学博士陈天奇创造的一个梯度提升(GradientBoosting)的开源框架。至今可以算是各种数据比赛中的大杀器,被大家广泛地运用。接下来,就详细介绍一下XGBoost的原理和公式推导。XGBoost其实是一个树集成模型,他将K(树的个数)个树的结果进行求和,作为最终的预测值。好比接下来有两颗决策树:tree1和tree2。小男孩的回归预测分数是tree1叶子结点的权重和tree2叶子结点的权重相加:2+0.92.9。爷爷的预测分数同...
人工智能训练营
0回复
1127浏览
Xgboost
算法
集成模型
Anthropic 工程实践《如何构建多智能体研究系统》
一、多智能体系统的优点应对研究工作的不可预测性:研究工作通常面临开放性问题,难以提前预知所需步骤。多智能体系统能够根据调查过程中出现的新线索动态调整研究方向,与人类研究者类似,自主决策探索路径,适应复杂多变的研究主题,避免了线性、一次性流程的局限性。促进信息压缩与专注:子智能体通过并行处理不同问题方面,利用各自独立的上下文窗口,同时探索问题的多个维度,之后提炼出重要信息传递给主研究智能体,实现...
CourseAI
0回复
686浏览
Anthropic
工程
多智能体
蚂蚁多模态统一框架Ming-Omni:能看懂世界、会说话、还能画画
一、多模态训练的诸多难点多模态模型在处理不同模态数据时(如文本、图像、音频和视频)需要面临许多挑战:模态间的表示差异:不同模态的数据在特征表示上存在显著差异。例如,图像数据通常是像素级的二维信息,而文本数据是离散的符号序列,音频数据则是连续的时间序列。这种差异使得在单一模型中融合多种模态变得困难。训练过程中的收敛速度不一致:不同模态的数据量和复杂度不同,导致模型在训练过程中,各模态的收敛速度不...
CourseAI
0回复
624浏览
多模态
Ming-Omni
Agent
Next-Level Agents:释放动态上下文(Dynamic Context)的巨大潜力
原创
精华
编者按:本文深入探讨了如何通过优化动态上下文信息(DynamicContext)来提升AIAgents的工作效率和准确性。文章首先概述了五种常见的技术策略,包括信息标识(MessageLabeling)、针对不同需求设定不同上下文、优化系统提示词(SystemPrompts)、精简RAG系统中冗余信息,以及其他处理上下文的高级策略。随后,作者分享了一些技术实施细节和经验教训,这些教训虽然源自与Multiagent团队在实际生产环境中的长期合作实践,但对于single...
Baihai_IDP
1回复
4390浏览
LLMs
人工智能
AI Agents
白海科技
暂无内容
1
2
3
4
5
6
7
8
9
10
客服