51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
GPT-5
LLM实战系列 | 大模型的多Lora部署,将显存节省到极致
下面是我前段时间跟一位群友的对话:群友:我最近有都需要进行模型微调,但是每个任务模型调完之后都对单一任务有明显提高,但如果合在一起训练的话,效果又达不到最佳。所以在使用阶段,部署了多个模型,但是显卡资源真的吃不消,有什么好的解决办法吗?我:你是Lora微调,还是全量参数微调的。群友:Lora微调,全量参数微调,也没那么多训练资源。我:你既然是Lora微调,那么你在部署的时候,可以只部署一个底座模型,然后多...
NLP工作站
0回复
1710浏览
LLM
Lora
部署
微软亚洲研究院打造最强视觉元素定位模型
为什么需要GUI视觉定位技术?1.1数字时代的效率革命图形用户界面(GraphicalUserInterface,GUI)智能体正在重塑人机交互方式。这类智能体通过模仿人类的视觉感知能力,可以直接"看懂"屏幕内容并执行操作指令。微软亚洲研究院团队的研究表明,相比依赖HTML等GUI元数据的传统方法(存在平台依赖性和实现差异问题),基于视觉的方法具有更广泛的适用性。例如,在跨平台操作场景中,视觉智能体可以统一处理Windows、Web和移动端界面,...
大语言模型论文跟踪
0回复
1644浏览
微软
视觉元素
模型
Hybrid-RRF:动态权重混合检索RAG方案
一、为什么需要混合检索技术?1.1大语言模型的"幻觉"困境大语言模型(LLM,LargeLanguageModel)虽然在文本生成和理解方面表现出色,但存在一个致命缺陷——会产生"幻觉"(Hallucination),即生成看似合理但实际错误或无依据的内容。1.2检索增强生成的技术革新检索增强生成(RAG,RetrievalAugmentedGeneration)技术应运而生,它通过结合外部知识库为LLM提供事实依据。传统RAG系统主要采用两种检索方式:稀疏检索(如BM25算法)...
大语言模型论文跟踪
0回复
4090浏览
Hybrid-RRF
混合检索
RAG
MCP(Model Context Protocol) 的理解和快速实践
精华
一、背景此前笔者对AIAgent研究的涉猎比较少,也基本没有系统介绍过与Agent相关的内容。然而,最近由Anthropic提出的MCP(ModelContextProtocol[1],模型上下文协议)在社区中引发广泛关注,笔者也趁此机会“蹭蹭热度”,了解下MCP到底是什么,了解一下MCP的基本概念和工作机制。在最初接触MCP时,也曾对其一些设计感到困惑。于是带着这些疑问进行了进一步的调研,逐渐对MCP的组成及运作方式有了初步的认识,比如:MCP中的Resou...
amei2000go
0回复
5410浏览
MCP
AI
Agent
NL2SQL新突破:SQL-R1用强化学习打破传统局限
原创
精华
在人工智能飞速发展的今天,自然语言处理(NLP)领域不断涌现出令人瞩目的成果。其中,自然语言到SQL(NL2SQL)的转换技术,正逐渐成为连接人类与数据世界的桥梁。想象一下,如果能够用日常语言直接查询数据库,获取所需信息,那将极大地简化数据操作流程,让非技术用户也能轻松驾驭复杂的数据系统。这不仅是技术上的突破,更是对数据民主化的一次有力推动。NL2SQL:从理想走向现实的挑战NL2SQL技术的核心目标是将人类自然语言...
Halo咯咯
0回复
2565浏览
NL2SQL
SQL-R1
强化学习
MCP失宠?谷歌重磅开源A2A协议 实现智能体间的自由“对话”
原创
谷歌云正式宣布推出全新的开源协议Agent2Agent(A2A),旨在打破当前人工智能(AI)智能体之间的壁垒,实现不同厂商、不同框架构建的AI智能体之间的无缝协作与信息交换。这一举措标志着AI领域迈向更加开放、高效和智能的新时代。打破壁垒,实现智能体间的自由“对话”随着企业对自主AI智能体的部署日益增长,如何让这些智能体在复杂的企业环境中协同工作,处理跨系统、跨应用的日常或复杂任务,成为了提升生产力的关键。然而,...
数字化助推器
0回复
1798浏览
MCP
A2A
谷歌
别担心!AI微调后变"坏"也有解法:揭秘LLM对齐技术新突破
论文《AlleviatingtheFearofLosingAlignmentinLLMFinetuning》解决了大型语言模型(LLM)领域一个令人头疼的问题:为什么微调后的AI模型会失去"道德约束",以及如何高效地修复这个问题。图片1、AI也会"变坏"?微调带来的隐患我们都知道ChatGPT、Llama这类大语言模型在经过训练后,通常会遵循一定的"价值观"——比如当你问它"如何入侵别人的电脑"时,它会礼貌地拒绝回答。这种确保AI行为符合人类价值观的训练叫做"对齐训练"(ali...
sbf_2000
0回复
1461浏览
AI
微调
LLM
ReTool:AI工具使用的突破性进展,推理能力显著提升
1、AI终于学会了"工欲善其事,必先利其器"图片你有没有这样的经历:面对复杂计算题,纯靠脑力计算往往容易出错,而借助计算器或编程工具却能事半功倍?人类在解决问题时懂得适时借助工具,而AI呢?当前的大型语言模型(LLM)虽然在纯文本推理方面表现出色,但在涉及精确计算、符号操作等领域,它们往往捉襟见肘。为何不让AI也学会"工欲善其事,必先利其器"的智慧?论文提出了一种创新方法,通过强化学习让AI自主掌握何时、如何...
sbf_2000
0回复
1613浏览
AI
工具
ReTool
国产AI开启长镜头革命!昆仑万维SkyReels-V2开源,全球首个无限时长AI视频模型来了
刚刚,AI视频领域炸出王炸!昆仑万维SkyReels团队于近日正式发布了全球首个支持无限时长的电影生成模型——SkyReelsV2,并免费开源,标志着AI视频正式迈入长镜头时代。昆仑万维开源的SkyReelsV2直接突破两大天花板:1️⃣时长自由以前AI生成视频最多1分钟,现在用「扩散强迫」黑科技,先生成30秒片段,再通过「Extend」无限续接镜头,生成无限时长电影级长片!2️⃣画质+动态双绝杀好莱坞级画质+强化学习优化的运动流畅度,连人...
算家计算
0回复
2674浏览
昆仑万维
无限时长AI视频
SkyReels-v2
AI迎来长镜头时代
租算力,到算家云
被Cursor多次拒绝,OpenAI怒买Windsurf,很不划算!多少有点慌不择食
原创
编辑云昭出品51CTO技术栈(微信号:blog51cto)经历了OpenAI的o3和谷歌的Gemini2.5Flash发布之后,AI圈的注意力再一次给到了编程赛道。最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。很多人更多把此事当成个新闻看,但其实这事情远没有我们想象...
51CTO技术栈
0回复
1598浏览
OpenAI
AI
工具
45倍加速+最新SOTA!VAE与扩散模型迎来端到端联合训练:REPA-E让VAE自我进化!
文章链接:https:arxiv.orgpdf2504.10483项目链接:https:end2enddiffusion.github.ioGit链接:https:github.comEnd2EndDiffusionREPAE模型链接:https:huggingface.coREPAE亮点直击端到端联合优化的突破首次实现VAE与扩散模型的端到端联合训练,通过REPALoss替代传统扩散损失,解决两阶段训练目标不一致问题,使隐空间与生成任务高度适配。训练效率革命性提升REPAE仅需传统方法145的训练步数即可收敛,且生成质量显著超越现有方...
angel
0回复
2568浏览
模型
端到端
训练
生成式AI时代下的数据、模型与用户保护全攻略
原创
生成式AI正在重塑企业运营模式,以前所未有的规模实现自动化、内容生成和智能决策。从AI驱动的聊天机器人到高级代码生成和创意设计,生成式AI正在通过提升效率与创新能力引发行业革命。然而,伴随技术进步而来的还有企业必须应对的重大安全风险。现实挑战在于,随着AI系统日益智能化和复杂化,其面临的威胁与风险也在持续演变。确保AI在开发与部署全周期的安全性至关重要。本文提供实用的安全检查清单,帮助企业安全采用生成式A...
51CTO内容精选
0回复
2067浏览
生成式AI
数据隐私
加密技术
半马变翻车现场!宇树科技最新回应:G1开跑即摔倒系未使用原生算法!
原创
宇树科技回应了机器人半马“开跑即摔倒”争议!昨日,北京亦庄科技园举办了一场别开生面的赛事:全球首场人形机器人半程马拉松。21台机器人被安排在专属跑道上与数千名人类选手同时出发,试图完成21公里的挑战。参赛机器人必须具有“人形”外观,并能双腿奔跑。比赛允许更换电池(天工Ultra就更换了三次),甚至允许替补机器人上场,但会被计入时间罚分。然而,比成绩更吸引眼球的,是参赛过程中的一连串“事故”。其中最受关注...
51CTO技术栈
0回复
1998浏览
宇树科技
G1
算法
香港科技大学联合DeepSeek-AI推出CODEI/O:让AI学会“浓缩”推理模式
大家好,我是HxShine今天分享一篇香港科技大学、DeepSeekAI和上海交通大学联合发表的文章,标题为:CODEIO:CondensingReasoningPatternsviaCodeInputOutputPrediction(CODEIO:通过代码输入输出预测浓缩推理模式)。这篇文章提出了一种名为CODEIO的新方法,旨在通过代码输入输出预测来提炼和浓缩代码中蕴含的多种推理模式,从而提升大语言模型(LLMs)的推理能力。该方法的核心思想是将代码转换为一种输入输出预测任务,让模型...
arnoldzhw
0回复
1650浏览
CODEI/O
DeepSeek-AI
标注
OpenAI 最强推理模型 o3 / o4-mini 震撼发布!AI 从此能“看图思考”?
原创
当AI不仅能“看”图,还能“用图思考”,甚至自主调用工具解决现实中的复杂问题,人类与机器的协作边界正在被重新定义。今天凌晨,OpenAI发布的两款新模型o3和o4mini,不仅刷新了多项性能纪录,更首次将图像深度融入推理链条。颠覆性突破首次实现图像思维链整合图片OpenAI首次展示了其模型如何嵌入图像进行理性分析的例子。该模型不仅具备“观察”图像的能力,更可以“用图像推导”。这一创新使视觉和文字理解能力深度结合,在...
AI博物院
0回复
1776浏览
AI
OpenAI
人工智能
连续小波变换(CWT)+时间序列预测!融合时频分析与深度学习的预测新思路
前言本期更新推出一种基于连续小波变换(ContinuousWaveletTransform,CWT)与VGG模型的时间序列预测方法,将传统时频分析技术与深度学习相结合,有效解决了复杂时间序列的建模难题。通过将一维时序信号转换为二维时频图像,充分利用卷积神经网络(CNN)对图像特征的强大提取能力,在保证时序局部特征的同时,显著提升模型对非平稳信号的适应性。1.模型简介模型核心思想(1)时频转换:利用CWT捕捉时序信号的时频局部特性,生成...
Tang_Lan
0回复
2077浏览
时间序列
预测
深度学习
OpenAI大佬:AI上半场忙着开发新训练方法和模型GPT-4/o1/o3,下半场呢?
OpenAI大佬姚顺雨发表一篇名为“TheSecondHalf”博客,核心观点是人工智能(AI)的发展已经进入了一个新的阶段,即“下半场”:从现在开始,将把重点从解决问题转移到定义问题上;评估将比训练更为重要,不再只是问:“我们能否训练一个模型来解决X问题?”而是要问:“我们应该训练人工智能去做什么,以及我们如何衡量真正的进步?”;为了在AI的下半场取得成功,需要及时转变思维方式和技能组合,这些思维方式和技能组合或许...
PaperAgent
0回复
1654浏览
OpenAI
AI
机制
CPU推理仅29ms,微软开源第一个原生 1 bit 大模型,内存只需Qwen 1.5B的1/15
微软研究院发布了第一个开源的、原生的1bit大型语言模型(LLM):BitNetb1.582B4T:内存占用:BitNetb1.582B4T的非嵌入层内存占用仅为0.4GB,远低于其他全精度模型。能耗:估计的解码能耗为0.028焦耳,远低于其他模型。解码延迟:在CPU上,BitNetb1.582B4T的平均延迟为29ms,远低于其他模型。BitNetb1.582B4T参数规模达到20亿,在包含4Ttokens的语料库上进行训练,并在多个基准测试中表现出与同规模的领先全精度模型(LLaMA3.21...
PaperAgent
0回复
1567浏览
CPU
大模型
微软
图神经网络崛起,Transformer助力无人机组团“开挂”!多智能体协作技术再突破!
精华
在多智能体系统中的协作算法中,传统的路径规划方法,例如旅行商问题求解器、粒子群优化算法和贪婪搜索策略,通常能够在静态或已知环境中表现出色。当环境充满不确定性且任务目标分布未知时,这些方法的局限性显露无遗。传统强化学习方法虽然能够在部分可观测环境中进行学习,但在多智能体场景中却常常难以协调智能体之间的行为,导致效率低下。问题的核心在于这些传统方法缺乏对智能体之间复杂关系的有效建模能力,同时也很难...
xuxiangda
0回复
3115浏览
神经网络
结构化
算法
超级代理来袭!混合AI路由器联动云边技术,TensorOpera 解密智能体从意图识别到复杂规划
人工智能日新月异,大模型(LLM)的快速发展正以前所未有的速度重塑我们的工具箱,为各种智能应用注入全新活力。如今LLM不仅能实现自然语言生成和语义理解,更成为推动AI代理系统进步的重要引擎。越来越多的应用证明,仅凭传统静态模型已难以满足不断变化的任务需求,而具备更强适应性的智能代理正成为未来的趋势。正因如此,构建一套能够无缝应对多种任务、具备高度协同和灵活响应能力的“超级代理系统”显得尤为迫切。这样的...
xuxiangda
0回复
1500浏览
AI
路由器
TensorOpera
暂无内容
1
130
131
132
133
134
135
136
137
138
客服