51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
智能体
GPT-5
阿里版“Her”上线即开源!7B模型太全能了,全面击败Gemini-1.5-pro!所有用户都能试玩!
原创
出品51CTO技术栈(微信号:blog51cto)QwenChat上新实时语音聊天+视频聊天了!可以像打电话或视频通话一样与AI进行聊天,Qwen也有自己的Her了。更更重要的是,一向大方开源的千问,直接开源了背后的模型Qwen2.5Omni7B(Apache2.0许可),并发布了详细的技术报告!做了OpenAI应该干的事!QwenChat:https:chat.qwenlm.aiGitHub:https:github.comQwenLMQwen2.5Omni目前每天有10次体验机会:图片图片Qwen2.5Omni7B...
51CTO技术栈
0回复
1924浏览
7B模型
Gemini-1.5
开源
AI Infra的起飞前夜,跟两位创业者聊了两小时,从DeepSeek的中国朋友圈,到AI基建演进的价值铁律
原创
作者云昭嘉宾黄新平、谭中意出品51CTO技术栈(微信号:blog51cto)“人生不无聊,有太多变化,太多好玩的事情发生。”的确,近期围绕DeepSeek的新发布实在太多了,乱花渐欲迷人眼。从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1,到DeepSeek一体机的出圈,再到国民应用微信的接入,潮潮迭起。可以说,从B端到C端,几乎彻底沸腾了。“几乎所有做智能体的公司都很兴奋,寻找落地机会,还有做企业级应用、知识库的公司...
51CTO技术栈
0回复
2206浏览
AI
DeepSeek
英特尔
RAG只能应用于文本检索吗?关于大模型应用之RAG——检索增强的思考
原创
“RAG是一项入门很简单,但实际操作起来却很困难的技术之一;RAG是模型无关的独立技术栈,它的核心是文档和检索,RAG本身并不具备生成的能力,结合模型才具备生成能力”最近在做RAG方面的应用,关于RAG技术很多人应该都了解过,毕竟其也算是大模型应用的一个主要方向;具体应用场景有智能客服,搜索引擎优化,教育辅助等。在传统的印象中,RAG技术结合LLM(LargeLanguageModel)大语言模型,做文档类检索增强;但RAG仅仅只能用来...
AI探索时代
0回复
1892浏览
RAG
大模型应用
大模型
关于智能体Agent的实现技术之思维链和函数调用(function call)的思考
原创
“智能体是未来人工智能的一个重要应用技术,而其难点就在于怎么让大模型具备更好的独立思考和任务拆解与规划的能力。”Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。今天我们就从Agent的两个实...
AI探索时代
0回复
2060浏览
智能体
Agent
Agentic RAG 目前最强大的RAG实现方式
原创
1、什么是RAG?🍓RAG作为一种提升生成式AI模型表现的框架,通过检索外部知识源,增强生成内容的准确性与丰富度。AIAgent则是具备感知、推理、行动和学习能力的自主软件系统,能在复杂环境中完成任务。二者结合,让AI系统拥有更强大的功能。.💎传统RAG存在检索时机难定、文档质量不佳、易生成错误信息等问题。AgenticRAG系统有效解决了这些痛点,在客户支持、内容创作、研究辅助、工作流自动化等场景广泛应用。例如在客户支持中...
数字化助推器
0回复
4487浏览
RAG
Agentic RAG
AI架构系列:picoLLM 大模型的量化魔术师
原创
Picovoice首席执行官AlirezaKenarsari指出,“picoLLM是Picovoice深度学习研究人员和量产工程师共同努力的成果。前者研究出X位量化算法,而后者构建了跨平台的LLM推理引擎。目的还是在于将LLM遍及到任何设备且将控制权交还给企业”。picoLLMInference可以免费使用,没有任何使用限制。无论是在概念验证上工作,还是为数百万用户提供服务。只需几行代码即可部署。注:其余的产品线有非商用免费版,也有收费版1.认识量化(Quantiz...
鲁班模锤1
0回复
1986浏览
AI
架构
大模型
从词语到概念:大概念模型如何重新定义语言理解与生成
原创
近年来,大型语言模型(LLMs)在生成类人文本、翻译语言和回答复杂问题方面取得了显著进展。然而,尽管LLMs能力惊人,它们本质上仍是通过基于上文预测下一个词或标记来运作。这种方法限制了它们在深层理解、逻辑推理和复杂任务中长期保持连贯性的能力。为解决这些挑战,人工智能领域出现了一种新架构:大概念模型(LCMs)。与传统LLMs不同,LCMs不仅关注单个词语,而是以完整概念为操作对象,这些概念代表句子或短语中蕴含的完...
51CTO内容精选
0回复
1796浏览
大概念模型
LCMs
大型语言模型
Gemini2.5 Pro测试,代码能力飙升,但多模态表格解析依旧不理想
国内Qwen是汪峰,国外Google是汪峰,昨天Google更新,放出新模型Gemini2.5Pro,凌晨OpenAI更新GPT4o,上新图像生成功能,难受住了。GPT4o没测,但是网上的效果也太好了吧,倒影啥的都太自然了吧。。这篇主要测试Gemini2.5Pro的能力,整体测试通过Google的AIStudio上测试,每天免费50次,正常使用够了,爽玩还是不够的。https:aistudio.google.comGemini2.5Pro在Benchmark上效果还是很好的,甚至在lmsys的对战榜单上,现在是第一...
NLP工作站
0回复
3267浏览
Gemini2.5
代码
多模态
MES-RAG:准确率提升 25%!
MESRAG框架,专为提升实体查询处理能力而设计,确保响应的准确、安全与一致。MESRAG采用主动安全措施,通过预先保护机制确保数据访问安全。此外,该系统支持实时多模态输出,包括文本、图像、音频和视频,无缝融入现有RAG架构。一、为什么需要MESRAG技术?1.1传统RAG系统的局限性传统的检索增强生成(RetrievalAugmentedGeneration,RAG)系统虽然在提升大语言模型(LargeLanguageModels,LLMs)的能力方面表现出色,但它们往往只...
大语言模型论文跟踪
0回复
1848浏览
MES-RAG
多模态
LLMs
开源:9个GraphRAG框架大一统
精华
构建了一个涵盖所有基于图的RAG方法的统一框架,并从宏观角度进行了总结。接着,在不同类型的问答(QA)数据集上对具有代表性的基于图的RAG方法进行了全面比较,从具体问题到抽象问题,深入分析了各种方法的表现。通过实验分析,不仅揭示了基于图的RAG方法的有效性,还通过结合现有技术,在具体问答和抽象问答任务中发现了优于现有最优方法的新变体。https:arxiv.orgpdf2503.04338一、为什么需要图检索增强生成(Graphb...
大语言模型论文跟踪
0回复
3515浏览
GraphRAG
框架
数据
Google Gemma 3:性能“炸裂”还是榜单优化?
一、背景最近几天Google发布了最新的Gemma3系列开源模型,迅速成为业界热议的焦点,其中,Gemma327BIT模型尤为引人注目。如下图所示为Google广泛宣传的Gemma327BIT模型在ChatbotArenaLeaderboard[1]上的表现,以27B的参数量,不仅超越了更大参数量的DeepSeekV3(实际激活参数量差不多),并且接近顶尖的DeepSeekR1。事实上性能真的这么“炸裂”吗?还是面向ChatbotArena的优化?值得注意的是,ChatbotArena的排名基于用户盲测投...
amei2000go
0回复
3637浏览
性能
优化
Gemma 3
TinyR1-32B-Preview: 通过全新分支合并蒸馏技术让大模型瘦身不掉智商
图片图1:(A)我们的分支合并蒸馏方法的简化图解。(1)在分支阶段,初始模型(骨干网络)的每个副本都在不同领域的知识上进行训练;(2)在合并阶段,模型基于ArceeFusion规则进行合并。(B)不同LLM模型的性能比较(Mustar,2025)。TinyR132BPreview在科学、数学和编程领域的表现优于同等规模的蒸馏模型,并达到了与DeepseekR1相当的结果。这里的LiveCodeBench指的是完整LiveCodeBench的24.0825.02子集。你是否好奇:为什么大语言模型一...
sbf_2000
0回复
2056浏览
分支合并
蒸馏
模型
生成式AI人机协同有哪几种模式?
原创
当今科技的浪潮席卷而来,生成式人工智能(AI)正成为这场数字革命的中坚力量。在这个迅速演进的领域中,我们见证了一个接一个的创新和人机交互方式的变革。人机协同(humanmachinesynergy)就是将人和机器组成一个团队,集成人类智能和人工智能,促进人机自主交互,协作共赢。人工智能研究的主要驱动力一直是机器与人类认知的协作与竞争,如机器在国际象棋中击败人类或者通过图灵测试,从而证明要么是机器比人类更好,要么是人类...
数字化助推器
0回复
8205浏览
生成式AI
Search-R1:让大模型学会“检索+推理”的新范式
今天分享一篇伊利诺伊大学的文章,标题为:SearchR1:TrainingLLMstoReasonandLeverageSearchEngineswithReinforcementLearning(SearchR1:利用强化学习训练LLM进行推理并利用搜索引擎)。这篇文章是关于如何训练大型语言模型(LLMs)有效地利用搜索引擎来增强其推理和文本生成能力。论文提出了一个名为SEARCHR1的框架,该框架仅仅通过强化学习(RL)让LLM学习如何在逐步推理过程中自主生成搜索查询并与实时检索交互。该方法特...
arnoldzhw
0回复
2556浏览
大模型
检索
推理
劲速云算力:以真性价比与硬核实力,赋能 AI 创新加速
在AI技术爆发式发展的今天,算力已成为驱动行业变革的核心引擎。无论是算法迭代、模型训练还是数据处理,高效稳定的算力支持都是企业与开发者突破瓶颈的关键。劲速云凭借“高可靠、高性能、高性价比”的核心理念,正以全国布局的算力网络与创新技术,为全球AI开发者与企业提供坚实的算力底座,助力其在智能时代抢占先机。一、万卡集群+智能调度:打破资源壁垒劲速云在全国12大算力枢纽(内蒙古、广东、江苏、湖北等)部署了万卡...
AI算力补给站
0回复
1879浏览
劲速云算力
算力租赁
4090显卡
AI创新
算力
音乐界的DeepSeek来了!全球首个音乐推理大模型Mureka O1上线,音乐领域要迎来大变革了?
国产大模型再次引爆了科技领域。3月26日,昆仑万维发布了最新音乐大模型MurekaV6和O1,给全球音乐圈带来了不小的震撼。MurekaO1是全球首个引入CoT的音乐推理大模型。在文本、视觉任务之外,强推理、慢思考这一强大能力终于融合到了音乐领域。MurekaV6则创下了两个全球记录:一是全球首批开放(五种)API服务的高质量AI音乐生成平台。开发者和音乐平台可以将Mureka的音乐生成能力无缝集成到自家产品或平台中,加速AI音乐创作的应...
算家计算
0回复
2094浏览
Mureka
Mureka o1
昆仑万物
算家云
音乐推理大模型
AI巨头画饼被戳穿!研究员警告:比起专注开发诺奖级AI,取代白领工作更有利可图!
原创
许多AI大佬都给我们画过同样的饼——AI可以成为科学家。不仅如此,根据他们的说法:诺奖级AI近在眼前,届时所有的研发工作将被自动化,世界也会因为各种科学突破变得愈发繁荣和美好。OpenAI奥特曼曾表示,AI可能会像晶体管一样,成为一种可广泛扩展并渗透到经济各个角落的重大突破。虽然他的观点较为温和,但他仍然认为AI在推动科学进步方面的影响“将超越其他一切”。DeepMindCEODemisHassabis也对AI在研发领域的影响持乐观态...
51CTO技术栈
0回复
1861浏览
AI
办公软件
Agent
别让大模型想太多了,过度思考会影响性能
加州大学伯克利分校、苏黎世联邦理工学院等多所高校的研究人员,深入剖析了大模型在执行Agent任务时面临的困境——过度思考。为了量化这种行为,研究人员开发了一套系统评估框架,并通过4018条轨迹分析发现,高推理努力配置的模型虽然解决了29.1%的问题,但成本高达1400美元;而低推理努力配置则以3.5倍更低的成本达到了21.0%的成功率。此外,生成两个低推理解决方案并选择其中一个具有较低过度思考得分的方法,实现了27.3%的解...
Aceryt
0回复
1962浏览
模型
生成
AI
刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
精华
今天凌晨2点,OpenAI进行了技术直播,对GPT4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。尤其是生成图像的逼真度,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。新图像模型功能展示...
Aceryt
0回复
2432浏览
模型
生成
AI
实操干货!MCP 全解析,手把手教你基于 MCP 开发 Agent
原创
随着Manus推动Agent应用的火爆,MCP(模型上下文协议)成为众多社区热议的焦点。今天,我们将深入解析MCP并提供实操应用指南。相信读完这篇文章,你就能立刻上手MCP。1、MCP架构设计全剖析第一、为什么会出现MCP?如果你开发了一个AI应用,无论是ChatBot还是复杂的Agent,都不会仅限于简单的LLM对话。很多时候,你需要与外部世界连接,以访问数据源或使用工具。例如:操控浏览器实现自动化;访问本地文件;访问数据库结构,以便...
玄姐聊AGI
0回复
1.7w浏览
Agent
智能体
暂无内容
1
143
144
145
146
147
148
149
150
151
客服