51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
模型
LLM
大规模AI推理再非难事:如何在Kubernetes上部署DeepSeek
原创
社区头条
随着人工智能的持续发展,高效、大规模部署AI驱动应用程序变得至关重要。而编排平台Kubernetes在管理容器化AI工作负载、确保可扩展性、弹性以及降低管理难度等方面,无疑将发挥不可替代的作用。在本文中,我们将共同了解如何在Kubernetes上部署DeepSeek,运用其强大的AI推理模型DeepSeekR1与OpenWebUI集成以实现无缝交互。一、为何选择Kubernetes?作为一款先进的推理模型,DeepSeek将受益于Kubernetes提供的强大容器化与编排...
51CTO内容精选
0回复
1359浏览
Kubernetes
DeepSeek
AI驱动
Mem0 让 AI 拥有超强记忆能力
社区头条
在人工智能(AI)领域,模型的规模和复杂性正在以前所未有的速度增长。这给AI系统的记忆管理带来了巨大挑战,因为传统的记忆管理技术已经难以满足需求。Mem0作为一种新兴的AI记忆管理系统,旨在解决这些挑战,并有可能成为未来AI记忆管理的关键技术。AI记忆管理的挑战传统的记忆管理技术在处理AI工作负载时面临着以下挑战:海量数据:AI模型,尤其是深度学习模型,通常需要处理海量数据,这需要大量的记忆来存储训练数据、模型参...
丢翅膀的鱼
0回复
3919浏览
Mem0
AI
API
Deepseek-R1,论文番外篇!
一篇对deepseekr1论文补漏的文章,做了很多额外的实验,内容很到位,标题:UnderstandingR1ZeroLikeTraining:ACriticalPerspective。论文地址:https:github.comsailsgunderstandr1zeroblobmainunderstandr1zero.pdf基础模型分析验证模板对几种基础模型的影响观察结果如下:模板对模型是回答question,还是补全question很重要测试的几个基础模型在RL之前已经具备数学解题能力Llama和DeepSeek模型使用R1模板时回答能力显著提升De...
NLP前沿1
0回复
1262浏览
Deepseek-R1
GRPO
模型
Qwen原生多模态开源,浅析一下!
Qwen2.5Omni7B开源,Qwen的第一个端到端的多模态模型,可以文本、图像、音频和视频输入,同时以流式方式生成文本和自然语音回复。提出了ThinkerTalker架构。PR还没合进去,要注意安装方式评测的榜似乎画的有点赶,看不出信息量。提出了一种新的位置嵌入,称为TMRoPE(时间对齐多模态RoPE),用于同步视频输入的时戳与音频。资源占用:理论值如下,实际要在高1.2倍,看起来消耗有点大。瞄下代码,关于输入,每个模态都有专门的处...
NLP前沿1
0回复
1597浏览
Qwen
原生
多模态
DeepSeek-V3:小版本升级,大能力进阶
社区头条
在人工智能领域,模型的迭代升级一直是推动技术进步的关键力量。近期,DeepSeek团队发布了DeepSeekV30324模型,虽然官方将其定义为小版本升级,但其带来的能力提升却令人瞩目。本文将详细介绍DeepSeekV30324模型的更新内容、技术亮点以及使用建议,帮助大家更好地了解和应用这一强大的AI模型。一、模型概述DeepSeekV30324模型于2025年3月24日发布,是DeepSeekV3的小版本升级版本。该版本在推理任务、前端开发能力、中文写作能力...
穿越时空111
0回复
1533浏览
DeepSeek-V3
小版本
AI
OpenAI也妥协了,全面拥抱MCP!
精华
SamAltman通过社交媒体宣布OpenAI将全面支持ModelContextProtocol(MCP),这意味着曾经引领行业的OpenAI,最终还是向这一由竞争对手Anthropic主导的开放协议低头了。OpenAI之前一直在推广自己的FunctionCall、GPTs和AgentSDK,试图建立自己的护城河。然而,随着越来越多的开发者和企业选择MCP,OpenAI不得不面对现实:标准之战已经落下帷幕,MCP赢了。a16z梳理的mcpmarketMCP已显著垄断了AIApps&Agents和Tools&DataSources之间...
探索AGI
0回复
1992浏览
OpenAI
MCP
I行业
数值怪物VS编码之王:Gemini 2.5与DeepSeek双雄争霸!
嘿,大家好!这里是一个专注于前沿AI和智能体的频道DeepSeekV30324前天悄然发布,没有任何预告和宣传,却因其极强的编码能力,迅速火遍全网。或许,它已成为目前最优秀的"非推理"模型。编码性能直追目前基本唯一可用的ClaudeSonnet3.7。到昨天晚上,官方终于发布公告,在LiveCodeBench编码测试中,性能指标已超越ClaudeSonnet3.7。官网已更新至最新版模型,不开启深度推理时,即使用的是这一最新版本。昨晚上,Google发布了Gemi...
探索AGI
0回复
2992浏览
数值怪物
Gemini 2.5
DeepSeek
云算力:AIGC 时代的 “数字能源”—— 重构智能经济的基础设施革命
社区头条
引言:算力革命与AIGC的共生演进在ChatGPT突破3000亿参数规模、Midjourney生成作品斩获艺术大奖的今天,人工智能生成内容(AIGC)正以前所未有的速度重塑人类文明形态。这场革命的底层驱动力,是被称为"数字能源"的云算力——一种通过互联网按需分配的计算服务。如同工业革命时期煤炭重塑生产方式,++云算力正在构建智能时代的基础设施,让算力像水电一样成为可计量、可交易、可存储的战略资源。++一、云算力的本质:从物理资产...
AI算力补给站
0回复
1412浏览
算力租赁
算力
劲速云
AI大模型
人工智能
免费使用DeepSeek-V3–0324大模型,Cursor编程更上一层楼
近日,全新的DeepSeekV3–0324模型发布了!此次V3系列的更新,在推理能力和编码性能等方面相较于前代都有了明显提升。本文教你如何借助Cursor和OpenRouter,运用这一强大模型开展编码工作。一、DeepSeekV3–0324简介DeepSeekV3–0324是由DeepSeek开发的语言模型,在基准测试中的表现非常亮眼:MMLUPro测试:得分从75.9提升至81.2(提升了5.3)GPQA测试:得分从59.1提升至68.4(提升了9.3)AIME测试:得分从39.6提升至59.4(提升...
小虎哦哦
0回复
2049浏览
DeepSeek
大模型
Cursor
OpenAI要开源了!奥特曼即将开放首个推理模型,AI争夺战将走向何方?
今天凌晨,OpenAI官宣开源——放出首个带推理能力的模型权重,但保留架构控制权。DeepSeek发布后的一段时间内,开源大潮确实在重塑AI行业规则。以前开发者只能当API打工人,DeepSeek带来开源热潮后,直接让闭源顶尖的信仰崩塌了。“云服务+闭源模型”的捆绑模式正在动摇。另一方面,OpenAI宣布完成400亿美元(约合人民币2905亿元)新融资,投后估值达3000亿美元(约合人民币21787亿元),创造了科技领域的融资新纪录。但随着投...
算家计算
0回复
1126浏览
OpenAI即将开源
开源大模型
算家云
算力租赁
每日AI资讯
阿里扔出王炸:全球首个开源全模态大模型Qwen2.5-Omni:7B搞定看听说写,AI越来越像人了
社区头条
3月27日凌晨,阿里通义千问团队发布首个全模态大模型Qwen2.5Omni,直接让AI学会“看听说写”,还能和你实时视频通话对答如流。几乎复刻了人类“接收信息思考表达”的全流程。也就是说,你可以和Qwen2.5Omni实时进行音视频通话,随问随答。核心暴击点如下:双核大脑:Thinker整合画面语音文字,Talker秒回人声,延迟堪比真人对话;全模态屠榜:干翻谷歌Gemini1.5pro,音频生成自然度几乎逼近真人;开源白嫖:HuggingFaceGitHub随...
算家计算
0回复
1803浏览
Qwen2.5-Omini
通义千问
阿里巴巴集团
全模态大模型
算家云
阿里版“Her”上线即开源!7B模型太全能了,全面击败Gemini-1.5-pro!所有用户都能试玩!
原创
社区头条
出品51CTO技术栈(微信号:blog51cto)QwenChat上新实时语音聊天+视频聊天了!可以像打电话或视频通话一样与AI进行聊天,Qwen也有自己的Her了。更更重要的是,一向大方开源的千问,直接开源了背后的模型Qwen2.5Omni7B(Apache2.0许可),并发布了详细的技术报告!做了OpenAI应该干的事!QwenChat:https:chat.qwenlm.aiGitHub:https:github.comQwenLMQwen2.5Omni目前每天有10次体验机会:图片图片Qwen2.5Omni7B...
51CTO技术栈
0回复
1420浏览
7B模型
Gemini-1.5
开源
AI Infra的起飞前夜,跟两位创业者聊了两小时,从DeepSeek的中国朋友圈,到AI基建演进的价值铁律
原创
社区头条
作者云昭嘉宾黄新平、谭中意出品51CTO技术栈(微信号:blog51cto)“人生不无聊,有太多变化,太多好玩的事情发生。”的确,近期围绕DeepSeek的新发布实在太多了,乱花渐欲迷人眼。从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1,到DeepSeek一体机的出圈,再到国民应用微信的接入,潮潮迭起。可以说,从B端到C端,几乎彻底沸腾了。“几乎所有做智能体的公司都很兴奋,寻找落地机会,还有做企业级应用、知识库的公司...
51CTO技术栈
0回复
1587浏览
AI
DeepSeek
英特尔
RAG只能应用于文本检索吗?关于大模型应用之RAG——检索增强的思考
原创
社区头条
“RAG是一项入门很简单,但实际操作起来却很困难的技术之一;RAG是模型无关的独立技术栈,它的核心是文档和检索,RAG本身并不具备生成的能力,结合模型才具备生成能力”最近在做RAG方面的应用,关于RAG技术很多人应该都了解过,毕竟其也算是大模型应用的一个主要方向;具体应用场景有智能客服,搜索引擎优化,教育辅助等。在传统的印象中,RAG技术结合LLM(LargeLanguageModel)大语言模型,做文档类检索增强;但RAG仅仅只能用来...
AI探索时代
0回复
1430浏览
RAG
大模型应用
大模型
关于智能体Agent的实现技术之思维链和函数调用(function call)的思考
原创
“智能体是未来人工智能的一个重要应用技术,而其难点就在于怎么让大模型具备更好的独立思考和任务拆解与规划的能力。”Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。今天我们就从Agent的两个实...
AI探索时代
0回复
1449浏览
智能体
Agent
Agentic RAG 目前最强大的RAG实现方式
原创
社区头条
1、什么是RAG?🍓RAG作为一种提升生成式AI模型表现的框架,通过检索外部知识源,增强生成内容的准确性与丰富度。AIAgent则是具备感知、推理、行动和学习能力的自主软件系统,能在复杂环境中完成任务。二者结合,让AI系统拥有更强大的功能。.💎传统RAG存在检索时机难定、文档质量不佳、易生成错误信息等问题。AgenticRAG系统有效解决了这些痛点,在客户支持、内容创作、研究辅助、工作流自动化等场景广泛应用。例如在客户支持中...
数字化助推器
0回复
3124浏览
RAG
Agentic RAG
AI架构系列:picoLLM 大模型的量化魔术师
原创
Picovoice首席执行官AlirezaKenarsari指出,“picoLLM是Picovoice深度学习研究人员和量产工程师共同努力的成果。前者研究出X位量化算法,而后者构建了跨平台的LLM推理引擎。目的还是在于将LLM遍及到任何设备且将控制权交还给企业”。picoLLMInference可以免费使用,没有任何使用限制。无论是在概念验证上工作,还是为数百万用户提供服务。只需几行代码即可部署。注:其余的产品线有非商用免费版,也有收费版1.认识量化(Quantiz...
鲁班模锤1
0回复
1387浏览
AI
架构
大模型
从词语到概念:大概念模型如何重新定义语言理解与生成
原创
社区头条
近年来,大型语言模型(LLMs)在生成类人文本、翻译语言和回答复杂问题方面取得了显著进展。然而,尽管LLMs能力惊人,它们本质上仍是通过基于上文预测下一个词或标记来运作。这种方法限制了它们在深层理解、逻辑推理和复杂任务中长期保持连贯性的能力。为解决这些挑战,人工智能领域出现了一种新架构:大概念模型(LCMs)。与传统LLMs不同,LCMs不仅关注单个词语,而是以完整概念为操作对象,这些概念代表句子或短语中蕴含的完...
51CTO内容精选
0回复
1257浏览
大概念模型
LCMs
大型语言模型
Gemini2.5 Pro测试,代码能力飙升,但多模态表格解析依旧不理想
国内Qwen是汪峰,国外Google是汪峰,昨天Google更新,放出新模型Gemini2.5Pro,凌晨OpenAI更新GPT4o,上新图像生成功能,难受住了。GPT4o没测,但是网上的效果也太好了吧,倒影啥的都太自然了吧。。这篇主要测试Gemini2.5Pro的能力,整体测试通过Google的AIStudio上测试,每天免费50次,正常使用够了,爽玩还是不够的。https:aistudio.google.comGemini2.5Pro在Benchmark上效果还是很好的,甚至在lmsys的对战榜单上,现在是第一...
NLP工作站
0回复
2088浏览
Gemini2.5
代码
多模态
MES-RAG:准确率提升 25%!
MESRAG框架,专为提升实体查询处理能力而设计,确保响应的准确、安全与一致。MESRAG采用主动安全措施,通过预先保护机制确保数据访问安全。此外,该系统支持实时多模态输出,包括文本、图像、音频和视频,无缝融入现有RAG架构。一、为什么需要MESRAG技术?1.1传统RAG系统的局限性传统的检索增强生成(RetrievalAugmentedGeneration,RAG)系统虽然在提升大语言模型(LargeLanguageModels,LLMs)的能力方面表现出色,但它们往往只...
大语言模型论文跟踪
0回复
1359浏览
MES-RAG
多模态
LLMs
暂无内容
1
58
59
60
61
62
63
64
65
66
客服