51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
1021
篇优秀内容
2025年07月
华人占AI半壁江山!全球AI顶尖人才榜揭晓,何恺明领衔多位华人科学家
原创
华人科学家,正在重塑硅谷的AI格局。7月3日,2025全球数字经济大会现场,全球AI领域Top100人才榜单首次亮相,这份重磅榜单揭示了全球AI竞争格局的现状。其中,华人科学家以压倒性优势占据主要席位。 这份榜单基于近十年10万篇论文深度分析,评选出AI领域前100位精英人才,领衔众多华人科学家的,正是被业界称为“AI大神”的何恺明。 他提出的残差网络ResNet,以「跳跃连接」的巧妙设计攻克了困扰神经网络20年的「梯度...
算家计算
1天前
0回复
424浏览
人工智能
何恺明
AI人才
国产AI
算家云
深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”
精华
引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。一、深入解析检索增强生成(RAG)RAG...
柏企阅文
1天前
0回复
571浏览
RAG
语言模型
检索
开源大佬炮轰MCP:我不是MCP的忠实拥趸!MCP是一个死胡同!根本不是为无推理自动化而设计的!
原创
编辑云昭今天凌晨,知名开源Web框架作者Ronacher发表了一篇引起热烈反响的博客。虽然他自谦地在X上称这篇“烂文章”,但网友们却非常认同。图片这篇文章标题为:《Tools:Codeisallyourneed》。文中,作者开门见山的指出自己不是MCP的忠实拥趸,并认为MCP现在的宣传言过其实。图片此外,Ronacher指出MCP并不具备真正的可组合性,而且依赖且消耗本可以不必如此多的推理上下文,远不如单纯运行代码那么简单。基于此,MCP的可扩展...
51CTO技术栈
1天前
1回复
223浏览
MCP
LLM
AI
为什么大家都开始探索 MoE 架构?MoE 相比 Dense 有什么好处?
在大模型发展进程中,MoE架构凭借独特优势备受关注。与传统Dense架构相比,它在计算效率、模型扩展性和任务处理能力等方面表现突出,为大模型性能提升提供了新方向。下面是其优势:计算效率更高:MoE架构通过路由器网络动态选择输入token激活的专家集合,仅激活部分参数,大幅降低计算量。如DeepSeekV3激活37B参数(占总量671B的5.5%),其FLOPs可降低至传统Dense架构的30%以下。在推理时,MoE架构能根据输入动态分配计算资源,...
鸿煊的学习笔记
2天前
0回复
341浏览
MoE
架构
Dense
大语言模型的革新:基于logits的微调技术突破性进展
引言:打破传统微调的局限性在大语言模型(LLMs)快速发展的今天,如何开发紧凑且高效的模型已成为研究的热点。本文介绍了一种突破性的微调方法,通过结合教师模型的logits知识和真实标签,显著提升了模型性能。该方法在数学推理等任务上取得了显著进展,为大语言模型的优化开辟了新的方向。技术创新:突破传统监督微调的瓶颈传统的监督微调(SFT)方法存在明显的局限性,主要体现在无法有效捕捉token之间的依赖关系和语言表达...
顿数AI
1天前
0回复
268浏览
大语言
模型
技术
AI智能体驱动未来商业,深度剖析11种AI Agent商业模式
全球技术研究与咨询机构Gartner有一项调查显示,生成式AI(GenAI)已是组织中部署的第一大人工智能解决方案。这份调查完成于2023年第四季度。调查数据显示,来自美国、德国和英国组织的644名受访者中,有29%表示他们已经部署并正在使用GenAI,这使得GenAI成为部署最频繁的AI解决方案。GenAI被发现比其他解决方案更常见,如图形技术、优化算法、基于规则的系统、自然语言处理和其他类型的机器学习。调查还发现,利用嵌入现有应用...
王吉伟自频道
1天前
0回复
338浏览
AI
智能体
Agent
开源 AI 联网搜索工具:Open-WebSearch MCP 全新升级,支持多引擎 + 流式响应!
原创
🚀开源AI联网搜索工具:OpenWebSearchMCP全新升级,支持多引擎+流式响应!💡「让你的AI插件真正能联网」——不需要APIKey,搜索结果可控、开箱即用!大家好,我最近开源了一个AI插件开发工具——[OpenWebSearchMCP](https:github.comAaseeopenwebSearch)。这个项目旨在解决AI在实际应用中无法联网或联网费用高昂的问题,特别适合在Claude、LangChain、RAG方案中添加“实时搜索”能力。🧠项目亮点一览✅多引擎实时搜索支持Bing、...
Aasee
2天前
0回复
922浏览
mcp
llm
chatgpt
智谱开源多模态推理新王者!9B参数挑战72B巨头
原创
小模型的大智慧,正在重构全球AI竞争规则。 昨天,在上海张江科学会堂上,智谱CEO张鹏正式发布GLM4.1VThinking,旨在探索视觉语言模型中推理的上限。这个仅90亿参数的多模态模型,在18项关键测试中逼平甚至超越了参数规模八倍于己的行业巨头Qwen2.5VL72B。  就在发布当天,浦东创投集团与张江集团宣布向智谱注资10亿元战略投资,首笔交割即时完成。 GLM4.1V9BThinking的诞生,标志着多模态模型从「感知」向...
算家计算
2天前
0回复
413浏览
人工智能
GLM-4.1V
智谱AI
多模态生成
算家云
从播客到带娃,看老黄、纳德拉、奥特曼这些CEO 如何在生活中使用 AI
原创
精华
编辑云昭出品51CTO技术栈(微信号:blog51cto)在大多数人还在摸索AI能帮自己做什么时,那些全球最忙、最顶尖的大公司CEO,更是乐在AI中,更为恐怖地是,这些大佬可不是为了炫技,而是纯纯的刚需。他们用AI跟播客“对话”、用AI总结邮件、甚至在深夜带娃时,也离不开ChatGPT。不止办公室!本文带你看看,微软、OpenAI、苹果、英伟达、Zillow这五位CEO,分别是怎么在日常生活中「高频使用AI」的。速看。1.微软CEO萨提亚·纳德拉...
51CTO技术栈
2天前
0回复
1484浏览
播客
奥特曼
AI
九大GraphRAG方法深度对比:选择最适合你的图检索增强生成方案
原创
在目前AI市场上,RAG技术已经成为大语言模型应用的重要组成部分,而GraphRAG作为RAG的进化版本,通过引入图结构来处理复杂的知识关系,正在受到越来越多的关注。但面对市面上众多的GraphRAG变种,我们该如何选择最适合自己应用场景的方案呢?最近,一项名为GraphRAGBench的评估研究为我们提供了答案。它系统性地评估了总共九种主流GraphRAG方法,包括RAPTOR、LightRAG、GraphRAG、GRetriever、HippoRAG、GFMRAG、DALK、KGP和ToG...
AI博物院
2天前
0回复
397浏览
GraphRAG
RAG
MultiFinRAG:针对金融领域问答的多模态RAG框架,效果比ChatGPT-4o提升19%,Token使用减少60%
“MultiFinRAG:AnOptimizedMultimodalRetrievalAugmentedGeneration(RAG)FrameworkforFinancialQuestionAnswering”现代金融文件通常超过100页,包含复杂的文本、表格和图形,准确的问答(QA)对分析师和自动化金融代理至关重要。然而,现有问答方法面临文档长度超出LLM的令牌限制、API成本高、混合格式使得表格和图形的关系在转为文本时丧失等挑战。MultiFinRAG是一个专为金融问答设计的检索增强生成框架,解决传统大语言模...
灵度智能
2天前
0回复
381浏览
RAG
框架
ChatGPT-4o
建立基于AI的知识体系:面向企业需求的LlamaIndex与Apache Tika
原创
LlamaIndex是一套开源Python框架,类似于智能数据管理员,能够通过文档为AI提供信息支撑。它专为检索增强生成(RAG)而打造,可帮助AI在回答问题或生成内容前检索文件、数据库或记录条目,找寻正确信息。这样AI生成的答案将更加准确,且显著优于依赖预训练知识储备的常规聊天机器人。LlamaIndex的工作流程分为三个步骤:加载数据(读取PDF或Word等文件);检索内容(像图书馆目录那样组织数据);查询数据(让AI在目录中搜索答...
51CTO内容精选
1天前
0回复
350浏览
LlamaIndex
AI
Python
讲清楚了!一文看懂什么是世界模型
世界模型的定义世界模型是一种能够对现实世界环境进行仿真,并基于文本、图像、视频和运动等输入数据来生成视频、预测未来状态的生成式AI模型。它整合了多种语义信息,如视觉、听觉、语言等,通过机器学习、深度学习和其他数学模型来理解和预测现实世界中的现象、行为和因果关系。简单来说,世界模型就像是AI系统对现实世界的“内在理解”和“心理模拟”。它不仅能够处理输入的数据,还能估计未直接感知的状态,并预测未来状态...
智驻未来
3天前
0回复
491浏览
世界模型
多模态
数据
我对 AI 写作的一些思考:Writing in the Age of LLMs
原创
精华
编者按:当你收到一篇由AI完成的文章时,是否也有过这样的困惑:内容看似专业严谨,读起来却总觉得缺少什么?明明语法正确、逻辑清晰,为什么就是无法抓住读者的注意力?本文作者基于丰富的技术写作经验,深入剖析了AI生成内容的八大典型问题。更重要的是提出了一套完整的“人机协作写作流程”,每个环节都有具体的操作策略。作者还为那些被误判为“AI腔”的优秀写作技巧正了名,帮助大家重新审视那些优秀的表达方式。作者Shrey...
Baihai_IDP
3天前
0回复
802浏览
AI
AI写作
SmolVLA来袭:用“小模型”解锁高效机器人控制
精华
在当今这个科技飞速发展的时代,机器人已经逐渐走进了我们的生活。从工业生产线上的机械臂,到家庭中的扫地机器人,它们都在以各种形式为我们提供便利。然而,尽管我们在机器人控制领域取得了不少进展,但将这些技术真正应用到现实场景中,依然面临着诸多挑战。尤其是那些基于大规模视觉语言动作(VLA)模型的机器人系统,往往因为硬件和数据需求过高,而难以在普通环境中广泛部署。这些模型通常依赖于拥有数十亿参数的Transfor...
Halo咯咯
4天前
0回复
606浏览
小模型
机器人
SmolVLA模型
开源
MiniMax-M1接棒DeepSeek,中国AI走向高性价比创新
DeepSeekR1的发布让整个AI界重新思考成本与性能的关系。用相对较低的成本训练出媲美GPT4的模型,这种可能性正在变为现实。而现在,中国AI公司MiniMax又悄然交出了另一份答卷。这家因海螺(Hailuo)AI视频而声名鹊起的公司,刚刚发布了他们的最新大型语言模型MiniMaxM1。M1完全采用Apache2.0许可证开源,任何企业和开发者都可以免费使用。更有趣的是训练成本:仅用53.47万美元就完成了完整的强化学习训练。MiniMaxM1的成本控制能...
AI取经路
4天前
0回复
385浏览
DeepSeek
AI
MiniMax-M1
我把DeepSeek微调参数扒光了,显存和性能优化的秘密都在这
精华
前言上周,团队准备用DeepSeek32B模型做微调,结果第一次训练就遇到了显存爆炸。各种OOM错误让人抓狂。经过摸索和实践,终于摸清了LLaMAFactory参数配置的门道。今天把这些经验分享出来,希望能帮大家避开我踩过的坑。LLaMAFactory参数体系全景LLaMAFactory有400+个配置参数,看起来很复杂,但其实可以分为三个层次:核心层(必须配置):决定能否跑起来优化层(影响性能):决定跑得好不好高级层(锦上添花):决定跑...
云原生AI百宝箱
4天前
0回复
1716浏览
DeepSeek
微调
参数
Cursor 1.0 深度解析:它和 Windsurf,谁才是开发者的下一个“AI同事”?
精华
VibeCoding,一个由AI领军人物AndrejKarpathy提出的概念,正描绘一种全新的软件开发范式:开发者“完全沉浸在氛围中,拥抱指数级增长,甚至忘记代码的存在”。这背后,是大型语言模型(LLM)日益精进的能力,正推动软件开发从传统的逐行编码,转向更直观、更具交互性的AI协作模式。在这股浪潮中,AI辅助开发工具无疑是核心角色。2025年6月初,备受瞩目的Cursor在经历了长达两年的打磨后,正式发布了其1.0版本。与其主要竞争对手...
凝固的雨_1
6天前
0回复
1226浏览
Cursor 1.0
AI
编码者
字节跳动开源Seed-Coder,用六万亿token语料库训练的LLM
原创
在当今数字化时代,代码数据对于训练大型语言模型(LLM)的重要性不言而喻。它不仅对编程任务有着直接的推动作用,还能提升模型更广泛的推理能力。然而,目前许多开源模型在构建代码数据集时,往往依赖于人工筛选和专家制定的规则,这种方式不仅耗时费力,还容易受到人为偏见的影响,难以在不同编程语言之间进行大规模扩展。而像Claude3.7和OpenAIo3这样的专有模型虽然在编程任务上表现出色,却对它们的数据细节守口如瓶。即使...
Halo咯咯
5天前
0回复
523浏览
字节跳动
开源
LLM
2025年06月
谷歌又来砸饭碗!免费AI Agent发布,程序员狂喜
精华
前天,谷歌毫无征兆地甩出王炸,发布了一款叫GeminiCLI的产品。免费、开源,可以直接在电脑终端里运行的AIAgent。谷歌给它的定位是“开源AIAgent”。可以用来理解复杂任务、制定计划、并调用工具(比如你的本地文件和命令)来一步步完成工作,主打一个“说到做到”。免费,而且是“王炸级”免费先不谈别的,直接看Google这次有多大方。官方明确表示,这次的免费额度,就是为了让你几乎永远达不到上限。只要用个人Google账号登录...
探索AGI
8天前
0回复
1146浏览
AI
Agent
开源
1
2
3
4
5
6
7
8
9
10
52
客服