51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
模型
LLM
一文轻松搞懂 MHA、MQA、GQA 和 MLA
图片今天咱们来唠唠那些听起来高大上、实则超实用的注意力机制:MHA、MQA、GQA和MLA。是不是光看这些缩写就头大了?别怕,我这就带你一文看懂它们的原理和计算公式,让你轻松掌握这些前沿技术1.MHA(MultiHeadAttention)1.1原理与公式多头注意力机制(MHA)是Transformer架构的核心组成部分,其原理是将输入数据通过不同的“头”进行多次注意力计算,然后将这些计算结果拼接起来,再通过一个线性变换得到最终的输出。这种机制...
智驻未来
0回复
2322浏览
MHA
MQA
MLA
有一款神器!深入探索Transformer语言模型的可视化工具BertViz
BertViz的核心功能注意力矩阵可视化BertViz通过交互式的注意力矩阵视图,展示了模型在处理文本时各个层和注意力头的权重分布。用户可以直观地看到模型如何捕捉单词之间的上下文关系。多视图模式HeadView:可视化同一层中一个或多个注意力头的注意力模式,帮助分析单个注意力头的行为。ModelView:提供跨所有层和注意力头的全局视图,展示注意力分布的整体情况。NeuronView:可视化单个神经元的查询和键向量,揭示其在计算注意力...
智驻未来
0回复
1417浏览
Transformer
语言模型
工具
大语言模型增强的文本到 SQL 生成:综述
1.引言用户问题:员工中薪水最高的人的名字是什么?获取到的scheam:Table:Employees(ID,Name,Salary)生成的答案:SELECTNameFROMEmployeesORDERBYSalaryDESCLIMIT1;1.1知识图谱构建在当今数字化时代,数据已成为人类生产生活中至关重要的生产要素。随着电子设备的迅猛普及,海量数据库如雨后春笋般涌现,它们广泛存储着来自各个领域的丰富信息。然而,对于普通大众而言,学习诸如SQL这类数据库查询语言宛如攀登陡峭高山,门槛...
AIGC前沿技术追踪
0回复
2159浏览
大语言
模型
SQL
【LLM合集】Qwen2.5-Omni:像人类一样「看听想说」的全能助手来了!
1.Qwen2.5OmniTechnicalReport我们全新推出Qwen2.5Omni,一个能同时理解文字、图片、声音和视频的"全能型"AI模型!它像人类一样,不仅能看图听声,还能边思考边生成自然流畅的文本和语音回答。三大创新亮点:1)同步感知:采用独特的"交错处理"技术,让视频画面和音频完美同步,配合创新的"时间对齐"算法,确保多模态信息精准配合。2)双轨生成:独创"思考者说话者"架构——思考者:像超强大脑一样生成文字内容说话者:根据思考...
AIPaperDaily
0回复
1640浏览
Qwen2.5
Omni
AI
基于文本结构分块 - 文本分块(Text Splitting),RAG不可缺失的重要环节
在RAG的核心步骤中,有一个至关重要的步骤:“文本分块(TextSplitting)”。它的主要作用就是把一大段文本切分成更小、更合理的片段,这样模型才能更好地理解、处理或者存储这些内容。如果一整篇文章不拆开,那embedding的颗粒度太粗,问答的时候很容易不准。所以切得好不好,直接影响最后答案的相关性和准确性。最基本的分块方法是根据文档的长度进行拆分。这种简单而有效的方法确保每个块不会超过指定的大小限制。基于长度拆...
AI取经路
0回复
1229浏览
文本分块
RAG
结构分块
AI真的“碾压”人类智慧了?重读《苦涩的教训》
社区头条
当大模型以"大力出奇迹"的方式惊艳世界,一位AI先驱早在2019年就预言了这一切。强化学习之父RichSutton的《苦涩的教训》[1],揭示人工智能进化史上最反直觉的真相...一、核心启示:算力碾压的"苦涩真理"[核心观点树状图]└─苦涩的教训├─历史验证:70年AI发展规律├─核心矛盾│├─短期优化:人类知识注入│└─长期胜利:算力暴力破解└─双引擎驱动├─搜索算法└─机器学习2019年,当AI界还在争论神经网络的前景时,RichS...
云原生AI百宝箱
0回复
1095浏览
AGI
AI
算力
微软突然封锁Cursor,全面禁用C、C++、C#扩展,网友:理解微软,Cursor白嫖VSCode
原创
社区头条
编辑|云昭出品51CTO技术栈(微信号:blog51cto)就在两天前,有用户在知名AI编程工具Cursor的论坛上提出了一个问题:怎么回事?VSCode的扩展以后还能在Cursor上使用吗?这个问题震惊了Cursor用户们,他们发现微软的CC++语言服务扩展突然停止支持Cursor,这是反常识的:因为Cursor使用了跟VSCode同源的基础代码。微软的语言扩展竟然突然不能使用了?!据了解,这个问题更具体点是:1.18.21及以后的版本不行,1.17.62版本还可以...
51CTO技术栈
0回复
2946浏览
Cursor
C++
C#
OpenAI史上最硬核技术播客!系统揭秘GPT4.5诞生,已进入数据受限时代!小哥亲述大模型修bug血泪史!
原创
社区头条
整理伊风出品51CTO技术栈(微信号:blog51cto)刚刚,奥特曼亲自预热的那期播客,完整版视频终于上线啦!!!这一次,OpenAI也开始“学对手”了——正式推出类似Anthropic风格的硬核技术播客内容。本期嘉宾阵容豪华,全部来自OpenAI核心团队,首次系统揭秘GPT4.5是怎么诞生的,深入探讨它在模型训练、系统架构和数据效率上的关键突破。图片不同于OpenAI以往的“营销味”,这个播客确实分享了前沿的训练干货,让我有一种想法:在...
51CTO技术栈
0回复
1260浏览
OpenAI
GPT4.5
代码库
一张照片,开口说话!阿里等最新音视频对齐技术FantasyTalking:打造超写实可控数字人!
社区头条
文章链接:https:arxiv.orgpdf2504.04842开源地址:https:fantasyamap.github.iofantasytalking亮点直击设计了一种双阶段视听对齐训练策略,以适配预训练的视频生成模型:首先在片段级别建立与输入音频对应的、包含背景和上下文对象(而不仅限于肖像本身)的连贯全局运动,随后构建精确对齐的唇部运动以进一步提升生成视频的质量。摒弃了传统的参考网络用于身份保持的方法,转而设计了一个专注于面部的交叉注意力模块,该模块集...
angel
0回复
2125浏览
训练
生成
视频
惊艳!单模型统一多图个性化生成!字节重磅开源UNO, FLUX版训练、推理、权重全开源!
社区头条
文章链接:https:huggingface.copapers2504.02160arXiv链接:https:arxiv.orgpdf2504.02160代码链接:https:github.combytedanceUNO项目网页:https:bytedance.github.ioUNO亮点直击提出了模型数据协同进化范式,突破了传统定制化图像生成中数据瓶颈的限制。开发了渐进式数据生成框架和通用定制化模型UNO,实现了从单主体到多主体的高质量图像生成。在多个任务中取得了卓越的性能,包括单主体和多主体驱动的图像生成,并且能泛...
angel
0回复
2126浏览
模型
数据
AI
LLMs.txt:让大模型更懂你的 Web 文档
原创
精华
社区头条
编者按:当你向AI助手询问API细节时,它是否经常被文档中的导航栏、样式表等无关内容干扰,给出模棱两可的答案?AI助手已成为开发者不可或缺的得力助手。然而,它们在处理网站内容时往往受限于有限的上下文窗口,加上HTML页面中大量非核心内容的干扰,导致理解效率低下。本文深入剖析了新兴的LLMs.txt标准如何巧妙解决这一问题。这个由Answer.AI联合创始人JeremyHoward提出的解决方案,通过提供优化的markdown格式文档...
Baihai_IDP
0回复
3460浏览
AI
LLMs
人工智能
Java家族出列:十款值得关注的生成式AI工具与框架
原创
社区头条
Python开发者独享AI话语权的时代该结束了。以下十款高人气Java工具,将助你将AI深度集成到Java应用与工作流中。尽管Java并非大多数程序员构建AIML项目的首选语言——毕竟Python拥有更庞大的AIML框架生态——但Java在AI、机器学习及生成式AI革命中仍占据重要席位。其技术优势和广泛的生态系统使其成为许多开发者的首选,尤其是那些偏好严格类型定义和JVM高性能的开发者。甚至部分Python爱好者也会通过Jython运行代码以发挥JVM...
51CTO内容精选
0回复
1796浏览
Java工具
生成式AI
机器学习
打破数据孤岛!MCP协议深度解析
原创
在AI技术飞速发展的今天,如何让AI模型更好地理解和生成符合人类需求的内容,一直是开发者们关注的焦点。而ModelContextProtocol(MCP)的出现,为这一问题提供了一个全新的解决方案。今天,我们就来深入探讨一下MCP协议,看看它是如何为AI开发带来变革的。一、MCP协议:背景与意义在AI的世界里,上下文(Context)是至关重要的。无论是生成文本、图像还是代码,AI模型都需要足够的上下文信息来生成相关且连贯的输出。然而,在...
Halo咯咯
0回复
2191浏览
MCP
MCP协议
AI模型
就八亿参数!TeapotLLM,让AI告别“胡言乱语”
原创
在当今数字化时代,文本生成模型已经成为研究和应用领域不可或缺的工具。它们凭借强大的架构、精细的训练和海量的数据集,展现出令人惊叹的能力。今天,我们要介绍的主角是TeapotAI团队开源的TeapotLLM模型,一个在低资源环境下表现出色的小型语言模型。它不仅能够高效运行在智能手机和CPU上,还能精准地完成问答、信息检索和结构化数据提取等任务。一、什么是TeapotLLM?TeapotLLM是一个拥有8亿参数的先进语言模型,专为生成无...
Halo咯咯
0回复
1648浏览
TeapotLLM
开源模型
LLM
AI Agents-6 | AI智能体架构大揭秘:从基础知识到前沿模式
原创
精华
这个系列文章旨在为AI代理(AIAgent)提供全面的概述,深入研究其特征,组成部分和类型,同时探索其进化,挑战和潜在的未来方向。在当今数字化飞速发展的时代,人工智能(AI)已经渗透到我们生活的方方面面,从智能家居设备到自动驾驶汽车,从智能客服到医疗诊断系统,AI智能体正以惊人的速度改变着我们的世界。那么,这些智能体是如何被设计和构建的呢?今天,就让我们一起深入探讨AI智能体架构的奥秘,从基础架构到前沿设计模...
Halo咯咯
0回复
2789浏览
智能体
Agent
大型语言模型
12张图清晰总结 MCP、RAG、Agent 架构设计间的关系
原创
MCP、RAG、Agent这些概念最近热度飙升,成了AI领域的热门话题。然而,我发现身边不少朋友对这些概念还是一知半解。为了帮助大家更好地理解,精心绘制了12张简单易懂的架构图解。这些架构图解涵盖了从MCP的提示词混合机制,到RAG的知识检索增强,再到Agent的自主决策框架等多个方面。下面详细剖析之。01、MCP、RAG、Agent概念与关系第一、核心概念1、RAG(检索增强生成)定义:RAG将信息检索与文本生成相结合,创造更准确、信息...
玄姐聊AGI
0回复
2505浏览
MCP
RAG
Agent
别再只知道“请帮我写…”了,看看谷歌如何解构 Prompt Engineering
网上充斥着各种Prompt“最佳实践”指南,很多都流于表面。你可能已经看过不少,感觉就像食谱一样,告诉你加几勺这个、几勺那个。但今天,我们来点硬核的,看看搜索巨头谷歌内部是如何系统性地理解和实践PromptEngineering的。这份来自Google的白皮书,扒开了PromptEngineering的外壳,直指核心。准备好,这篇东西值得你收藏和反复琢磨。为什么PromptEngineering这么重要?首先,得明白LLM(大语言模型)到底是个啥。别被那些花...
草台AI
0回复
1720浏览
谷歌
LLM
AI
简单的模拟膝关节振动信号(VAG)分析(MATLAB)
目标:区分正常与病理性膝关节VAG信号:通过模拟信号生成、滤波、峰值检测与时频分析,判断信号是否异常。关键指标:基于滤波后信号的峰值数量(>30则判定为异常)。模块:(1)信号生成正常信号:vagnormalsin(2pi50t)+0.2randn(size(t))设计意图:50Hz正弦波模拟正常关节振动,叠加弱噪声(标准差0.2)。病理性信号:vagpathologysin(2pi50t)+1.0sin(2pi120t)+0.7randn(size(t))设计意图:在50Hz基础上添加120Hz高频成分(幅度1....
步惊云_32
0回复
1479浏览
模拟
膝关节
振动
暴论:2025年,程序员必学技能就是 MCP
原创
精华
社区头条
MCP(模型上下文协议)就像是大模型世界里的“最后一公里”。大胆地说一句,MCP应该是每个程序员在2025年必须掌握的知识点。大模型的功能确实很强大,但它们也有明显的短板。例如,大模型在数学计算方面表现不佳。曾经有一个知名的测试,让大模型比较9.8和9.11哪个数更大,大约半年前,大部分大模型都会错误地回答9.8更小。如今,这种情况已经基本得到纠正,这主要得益于RAG(检索增强生成)技术。RAG的原理与MCP有异曲同工之妙...
玄姐聊AGI
0回复
3967浏览
MCP
RAG
大模型
探索数据矿藏:AI大模型与数据挖掘实战经验分享
在人工智能的浪潮中,我有幸作为项目负责人,带领团队深入挖掘数据的潜力,利用AI大模型的力量,取得了令人瞩目的成果。今天,我想与大家分享这一过程中的心得体会,以及我们如何利用Python实现数据挖掘与AI大模型的完美结合。1.数据获取与预处理:构建AI的坚实基石1.1数据获取:广度与深度的探索数据是AI的基石。我们面临的首要挑战是如何获取多样化和大规模的数据。利用Python的requests和BeautifulSoup库,我们构建了高效的...
风云2002_1
0回复
1310浏览
AI
大模型
数据挖掘
暂无内容
1
48
49
50
51
52
53
54
55
56
客服