51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
算家云
智能体
如何正确看待GPT4.5
总结,模型门户留给GPT5去做了,4.5还是像Altman之前说的就是最后一代纯预训练。1一个超巨大的模型,grok3级别(10万卡),AK说每个0.5要提升10倍预训练算力,那对比GPT4的1.8T,也就说4.5是一个18T(18000B)级别的模型,所以必须跨多campus,异步梯度下降的训练方式(要求太高,这个目前只有grok,oai,gemini,3家真正严格实践过,anthropic都不行)。2拥有更多的知识(o3和人类比如博士生做题的合成数据),比4o能力提升百分之50(其实...
熵减AI
0回复
2389浏览
GPT4.5
GPT5
预训练
DeepSeek做爆款图文,太强了
刷小红书,看到下面这种爆款图文,就拿DeepSeek的深度推理能力拆解了下文案特点,然后大致复刻了一下,这里使用的工具组合是DeepSeek+即梦AI+美图秀秀「DeepSeek」擅长逻辑构建与内容生成,其深度思考能力最适合分析这种文案风格特点,而且还会把中间的思考过程展示出来,就很容易会出来比原来文案更好的效果。「即梦AI」主要用来生成IP形象表情包(可以是老奶奶、现代版关羽、古风哪吒、水豚等等)。「美图秀秀」将素材整合,...
Bx玩AI
0回复
3341浏览
DeepSeek
图文
IP形象
Dify 搭建私有数据可视化智能体,效果直逼 ChatGPT
原创
前几天写的文章《Trae+Dify10分钟构建DataMcpServer与Agent,和Excel说再见!》,跟大家一起实现了简单的大模型数据处理,返回的最后结果只是json格式的数据。今天我们做一个完整的聊天应用,可以在聊天结果中实现数据可视化分析。标题说效果直逼ChatGPT,还是有点差距的,这差距多大呢,差不多一光年吧!毕竟我们今天做的还只是玩具。我们先一起来看一下ChatGPT如何实现数据可视化结果的呈现。很显然,ChatGPT的思路和...
九歌AI大模型
0回复
4517浏览
Dify
智能体
ChatGPT
内行看Manus!大模型通过Deep ReSearch驾驭Multi-Agent原理深度剖析
原创
这两天AI产品的频繁出圈,都把大家整焦虑了,我朋友圈有同学宣布一个月不看AI新闻,闭关了。为啥,都是Manus闹的。当然,背后其实是自媒体无底线的尬吹。我今天一直在考虑要不要蹭Manus的流量,内心纠结了半天,后来看到某大V连续两天发的文章,就释怀了。人家是真本事啊,第一天把Manus吹上天,第二天又发文理性批评,真是妙啊,好人坏人都当了,这流量赚的的是满满的。真是昨天叫人家小甜甜,今天改叫人家牛夫人了,像极了一...
九歌AI大模型
0回复
5029浏览
Manus
大模型
Deep ReSearch
PathRAG:通过图剪枝的方法优化Graph-based RAG的性能方法浅析
原创
PathRAG也是一种新型GraphbasedRAG方法,通过检索索引图中的关键关系路径,减少噪声并优化LLM提示。其核心创新在于基于流的剪枝算法和路径为基础的提示策略,特别适用于捕捉复杂数据集中的关系。(其实可以看做相比GraphRAG假如剪枝算法和路径提示策略,减少噪声并提升性能)三种GraphbasedRAG对比总结(PathRAG、GraphRAG、LightRAG):•PathRAG:通过从索引图中检索关键的关系路径来减少冗余信息。PathRAG使用基于流的剪枝算...
大模型自然语言处理
0回复
3176浏览
PathRAG
RAG
LLM
【万字长文】深度剖析:RAG、AI Agent与Agentic RAG的融合发展|值得收藏
原创
精华
一、引言:AI发展浪潮中的新探索在当今科技飞速发展的时代,人工智能(AI)正以前所未有的速度不断前进。科学家们持续钻研,开发出各种用于知识共享、信息表达、推理以及决策的创新方法。近年来,检索增强生成(RetrievalAugmentedGeneration,简称RAG)技术异军突起,备受瞩目。它能够将大型语言模型与外部最新知识相结合,为模型的输出提供坚实的事实依据。与此同时,AI智能体,作为一种能够感知环境并做出响应的智能软件,在...
Halo咯咯
0回复
7217浏览
RAG
AI Agent
Agentic RAG
人工智能
轻量化AI的崛起:蒸馏模型如何在资源有限中大放异彩
原创
01、概述我们可能已经听说了Deepseek,但你是否也注意到Ollama上提到了Deepseek的蒸馏模型?或者,如果你尝试过GroqCloud,可能会看到类似的模型。那么,这些“distil”模型到底是什么呢?在这一背景下,“distil”指的是组织发布的原始模型的蒸馏版本。蒸馏模型本质上是较小且更高效的模型,设计目的是复制较大模型的行为,同时减少资源需求。这种技术由GeoffreyHinton在2015年的论文“DistillingtheKnowledgeinaNeuralNetwork...
Halo咯咯
0回复
3312浏览
蒸馏模型
Mistral-Small-24B-Instruct-2501:小身材,大智慧,AI界的“轻量级拳王”来了!
原创
01、概述在人工智能领域,开发既紧凑又高性能的语言模型一直是一个巨大的挑战。大型模型虽然表现卓越,但往往需要庞大的计算资源,这让许多硬件能力有限的用户和组织望而却步。与此同时,市场对多任务处理、多语言支持和高效准确响应的需求日益增长。如何在性能、可扩展性和可访问性之间找到平衡,尤其是在本地部署和数据隐私方面,成为了一个关键问题。这也催生了创新的需求:我们需要更小、更高效的模型,既能媲美大型模型的...
Halo咯咯
0回复
2621浏览
小型语言模型
自然语言处理
人工智能
RAG常见13种分块策略大总结(一览表)
原创
分块策略在RAG中至关重要,目的是提高效率、相关性和上下文保持。分块能减少计算开销,增加检索相关信息的可能性,同时保持信息完整性。但也存在风险,如上下文丢失、冗余和不一致性。选择策略需考虑文档类型(结构化vs非结构化)、查询复杂性、资源可用性和期望结果(速度vs准确性vs上下文)。以下是13种独特分块策略的详细描述,按策略名称、描述、优点、缺点和实施建议。仅供参考。策略名称描述优点缺点实施建议固定长度分块...
大模型自然语言处理
0回复
3196浏览
RAG
大模型
Phi-4-multimodal:图、文、音频统一的多模态大模型架构、训练方法、数据细节
原创
Phi4Multimodal是一种参数高效的多模态模型,通过LoRA适配器和模式特定路由器实现文本、视觉和语音音频的无缝集成。训练过程包括多阶段优化,确保在不同模式和任务上的性能,数据来源多样,覆盖高质量合成数据。它的设计体现了小型语言模型在多模态任务上的潜力。模型架构模型架构Phi4Multimodal的基础是Phi4Mini语言模型,这是一个3.8亿参数的模型,设计为高效处理文本任务。架构包括:Transformer层和维度:32层Transformer,...
大模型自然语言处理
0回复
2837浏览
DeepSeek
GRPO算法
多模态
大语言模型
怎么自定义一个数据集?自定义数据集面临哪些问题?
原创
“在目前的神经网络应用中,数据集是对大部分企业需要面临的主要问题。”数据集作为神经网络模型中的一个必要环节,其重要性不言而喻;虽然网络上有很多开源的数据集,但对很多场景来说需要自定义数据集才能满足自身的需求。从目前的大模型发展来看,大部分企业选择在开源模型的基础之上做训练和微调是比较好的选择;而这时,神经网络结构就不是主要的技术难点,反而是数据成为了很多企业的痛点,成为亟待解决的问题。因此,怎...
AI探索时代
0回复
2660浏览
神经网络
数据集
数据预处理
AI紧箍咒!OpenAI发布CoT监控,阻止大模型恶意行为
今天凌晨1点,OpenAI发布了最新研究,用CoT(思维链)监控的方式,可以阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。OpenAI使用了最新发布的前沿模型o3mini作为被监控对象,并以较弱的GPT4o模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达95%,远超仅监控行为的60%。随着o1、o3、R...
Aceryt
0回复
2344浏览
模型
系统
AI
破解LoRA融合密码!无需训练夺得SOTA!K-LoRA巧用Top-K策略,让风格与主体完美融合
论文链接:https:arxiv.orgpdf2502.18461项目链接:https:klora.github.ioKLoRA.io亮点直击提出了KLoRA,一种简单而有效的优化技术,能够无缝融合内容和风格LoRA,从而在保留细节的同时生成任何主题的任意风格。本文的方法用户友好,无需重新训练,可直接应用于现有的LoRA权重。它在多样化的图像风格化任务中表现出色,超越了现有方法。总结速览解决的问题风格与内容的同时保留:现有方法在融合不同LoRA(LowRankAdaptation)时...
angel
0回复
2882浏览
AI
模型
生成
DeepSeek级AI?训练自己的推理模型仅需七个步骤
原创
谁需要超级计算机?仅用15GBVRAM就可以训练你自己的功能强大的AI推理模型!DeepSeek的R1模型在不需要人类反馈的情况下就能进行更深思熟虑的推理,已颠覆了大语言模型(LLM)领域。这一重大突破背后的关键是群体相对策略优化(GRPO),这是一种帮助模型自主开发推理能力的强化学习技术。与依赖值函数的近端策略优化(PPO)不同,GRPO在不需要值函数的情况下就可以优化响应,从而提高了效率。开发更好的推理模型的竞赛正如火如荼...
51CTO内容精选
0回复
2887浏览
DeepSeek
AI
推理模型
机器学习|从0开发大模型之复现DeepSeek的aha moment
前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的GRPO代码,不过从工程领域来看,并没有复现DeepSeekR1,于是最近申请了48G的显存,结合一些开源的方案复现ahamonent,并给出完整的代码和工具链。1、什么是ahamonentDeepSeekR1论文中提到,模型让作者「见证了强化学习的力量和美感」,在DeepSeekR1Zero的中间版本,「顿悟时刻」来了:模型学会了以人类的语气进行反思。ahamonent2、使...
周末程序猿
0回复
2712浏览
开发
大模型
DeepSeek
还拿不到Manus邀请码?试试这几款开箱即用的computer use智能体,附教程
我在今年1月初写了2025年的AIAgent发展十三大趋势,其中两个趋势是多Agent系统开始流行和GUIAgent产品得到更多应用,没想到来得这么快。推荐阅读:智能体商用元年开启,2025年AIAgent行业发展十三大趋势最近几天,集多Agent架构、computeruse、GUI智能体等技术和概念于一身的Manus,通过一些媒体、科技博主的报道和渲染,在“比肩DeepSeek”“AIAgent的GPT时刻”等一浪强过一浪的声浪中,Manus一夜出圈。官方资料显示...
王吉伟自频道
0回复
6689浏览
Manus
邀请码
智能体
基于秘密共享重构 DeepSeek DeepGEMM Kernel 的安全高效 MPC-GEMM 方案
摘要本文针对安全多方计算(MPC)框架下通用矩阵乘法(GEMM)运算的性能瓶颈,提出一种全新的MPCGEMM实现方案。该方案的核心思想在于:基于加法秘密共享重构DeepSeekDeepGEMM的CUDAkernel,将MPC协议的逻辑与DeepGEMM的底层优化深度融合,消除MPC协议与GPU计算之间的“两张皮”现象。方案采用INT8FP8数据表示、秘密共享运算的kernel级实现、Hopper架构优化(如适用)、GPU并行Beaver三元组生成以及JIT编译等关键技术。本文将详...
上堵吟1
0回复
3371浏览
DeepSeek
Kernel
MPC
一文读懂 RAG 中的 embedding model
在当今人工智能的浪潮中,RAG(检索增强生成)技术大放异彩,像是RAGFlow、Qanything、Dify、FastGPT等RAG引擎,逐渐走进大家的视野。在这些强大的RAG引擎背后,有一个关键组件起着不可或缺的作用,它就是嵌入模型(EmbeddingModel)。今天,就让我们一起深入了解一下这个神秘的嵌入模型吧!1.Embedding究竟是什么?在了解嵌入模型之前,得先搞清楚Embedding的概念。简单来说,Embedding是一种“神奇魔法”,能把离散的非结构化...
鸿煊的学习笔记
0回复
3571浏览
RAG
FastGPT
Embedding
Diffbot的GraphRAG大模型
前言2025年1月9日–加利福尼亚州门洛帕克–世界上最大的开放网络知识图谱创建者Diffbot宣布推出其第一个大型语言模型(LLM),这是迄今为止世界上最基于事实的AI语言模型。利用Diffbot专有的知识图谱(包括超过100亿个实体和来自开放网络的超过1万亿个结构化事实),新模型在事实可靠性和领域覆盖率方面超过了目前所有可用的LLM。当前前沿的LLM方法通过扩大模型的大小来减少不良响应(又名“幻觉”),使其代表更多的训练数据,...
知识图谱科技
0回复
3407浏览
大模型
Diffbot
GraphRAG
QuantAgent:通过自我改进的大语言模型寻找交易中的圣杯
摘要基于大型语言模型的自主代理在量化投资等专业领域的应用面临挑战,尤其是构建和整合领域特定知识库。本文提出一个两层循环的框架:内层循环通过知识库优化响应,外层循环在真实场景中测试响应并自动增强知识库。该方法使代理能够逐步接近最优行为,并具备可证明的效率。通过名为QuantAgent的自主代理实例化该框架,展示其在挖掘交易信号和提高金融预测准确性方面的能力。简介大型语言模型(LLMs)推动了自主智能体的发展...
灵度智能
0回复
2275浏览
LLM
代理
效率
暂无内容
1
155
156
157
158
159
160
161
162
163
客服