51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
算家云
AI
LLM
Meta连自己内部开发发布模型的流程都公开了:停止开发风险极高的AI系统,开源AI模型发布后监控方法
原创
出品51CTO技术栈(微信号:blog51cto)就在昨晚,Meta冷不防就把自家的大模型发布前的决策步骤对外公开了。“我们在开发和发布前沿AI时遵循的流程的概述,以确保我们在整个过程中监控和管理风险。我们的治理方法可以分为三个主要阶段:计划、评估和缓解、以及决策。在任何阶段的发现都可能通过我们的集中审查流程引发讨论,这确保了高级决策者参与开发和发布生命周期的全过程。”图片1.Meta:停止发布极高风险的AI模型...
51CTO技术栈
0回复
2150浏览
开发
模型
AI
FinRobot:基于大型语言模型的金融领域开源AI框架
金融行业与AI社区之间存在数据和专业知识的障碍,影响AI在金融任务中的应用。FinRobot是一个开源AI代理平台,利用多源LLM进行多样化金融任务,提升透明度和可扩展性。论文地址:https:arxiv.orgpdf2405.14767Github地址:https:github.comAI4FinanceFoundationFinRobot摘要金融行业与AI社区之间存在数据和专业知识的障碍,影响AI在金融任务中的应用。本文旨在开发金融专用的LLM工具链,推动AI在金融决策中的普及。FinRobot是一...
灵度智能
0回复
4271浏览
大型语言
模型
LLMs
神经网络理论与技术学习以及工具
原创
“为什么数据在神经网络模型中经过数学变换,就能被学习?”关于神经网络技术有两个大的方向,一个是搞应用,另一个是搞技术;当然这里所说的应用并不是指完全脱离技术,而是指以大模型技术为底座构建上层应用或产品。而今天所讲的主要是关于神经网络技术的学习,包括怎么实现一个神经网络,应该使用哪些工具等等。神经网络技术学习及工具先科普一下,现在爆火的大模型技术就是基于深度学习的神经网络模型;所谓的大模型技术本...
AI探索时代
0回复
2472浏览
神经网络
手把手教你在本地部署 DeepSeek R1,并集成到 Dify 中,建议收藏!
原创
本教程将一步步指导你如何在本地环境中安装DeepSeekR1,并将其融合进Dify中,确保你的工作的效率得到实质性的提升!1、DeepSeekR1模型部署本部分内容将重点阐述如何在本地环境下利用Ollama来部署DeepSeekR1。后续章节将详细讲解如何将DeepSeekR1与Dify系统进行集成。第一、安装Ollama请访问Ollama的官方网站,根据你的操作系统选择合适的版本,下载Ollama应用程序并进行安装:安装完成后,打开命令行界面并输入ollama命令。如果...
玄姐聊AGI
0回复
1.2w浏览
DeepSeek R1
基于 DeepSeek R1 和 Ollama 开发 RAG 系统
原创
今天,我们探讨一下如何利用目前最受欢迎的开源推理工具DeepSeekR1和轻量级的本地AI模型执行框架Ollama,来构建一个功能强大的RAG(RetrievalAugmentedGeneration)系统。1、DeepSeekR1:RAG系统的卓越之选DeepSeekR1,被誉为开启AI推理新时代的开源先锋,在构建RAG系统方面表现卓越,拥有众多引人注目的优势,成为开发者不可或缺的利器。相较于OpenAI的o1模型,DeepSeekR1在性能上与之媲美,但成本却大幅下降,仅占o1的5%,这...
玄姐聊AGI
0回复
4652浏览
Ollama
RAG
DeepSeek 惊艳背后的技术架构创新剖析
原创
精华
DeepSeekV3重磅登场!以110计算量实现对标Llama3405B的顶尖性能,三大硬核创新重塑大模型架构范式。技术团队通过:1)首创多头潜注意力机制(MLA),攻克长文本推理的显存效率瓶颈;2)革新动态路由算法,突破MoE模型长期存在的专家选择困境;3)创新性多令牌预测框架,实现推理吞吐量跨越式提升,完成对传统Transformer架构的颠覆性改造。这场由DeepSeek引领的架构革命,不仅印证了中国团队在AI基础研究领域的深厚积累,更以突...
玄姐聊AGI
0回复
1.2w浏览
DeepSeek
深度学习的‘黄金法则’:为什么选择ReLU?
ReLU(RectifiedLinearUnit)函数详细讲解ReLU(修正线性单元)是一种在深度学习中非常流行的激活函数,它主要用于神经网络中的隐藏层。ReLU的设计简单而高效,能够有效地处理梯度消失问题,使深度神经网络得以训练。1.ReLU函数的定义ReLU的数学表达式非常简洁:f(x)max(0,x)意思是:当输入值x大于0时,输出值就是输入值x。当输入值x小于或等于0时,输出值是0。2.ReLU函数的图形ReLU函数的图形形状呈现为分段线性函数,在输入...
人工智能训练营
0回复
3700浏览
深度学习
ReLU
DNN
炸裂!Deepseek-Janus-Pro能识别图片地址、看图讲故事
一、JanusPro能做5种任务1.1图片描述1.2地点识别1.3背景推理1.4OCR文字识别1.5文图生成二、JanusPro原理JanusPro的核心设计原则采用自回归框架,通过解耦视觉编码,解决多模态理解和生成任务之间的冲突。通过独立的编码方法将原始输入转换为特征,然后由统一的自回归变换器进行处理。对于多模态理解任务,使用SigLIP编码器从图像中提取高维语义特征,并将其展平为一维序列,通过理解适配器将图像特征映射到语言模型的输入空间。...
CourseAI
0回复
7326浏览
Deepseek
识别
图片
写给大模型新人的经验,刷到少走三年弯路!
大家好,我是丁师兄。这篇文章,我将结合自己在大模型领域的经验,给大家详细聊聊新人应该如何转行大模型赛道?比如大模型都有哪些方向?各方向的能力要求和岗位匹配?新手转行大模型常踩的坑和常见的误区?以及入行大模型最顺滑的路径?如果你是正打算入行大模型的校招社招同学,请一定看完,可能会让你在入行大模型的路上,少走很多弯路。1.大模型都有哪些方向?如果你在求职网站搜索"大模型"关键词,看一下招聘JD,基本可以...
丁师兄大模型
0回复
4451浏览
AI
算法
RLHF
三种文本相似计算方法:规则、向量与大模型裁判
文本相似计算介绍有一些工作需要评估出两个字符串之间的相似程度。比如,要评估大模型生成的结果,与预设定的答案之间的相似程度。本文介绍三类方法用于评估两个字符串的相似程度:规则、向量、大模型裁判。规则:基于字符ngram的相似计算,常用算法,ROUGE、BLEU;向量:使用热门的嵌入模型(Jina),把字符串编码为向量,计算两个向量之间的相似度;大模型裁判:使用大模型评估两个字符串之间的相关性;摘要介绍了三种方法,评估...
AI悠闲区
0回复
3426浏览
大模型
规则
向量
YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
原创
编辑伊风出品51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。然而,YC合伙人Brad一针见血地戳到痛处:AI创业并不像想象中那么简单,不是ChatGPT的套壳就是一个好产品!近期,YC的四位合伙人围坐在...
51CTO技术栈
0回复
2518浏览
OpenAI
API
YC投资
用Ray观测和监控大语言模型工作负载
原创
前言GPT4、PHI2、BERT和T5等大语言模型(LLM)的出现已彻底改变了自然语言处理,这些模型支持高端应用程序,包括聊天机器人、推荐系统和分析。然而,LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。在这种情况下,在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。Ray是一种分布式计算框架,提供了一个强大的平台,可以跨集群有效地扩展LLM工作负载。因此,它成了托管、管理和观测LLM的一种出色...
51CTO内容精选
0回复
3374浏览
大语言模型
LLM
Ray
Kimik1.5、DeepSeek-V3 大战 OpenAI o1,谁能笑到最后?
精华
最近,国内大模型界可谓是“风起云涌”,kimik1.5和DeepSeekV3这两位“大侠”横空出世,一路“杀疯了”,不断向OpenAI和其他海外大模型的霸主地位发起挑战。这不禁让人想起了那句网络梗:“一山更比一山高,一模更比一模强!”今天,咱们就来好好对比一下这两位国内大模型界的“当红炸子鸡”,看看它们到底有何不同,顺便再和海外顶尖的OpenAIo1对比一下,看看咱们离国际顶尖水平还有多远。接下来,咱们就来详细对比一下这三位...
智驻未来
0回复
6870浏览
Kimik1.5
OpenAI o1
DeepSeek
一个强大的集成学习算法:随机森林
一、算法介绍随机森林属于集成学习(EnsembleLearning)中的一种,它是通过构建多个决策树,并综合这些决策树的预测结果来进行最终的预测。就好比一群经验丰富的专家(各个决策树)共同商讨一件事,然后汇总大家的意见(预测结果)得出最终结论,往往这样综合考量后的结果会更加准确可靠。随机森林可以用于解决分类问题,比如判断一封邮件是垃圾邮件还是正常邮件;也能处理回归问题,例如预测某地区的房价走势等。它具有以下优...
宝宝数模AI
0回复
3958浏览
集成
学习算法
随机森林
爆!2024‘Meta 推出CTR集成框架 CETNet,多 CTR 模型集成大幅提升预测精度
1.Kimik1.5:ScalingReinforcementLearningwithLLMs语言模型预训练时,通过预测下一个词来提升计算量的方法效果不错,可训练数据量却限制了它的进一步发展。强化学习(RL)的拓展则为人工智能持续进步提供了新途径,让大语言模型(LLMs)有机会通过学习探索扩充训练数据。不过,之前相关研究成果都不太理想,没有特别突出的。基于这样的情况,我们来分享Kimik1.5的训练过程。这是我们新研发的多模态LLM,使用RL训练。我们会讲讲R...
AIPaperDaily
0回复
2583浏览
RL
框架
OpenAI O1
2025年值得入坑AI Agent智能体的五大框架
原创
1、五大AIAgent多智能体开发框架在AI大模型新时代,AIAgent多智能体系统(MultiAgent)技术正日益受到众多科技巨头的瞩目。伴随着OpenAI的Swarm、微软的MagenticOne等框架的推出,这一领域的发展变得更为错综复杂。面对众多的选项,选择一个最匹配自身需求的MultiAgent框架成为了众多开发者与企业需要解决的关键问题。本期我们将深入分析市场上最受欢迎的五款AIAgent多智能体框架,包括微软的AutoGen、CrewAI、LangChain的LangG...
玄姐聊AGI
0回复
6905浏览
AI Agent
智能体
两个简单技巧把 RAG 检索正确率从 50% 提高到 95 %
原创
在实际项目实施过程中,RAG(检索增强生成)系统的关键在于其检索阶段,这一环节直接关系到生成效果的质量。RAG系统的运作流程主要涉及数据摄取和数据查询两个步骤,而检索环节的重要性不言而喻。本文分享了一个案例,讲述了团队如何运用两大关键策略,将RAG系统的检索准确率从50%显著提升至95%。1、RAG检索召回率RAG系统的检索召回率(Recall)是评估检索系统在用户查询时能否有效检索出所有相关文档的标准。在RAG系统中,这一...
玄姐聊AGI
0回复
9901浏览
RAG
一文说清楚"知识蒸馏"(让“小模型”也能拥有“大智慧”)
精华
最近Distillation这个词见的非常多。前两天大火的DeepSeek团队发布的DeepSeekR1,其670B参数的大模型通过强化学习与蒸馏技术,成功将能力迁移至7B参数的轻量模型中。蒸馏后的模型超越同规模传统模型,甚至接近OpenAI的顶尖小模型OpenAIo1mini。在人工智能领域,大型语言模型(如GPT4、DeepSeekR1)凭借数千亿级参数,展现出卓越的推理与生成能力。然而,其庞大的计算需求与高昂的部署成本,严重限制了其在移动设备、边缘计算等...
AI取经路
0回复
1.9w浏览
小模型
知识蒸馏
部署成本
关于神经网络的一些思考与感受
原创
“神经网络模型并不是通用模型,不同的问题需要设计不同的神经网络模型,千万不要想着一个模型打天下”神经网络作为当前人工智能领域最炙手可热的技术,其技术原理也相对比较复杂;而在学习神经网络的过程中也面临着很多问题和感受,因此这里就简单记录一下。关于神经网络从本质上来说,所谓的神经网络就是一个模拟人类大脑的数学模型;而为了解决不同的问题,技术专家们也设计了多种不同的神经网络模型,比如RNN,CNN以及Trans...
AI探索时代
0回复
2321浏览
神经网络
AI大神Andrej Karpathy:OpenAI Operator预示着AI智能体的未来,但仍需突破!
各位小伙伴,最近OpenAI发布了Operator的研究预览版,这是一个可以使用自己的浏览器为你执行任务的AI代理,引起了广泛关注。今天,我们来听听AI大神AndrejKarpathy对此的看法。他不仅深度参与了OpenAI的早期项目,还对AI的发展有着深刻的见解。文章要点总结:•Operator的类比:Karpathy将OpenAI的Operator比作数字世界的人形机器人,两者都是通用的系统,能够通过接口(键盘鼠标或人体)执行各种任务。•混合自主的未来:这类A...
草台AI
0回复
2658浏览
AI
智能体
OpenAI
暂无内容
1
176
177
178
179
180
181
182
183
184
客服