51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
24年11月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
482
篇优秀内容
2024年10月
微软内部工程师突爆料:OpenAI下一代模型11月即将上架,今天离职的AGI顾问:今天Lastday
原创
编辑言征出品51CTO技术栈(微信号:blog51cto)大消息,OpenAI的下一代前沿模型猎户座已经筹备发布了?24晚间消息,外媒TheVerge得到微软内部工程师的曝料称:该公司预计最早在11月就能获得对OpenAI酝酿已久的Orion访问权限,以便他们构建自己的产品和功能,这位工程师正在准备在Azure上托管Orion的工作。不过,Verge报道,这次Orion发布于此前版本不同,OpenAI会先给受信任的合作伙伴发布该模型,之后才会通过ChatGPT更广泛地...
51CTO技术栈
2天前
0回复
92浏览
OpenAI
AI
系统
从传统 RAG 到图 RAG,赋予大型语言模型更强大的知识力量
大型语言模型(LLMs)在固定数据集上进行训练,其知识在最后一次训练更新时就已固定。ChatGPT的常规用户可能已经注意到其众所周知的局限性:“训练数据截止到2021年9月”。这种局限性会导致模型产生不准确或过时的响应,因为它们会“幻觉”信息。在不重新训练或微调的情况下,用新信息更新模型或增强其上下文理解能力,在资源和人力方面都极具挑战。检索增强生成(RAG)检索增强生成(简称RAG)是一种通过整合来自外部可靠知识库的信...
NLP前沿1
2天前
0回复
100浏览
RAG
RAG
语言模型
#AIGC创新先锋者征文大赛# 50亿美元亏损背后:解析生成式 AI 的商业模式之争
原创
【本文正在参与AI.x社区AIGC创新先锋者征文大赛】https:www.51cto.comaigc2223.html编者按:人工智能正在席卷各个行业,但你是否曾思考过:当ChatGPT的开发商OpenAI可能面临50亿美元亏损时,生成式AI的商业模式究竟还能走多远?这篇分析文章直击当前AI行业的痛点:巨额投资与高昂运营成本之间的矛盾,技术进步与商业化之间的鸿沟,以及研究价值与经济可持续性之间的平衡。它提醒我们,在追求技术进步的同时,也...
Baihai_IDP
2天前
0回复
88浏览
AI
LLM
GenAI
Baihai IDP
白海科技
Transformers.js v3震撼发布:WebGPU加速、120种架构支持,开发者必备神器!
笔者等待多时的Transformers.jsv3版本,经过一年多的开发,终于发布了!这一版本带来了多项重大更新和增强,必将引起前端及浏览器插件AI应用爆发。核心亮点WebGPU支持Transformers.jsv3引入了WebGPU支持,性能比WASM快高达100倍,利用浏览器的GPU进行高性能计算。WebGPU是一种新的网页标准,用于加速图形和计算,性能优于WebGL,能够直接与现代GPU交互,非常适合机器学习任务。示例代码import{pipeline}from"huggingfacetransfo...
Syrupup
3天前
0回复
130浏览
WebGPU
WASM
模型
一文彻底搞懂深度学习 - 损失函数(Loss Function)
原创
深度学习中的损失函数(LossFunction)是一个衡量预测结果与真实结果之间差异的函数,也称为误差函数。它通过计算模型的预测值与真实值之间的不一致程度,来评估模型的性能。损失函数按任务类型分为回归损失和分类损失,回归损失主要处理连续型变量,常用MSE、MAE等,对异常值敏感度不同;分类损失主要处理离散型变量,常用CrossEntropyLoss、DiceLoss等,适用于不同分类任务需求。LossFunction一、损失函数损失函数(LossFunct...
鱼啊鱼
2天前
0回复
252浏览
深度学习
损失函数
点滴成就,创造未来无限可能
回顾今年,来自海内外的开发者们将Google技术创新融入实际应用,面向全球舞台展示着他们卓越的创造力与实践能力,在海外市场中探索新的可能性与机遇。这些来自不同背景的故事经历和创意作品,在多元的出海和开发环境中激发了更多开发者的内在驱动力:智创之力开发者们通过AI技术,助力日常生活和工作变得更加便捷与高效。他们还通过创新的解决方案,将智能化融入生活,为社会带来了积极的影响,推动了更美好的未来。博主黑皮诺的...
AI.x社区官方账号
3天前
0回复
362浏览
谷歌
OpenAI上新sCM!生成速度提升50倍,Scaling Law 再创奇迹:两步采样就出图,实时视频时代或将开启!
原创
传统扩散模型要过时了?OpenAI找到一种新方法,直接把生成速度提高50倍!扩散模型在生成式AI领域的重要性不言而喻,把生成逼真的图像、3D模型、音频和视频变为了现实。但是,扩散模型依然有个致命bug——采样速度太慢。OpenAI研究的新方法,被称为sCM(连续时间一致性模型)。sCM在仅使用两个采样步骤的情况下,实现了与领先扩散模型相当的样本质量。来感受下sCM的速度:那么sCM为什么这么快呢,我们一起看看。1.提速50倍:Scal...
51CTO技术栈
2天前
0回复
106浏览
OpenAI
sCM
视频
一文彻底搞懂深度学习 -激活函数(Activation Function)
原创
神经网络中的线性组合(即加权求和)本身只能表示线性关系。然而,现实世界中的大多数问题都是非线性的。通过引入激活函数,决定神经元是否应该被激活(将信号传递给下一个神经元)以及信号的强度。这样神经网络才能够学习并表示这些非线性关系,从而解决更复杂的问题。传统激活函数Sigmoid将输入映射到(0,1)之间,常用于二分类问题;主流激活函数ReLU在正区间保持梯度不变,计算高效且能缓解梯度消失问题,广泛应用于深度学习...
鱼啊鱼
3天前
0回复
340浏览
深度学习
激活函数
【智汇金秋创造季】智汇成海,致敬开发者的“超级码力”!
随着秋风送爽,我们迎来了硕果累累的季节。在这一年中程序员最特别的日子——1024程序员节,我们向改变世界的代码“魔法师”们致敬!51CTOAI.x社区联合Google携手打造【智汇金秋创造季】,汇聚技术的力量,助力每一位开发者将创意和热情转化为现实。🍁活动简介在这个收获的季节,我们为开发者们准备了一系列精彩活动,包括专业课程学习、创新技术应用案例,以及开发者“超级码力”投票活动。让我们一起探索、学习和创新,让这个...
AI.x社区官方账号
3天前
25回复
3415浏览
谷歌
Google
大模型图像处理技术之扩散模型——Diffusion Model
原创
“大模型的原理就是通过编程实现的某种数学算法模型,把输入数据进行处理,最后再输出的一个过程”这段时间的文章中,一直都是在说大模型的应用,也就是怎么基于大模型开发上层应用,以及在开发过程中遇到的一些问题;但同样在文章中也说过从应用入手,然后再了解其实现原理,这就是知其然,再知其所以然。最近一直在搞图片生成和视频生成方面的应用,但使用的不是第三方的接口,就是现有的开源模型,虽然知道它们能做些什么...
AI探索时代
4天前
0回复
215浏览
大模型
图像处理
扩散模型
统一多模态大模型!PUMA:多粒度策略笑傲生成、编辑、修复、着色、条件生成和理解!
文章链接:https:arxiv.orgpdf2410.13861项目链接:https:github.comrongyaofangPUMA亮点直击多粒度特征处理:PUMA能够同时处理粗粒度和细粒度的视觉特征,适应不同任务的需求,如文本到图像生成和图像编辑,解决了现有模型在多样性和精确可控性之间的平衡问题。统一多模态框架:PUMA通过统一的多模态大模型框架,无缝集成图像生成与理解,适用于从多样化图像生成到精确图像编辑等多种任务,扩展了多模态模型的应用范围。两阶段训...
angel
3天前
0回复
188浏览
AI
生成
LLaMA-Omni:专为与大型语言模型(LLMs)进行低延迟、高质量的语音交互而设计
原创
精华
大型语言模型(LLMs)如GPT4等,已经在多个领域展示了其强大的能力,能够通过对话帮助人们完成各种任务。然而,这些模型在需要语音输入或输出的场景中仍面临显著的限制。尽管最近的技术进展,如GPT4o,提升了语音交互的响应速度,但依然存在延迟和质量方面的挑战。如何实现低延迟且高质量的语音交互,成为开源社区亟待解决的问题。01、概述为了实现与LLMs的语音交互,研究者们尝试了多种方法,每种方法都有其局限性。最常见的做...
乔晨80616
4天前
0回复
196浏览
大型语言模型
LLMs
基于自定义数据集的YOLOv8模型实战
原创
本文将通过一个完整的实战案例来展示使用Python、命令行或GoogleColab等方式在自定义数据集上训练自己的计算机视觉模型。简介当前,Ultralytics公司研制的高级YOLOv8模型成为解决计算机视觉问题的最佳方法之一,同时该模型也最大限度地减少了有关开发过程遭遇的麻烦。YOLOv8是UltralyticsYOLO(YouOnlyLookOnce)系列模型的第8次也是最新一次迭代,与其他迭代一样,它使用卷积神经网络(CNN)来预测对象类别及其边界框。YOLO系...
51CTO内容精选
2天前
0回复
75浏览
YOLOv8模型
神经网络
计算机视觉
五种时频图像一键切换,CVPR 顶会+多模态融合
前言本期推出结合CVPR2022视觉顶会论文RepLKNet的多模态故障诊断创新模型,适合各种故障诊断领域、电能质量扰动信号、各种声信号、脑电信号等分类任务!创新模型还未发表!!!有小论文、毕业论文需求的不容错过!提供马尔可夫转换场MTF、递归图RP、格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT五种时频图像变换方法,可灵活替换多模态特征中的时频图像类型!1创新模型相关解释●数据集:CWRU西储大学轴承数据集●环境框...
Tang_Lan
4天前
0回复
135浏览
多模态
融合
时频图像
Bitnet.cpp:微软开源1比特推理框架,CPU跑100B模型
精华
Hi,这里是Aitrainee,欢迎阅读本期新文章。前两天,微软开源了Bitnet.cpp,这是一个重磅消息。简单来说,这意味着你现在可以在CPU上运行像72B甚至更大的超级大模型。原因是这些模型的精度已经降低到1位。Bitnet.cpp是一个超级高效的1位LLM推理框架,你可以在本地设备上以高达六倍的速度运行100B模型,并且能耗降低82.2%。Bitnet.cpp未来还会支持NPU和GPU,它在ARMCPU上能让模型速度提高1.37到5.07倍,同时能耗降低55.4%至70%。...
老蛀虫
5天前
0回复
555浏览
微软
开源
模型
人工智能新高度:GLM-4-Plus,智谱AI打造媲美GPT-4o的基座大模型
在当今人工智能飞速发展的时代,各种先进的大模型不断涌现,为我们的生活和工作带来了前所未有的变革。今天,让我们一同走进智谱AI推出的GLM4Plus大模型,深入了解它的独特魅力和强大功能。一、GLM4Plus简介智谱GLM团队重磅发布了新一代基座大模型——GLM4Plus。作为智谱全自研GLM大模型的全新版本,GLM4Plus充分彰显了智谱AI在通用人工智能领域的深度耕耘,有力地推动了大模型技术的独立自主创新。GLM4Plus是对以往模型持续优...
穿越时空111
5天前
0回复
509浏览
GLM-4-Plus
GPT-4o
模型
神经网络算法 - 一文搞懂Transformer
原创
本文将从Transformer的本质、Transformer的原理、Transformer架构改进三个方面,带您一文搞懂Transformer。一、Transformer的本质Transformer架构:主要由输入部分(输入输出嵌入与位置编码)、多层编码器、多层解码器以及输出部分(输出线性层与Softmax)四大部分组成。Transformer架构输入部分:源文本嵌入层:将源文本中的词汇数字表示转换为向量表示,捕捉词汇间的关系。位置编码器:为输入序列的每个位置生成位置向量,以...
鱼啊鱼
5天前
0回复
158浏览
神经网络算法
Transformer
一文彻底搞懂深度学习 - 感知机(perceptron)
原创
在机器学习中,感知机(perceptron)是最简单的神经网络模型之一,只有输入层和输出层,是二分类的线性分类器。它可以解决与(AND)、或(OR)等简单的线性可分问题,但无法解决复杂的异或(XOR)等非线性可分问题。perceptron一、单层感知机感知机(perceptron)是什么?感知机是由美国学者FrankRosenblatt在1957年提出的,它是一种模拟人脑神经元工作原理的模型。感知机接收多个输入信号,通过加权求和并加上偏置值,然后通过...
鱼啊鱼
5天前
0回复
242浏览
深度学习
感知机
微软10大商用智能体一锅出!Agent要重塑办公了!实绩可查:500强企业六成都在用,有公司一年省出5000 万!
原创
精华
出品51CTO技术栈(微信号:blog51cto)智能体元年是不是要来了?前脚Salesforce刚刚发布其Agentforce平台,CEOMarcBenioff还顺便踩了脚微软Copilot是Clippy2.0(微软90年代推出的广受诟病的Office助手)。图片一周的时间,微软就展开了反击,一口气宣布了两个大事!图片首先,CopilotStudio可以自己“捏”Agent了!这项功能将在下个月进行公开预览。其次,微软在Dynamics365中直接重磅推出十个新的商业智能体,用AIAgent赋能销...
51CTO技术栈
5天前
0回复
228浏览
微软
智能体
AI
矛盾之争,AI合成数据可以骗过大模型吗?中山大学联合上海AI Lab提出合成检测基准LOKI
文章链接:https:arxiv.orgpdf2410.09732项目链接:https:opendatalab.github.ioLOKI数据&代码:https:github.comopendatalabLOKI总结速览引入了LOKI基准,以全面评估LMMs在区分合成数据上的表现。LOKI基准的亮点包括:全面模态评估。收集了近期热门合成模型生成的高质量多模态数据,涵盖视频,图像,3D数据,文本,音频等多个模态。异构数据覆盖。数据集中包括28个不同模态的细致分类,包括有专业的卫星,医学等图像,哲学,文...
angel
6天前
0回复
203浏览
模型
数据
1
2
3
4
5
6
7
8
9
10
25
客服