51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
算家云
LLM
百度CEO李彦宏就当前业界对大模型的认知误区发表了自己的看法
在近期的一次内部员工交流会上,百度创始人、董事长兼CEO李彦宏就当前业界对大模型的认知误区发表了自己的看法。他的讲话涵盖了大模型竞争、开源模型效率以及智能体趋势等热点话题,引发了广泛关注。李彦宏认为,未来大模型之间的差距可能会越来越大。他指出,大模型的潜力和天花板非常高,目前的发展水平距离理想状态还有很大差距。因此,模型需要不断进行快速迭代、更新和升级。这需要企业能够持续数年乃至十几年如一日地投入资源,...
InfonityAI智推星
0回复
2720浏览
百度CEO
模型
李彦宏
最近一段时间关于大模型技术的学习及应用的心得体会
原创
“怎么把大模型的各种技术与应用场景相结合是一个值得思考的问题”今天这篇文章应该算是对这几个月以来学习和应用大模型技术的总结,也可以说是这段时间的心得体会。今天主要从技术与应用两个方面来讲,当然也会夹杂着一些自己的理解与想法。关于大模型技术的学习与应用及心得体会对任何一项技术来说,主要有两个方面,其一是技术面,其二是应用面;技术本质只是一个工具,也就是我们常说的,技术是为业务服务的。一项新技术的...
AI探索时代
0回复
4435浏览
人工智能
大模型
麻省理工研究团队革新科学研究方式,通过多智能体智能图推理实现科学发现自动化
在当今快速发展的科学研究领域,如何高效地探索新领域、识别复杂模式并揭示庞大科学数据中的隐藏联系,成为了人工智能面临的重大挑战。传统的科学研究方法虽然取得了许多突破,但受限于研究人员的创造力和背景知识,可能无法充分挖掘现有数据中的潜在知识。为了解决这一问题,麻省理工学院(MIT)的研究团队提出SciAgents通过多智能体智能图推理,自动化科学发现过程,推动科学研究进入新的高度。科学发现的过程通常包括背景知...
xuxiangda
0回复
5280浏览
MIT
AI
模块化
OpenAI o1模型推理能力大幅提升的背后:重复采样如何提升AI推理能力
精华
今天OpenAI对外发布了o1模型,最大的特点便是推理能力大大增强,推理速度大大变慢。传统大模型都在比拼降低响应延迟的时候,OpenAI竟然做了一个“超慢”模型。为什么会这样答案就在下面这张图里,它解释了o1的推理工作原理,也回答了它为啥变慢。o1模型的特点是在回答前进行思考,并不直接给出推理结果,响应用户之前会产生长串的内部思维链,生成不同的方法,进行验证尝试,有成功的,也有失败的,但不会展示给用户,就像是打...
Syrupup
0回复
4401浏览
OpenAI
模型
AI
SDM: 第三代神经网络和扩散模型强强联合!FID最多超基线12倍,能耗省60%,实力SOTA!
论文链接:https:arxiv.orgpdf2408.16467代码链接:https:github.comAndyCao1125SDM亮点直击本文提出了脉冲扩散模型(SpikingDiffusionModel,SDM),一种高质量的图像生成器,在基于SNN的生成模型中实现了SOTA性能。从生物学的角度出发,本文提出了一种时间脉冲机制(TemporalwiseSpikingMechanism,TSM),使脉冲神经元能够捕捉更多的动态信息,从而提高去噪图像的质量。大量结果显示,SDM在CIFAR10数据集上的FID分数上超越了SN...
angel
0回复
4254浏览
模型
数据
实战LangGraph中实现「人机交互」!如何确保Agent系统每一步都符合预期?
嘿,大家好!这里是一个专注于AI智能体的频道!今天我们聊聊如何在LangGraph中实现“人机交互”(HumanintheLoop,简称HIL)的机制。这可是让智能系统更懂你、更贴心的秘密武器哦!想象一下,你的智能助手在执行任务时突然停下来,问你:“嘿,我接下来要用这个工具,你觉得怎么样?”这就是HIL的核心——在关键时刻让人类介入,确保每一步都符合你的期望。具体怎么做呢?我们通过在LangGraph中设置断点来实现。这些断点会在执...
探索AGI
1回复
7370浏览
LangGraph
Agent
系统
李彦宏内部讲话流出!谈大模型三大认知误区:模型能力差距只会越来越大!
原创
出品51CTO技术栈(微信号:blog51cto)最近,李彦宏在一次和员工的交流中,再次谈及了业界对于大模型的认知误区,涵盖大模型竞争、开源模型效率、智能体趋势三个方面。李彦宏提到,模型之间的能力仍然有很大差距,不能迷信榜单中的得分,关键要评判模型“在具体应用场景当中到底有没有能够满足用户的需求,有没有能够产生价值的增益”。谈及开闭源,李彦宏不认为开源模型能力的提升会摧毁闭源的商业模式,传统开源的优势在于降...
51CTO技术栈
0回复
2576浏览
李彦宏
模型
智能体
OpenAI草莓o1深夜炸场,一众大佬博主熬夜实测:有坑,很难说
原创
编辑言征、伊风出品51CTO技术栈(微信号:blog51cto)在炒作将近9个月后,OpenAI代号“草莓”的模型o1终于深夜突然亮相,一时间具备试用资格的大牛纷纷开始了测评,业内许多AI项目、公司的大佬如英伟达高级研究经理JimFan、Devin的DeepWisdom创始人纷纷发表了自己对于o1的使用感受。整体上看分两派:一派认为o1代表着ScalingLaw以外的新赛道的开启,另一派则认为——“炒作大于实际”、“有坑”、“很难说”。这里不再花篇幅去...
51CTO技术栈
0回复
3811浏览
OpenAI
项目
项目
大语言模型智能体怎么入门?来看看OpenAI研究员Lilian Weng的干货分享
原创
精华
2024年,大语言模型智能体LLMAgent吸引了越来越多人的关注,各种技术层出不穷。相比于传统机器学习方法,LLMAgent借助于大语言模型的涌现能力,能够实现少样本、零样本学习,并且能够实现与现实物理世界的交互。如何入门这一令人兴奋的领域呢?小编找到了OpenAI研究员LilianWeng分享的博客,并全文翻译过来,原文地址:https:lilianweng.github.ioposts20230623agent构建以大型语言模型(LLM)为核心控制器的智能体是一个极富创...
AIGC最前线
0回复
4791浏览
大语言模型
智能体
如何选择适合企业需求的大语言模型
原创
LLM正在推动各行各业的突破和效率。在选择一种模型时,企业应该考虑预期的应用、速度、安全、成本、语言和易用性。虽然与其他人工智能(AI)技术相比,生成式AI比较新,但它已经被用于支持从审查求职者到诊断和推荐疾病治疗的一系列任务。IDC预测,到2028年,80%的首席信息官将依靠生成式AI工具来加快分析、促进决策和改善客户服务等。企业正在竞相挖掘这项技术的潜力,以提高客户满意度和员工生产力。为此,它们正在考虑使用最...
51CTO内容精选
0回复
3374浏览
人工智能
LLM
大语言模型
AgentRE:用智能体框架提升知识图谱构建效果,重点是开源!
精华
图片1.背景关系抽取(RelationExtraction,RE)是指将非结构化文本转化为结构化数据(关系三元组),在知识图谱构建等领域扮演了重要角色。但是关系抽取往往因为关系类型的多样性和句子中实体关系的模糊性等问题,导致难以实现高效的RE。这两年,大语言模型凭借其在自然语言理解和生成方面的强大能力,开始在关系抽取方面得到广泛应用。尽管取得一定进展,但往往局限于监督式微调或少量样本问答(QA)基础抽取,较少在复杂关系...
大语言模型论文跟踪
0回复
5559浏览
AgentRE
数据
样本
AI新思考:“浴火重生”的草莓模型
原创
“这个模型肯定比我更擅长解决AP数学考试,而且我在大学时辅修数学,”OpenAI的首席研究官鲍勃·麦格鲁(BobMcGrew)告诉我。他说,OpenAI还根据国际数学奥林匹克竞赛的资格考试对o1进行了测试,虽然GPT4o只正确解决了13%的问题,但o1的得分为83%。OpenAI发布名为o1新模型,这是全新“推理”模型系列中的第一个,这些模型经过训练可以比人类更快地回答更复杂的问题。它与o1mini一起发布,o1mini是一个更小而且较为便宜的版本。...
鲁班模锤1
0回复
2779浏览
AI
模型
OpenAI
最强图像大模型Phi-3.5-vision,教你跑起来
微软推出的Phi3.5vision,把人工智能带到了成长的新阶段。这款AI模型擅长处理文本和图像,为图像识别和自动文字识别等任务带来创新的解决思路。本文介绍Phi3.5vision的技术亮点及其在实际场景中的应用。一、Phi3.5vision核心特性和功能Phi3.5vision处理文本和图像信息的能力全面且高效,能够胜任多样化的任务,成为众多应用场景中的得力助手,是行业中的佼佼者。核心特性支持长达128,000个token的上下文理解,让模型在处理长文...
小虎哦哦
0回复
3968浏览
模型
GPU
CUDA版本
大模型Agent的过去、现在、未来
嘿,大家好!这里是一个专注于AI智能体的频道!今天跟大家聊一些关于Agent发展的事情。如果说去年是RAG的元年,大家都在naiveRAG中添加各种技巧,使其变成AdavancedRAG。今年应该就是Agent的元年,年初RAG的迭代变成了AgenticRAG的发展方向,上半年Agent、Agentic、workflow等名词的爆火。当然后来到年终,RAG炒作到了RAG2.0、GraphRAG等上面,最近的RAG炒作变成了MemoryRAG,或者RAG已死等等相关的尽管智能体Agent很热门,但它...
探索AGI
0回复
3171浏览
大模型
Agent
流程
NPU 与 GPU 相比,有什么差别?| 技术速览
原创
编者按:随着2024年被业界誉为“AIPC元年”,各大笔记本电脑厂商纷纷推出搭载NPU的全新AIPC,而在介绍产品性能时,“NPU”一词频频被提及。但NPU和我们所熟知的GPU之间的区别究竟是什么?我们今天为大家分享的这篇文章将和大家一起初探NPUvsGPU。简而言之,NPU专为加速AI任务而设计,包括深度学习和推理,能够高效地处理大量数据,并利用专用存储器快速执行复杂的AI算法。与GPU相比,NPU体积更小、成本更低、能耗更小,且在特定...
Baihai_IDP
0回复
3952浏览
GPU
NPU
AI
Amazing!精准可控新视角视频生成+场景级3D生成!北大&港中文&腾讯等开源ViewCrafter
论文链接:https:arxiv.orgabs2409.02048GitHub链接:https:github.comDrexuberyViewCrafter项目链接:https:drexubery.github.ioViewCrafterDemo链接:https:huggingface.cospacesDoubiiuViewCrafter亮点直击本文提出了一种迭代视图合成策略,并结合内容自适应相机轨迹规划算法,以逐步扩展新视图覆盖的区域和重建的点云,从而实现远距离和大范围的新视图合成。本文的方法在多个具有挑战性的数据集上表现出色,不仅在合成新视图...
angel
0回复
3557浏览
AI
生成
时尚穿搭想换就换,各种风格一键完美搭配!这个引爆时尚圈的平台上线了
随着科技的发展,时尚领域也迎来了新的革命。传统的试衣方式逐渐被现代科技所取代,虚拟试衣间的出现使得用户可以在舒适的家中轻松体验不同的服装风格。先前给大家也介绍过一些虚拟试衣的技术,例如AnyFit或者OutfitAnyone等,今天AIGCer给大家介绍一款亲测效果超棒的,可在线操作的平台———DressPlay,是由新加坡华人团队自主研发。它是这场时尚变革中的佼佼者,通过先进的人工智能技术,为用户提供了一种全新的试衣体验。更...
angel
0回复
3518浏览
虚拟技术
AI
LLM 合并新思路:进化算法+零训练->新任务
一、背景我们之前介绍过一些LLM模型融合或堆叠的方案,然而这些方案通常需要人工设计或者继续训练、微调,这里我们介绍一篇新的工作试图解决这些问题,其思路很有意思,为后续的模型生产提供了一条思路,也得到了意想不到的结果。需要说明的是,虽然开源了代码,单开源代码中并没有开放如何合并的代码,导致合并的细节无法获知。此外,相应的代价有多高也没有具体介绍,比如评估成本。对应的论文为:[2403.13187]EvolutionaryOp...
amei2000go
0回复
3830浏览
LLM
合并
零训练
MemLong:用于长文本建模的记忆增强检索
一、结论写在前面论文标题:MemLong:MemoryAugmentedRetrievalforLongTextModeling论文链接:https:arxiv.orgpdf2408.16967LLMs在各个领域的最新进展取得了显著的成功。然而,由于注意力机制的二次时间和空间复杂性以及生成过程中键值缓存的内存消耗不断增加,处理长上下文仍然是LLMs的一个重大挑战。论文提出了MemLong,一种高效且轻量化的方法,用于扩展大型语言模型(LLMs)的上下文窗口。其核心思想是将过去的上下文和知...
sbf_2000
0回复
3191浏览
MemLong
检索
数据集
聊聊基于 Informer+BiGRU-GlobalAttention的并行预测模型
1创新模型效果:1.1模型评估:1.2风电功率预测可视化:1.3电力负荷预测可视化:2模型创新点介绍2.1结合Informer和BiGRUGATT的优势Informer:擅长处理长时间序列,能够并行计算,提高了计算效率和预测性能。Informer在Transformer的基础上进行了改进,使其更适合时序数据,特别是具有长时间依赖的序列数据。BiGRUGlobalAttention:通过双向门控循环单元(BiGRU)同时从前向和后向对序列进行建模,以更好地捕获序列中的依赖关系,...
Tang_Lan
0回复
5005浏览
并行
预测
模型
暂无内容
1
240
241
242
243
244
245
246
247
248
客服