chengganfei
LV.2
这个用户很懒,还没有个人简介
声望 195
关注 0
粉丝 0
私信
主帖 21
回帖
OpenAI正通过其Stargate项目重塑AI格局,这是一项与Oracle和SoftBank合作的宏大计划,在美国德克萨斯州阿比林(Abilene,Texas)建设全球最大的单一数据中心。这一占地900英亩的庞然大物已消耗300兆瓦(MW)电力,远超埃隆·马斯克(ElonMusk)旗下xAI的Colossus——一座拥有20万个GPU、功率250兆瓦(MW)的设施。OpenAI计划到2026年中将阿比林数据中心的功率提升至创纪录的1.2吉瓦(GW),并获得高达5000亿美元的四年投资以及白...
2025-06-30 00:25:56 771浏览 0点赞 0回复 0收藏
谷歌近期在AI领域迈出重要一步。2025年5月,OpenAI——ChatGPT的开发公司及微软的重要合作伙伴——与GoogleCloud达成协议,租用其TensorProcessingUnit(TPU),为AI硬件市场带来显著影响。这不仅是一项云服务合作,更是一次战略调整,挑战了Nvidia在GPU领域的领先地位,凸显了微软的资源瓶颈,并巩固了谷歌定制芯片的市场竞争力。OpenAI的战略选择:为何转向谷歌?OpenAI业务增长迅速,据路透社报道,截至2025年6月,其年化收...
2025-06-30 00:19:37 929浏览 0点赞 0回复 0收藏
来源:https:newsletter.maartengrootendorst.compavisualguidetomixtureofexperts如您关注最新发布的大型语言模型(LLM),可能会频繁在标题中看到“MoE”这个词。那么,“MoE”究竟是什么?为何众多LLM都开始采用它呢?在这份图解中,我们将通过50多张可视化图,详细探索这个重要组件——混合专家模型(MixtureofExperts,MoE)!在这份图解中,我们将深入探讨MoE的两个主要组成部分,即专家(Experts)和路由器(Router),及...
2025-06-17 06:23:17 1368浏览 0点赞 0回复 0收藏
​核心观点1.大语言模型推理的定义常规观点:大语言模型(LLM)的推理被视为类似人类的高级能力,定义模糊,常引发争论。Zhou的观点:推理争论因缺乏明确定义而无意义;Zhou将推理定义为输入与输出之间的中间Token(推理步骤),仅是模型输出的可预测行为,而非神秘过程。2.预训练模型的推理能力常规观点:预训练模型需通过思维链(CoT)提示或微调才能具备推理能力。Zhou的观点:预训练模型已具备推理能力,推理路径存在于输出...
2025-06-04 06:52:09 1242浏览 0点赞 0回复 0收藏
​摘要本文批判性地区分了人工智能代理(AIAgents)与代理式人工智能(AgenticAI),提出了结构化的概念分类、应用映射和挑战分析,以阐明二者在设计理念和能力上的差异。本文首先概述了搜索策略和基础定义,将AI代理描述为由大型语言模型(LLM)和大型图像模型(LIM)驱动的模块化系统,专注于狭窄、特定任务的自动化。生成式人工智能(GenerativeAI)被定位为前驱,而AI代理通过工具集成、提示工程和推理增强得以发展。相比之...
2025-05-21 07:26:16 2962浏览 0点赞 0回复 0收藏
光子技术(Photonics)在数据中心AI加速中扮演着日益重要的角色。光学组件的全球市场规模已相当可观,去年收入达170亿美元。历史上,电信领域(如海底光缆和光纤到户)主导了需求。然而,如今数据通信领域,尤其是AI驱动的数据中心,已占据市场超60%的份额。这一转变正在加速光学技术的增长。为匹配AI计算集群(包括GPU和定制加速器在内的xPU)不断提升的性能,光学传输速率正迅速提高。图1:光学组件市场历史与预测。来源:OMD...
2025-05-08 00:58:28 1008浏览 0点赞 0回复 0收藏
什么是AI代理?AI代理是一种软件组件,具备代表用户或系统自主执行任务的能力。用户可将多个代理整合为系统,以协调复杂的工作流程、协同管理各代理间的活动、运用逻辑推理解决复杂问题,并评估用户查询的响应。如果你曾与客户服务聊天机器人互动,或要求生成式AI模型创作一首十四行诗,那么你已经接触到AI代理的基础形式。若你察觉自ChatGPT推动生成式AI成为主流以来,其性能显著提升,你的观察并无偏差。尽管AI代理的概念已存...
2025-04-23 07:50:06 1595浏览 0点赞 0回复 0收藏
​MinIOMinIOAIStor与ModelContextProtocol(MCP)Server应用的AI能力自然语言处理(NLP):支持与主流大语言模型(LLMs)如AnthropicClaude或OpenAIGPT集成,用户可通过自然语言进行意图驱动的查询(如:“FindunclassifiedimagesinbucketX”),无需编写结构化命令,从而实现对存储系统的类对话式交互。自动元数据标注:借助MCPServer的askobject功能,通过AI模型自动提取和分类非结构化数据(如图像元数据),可能基于嵌入式...
2025-04-11 00:21:34 1833浏览 0点赞 0回复 0收藏
​标题:UBMesh:aHierarchicallyLocalizednDFullMeshDatacenterNetworkArchitecture作者:HengLiao,BingyangLiu,XianpingChen,ZhigangGuo,ChuanningCheng,JianbingWang,XiangyuChen,PengDong,RuiMeng,WenjieLiu,ZheZhou,ZiyangZhang,YuhangGai,CunleQian,YiXiong,ZhongwuCheng,JingXia,YuliMa,XiChen,WenhuaDu,ShizhongXiao,ChungangLi,YongQin,LiudongXiong,ZhouYu,LvChen,LeiChen,BuyunWang,PeiWu,JunenGao,XiaochuLi,JianHe,...
2025-03-31 01:39:11 7944浏览 0点赞 0回复 0收藏
​题目:FrontiersofAIandComputing:AConversationWithYannLeCunandBillDally谈话人:BillDally,ChiefScientistandSVPofResearch,NVIDIAYannLeCun,ChiefAIScientistatMeta,ProfessoratNewYorkUniversity时间:March2025(GTC2025)核心观点1.AI发展方向BillDallyAI在过去十年取得显著进展,尤其得益于计算能力的提升,如GPU性能从Kepler到Blackwell增长5000至10000倍。AI未来需关注训练与推理的权衡,强大模型需更多训练资源,较...
2025-03-31 01:31:22 2041浏览 0点赞 0回复 0收藏
​核心观点1.HPCAI市场的快速增长与不确定性并存2024年HPCAI市场展现出强劲增长势头,超大规模AI基础设施投资翻倍,ElCapitan等超算项目的突破标志技术进步。然而,AI热潮可能对传统HPC构成挤压风险,同时存在泡沫破裂的担忧。2.超大规模AI主导市场,传统HPC面临转型压力超大规模AI市场预计从2022年的约5万单位增长至2028年的25万单位,远超本地部署HPCAI(2028年约5万单位),显示其主导地位。云化趋势可能压缩本地HPCAI市场,...
2025-03-18 08:48:31 1980浏览 0点赞 0回复 0收藏
预计到2028年,AI的应用将促使企业数据存储需求呈现指数级增长态势。根据我们于2024年11月开展的一项调查显示,在主要依赖云存储管理AI数据的基础设施采购决策者中,61%的受访者预计其存储需求到2028年将至少实现翻番。驱动这一需求增长的关键因素包括:数据保留周期的显著延长(从6个月延长至永久保存);73%的受访者表示,他们采用了每日或每周一次的大型语言模型(LLM)检查点机制80%的受访者认为数据多副本对于AI数据管理“...
2025-03-06 09:58:57 2167浏览 0点赞 0回复 0收藏
人们——此处特指“华尔街”及个人投资者——时常怀有非理性的预期。这一现象正发生在仍被我们称为Google的公司身上,毕竟Alphabet仅为一家控股公司,主要持有Google的股份。昨晚市场收盘后,Google携手AMD公布了2024年第四季度的财务业绩,但华尔街对这两家公司合理增长及盈利状况并不买账。并非所有公司都能如NVIDIA在过去一年半中所享有的那般财务表现,即便身为NVIDIA的强大合作伙伴,Google亦是如此。(Google有自研的TPU...
2025-02-08 14:08:54 2550浏览 0点赞 0回复 0收藏
​随着各行业企业为2025年的AI投资和战略布局做准备,我们总结了企业在未来一年的核心关注点:基础设施将成为最紧迫的投资领域,企业将重点构建AI代理(AIagents)和AI系统。企业将聚焦于数据优势(dataadvantage),以通过AI获取竞争优势。AI培训将致力于推动员工行为变革,促进AI的广泛采用,并构建“人类参与”流程(humanintheloopprocesses)。AI将继续成为2025年每位业务领导者战略计划的核心。根据最新调查显示,70%的企...
2025-01-15 12:04:53 2530浏览 0点赞 0回复 0收藏
​数据驱动的AI变革:AI的普及推动了存储系统从单纯追求性能向企业级综合能力(包括数据管理、效率、韧性等)转变,并凸显了高质量数据和有效数据治理对AI战略成功至关重要的作用。高性能对象存储崛起:对象存储正通过技术创新,突破传统应用边界,向高性能计算领域(尤其是AI和数据分析)拓展,并有望挑战并行文件系统的主导地位。AI驱动混合云智能化升级:企业级AI工作负载的需求推动混合云从资源整合向更智能的集成和优化演...
2025-01-07 11:34:39 3459浏览 0点赞 0回复 0收藏
​关键洞察AI驱动存储转型:AI的需求推动了对象存储成为企业存储的主导技术,尤其是对于大规模数据处理和并行计算工作负载,尤其是在AI模型训练、推理及数据湖仓存储中。对象存储的普及:超过70%的云原生数据已存储在对象存储中,预计两年内这一比例将增至75%。对象存储因其性能、扩展性、安全性等特点,成为支持AI工作负载的首选技术。AI工作负载对存储的需求:AI(尤其是生成式AI)对存储性能和规模提出更高要求,对象存储能...
2024-12-27 13:51:29 2818浏览 0点赞 0回复 0收藏
会议:NeurIPS2024时间:December14,2024发言人:IlyaSutskever主题:SequencetoSequenceLearningwithNeuralNetworks:WhataDecade​IlyaSutskever是论文《基于神经网络的序列到序列学习》(SequencetoSequenceLearningwithNeuralNetworks)的第一作者。该论文荣获了NeurIPS2024的“TestofTime”论文奖。该奖项旨在表彰在2014年NeurIPS会议上发表、对研究领域产生了重大影响并经得起时间考验的论文。自发布以来,该论文已被引用...
2024-12-18 12:08:04 3758浏览 0点赞 0回复 0收藏
TeslaDojoTesla自研的D1芯片采用7纳米制程,包含354个核心,每个核心拥有1.25MBSRAM,支持多种数据格式。单芯片计算能力达362TFLOPS,专为自动驾驶AI并行计算优化。DojoV1系统包含6个训练模块,共5.31万个核心,运算能力为1exaflops;完整ExaPod系统扩展至120个模块,106.2万个核心,目标运算能力为20exaflops。每个训练模块提供9petaflops计算能力,配备高带宽内存,单模块功耗15千瓦。采用水冷设计,内存带宽达400GBs(读取)...
2024-11-29 15:04:03 2599浏览 0点赞 0回复 0收藏
生成式AI的挑战数据准备和管理:生成式AI的训练需要整合分散在多个系统中的数据,数据格式复杂,常包含缺失值和噪声,影响模型的训练效果。企业需高效收集、清洗、转换这些数据,并且要满足大规模数据处理和高速存储需求。同时,必须确保数据的安全和隐私合规。模型训练和部署:训练生成式AI模型需要大量计算资源和长时间的训练,硬件成本高且训练周期长。选择合适的模型架构和超参数至关重要,并且需要有效的版本控制来管理多...
2024-11-22 11:57:57 2841浏览 0点赞 0回复 0收藏
数据加载过程与性能优化数据加载的复杂性数据加载并不仅限于从存储读取数据,它涵盖了解码、格式转换及数据增强等预处理环节。这些步骤通常在CPU上执行,目的是将原始数据转换为GPU可处理的张量格式。数据加载的步骤数据加载流程可以概括为:​从存储系统读取数据到系统内存。解码原始数据。应用数据变换和增强操作(如裁剪、尺寸调整)。将处理后的数据传输至GPU。​预取器的作用预取器显著提升数据加载效率,它在模型训练需要...
2024-11-15 16:34:05 5679浏览 0点赞 0回复 0收藏
获得成就
已积累 1.2w 人气
获得 0 个点赞
获得 0 次收藏