数据中心短缺如何阻碍人工智能的未来

人工智能 数据中心
数据中心在我们的日常生活中发挥着至关重要的作用,但它们常常被视为理所当然或完全被忽视。每当我们浏览社交媒体、发送消息、在淘宝上订购真空吸尘器或通过银行汇款时,都需要依靠数据中心来处理每一项数字操作。它们是我们IT基础设施的基石。

许多企业投资数十亿美元来开发和采用人工智能技术。虽然很多人都在解释知识产权问题、潜在的监管框架和GPU短缺会如何减缓人工智能应用的发展,但似乎没有人认识到更大的瓶颈:训练和运行人工智能应用所需的数据中心电力和空间短缺。

影响人工智能未来的4个数据中心存储挑战

  • 建设新数据中心的成本
  • 建设新数据中心需要时间
  • 现有数据中心空间不足
  • 功率限制

训练人工智能模型会产生巨大的资源消耗,需要大量的资本、时间、空间和电力来部署。最终,人工智能的进步可能归结为解决数据中心短缺的问题。

为什么数据中心对人工智能很重要

数据中心在我们的日常生活中发挥着至关重要的作用,但它们常常被视为理所当然或完全被忽视。每当我们浏览社交媒体、发送消息、在淘宝上订购真空吸尘器或通过银行汇款时,都需要依靠数据中心来处理每一项数字操作。它们是我们IT基础设施的基石。

但随着人工智能需求的爆炸式的激增,数据中心的容量正在减少,需求明显超过供应。虽然关于人工智能的讨论主要集中在芯片和ChatGPT上,以及人工智能产品将如何增加数十亿美元的收入,但我们应该关注的是回答这样一个问题,当对人工智能的需求超过我们现有基础设施所能支持的水平时,会发生什么?

答案似乎很简单,通过建设更多能力来克服能力不足。然而,在实践中,这变得更加困难。

数据中心短缺的4大原因

随着人工智能的发展,对计算能力的需求呈爆炸式增长,这需要密集、复杂的计算能力来训练。

数据中心行业已经面临满足现有企业数字化转型和公共云使用需求的压力。由于部署新构建的成本和时间都很高,因此数据中心通常是根据预测的需求即时交付来构建的。除了供应已经紧张之外,人工智能的指数级采用还推动了前所未有的需求。

生成式人工智能需要的能力是传统工作负载的五倍。据说ChatGPT-4的智力明显更好,需要更多的力量来训练。人工智能的发展竞赛归结为四个关键的供应限制:资金、时间、空间和权力。

1、资本

数据中心的建设成本高昂。一座25万平方英尺的中型数据中心建筑,要花费近5亿美元才能完全建成。

预计对人工智能的需求在数百兆瓦到千兆瓦之间,全部价格将达到数百亿美元。这是一大笔资金。当利率高企,资金难以筹集时,数据中心的价格就会上涨,这使得筹集必要的资金和满足需求变得更具挑战性。筹集所需资金也需要更长的时间,这延长了建设时间,进一步拖慢了一切。

最近,许多传统数据中心提供商因重组或破产而分心或陷入停滞,这进一步挑战了容量的及时交付。数据中心运营商仍然可以利用这些资金来为新容量提供资金,只是不会像零利率时代那么容易。赢家将是那些拥有有效部署资本和有效运营记录的人。

2、时间

建设一个数据中心需要24到36个月的时间。当然,提供商可以同时进行多个项目,但大多数项目仍需要数月至数年才能完成。在当前需求猛增之前,许多项目都是基于更为温和的需求预测而建造的。

最重要的是,该行业仍在努力应对供应链挑战,以提供为现代数据中心供电和冷却所需的机械、电气和冷却系统。这些时间表已从两年前的12至24周缩短至52至80周。

新容量上线需要时间,而且即使上线也可能不够。然而,拥有数据中心下方的房地产并追求多设施园区战略的运营商将最有能力通过控制土地使用和缩短上市时间来快速扩大规模。

3、空间

整个行业剩余的可用空间所剩无几,特别是在拥有任何额外产能的优先购买权(ROFR)的客户看到需求增长快于供应的情况下,他们现在正在要求这些选择。

目前,GPU驱动的高性能计算(HPC)集群正在被许多企业采用,以训练人工智能应用,但它们并不是数据中心空间需求的唯一驱动因素。超大规模公共云和传统企业技术部署的自然增长也将继续强劲,这将在未来12到18个月内给供应带来更大的压力。如果我们继续沿着这条道路前进,没有任何出人意料的技术创新。

应对这一挑战的解决方案是数据中心提供商设计新设施,以适应从传统的高架地板、风冷企业应用到板式地板和水冷超大规模云或HPC工作负载的工作负载。这确保了无论上线的容量都可以快速适应市场最关键的瓶颈。

4、电源

一切都与电源有关。这些用于人工智能的高性能计算集群中使用的GPU使用的功率是传统工作负载的五倍。

电力已经供不应求,因为我们已经看到主要的数据中心市场宣布限制提供已经承诺的扩展电力。预计这一趋势将持续下去,需求的增加会给电网带来更大的压力,而向可再生能源的过渡需要时间的调整和完善,将产生更多的瓶颈。

智能数据中心提供商通过提高效率,将多设施园区选址在发电源附近,甚至部署自己的分站,走在了前面。

数据中心短缺持续存在会发生什么?

在研究了这四个领域之后,仍然存在一个问题:“如果我们无法克服这些限制,会发生什么?”其影响既深远又容易被忽视。

首先,它可能会阻碍人工智能应用开发人员部署GPU驱动的HPC集群的速度,这些集群需要训练底层大型语言模型(llm),和/或最终的推理阶段,在那里我们看到对基于这些llm构建应用的访问需求。

它还可能会抑制数据中心容量满足云提供商和正在增加现有工作负载企业的需求的能力。如今每个人都已经依赖这些来为SaaS应用、社交媒体、视频流、游戏、电子商务以及现代互联世界的便利提供动力,更不用说未来由人工智能驱动的应用了。

责任编辑:姜华 来源: 千家网
相关推荐

2018-05-04 07:07:40

工智能AI数据中心

2023-09-12 14:49:00

人工智能数据中心

2023-10-09 15:39:28

人工智能数据中心

2018-12-21 15:15:48

2023-04-27 09:44:47

人工智能数据中心

2020-08-17 10:06:25

自动驾驶人工智能数据中心

2023-08-24 15:42:20

2018-09-14 08:38:25

人工智能光纤技术数据中心

2023-03-24 12:54:11

人工智能数据中心

2017-07-26 16:26:47

数据中心人工智能技术

2021-02-21 10:14:59

数据中心人工智能

2020-10-21 14:48:00

机器学习人工智能数据中心

2019-03-19 12:46:04

人工智能数据中心运维管理

2023-05-30 18:39:08

人工智能数据中心

2023-09-26 10:40:09

人工智能数据中心

2021-03-22 12:08:30

人工智能

2023-12-22 10:06:32

数据中心人工智能AI

2023-01-03 10:47:35

人工智能自动化

2022-03-07 14:30:09

人工智能数据中心远程工作

2024-04-15 11:25:41

数据中心人工智能能源消耗
点赞
收藏

51CTO技术栈公众号