华为云全球率先引入GPU加速型容器,助AI算力高效运转

企业动态
1月25日,华为云·云容器实例(CCI)全球首发基于K8S的serverless GPU加速型容器实例。

1月25日,华为云·云容器实例(CCI)全球首发基于K8S的serverless GPU加速型容器实例。这是继华为云在全球首发基于K8S的容器实例后,为容器实例服务提供更丰富的计算选择,给关注AI、视频处理等高性能计算的企业和开发者带来更多的玩法。

AI算力需求迎来爆发式增长

以AI场景为例,OpenAI发布研究报告,透露2012年到2018年6年间单次AI训练的计算量增加30万倍,这意味着训练计算量每3.5个月翻倍,是摩尔定律的5倍。同时,AI正在向各行各业普及,因此AI算力的需求会出现爆炸式增长。公有云因为低成本的硬件、无需关注基础设施、0交付周期的优势,是客户在有AI算力需求时是更好的选择。

随着容器技术逐渐被各个领域开发者接受,大家发现容器技术可以提供标准化的容器打包,解决AI场景中不同工具对环境的依赖。用户在搭建深度学习训练环境,需要准备带GPU的机器,安装python,tensorflow,GPU驱动等,如果要从开发环境到测试环境,再从测试环境到生成环境,涉及环境迁移过程中如何保证环境的一致性。然而容器带来的标准化打包能力可以提供了***的解决方案,可以极大降低AI平台的复杂度,做到多训练框架并存、大幅简化生产环境部署。

目前K8S已经成为业界最主流的容器管理平台,它提供灵活的编排调度系统,可以满足大规模、高并发的AI分布式训练,大幅提高训练速度。因此,公有云GPU容器实例对AI用户的吸引力越来越高。

华为云·GPU加速型云容器实例

华为云·云容器实例本次发布的GPU加速型容器实例本质是在Serverless K8S的基础上提供GPU算力,这两个技术的结合给AI、基因、视频处理等场景带来不一样的体验。

  • 免运维。相比传统租用云服务器、甚至自建IDC,GPU加速型容器实例无需客户维护集群、考虑集群的升级、社区bug修复、集群资源利用率等问题,直接购买和管理GPU容器实例。同时,CCI提供了可视化的pod CPU/MEM/GPU监控功能,可以实时监控处理过程,极大的简化运维成本.
  • 高性能。华为云GPU加速型云容器实例支持秒级伸缩和高并发,kata容器启动速度实测600ms,集群规模高达上十万容器实例,让客户快速利用GPU实例实现分布式计算。例如,华为云EI使用该GPU容器实例,在斯坦福大学DAWNBench测试中取得前两名的好成绩,并达到0.8+的GPU线性加速比。

  • 低成本。很多高性能计算时长非常灵活,以AI训练为例,很多场景下,客户需要快速、多次计算进行迭代。华为云GPU加速型云容器实例提供按需按秒计费,让客户真正按业务计算市场进行消费,避免包年包月带来的高成本。

华为云·GPU加速型云容器实例在Serverless K8S上展现了免运维、高性能、低成本算力的优势,逐步成为解决AI场景中各种环境问题的利器。未来也将在AI、基因、视频处理等行业,为高性能计算的企业和开发者提供更加高效,安全、低成本的公有云服务。

 

责任编辑:张燕妮 来源: 51CTO
相关推荐

2018-08-28 18:12:58

华为云

2021-03-17 15:12:57

AI 数据人工智能

2017-03-24 11:05:18

腾讯云NVIDIA(英伟达)

2017-12-06 10:50:57

华为云

2024-03-28 14:45:56

2019-05-15 10:50:08

华为人工智能原生AI-Native

2023-04-20 18:17:33

计算

2019-08-24 08:45:10

华为云AI昇腾910芯片

2010-12-29 17:26:47

金农云计算浪潮

2023-07-25 14:12:42

亚马逊云科技

2019-12-16 19:32:55

华为郑叶来多元算力

2018-10-18 11:52:55

华为云

2017-12-08 20:13:43

华为云
点赞
收藏

51CTO技术栈公众号