对象存储系统 vs Hadoop 云存储怎么选?

云计算 Hadoop
云存储选择适用于广泛的需求,但是要针对你的需求找到正确的存储类型,也意味着要找到延迟、易用性、数据完整性和成本之间的合适的平衡点。对象存储系统和Hadoop都是可行的云存储选择。但是在执行云端大数据分析的时候要考虑后者。

[[128498]]

选择多如牛毛,为你的应用选择***的云存储系统并非易事。但是对象存储系统是一个选择,尤其是如果你的应用要求访问控制。而那些使用云进行大数据分析的则要考虑Hadoop。

对象存储系统,比如AWS S3、微软Azure Blob和谷歌云存储,可以在一个持久稳固且高度可用的系统中存储任意的对象,且独立于虚拟机实例之外。应用和用户可以在对象存储中使用简单的API访问数据;这些通常都基于表属性状态转移(REST)架构,但是也有面向编程语言的界面。

对象存储提供了数据上受限操作的访问控制。数据管理员可以在bucket层级上(类似于目录)或者对象层级上(类似目录中的文件)应用访问控制。存储对象的授权/认证通过云提供商的身份认证管理系统或者你的目录服务来管理。通过后者,你可能有一个本地的目录,同基于云的目录服务同步,巩固所有的访问控制角色和进入单一注册库的特权。

提及存储,对于那些使用云进行大数据分析的还有额外的选择考虑。比如AWS提供了弹性Map Reduce (EMR),这是一项Hadoop服务。Hadoop旨在同期文件系统工作,以HDFS著称。

当用户用EMR创建了一个Hadoop集群,他们可以从AWS S3或者一些其他的数据存储复制数据到集群上的HDFS,或者也可以直接从S3访问数据。HDFS使用本地存储,而且通常提供了比从S3恢复更好的性能,但是在运行Hadoop工作之前,也需要时间从S3复制数据到HDFS。如果EMR集群要运行一段时间,且针对多项工作使用相同的数据,可能值得额外的启动时间来从S3复制数据到HDFS。

云存储选择适用于广泛的需求,但是要针对你的需求找到正确的存储类型,也意味着要找到延迟、易用性、数据完整性和成本之间的合适的平衡点。

控制归档成本

云存储的另一个常用用例是归档。这个程序要需要较长时间复制数据来进行持久的存储。下面是在控制归档成本时需要考虑的三个内容:

  • 归档数据一次写入且很少读取。因此,***先考虑的就是受限的归档成本。
  • 对象存储可以用来归档,但是除非你需要低延迟检索,开支可能要比所需高。
  • AWS提供的Glacier归档存储服务成本比S3大幅减少。从Glacier检索数据用时数小时,因此并不适用于大多数应用。

原文链接:http://www.searchcloudcomputing.com.cn/showcontent_87943.htm

责任编辑:Ophira 来源: TechTarget中国
相关推荐

2014-01-07 09:15:24

云集成云存储RESTful

2013-02-22 11:07:36

Red Hat开源Hadoop

2016-11-23 09:57:45

Apache KuduHadoop存储

2017-07-10 09:02:24

NAS存储云存储

2018-09-29 14:08:04

存储系统分布式

2018-01-31 08:44:20

数据存储存储设备存储系统

2017-02-20 07:57:42

Kudu快速分析Hadoop

2016-12-06 20:01:00

超融合

2017-07-04 10:58:57

SAN存储网络存储系统架构

2017-11-08 11:22:46

存储趋势系统

2018-03-07 10:35:45

云计算存储系统

2020-08-25 09:14:17

对象存储文件存储块存储

2014-02-19 11:37:57

分布式对象存储Sheepdog

2013-12-27 10:56:42

分布式对象存储Sheepdog性能测试

2014-12-17 12:46:17

华为存储

2018-07-03 08:48:48

对象存储块存储

2018-01-19 08:35:47

存储系统SAS

2019-11-12 09:47:34

KubernetesMinio存储

2011-11-25 10:12:42

虚拟化存储虚拟化

2015-12-27 23:28:19

云存储
点赞
收藏

51CTO技术栈公众号