这些分布式存储产品谁更胜一筹?FusionStorage、XSKY、Ceph、vSAN、SmartX 等……

存储 分布式
想了解关于FusionStorage、Ceph、vSAN、SmartX等分布式存储产品优劣对比,以及未来的技术演进趋势如何?

 [[324413]]

想了解关于FusionStorage、Ceph、vSAN、SmartX等分布式存储产品优劣对比,以及未来的技术演进趋势如何?

FusionStorage在对象存储这块和C系的XSKY的比较?

FusionStorage与Ceph、vSAN、SmartX的对比,包括块、文件、对象详细的对比?

问题来自@csj11341 北明 项目经理,下文来自twt社区众多同行实践经验分享,欢迎大家参与交流,各抒己见。

@刘东 东软集团 IT技术咨询顾问:

FusionStorage可以支持基于X86服务器的分布式对象存储,而XSKY支持对象存储的组件叫做 XEOS或者可以使用 XEDP统一存储组件来做,除了支持 X86服务器服务器以外,还支持基于POWER芯片的服务器,支持更广泛,生态建设的比较好。

1、FusionStorage与Ceph对比

块存储方面:FusionStorage与Ceph在支持块存储方面都比较好,而且块存储也是 Ceph的主要支持优势, FusionStorage也做了块存储支持的加强,毕竟是商业版本,性能优化上比较好。而且还通过了Oracle RAC的认证,这个是为数不多的可以支持Oracle RAC的分布式块存储,可以支持在分布式存储上更好的部署Oracle 群集环境。

文件存储方面:Ceph在支持文件存储上相对较弱,不直接支持 scsi,需要自己自己搭建scst或lio服务端来支持 scsi接口,而且没有高可用。FusionStorage可以让每个iscsi 目标端部署所有的主机节点上,支持虚拟IP地址配置,可实现高可用对接vmware,winserver和数据库等等。

对象存储方面:对象存储Ceph是最大的一个优势,因为它的本质上就是一个“对象存储”,其块和文件服务都是基于对象提供的,因此对象的性能上是最优的> ceph 块> ceph 文件。FusionStorage相对 Ceph的优势是除了可以支持对象,在分布式块、文件、 对象存储的融合方面做的比较好,支持功能和性能上比较全面,在生产环境中可靠性也比 Ceph更高。

2、FusionStorage与 vSAN 对比

块存储方面:FusionStorage支持的块存储可以提供给多种虚拟化环境使用,除了VMware以外,还可以支持基于VMware ESXi、Microsoft Hyper-V、Citrix 等企业级虚拟化平台的统一存储需求,简化存储基础架构,避免孤岛。而 vSAN只能用于 VMware自身的虚拟化环境。

文件存储方面:vSAN 文件服务使用 vSAN 分布式文件系统 (vDFS) 来提供与基于 vSAN 存储策略的管理功能相集成的可扩展文件系统。只能为 VMware虚拟主机提供文件服务,而 FusionStorage不受限制。

对象存储方面:vSAN不能直接支持对象存储, vSAN更多是为 VMware ESXi主机提供文件存储服务,对象存储需要通过在 VMware 中部署类似 ceph的对象存储软件来支持对象存储环境。FusionStorage虽然也是对象存储软件,但是 FusionStorage 是原生支持对象服务的,底层是基于X86物理服务器的。

3、FusionStorage与 SmartX 对比

块存储方面:FusionStorage和SmartX都是商业版分布式存储软件, FusionStorage和 SmartX 目前都是自主研发的,都支持基于X86服务器的分布式存储场景。相对于 FusionStorage分布式存储软件, SmartX的性价比似乎更高一些。

文件和对象存储方面:SmartX 分布式存储ZBS是一种分布式块存储软件,无法直接支持文件和对象存储服务,可以通过在块存储设备的服务器上部署NAS软件和OBS软件间接提供文件存储和对象存储服务。FusionStorage可以原生支持文件存储和对象存储。

未来的技术演进趋势:

未来技术一定是以分布式存储为主、传统阵列为辅的架构, 分布式存储的灵活性是传统阵列无法取代的,随着分布式存储的性能、可靠性和稳定性的不断提高,其各方面功能都逐渐完善,可以逐步的替代传统阵列,组建一个软件定义存储( SDS )的数据中心。但是传统阵列仍然有其自有的存储场景,会长时间并存。从技术来看,融合存储和统一存储是未来技术发展的趋势,而且在各个行业都会有其细分市场,应对不同的业务场景。

@wenruoyiming 山西恒信科技有限公司 网络工程师:

首先我觉得有必要区分分布式存储和 SDS 这两个名词的边界。

分布式存储:

分布式存储是架构,如果仅仅讨论分布式存储本身, EMC Islion ,华为 N9000 ,D ELL EQL ,这些分布式架构的存储都应该放进来比较,这部分有个特点,基于分布式架构,但是存储操作系统出厂预装好了,大部分 SDS 都可能是分布式架构,但是并不是所有分布式存储都能算进 SDS 里面去,至少没有人认为 Islion 算 SDS。

基于分布式架构的软件定义存储,简称 SDS :

这里面 C 系的除了 XSKY ,还包括 H3C Onestore 、群顶的TDS 、元核、苏州移动研究院面向移动系的产品。另外非Ceph 系的,包括题目中提到的 FusionStorage;但是我认为不包括 VSAN (跟Vsphere 一起组成了 VXRail )以及 SMARTX、Nutanix 这些严格意义应该划分到 HCI 范围的产品。

再来说说楼主提到的 FusionStorage 和XSKY的比较问题:

市场端的表现:

华为最早的对象产品是 UDS ,从公有云继承的产品,架构太重,一直没怎么卖, 17 年架构推倒重新定义更名为 FusionStorage8.0 对象存储, 19 年开始对外宣传,但是官网现在还没有详细的介绍材料。

XSKY 非常好的利用了其自身 Ceph 社区的优势,用自己的商业软件帮助用户解决 Ceph 环境的问题,同时在推动了对象存储在国内的落地。

技术架构的差异:

华为对象主打大数据场景,感觉是大数据的一个配套,单桶 1000 亿小文件的支持也是其主打的一个规格差异。

XSKY 主打一个数据平台解决所有问题,对象是其中的一个方案, XSKY 对象产品主打的场景:海量小文件、大数据、、多数据中心等,比较突出 NFS&S3 互访问、属性查询等功能。

销售方式的差异:

华为喜欢推荐端到端的解决方案,上下打通,提供一揽子的解决方案,用户相对比较省心。

XSKY 只是卖纯软件,推荐软硬件解耦的方案,相对用户的自主性大一些。

@chinesezzqiang 信息技术经理:

FusionStorage和vsan比较:

封闭:vSAN只配合vSphere一起配置和使用,不支持其他虚拟化平台。而华为的FusionStorage没有限制;

性能:根据测试数据,FusionStorage是vSAN的3倍,IOPS可达130万;

规格:vSAN仅支持64个物理节点,Fusionstorage可以支持4096个节点。

FusionStorage和ceph比较:

属性:FusionStorage属于商业化产品,具备较好的服务支持,Ceph为开源产品,服务支持差;

性能:相同节点的情况下,FusionStorage性能远高于Ceph;

可用性:FusionStorage的高可用解决方案成熟度高,Ceph的高可用方案需要借助其他软件支持,且存在不稳定性;

运维成本:FusionStorage具备成熟、完整的服务支持体系,运营成本低。Ceph需要专门的IT团队,运维成本高。

FusionStorage和Smartx比较:

属性:两者均为成熟的商用产品;

性能:企业为部署FusionStorage和Smartx,但是从论坛及其他渠道获悉,FusionStorage的性能略高。

@zhuqibs Mcd 软件开发工程师 :

FusionStorage和vSAN比较:

(1)vsan:在vsphere中使用,性能尚可;FusionStorage没有限制

(2)性能比较:有报道说,FusionStorage是vsan的3倍

(3)规模比较:Fusionstorage可以支持4096个节点,而vsan只支持64个节点。

(4)耦合性:vsan和vsphere紧耦合,可靠性受到影响,而FusionStorage没有

FusionStorage和Ceph比较:一个开源,一个商业化,而Ceph还不包硬件,这对Ceph很不公平

(1)性能比较:FusionStorage远远高于Ceph

(2)使用场景:FusionStorage支持所有可以对接iscsi协议的客户端,比如windows、vmware、异构虚拟机,数据库等使用场景

(3)规模比较:Ceph规模也可以上千,但性能更为不佳

(4)可用性:Ceph+iscsi的高可用方案不佳,FusionStorage可以实现较为完整的高可用。

FusionStorage和Smartx比较:

(1)性能比较:FusionStorage较高,但基本不相上下

(2)规模比较:都可以部署方案在上千节点上

(3)耦合性:都是松耦合

@吴桦 SmartX超融合 产品经理:

个人认为技术没有绝对的好坏,最重要的是用户需要对产品和自己的需求有准确的理解和把握,因为合适的产品才是好的产品。

部署模式:首先,如上提到的SmartX分布式存储叫SMTX ZBS,既可以支持融合架构的部署(作为超融合软件SMTX OS的一部分),也可以以分离架构进行部署,用户可以灵活选择。分布式块存储作为超融合部署模式会有两个独特的需求,就是存储在高性能的同时还要占用计算资源少,另一方面,就是超融合独有的数据本地化,SMTX ZBS在这两方面做的都做的比较出色;

主打的存储场景:无论是超融合部署,还是分离部署,SMTX ZBS都主打块存储,这种存储场景的需求特点是高IOPS、低延迟,可靠性要求高。不同的存储场景对产品的架构、实现以及优化方向是不一样的,虽然有一些产品可以支持多种存储接口协议,但很难做到块存储、文件存储和对象存储都做好。所以我们会围绕一种模式打磨产品。

产品实现方式:Ceph以及基于Ceph包装的产品是基于开源代码,产品发展取决于社区而不是厂商,而包括SMTX ZBS在内的其他产品都是商业产品,由于投入大量开发,单纯的采购成本肯定更高,但产品的服务和发展更有保障。

性能:很多人都提到了性能的对比,但我们认为任何缺乏统一的测试方法,硬件配置的性能对比都是不严谨的,以上有些专家提到与 FusionStorage 产品性能对比的情况,因为不知道数据来源,也无法认同这样的结论,目前无论在 POC 测试结果或者实际使用,SmartX 分布式存储性能从未在同等硬件条件下逊于 FusionStorage。目前可以给大家参考的数据是SMTX ZBS在超融合模式下使用NVME SSD作为缓存的话单节点4K随机读就可以高达20万IOPS了,但这些也都是要在明确的硬件和测试方法的基础上得出的。

@邵国健 XSKY 软件架构设计师:

题主提到的几家产品中,XSKY和FusionStorage属于SDS,而vSAN和SmartX属于HCI,理论上很难直接对比。

从技术架构和产品上,XSKY与上述几家产品最大的差异是XSKY提供统一存储平台XEDP,即一套存储系统同时提供块、文件和对象存储服务。此外,对于特定的场景,也提供独立的产品。

块存储:XSKY自主研发的数据网关XDC,能够同时支持iSCSI, SCSi, FC, RBD等协议,在OpenStack场景下能够提供IO聚合功能,同样的配置能支持更多虚拟机,同时提供在线升级功能。支持VMware VAAI特性,能够无缝应用于VMware虚拟机化场景。支持纳管卷和在线卷迁移,能够提供虚拟机的存储热迁移特性。

对象存储:支持单集群百亿小文件规模和对象存储多站点功能,为应用提供本地优先读写能力;数据分层,支持本地存储到外部各种存储的数据流动,比如能够自动将冷数据归档到云端存储;S3 Console,面向S3用户的独立的图形化界面,快捷管理对象存储数据;专为HDFS优化的高性能客户端,提供比S3a更优的大数据存取性能。

文件存储:支持FTP、SMB、NFS等协议,支持本地、AD、LDAP等用户管理,文件定时快照,文件系统克隆、回滚、访问日志等功能。

除此以外,也提供数据保护功能,能对块、文件和对象存储的数据进行复制和备份。

@潘延晟 系统工程师:

VMware 超融合方案支持vSphere虚拟化 + vSAN分布式存储 + vCenter管理模式,每一个部分都是付费的模块。

SmartX超融合方案架构的一个最大的差异首先来自于其既可以支持vSphere虚拟化 + SmartX 分布式块存储(ZBS)模式,也支持SmartX 免费的虚拟化平台ELF,甚至Ctriix的 Xenserver虚拟化。而SmartX的ELF是无需付费的。其中,SMTX 内嵌的虚拟机服务是免费模块,同时,SMTX 分布式块存储可以同VMware vSphere、Citrix XenServer 构成超融合方案。

VMware vSAN 是 vSphere 原生软件定义的存储平台,可帮助客户向超融合基础架构 (HCI) 转变,降低 IT 成本并为未来变革准备敏捷解决方案。

它的优势主要有:

1)vSAN 与 ESXi 结合紧密,部署比较方便,和 ESXi 一次部署完成;

2)凭借 VMware vSphere 优良生态的先天优势,vSAN 推出不少相关的生态合作方案;

3)vSAN 获得 ESXi 内核级别的支持,运行效率高,能输出不俗的性能。

但同时,vSAN也有一些美中不足,比如:

1)无法支持多 hypervisor 环境

2)与 ESXi 耦合度高且兼容版本有限

3)vSAN 引起 VMware HA 的限制

4)vSAN 无法支持 MSCS 和 WSFC

SmartX ZBS 来自国内超融合厂商SmartX,基于 VMware vSphere 超融合部署,适用度更强,让IT管理更直接、更高效。其差异化的优势体现在以下几方面:

1)松耦合,更灵活

2)不中断,更稳定

@雪落无痕 欧科:

金融行业的分布式架构的 SDS 应用今天已经非常广泛了,但是实际上跟 HCI 的应用领域是完全不同的差异性,简单介绍下:

SDS 适用或者可以涉及的场景:

  • 开发测试( Openstack, 容器, Vmware , Zstack );
  • 内容管理,电子影像,双路等等,从 NAS 到对象的趋势非常明显;
  • 大数据,采用基于对象或者文件的原生或者客户端对接方式,代替 HDFS 的重复投资,华为, XSKY , EMC 都有类似的方案;
  • 跨站点容灾,同城双活,基于数据面的双活高可用,是 SDS 的强项所在, SDS 四,六副本天然跨站点的优势,延展集群不用再依赖第三方双活软件。

HCI 适用或者涉及的场景:

  • 分支机构办公
  • VDI 桌面办公
  • 基于 KVM 或者 Vspher 某种形态的开发测试环境,无法混用

对于金融机构, HCI 测试评估进入的时间短,进入的节点数少,易于立项和快速投入生产,对于业务单元的支撑具有天然的优势,但是存算一体化天然的,不利于与存算分开扩容,大部分场景只支持块,文件需要通过 Licenses 来支持( Nutanix ),而对象就更加只能是独立的一套产品了。

SDS 进入金融机构的时间较长,需要评估的场景较多,当然,因为适用的面更广,进入评估,预研,测试的周期大多数金融机构超过 6 个月,但是数据面,资源面高度弹性和扩展性,让 SDS 天然适用于中大型金融机构, PB 级的数据量,块,文件,对象等等的混合应用场景,甚至目前已经可以针对 CDH 大数据存算分离的架构,甚至绝大部分不用重新搭建 HDFS 集群,极大的降低了金融机构的整体成本,另外 SDS 本身是数据湖建设的关键环节,数据热,温,冷根据时间可以在应用层面自由的流动,也打消了跨机房,跨地市的数据边界,通过桶复制,对象多站点,在 SDS 内部,和 SDS 到第三方之间,形成了天然的桥梁。所以在选择 SDS 方面,研发基础架构基于 SDS 就已经决定了企业未来使用数据的边界。

 

责任编辑:武晓燕 来源: twt企业IT社区
相关推荐

2018-03-26 14:09:00

缓存Redis分布式缓存

2020-03-06 09:21:28

PWA原生应用Web

2010-05-28 11:21:17

2018-06-12 10:09:41

编程语言PythonJava

2014-03-06 15:07:41

青橙小米

2022-07-20 08:16:54

Lombokjava工具

2020-02-02 15:42:22

PythonC++编程语言

2020-01-18 14:55:03

架构运维技术

2017-01-11 14:38:39

编程语言Java

2017-11-13 15:38:03

VMwareOpenStack混合云

2019-01-04 09:59:14

KafkaRabbitMQMQ

2018-10-12 13:54:26

2010-05-21 16:36:09

GoogleCode

2010-07-27 14:36:31

Flex Array

2013-02-19 13:13:33

SurfaceiPad

2017-06-08 15:38:41

2015-12-08 13:48:50

大数据工具R语言Spark

2023-04-26 07:34:38

Java并发编程

2020-07-28 09:55:20

自拍华为三星
点赞
收藏

51CTO技术栈公众号