15万买到64万? 一台全闪阵列的生意经

企业动态

 

[[177235]]

 

作为存储管理员,以前只要守卫技术象牙塔,真是怎么爽由自己!

 
偶尔被拉进一个什么销售动员大会,还可以教育台下一众“技术小白”,讲一讲我们存储的技术原理、管理流程,让他们明白,所谓的促销战役对于我们存储来说,是极为不靠谱的!
 
可是现在,连平常甚少逛街的我都发现了,电商还真是“多快好省”啊!但说归说,那些销售部门分分钟搞出来的造节、大促,对于IT部门仍然是“被战役”!要上线新服务,提供新的存储卷,做数据分析,真真一个“烫手山芋”啊!
 
短暂的纠结过后,还得面对现实,毕竟“互联网+”给各行各业带来的冲击是有目共睹的!作为企业的IT管理人员,岂能坐视不理?
 
该干的活儿还得咱自己想办法!找个专业人士咨询则个!
 
 
第一个想到的,便是去拜访主张“加速促进新解决方案落地”的企事录团队,联合创始人曾智强在企业级存储领域有很多独到见解,想必能给我一些中肯的建议! 
 
果然,了解我的问题与困惑以后,曾智强迅速把解决方案锁定为全闪存阵列,“你要的是性能,又不太重容量”,而且,“一台配6个SSD的全闪才15万起步,每IOPS才一块钱!”
 
后来的沟通证实,这个建议背后源于企事录团队刚刚做过的一轮全闪存阵列评测,针对目前企业存储的挑战与存储管理员的困惑,犹如剥笋一般层层分解,最终得来“金句”。
 
一起来看专业评测如何剥笋吧,有图有真相!
 

拓扑图显示,整个测试环境采用传统的SAN架构,最上是戴尔PowerEdge R930四路服务器(72物理核心512GB内存),安装Oracle Linux 6.6和Oracle 12c,通过两块双端口FC HBA与中间的Brocade 6505 16Gb/s FC交换机相连接,因为是测试环境,交换机只有一台,并没有冗余设置。
 
最下即全闪存阵列,来自戴尔的Storage SC4020,配备了20块200GB容量的SSD,一块为热备盘,19块盘以一种类似于RAID 10的方式冗余。
 

 
据说,戴尔官方售价15万8千8百8十8的SC4020全闪配置的是6块容量为480GB的SSD,可以根据用户需求以“颇为惊喜的代价”升级为6块容量为1.92TB的SSD,曾经的“新贵”甩掉偶像包袱啦!
 
一个小插曲是,测试中前端Oracle数据库服务器上插的两块FC HBA卡,却只有3条FC通道,企事录团队的解释是一个光模块出了点问题,实验室里面也没有适合的备件。
 
这个问题倒是很常见,光模块跟HBA卡、FC交换机不是同一家厂商供货,指不定就有链路不通,或者带宽降低等兼容性问题。
 
看过价格和架构,重点来看数据库性能,见下图“8K数据块的随机读性能”▼
 
 
测试8KB数据块随机读取获得的结果:最大IOPS接近29万,平均响应时间在1ms(毫秒)以内,突发响应时间(最大延迟)在32ms左右,这样看来,性能非常好。我现在使用的高端存储,配了几百块盘,加上优化以及缓存的作用,IOPS也不过才几万。
 

 
同一个测试中的另一组成绩,8KB随机读的带宽最高到2264MB/s,考虑到服务器只是用了3条8Gb/s FC通道,理论带宽是2400 MB/s,已经可以认为是到达FC通道的极限了。
 
来自测试团队的另一组数据证实了我的想法,果然是服务器与FC交换机之间的带宽瓶颈。
 

 
128KB数据顺序读测试结果,最大带宽2268MB/s,与8KB随机读带宽2264MB/s相差无几,确认带宽是瓶颈
 
 
想必你也想知道“15万8的全闪存极限性能在哪里”,企事录团队的测试结果,如下面这张统计图显示▼
 

4KB数据块随机读取测试结果,IOPS接近37万,平均响应时间在1ms以内,最大延迟也在32ms左右,变化不大。
 
3条8Gb/s FC达到37万IOPS,但FC通道仍有成为瓶颈的可能。
 
而国外某权威机构有用6块SSD测试,IOPS超过10万。通过我们的验证,排除一块热备盘,国外机构实际使用5块SSD。企事录测试团队实际使用了19块SSD,接近4倍的盘数量获得了接近4倍的性能。
 
 
这个基准测试成绩跟应用性能的差距有多大?
我们调出Oracle性能测试成绩来验证一下▼
 
 
Oracle数据库性能测试主要考虑三个指标,即TPM(Transactions Per Minute,每分钟在线事务处理数)、TPS(Transactions Per Second,每秒在线事务处理数)和响应时间(ms)。
 
从上图可以看出:
 
峰值TPM最大为64.5万,平均TPM约为61.5万;
 
峰值TPS超过1.1万,平均TPS在1万以上;
 
性能较好,基本与前面基准测试中的8K数据块随机读取的性能相吻合。并且,其平均响应时间为36ms,突发响应时间为250ms,性能的稳定性很好。
 
单看性能数字,也许对业务部门并不“带感”,放在具体的业务情景来分析一下:
 

 
在今年双十一开始的头30分钟,天猫每秒交易峰值17.5万笔,相当于17.5万的峰值TPS;每秒支付峰值12万笔则相当于12万峰值TPS。这两者加起来差不多要接近30万TPS性能!
 
简单换算,不考虑其他因素影响,差不多30台同等配置的SC4020全闪存阵列就能满足天猫交易和支付的性能需求(登录、浏览等操作不在此列)。
 
当然,这个简单换算只是为了有一个直观印象,并不反映实际情况。毕竟“双十一”是全球最大规模的“购物狂欢”,系统架构将是其性能发挥的关键。绝大多数企业也不需要达到那么高的交易性能,在能够完成任务的前提下,,设备越少,其架构的复杂度越小,运维也更加方便。
 
 
搞清楚技术问题的种种只是开端,更重要的是,曾经“高富帅”而又甩掉了偶像包袱的全闪存,为存储重新定义了经济效益,具体来说,有以下几个方面:
 
更低的实际功耗:按照企事录团队的算法,目前市面上最快的磁盘是1.5万转(RPM)的SAS盘,功耗约为8W(实际为7.92W),IOPS大约为200,要达到10万IOPS,需要500个硬盘,仅硬盘的功耗就接近4KW(3960W)。也就是说,光是使用磁盘系统,一年的电费就够买好几台全闪存阵列了!
 

 
某知名硬盘制造商的一款高性能磁盘——15000 RPM、300GB容量的SAS磁盘,红框中显示其平均功耗为7.92W。而SC4020的开机功耗最大为380W左右,10倍于测试配置。
 
如果使用SC4020这种最大可配置24块2.5硬盘的2U机箱的话,500个硬盘需要21个机箱,正好满配一个42U机柜。
 
而如果要达到企事录测试获得的30万IOPS(实际4K随机为37万IOPS,8K为29万IOPS),则需要1500个硬盘,功耗接近12KW,而SC4020正常运行和全速运行时的功耗为260W-280W之间,不到前者的四十分之一。
 
更小的占地空间:SC4020满配24块SSD,提供超过30万IOPS,只占用2U高机架空间。而提供10万IOPS的磁盘系统需要一个满42U机柜(500 HDD),而提供30万IOPS的磁盘系统则需要3个满42U机柜。
 
卓越的单位I/O成本:从成本的角度来看,提供相同的I/O性能,SC4020的成本远低于磁盘系统。计算单位IOPS成本,考虑到SC4020在6个SSD的配置下能提供10万IOPS,而售价才15万人民币,相当于每IOPS成本1.5元人民币,不到2元钱。
 
需要明确一下,与每IOPS成本相对的则是每GB成本。目前而言,按IOPS成本计,闪存占优,即闪存能够更好地支撑性能需求型应用;而如果应用主要需要的是大容量的话,则基于低速(7200RPM及以下)大容量硬盘的系统更占优势,每GB成本更低。
 

责任编辑:润月 来源: 51CTO
相关推荐

2010-06-28 11:10:48

思科

2012-02-03 16:09:48

马卡龙HP Officeje

2021-08-28 10:44:39

网络流量信息泄露网络安全

2022-01-05 15:53:08

互联网大佬腾讯马云

2015-05-22 17:31:39

宝德

2015-05-07 09:51:33

小米亚马逊AWS米粉节

2013-01-22 11:57:01

QUMI Q5

2018-08-08 10:45:46

NVMeoF

2024-01-11 09:53:31

面试C++

2011-07-25 17:16:05

2009-03-05 09:39:30

龙芯龙芯电脑

2014-01-19 17:59:55

大神F1配置

2010-01-12 10:14:05

龙芯

2015-06-29 10:21:23

O2O EXPO

2018-05-11 09:40:10

服务器运维运营商

2012-02-28 13:58:24

谷歌Android

2009-04-14 11:01:33

薪资思科学历

2013-03-18 09:34:54

点赞
收藏

51CTO技术栈公众号