存储分层金字塔是啥玩意儿?

存储 存储软件
这年头IT市场充斥著各种忽悠词汇,我举个例子,当客户或是终端使用者问到SSD(固态硬盘)以及HDD(机械硬盘)彼此之间该怎么最有效的使用时,大部分的原厂销售代表就拿出个下像面的图并用几句话带过,不外乎就是SSD会被放在比较上层处理小IO的应用,大块数据就是扔到HDD上,结束。

 这年头IT市场充斥著各种忽悠词汇,我举个例子,当客户或是终端使用者问到SSD(固态硬盘)以及HDD(机械硬盘)彼此之间该怎么最有效的使用时,大部分的原厂销售代表就拿出个下像面的图并用几句话带过,不外乎就是SSD会被放在比较上层处理小IO的应用,大块数据就是扔到HDD上,结束。说实在的,连我自己搞技术营销的都说服不了自己,我还不敢给客户这样说呢……

图1: 存储分层金字塔

在一个加班准备吃夜宵的餐馆中,遇到了几位大婶阿姨,一直称赞咱们东芝做的冰箱很耐用,问我做什么的,于是想了个法子来解释给他们听听我平常在销售的是什么。

图2: 像厨房一般的存储分层

如果平时存放的资料就像是食物的话,那保存食物的地方不外乎就是几个,厨房里的冰箱、冷冻库、微波炉、烤箱甚至咖啡机。平时煮菜或是备料时,也都会考量到何时要用到食材而分门别类的放置:又或是根据急迫性来分类,例如浓缩咖啡机的快速冲泡、加班的人们速速微波便当准备敢下个会议等等。

具体来说,数据中心的存储设备就有如这个all in one厨房设备一样,保存者食物也时不时地江餐点端上桌。大致来讲,从三个面向来探讨。

一、比例原则

也不是所有的资料都是硬梆梆的只放在HDD或是SSD这两种二分法而已,而是都会放或是都会待过。而由于应用软件所侧重的性质不同,其资料放置在SSD或HDD的比例有所区隔而已。举个例子,近期在我是歌手很火红的视频-萧敬腾所翻唱的以后别做朋友,由于太火了,大部分个省份的人都会想要即时点播来看,这时候可能像腾讯视频、Bilibili等软件就会把这段视频先缓存起来,放置在各区域的CDN服务器当中,以利各家视频软件达到所谓“秒级点播“的服务。等过一阵子空间得重新配置或有更火的视频出来之后,萧敬腾这段视频就会慢慢由上往下移到HDD中存放,让各位粉丝们回溯寻找。

二、应用导向

从图2我们看到,在线交易(OLTP)、推荐系统或金融支付这几类讲求实时性以及低延迟的应用,就会要求较多的数据缓存在PCIe SSD类别类,因为其软件性质要求的速度和延迟下,必须得用这个级别的SSD才能达到,所以有一部分的企业级应用标榜著QoS协议,也是跟其后台租用这类服务器有关。在举个例子,很多国内BAT数据中心都会使用分布式运算,Hadoop可能是目前***宗的,其在资料分开运算的过程中,会产生大量的临时性文件( temporary data ),需要超越2.5″ SAS HDD能耐的东西但又不需要太高端的速度,因此有几家则是使用SATA SSD作为这个媒介,大量又快速的存储下去之后又马上洗掉,就好像西餐厅里的牛排一样,用完餐之后洗乾净在服务下一位客户。

三、热度频率

前面也稍微提过,应用软件的性质会决定了大部分的资料在什么层级的存储进行。试者想想当我们要看在5年前微信朋友圈中发生了什么事,那个往上滑而不断读取的圆圈进度条一直在转,就是在朝腾讯放冷存储的HDD集群们捞你的资料,毕竟在现今互连网的风潮之下,大家都不记得(或是不在乎)前几天中餐吃了哪家餐馆的时候,很少有人没事一直看自己还是18岁时候的照片,跟使用的热度或是一般会访问的频率有关。另外,政府机构其实很要求这些互连网巨头、电信运营商将资料都保存十年以上,可能是让一切都有凭有据的准备也有可能是秋后要大算帐……。但就是跟使用行为、访问频率、群体热度有关连。

结语:从粗放农业过渡到精致农业

各家数据中心目前算盘打的愈来愈精了,从冷却、用电、通风、人员管理、资安以及硬件资源的配用,都已经快到出神入化的程度(甚至是自己做SSD了)。也连带的让数据中心在系统设计的架构上、采购行为和配置考量点都与传统IT完全不同。企业内部的私有云架构可能还像是粗放农业一般,有些许的资源闲置在那边或是大材小用,然侯数据中心就是运算、网路、存储都切的很开并且分配的很细致,尽量不要有一丝的浪费!

对了,大婶们听的如吃如醉,略微张开的嘴巴与越过眼镜上缘看著我的神情让我愈说愈自得其乐,而***也得到阿姨们的赞赏:东芝的冰箱真的好用又不会坏啦!

责任编辑:武晓燕 来源: ssdfans
相关推荐

2018-05-04 15:57:42

AI智慧谷歌

2019-10-25 09:50:03

网络爬虫蜘蛛Wi-Fi

2010-06-29 13:39:26

Eclipse什么玩意儿

2010-06-28 15:58:45

EclipseJavaIDE

2010-07-02 10:10:09

Eclipse

2010-07-05 15:56:01

EclipseRCPECF

2018-10-11 15:05:56

测试软件自动化

2011-11-21 10:25:29

iCloud

2022-07-08 15:13:21

DockerLinux命令

2022-05-10 09:16:50

MQ内存消费者

2022-03-14 17:56:15

云厂商系统阿里云

2021-05-17 18:27:20

Token验证HTTP

2021-12-13 19:57:05

JNDIJava开发

2022-02-07 09:40:10

高可用高并发高性能

2021-07-14 18:21:50

负载均衡TCP网关

2021-01-25 06:37:06

Css前端CSS 特效

2020-04-27 13:45:08

数据流沙Filecoin

2020-12-01 08:19:15

Redis

2017-07-26 10:32:51

计算机视觉卷积神经网络FPN

2017-08-02 00:12:50

CVPR 2017论文FPN网络
点赞
收藏

51CTO技术栈公众号