实现绿色存储的方法与意义
  今天,我和大家交流一个话题,就是最近大家从媒体或市场上听的比较多、比较热一个问题,就是关于绿色存储。绿色存储后台涵盖的含义非常多,而我们政府和企业节能减排也是促成绿色存储的一个主要原因。
今天,我将分成几个方面和大家探讨一下关于绿色存储的一些做法。首先我介绍一下IBM自己,我们在绿色存储方面是以身作则的。第二个方面会说一下通过一些市场调查为什么绿色存储在现代存储市场中的位置被拔的这么高。另外第三个环节是具体怎么实现绿色存储。
首先我们介绍IBM在绿色方面投入的工作,大家在绿色理解存在两个方面,一个是政府提出的节能减排、第二个则是绿色环保也是保护环境,这两个是相互关联的,但是也略有区别。节能减排是从政府角度出发要减少在能源上的一些消耗,那么环保除了节能减排减少对环境的压力之外,还要尽量减少对环境的一些破坏。IBM早在1971的时候,第一个提出的就是在IT里面我们怎么考虑环境,1971年的时候公司成立了一个部门叫环境事务组负责这个事情,1997年IBM是全球跨国公司里面第一家获得ISO14001环境管理认证的公司,到了2007年,我们获得十年认证之后,IBM推出了一个非常大项目,这个项目叫绿色创新工程,投入高达十亿美金,包括在IBM内部在产品方面全面推广绿色概念。
IBM在绿色上,做这个工作体现在存储里面主要在两大方面,第一是我们在新一代存储设计,尽量考虑怎么样尽量少的消耗能源,这在后面我们会比较详细的介绍;第二个就是我们考虑任何产品都有不用的那一天,要弃置的那一天,那么考虑到现在的大量电子产品,对环境造成巨大的一个压力和污染,IBM从2006年开始在全球领域,要求大部分硬件产品都符合相应国家的环保要求,比较著名的如RoSH标准,IBM产品中对环境有害材料含量都完全符合这些标准要求。
我们首先谈谈节能减排,节能减排从客户角度来看非常重要的一块。我们企业很看重的原因也很明显,第一是从企业的责任和企业的形象来说很有必要树立这样一个节能减排绿色企业的一个形象要求,第二个就是很多IT经理看到他最现实的情况:机房里面的供电和其他系统可能支撑不了业务的发展,这一点是很迫切的,对IT经理人来说这一点如果不解决,他一切宏伟的计划可能就没有硬件基础支持他,也就实现不了,那么这一观点其实并不是说大企业才有,很多的组织都有这个问题,Gartner Group 2007年10月在一份报告显示,未来三年给企业带来重大影响的十大关注点中排在第一位的就是绿色IT技术。这也可以看到不仅是中国还是其他地区的,IT用户对这一块迫切程度都是非常的高,那么还有另外一份调查是采样上千个IT经理人的调查,问题是您的数据中心存在的最大问题是什么?
他列了很多,比如说人员、技术、产品的成熟度等,最后得到统计结果是关于电源和冷却的问题排在了前三位,这再次证明问题的迫切性。
绿色IT需要各方面的协助,譬如在设备的耗电和冷却问题上,产品的供应厂商在设计和生产时必须考虑耗电和冷却,而客户在考虑它的存储解决方案的时候,也要把这个作为一个因素考虑进去,就像考虑一个产品的性能和功能一样。另外在法律法规上,需要有更加完善的法律法规迫使供应商和IT使用者能够更好保护环境。比如设备的单位散热不能太厉害了等。还有,即使没有法律法规的强行要求,企业作为一个社会公民,企业应该负有一定的社会责任,在建设IT的同时需要顾及节能减排,绿色环保方面的一些问题。
我们在国内也做了一些分析,关于数据中心建设的,同时调查了政府、金融、电信、制造业、能源行业,这些行业对IT依赖性和IT成熟度都比较高。在这些行业里面,比如说以政府为例,一个中大型IT环境一般规模在一千平米以上,而且2/3正处于改建和新建当中。而政府行业里面特别要求有节能减排这些指标,所以他们积极在考虑绿色存储这个问题。
市场有这样的要求,客户也有这样的需求,那IBM也就行动起来了。IBM在去年,拔了10亿美元做对于绿色的项目,大家知道IBM原来是蓝色作为企业的一个代表颜色,那现在很多方面都改成了绿色,用绿色的意思就是说我们在绿色技术和服务的方面做了进一步改善,同时建立了一个跨部门的团队,他们专门用绿色解决方案做一些设计和服务。这个绿色数据中心对客户能够代表什么东西?这里面有一组统计数据大家可以做一个参考,我们讲降低能耗的目的是为了减少电费的消耗,电费比较容易用数额换算,中国电费成本其实要比美国高些,这里举一个美国的例子,有一个比较典型的数据中心2500平方米,那么如果它的设计和它使用产品按照IBM绿色计划进行规范的话,在达到同样功能和处理能力的基础上,可以减少50%的电费,那么2500平方米数据中心50%电费意味着什么,这个在美国相当于260万美元,如果在国内会更高一些,因为我们电力成本比美国要高一点。如果260万美元还不足以给你一些形象化的概念,那么消耗电能如果是用煤发电少烧了150万公斤的煤,或者是说相当于整个城市里面减少了1300辆汽车的能耗。另外一个例子是IBM公司自己, IBM公司的IT结构是相当复杂的,现在IBM计划把全球现有3900台分布式服务器集中到30台IBMz系列服务器上,相关存储也集中,根据目前实施的情况,预计如果完全实现以后IBM总的数据中心耗量省下的电力资源相当于省下美国一个中小型城市电力消耗,这也是非常惊人的数据。
我们进一步看到具体IT的技术方面,什么样绿色中心才能称为新一代绿色数据中心,首先第一步不是说有什么东西装在里面,第一个它要能够有一套机制,能够诊断现在的能耗情况是怎么样的,现在的散热情况怎么样,由此能够很有效管理电源和冷却。然后以此为基础再来考虑评估的机制,这个评估机制可以帮助数据中心在建设的时候,发现哪些地方是可以减少能耗的,哪些地方是可以改进的。第三方面是关于冷却系统,因为冷却在整个数据中心耗量占的比重是比较大的,大家也知道我们平时在看数据中心耗量的时候不是简单的把所有的设备加在一块,所以说能耗加在一起至少还要乘以1.5才是这些机器的能耗,多余50%的能耗就是散热。另外有一点是绿色中心必须注意,刚才讲的是偏硬件方面,实际上IT作为一个虚拟化的世界,有很多技术可以用来大大减少能耗,这一点是我们后面会提到的,也是目前绿色中心环节上比较重要的一点。
存储的单位能耗在IT领域里面不算很高的设备,有过这样一个统计和预测,从1994年到2008年的数据,再加上预测的数据到2014年,,能耗增长最快的IT硬件是通讯设备,在计算机硬件里面服务器单位能耗也排在存储前面,但存储的量增长是非常高的,所以存储在耗电方面增长速度不容忽视。由此使得很多数据中心减少存储能耗产生了很大的兴趣,产生了很多技术和手段,那么在这些技术和手段里面,我们发现硬件上有个比较通用的规则,这个规则和原来我们讲的存储的高性能,可能有点背道而驰,就是越是慢的存储它的耗量越是低,同样容量的磁盘7200转和15000转相比,7200能耗要低很多。同样容量的磁盘,SATA和光纤盘相比呢,SATA盘也要低很多。这样就是使得我们要考虑存储系统可能并不是越快越好,是在能够满足需求情况最合适的才是最好的系统。但是回过头来有很多IT经理人会想,我用更慢的存储可能满足不了我的要求。其实并非如此,大家在前几年就听到一个很热的话题,关于数据生命周期管理,数据生命周期管理这个动作,也能够解决今天能耗问题,比如说有些系统确实比较慢,但是它适合放一些不太常用的数据,如果我们有很好的技术能够比较自动把这些数据迁移到这上面去,整体能耗就会降低很多。我们有一个统计,我们把IBM自己的存储分成100T,200T、400个T和800个T,四种系统分别用了15000转磁盘,和7200转磁盘放在里面,分别做了同样的操作,经过一段时间后从能耗消耗比上再次证明15000转的盘不管是单独还是在一个机群里面,耗量都是差不多7200转磁盘的一倍。另外我们也把这个容量的数据放在我们磁带系统里面,那么这个磁带系统能耗低的惊人。因为磁带库,不像磁盘驱动器,磁盘驱动器只要是通电它就要耗电,但是磁带不是,磁带库里面磁头的数量相对比较少,大量的磁带是放在槽里面,它并不产生电能的需求。这样使得我们客户在考虑这些历史数据时,可以考虑一些分级的摆放,如果客户数据不是经常使用的话,那么我们建议放在磁带上面。从总体拥有成本来看,保存250TB数据放在磁带设备上十年要花的总成本是大约是94万美金。总体成本包括设备采购、维护、人员费用等,以美国成本为基础计算的。同样250TB数据如果是放在SATA盘上的话,10年要630万美金,这个相当于前者6倍左右。但是有些环境下,磁带不能完全满足要求,譬如有些归档数据需要频繁的访问,这种情况可以混合用,磁盘加磁带的方式,通过一些软件手段,把它分离出来,同样是保存250T,而且可以比较方便的迅速的回调数据,但是它10年需要消耗的成本是220万,比全部放在SATA磁盘630万还是要低得很多的。所以我们可以看到在我们设计方案的时候,如果可以考虑到这些,就能比较好的实现绿色存储的目的。
再谈谈磁盘阵列的散热。存储技术方面大家也知道,外部存储主要是磁盘技术,磁盘结构方面这50年并没有很大变化,这种机械机构使得它的耗能比较厉害,因此它的散热也比较高。现在有很多新的设计,来减少磁盘系统的散热。尤其是高端磁盘系统,里面聚集了大量单个驱动器,比如说我们的DS8000,每台最大可以有1000个磁盘驱动器,1000个磁盘驱动器产生的热量是非常高的。现在绝大部分系统是采用风冷,就是采用吹风的方式把热气从机器里面吹出去,原来情况下,很多机器在设计的时候没有考虑到很多大型用户不仅有一台存储,他有一大堆机柜式的存储,或者说服务器,当你前一个把热风从你里面吹出去的时候呢,它把这个热空气吹到另外一台机器里面,热和热空气叠加,造成冷却的成本进一步提高,所以IBM在8000里面,做了一个新的设计,看起来没有什么大的科技含量,只是把原来对外吹风的方式,变成说是在上面和下面都有一个吹风口,风从外面吸进来,把热能吹出去,但是就是这种方式,根据我们的研究发现,它可能带来机房最大达到10摄氏度温度的差异,那是一个非常大的改变了。

前面讲的都是一些和物理设备比较相关的话题,后面讲在存储使用策略和存储软件会带来节能减排的效果,首先我们可以回想一下,在任何一个IT环境或者我们个人的电子系统中,绝大多数存储利用率不是很高,而且不同存储之间很难相互分摊工作量。举一个例子,你可能有很多U盘,总的富裕空间是很多的,但还是常碰到某个U盘满了的情况,而此事又无法调用你其他的U盘来分担。这个情况在企业里面也很普遍,每台服务器都有自己专属的存储空间,但服务器相互间很难“借用”存储空间,造成不同存储空间的利用率差别很大而总体利用率偏低。根据统计,大部分数据中心存储利用率只有40%左右,而40%磁盘空间利用率,不代表这个系统能耗也是总能耗的40%,磁盘系统只要开着他都会耗能,所以造成很多能耗和散热方面的浪费。如果我们有一个很好的手段,提高存储利用率就可以减少能耗。但这件事说容易,做起来难。存储在现有的使用模式下,提高存储利用率往往代表花更多的人力去做很多调节,而且这样有可能带来员工更多的加班时间,及应用停机时间。所以我们可能要考虑其他的技术手段,将所有异构环境的存储资源在一个统一的控制器控制下做一个统一的分配和调度,这就是SAN的虚拟存储技术,利用虚拟存储技术硬件的综合利用率可以容易地达到80%,从40%到80%是一个非常大的改变。虚拟存储在IBM也有一个非常有名的产品SVC,它已经有了差不多5年的历史,拥有3千多个用户。
存储节能另外一个技术手段,是避免重复存储。我举一个例子,比如说有一个系统应用程序已经在运行,占用 1T的空间,每周要做一个复本,用于备份及高速恢复。另外,还需要一个数据副本,用于检查现在运行的程序有无问题,而公司里面的开发小组,还要基于现在的情况进行分析所以也要一个数据副本,另外还有要一个副本做数据仓库的数据源。可以看到由于这些原因原来一个T的数据,现在要四个T的空间,但是实际上大家仔细看一下这四个T里面,他有大部分数据是重复的,所以在现在的一些存储系统里面,通过避免重复来避免物理空间的占有。要避免重复,在存储系统必须有识别什么是重复的这个能力。目前IBM在避免重复上有各式各样的手段,譬如虚拟的数据快照,数据块级的防重复存储功能等。
还有一个每个人都用过,用于减少磁盘能耗很好的一个手段,叫压缩,在备份数据上来说这是一个很有效的手段,IBM除了在软件像TSM(Tivoli Storage Manager)提供压缩功能以外,在我们硬件设备,磁带机上面,也提供硬件磁带压缩的功能,这样使得客户即使在软件上没有压缩功能,数据在磁带里也可自做一个压缩,减少磁带占有的空间。如果客户需要还可以对磁带通过硬件做一个加密,这样可以比较放心的把历史数据放进去,即使一个磁带掉了,或者遗失以后这样数据也不会泄密。
除了硬件和软件上的节能,使用资源利用控制的软件也有利于节能,因为很多时候IT经理人不很清楚存储资源利用率怎么样,机房里面可能有十几套不同的存储,这种情况就需要一个很有效的管理工具,去查看这个环境到底存储用的怎么样,是不是有些设备开着几乎没有什么工作的。那么IBM的TPC(TotalStorage Productivity Center)软件就是一个很好的掌控工具。它可以发现所有现有机器的存储运行情况,每一台服务器占有的数据空间,发现哪一些是平时不怎么用,不怎么工作的,通过发现这些东西以后,管理员可以很好的知道哪些处理,没有用的东西不要再消耗宝贵的能源。
我们把绿色存储策略总结成五个词,就是更低、更高、更少、更多还有更灵活。那什么是更低呢,就是大家要考虑使用存储能耗更低这个设备,这是一个比较简单的原则,更高是要尽量提高存储设备的利用率,因为利用率是20%的磁盘阵列不是说它20%磁盘通电,其他都不通电,在那闲着,它还是要耗接近于50%到60%的能耗。那么可能要通过一些虚拟化的手段来提高这个利用率。更少,更少不是说客户尽量少存储,是尽量用少的硬件来实现更多的功能,比如我们提到压缩技术,比如说防止重复存储,比如说存储的瘦供给可以实现这个理念,。更多,指存储分层要更多一些,而不是单一的存储,因为不同价值、不同访问频度的数据,可以放在不同的能耗的存储层面上,这个能够把很多不常用的东西放在低能耗的设备上去。最后一点是更灵活,我们在存储环境里面,如果数据迁移是比较困难的,那么改善存储资源也会比较麻烦,而如果你的存储环境数据移动是非常灵活的,我们可以轻松的把数据不断调整到更优花的存储中,这对降低能耗帮助也是非常大的,这方面我们提到包括虚拟化的存储,包括IBM的SVC这样的设备,能够提供很好的帮助。
我们今天在这里讲的绿色存储可能对部分存储用户感觉还没有那么深刻,我访问用户的时候,都提到了这个绿色存储,有些用户并没意识到这方面的需求,但是实际上如果我们从中国能耗和其他国家能耗的比例来看,中国应该是更加需要在这个节能减排方面做一些工作的,比如说GDP能耗是远高世界平均的水平,虽然IT能耗不是社会能耗的一个主要方面,但是从趋势来看的话,绿色存储是早晚要进入所有行业IT客户负责范围的东西。
最后我还想谈一点就是在绿色存储中关于绿色工作环境的一个情况,我们有很多IT经理人和管理人不得不承受非绿色环境的折磨,比如说超长的工作时间,他要做一些数据搬迁,做一些系统的维护,所以他不得不在他休息的时候做这个事情,同时因为过于拥挤的机房产生过多的辐射,过大的噪音都对在这个环境工作的员工造成了不利的影响。我们是希望通过绿色数据中心的推广,不仅在存储上把能耗降下来,把散热降下来,同时也希望能够尽量减少系统管理员,在存储方面的工作时间,或者加班时间,把更多的事情交给一些自动化软件实现,能够构造一个比较好的、比较理想的数据软件,以解决现在需要人工来处理的问题。这个就是我们在绿色方面另外的一个考虑,也就是希望给管理员带来一个好的绿色环境。
我说一个小的故事作为我今天所有介绍的结束。在六七十年代的时候,美国宇航局发射火箭的最远距离受到限制,没法发射飞得更远的火箭,为什么会有这个情况发生?因为火箭发射是需要燃料的,火箭燃料仓运送到火箭发射基地,靠火车,火车的尺寸是规定的,因为大家知道铁轨就这么宽,这样他们没有办法运送更宽大的燃料仓,也不能把火箭燃料仓做像火车一样细长的,那可能立起来不稳。那就为什么铁轨只有这点宽呢?据说这个铁轨是最早按照古罗马时期标准路的宽度设计的,那么当时古罗马凭什么定的路宽度呢?是按照马车可以通过的宽度,马车宽度是两匹马屁股的宽度。所以马屁股宽度决定了罗马路的宽度,路的宽度决定了后来火车铁轨的宽度,铁轨宽度决定能够运载火箭燃料箱的尺寸,火箭燃料箱的尺寸最终决定火箭飞不了太远。或者说古罗马的马屁股决定了火箭飞不远。
这个看起来有点荒诞的情况,其实在我们的IT机房中也在发生, 电力和散热能力就像是铁轨的宽度,当机房不能供应足够的电力以支撑更大的业务处理时,企业也无法飞的更远。
最后,祝大家在工作当中能够更多考虑绿色。谢谢。
>>>以上文稿整理自 IBM 系统与科技事业部中国区存储产品经理 金微 讲演
IBM 技术专家 金微
点播专家视频讲解
·实现绿色IT对IT经理人和现代企业的重要意义
·CIO应当根据数据重要性和访问频率设计存储方案
·灵活高效的存储使用策略有助于减少能耗
·浅析资源利用控制软件和磁带机硬件压缩的作用
·五个关键词概括绿色存储策略
·古罗马的马屁股曾决定运载火箭的飞行高度
绿色数据中心有奖调查
促销信息
即日起至 2008年 6月 30日,凡在神州数码购买 1台 IBM p5 520+/520Q 或 IBM System p5 550/550Q 小型机,即可免费获得价值 7000元的 CDP+PDM 正版操作系统软件包一套。
下载绿色数据中心白皮书
推荐阅读
· 绿色技术两维度:节能减排 绿色环保
· 节能减排关乎企业社会形象和社会责任
· 新型绿色数据中心中存储的绿色至关重要
· 存储策略和存储软件也能达到节能减排
· 绿色存储新口号:更低更高更少更多更灵活
· 蝴蝶效应:马屁股曾决定火箭飞行距离
关于我们 | 诚聘英才 | 联系我们 | 网站大事 | 友情链接 | 意见反馈 | 网站地图
Copyright?2005-2008 51CTO.COM 版权所有 未经许可 请勿转载
京ICP证060544号