杜绝宕机 不同行业服务器RAS侧重点

运维 服务器运维
服务器在采购的时候要考虑多方面的因素,而安全性在“棱镜”事件后也成迅速得到了企业事业单位用户的重视。服务器的安全性主要体现在RAS性能上。RAS性能是指服务器的可靠性(Reliability)、可用性(Availability)以及可服务性(Serviceability)。具体RAS性能我们主要看一下几个方面:System级别的RAS特性、CPU RAS特性、内存RAS特性、I/O RAS特性等。

随着IT的发展以及企业业务的增加,服务器成为了很多企业业务支持的平台。尤其是在我国,服务器的增长势头非常强势。但由于我国IT科技发展较晚,所以企业用户在选购服务器的时候往往不知道从何下手,甚至在采购过程中遭遇奸商欺骗等行为。钱财损失是小,但耽误企业业务的正常运行可以说那就大了。

 

[[81897]]

 

服务器在采购的时候要考虑多方面的因素,而安全性在“棱镜”事件后也成迅速得到了企业事业单位用户的重视。服务器的安全性主要体现在RAS性能上。RAS性能是指服务器的可靠性(Reliability)、可用性(Availability)以及可服务性(Serviceability)。具体RAS性能我们主要看一下几个方面:System级别的RAS特性、CPU RAS特性、内存RAS特性、I/O RAS特性等。

可以看出,RAS性能是一个综合性指标,对于不同行业的用户来说,其对RAS性能的要求也不尽相同。下面我们就来具体看一下这些内容:

内存的RAS性能尤其重要

服务器内存在RAS性能中起到非常关键的作用,因为服务器中的所有计算几乎都是跑在内存中的,内存性能的好坏直接影响到服务器的稳定性,从而影响企业业务的可靠性。内存的错误率其实比想象中的要高(refer),内存也因为老化等原因会出现性能降低,从而产生问题而影响企业业务。

 

[[81898]]
服务器内存

针对内存方面的重要性,很多企业也采用了相应优化。例如目前许多x86服务器经销商的卖点宣传就是集中在内存上,比如服务器内存的ECC特性,Spare Row、Chip Kill、Single Device Data Correction (SDDC)等,其中Chip Kill是IBM的专利技术,主要用在高端服务器上。惠普服务器曾连续跑了二十年而没有停机,而宝德也有连续跑了五年没有停机的例子。

#p#

处理器的RAS性能的重要性

处理器相信是大家都熟悉的一个部件,很多人在购买PC和手机的时候,首先关注的就是处理器。

而在服务器领域,其服务器处理器与PC市场的型号并不相同,而是针对服务器市场的特定需求,英特尔推出了针对企业级的Xeon处理器,Xeon E3面向低端市场,Xeon E5处理器面向中端市场,面向高端市场的则是Xeon E7服务器。

 

杜绝“宕机”不同行业的服务器RAS侧重点
英特尔处理器

Xeon平台的可靠性、可用性和可维护性相比上一代处理器产品有了明显的提升,其继承了很多大型企业开发中验证过的RAS技术。通过所有的CPU电路间的无检测和恢复机制,避免由于CPU错误带来的系统故障,并可保证CPU内部的数据传输和存储的随机错误通过ECC数据纠正处理和指令重试技术恢复。

 

而且如今的处理器即使在发生不可恢复的错误的时候也不会停止工作,只会继续记录所有的错误信息,因此任何错误原因都能够迅速检测出来。例如,Xeon E7在英特尔上一代的Xeon 7500为基础,建立了面向诸多高端计算应用的支持,包括商业智能、实时数据分析和虚拟化等全新标准。可以确保数据的完整性能,从而提供整个数据中心的安全。

#p#

不同行业RAS性能的侧重点不同

RAS能力是评判服务器的重要标准。但是由于RAS能力提升需要服务器的制造成本提升,而且对于不同行业的用户来说,并不是所有的用户都需要那些RAS指标,所以服务器提供商并不是将所有服务器的RAS性能都设定的面面俱到。需要根据具体业务来判定具体需求。

可靠性在行业应用中最主要的是指双击热备份。这是用户非常喜欢提供服务器稳定性的方式,双击热备份就是一台主机为工作计划,另一台主机为备份机器,在系统正常的情况下,工作机为信息系统提供支持,备份集提供监视工作机的运行,工作机也同时监视备份机是否正在。

 

杜绝“宕机”不同行业的服务器RAS侧重点
双机热备份解决方案

当工作机出现问题的时候,不能够支持业务运行,那么备份机就会主动接管工作机的工作,继续支持业务的运行,从而确保业务的不间断运行。当工作机经过维修恢复正常后,它将会将原来的工作自动抓回,恢复以往服务器的工作状态。而备份集也有可能由于某些原因而出现异常,工作机则是负责通知工作人员,确保下一次切换的可靠性。

 

在不同行业中,不同的而延误对可靠性的要求不同,例如在金融、电力和医疗等行业,他们对计算机的可靠性要求非常高,所以习惯采用的是双击备份系统。双击备份可以时间运行时的互相监控,在发生故障的时候自动切换保证业务7*24小时的稳定运行,从而提升了数据的安全性和业务的可靠性。

#p#

可用性指的是系统被请求使用时能够迅速反馈并被正确操作的可能性。在一些行业中许多关键业务是不能在运行过程中间断的。例如商业智能分析、业务流程处理、核心数据库等等,特别是在政务、国防、电信、金融等领域更是注重系统的可用性。

企业的关键业务一旦出现意外会给用户造成极大的伤害,甚至是无法弥补的,所以这就对支持他的IT平台提出了非常严格的要求。亚马逊宕机时间一分中的损失就高达5万美元,所以停机事件在一些行业是不能出现的。双备份技术可以迅速恢复系统性能,另外还有多子星系统,满足多节点服务需求等。

 

[[81899]]
高铁IT系统非常重要

高铁的IT系统是一个非常重要的部门,其IT系统出现故障会造成整个交通的瘫痪,在高铁运营管理中用到一种SSI标准刀片服务器,是由六个计算刀片和14个存储刀片组成,集成度高,非常适合分散状况下的运行管理。

 

其实这个方案很简单,采用的是宝德PR6000M刀片服务器和双击热备软件,就形成了一个双击热备系统,两台服务器通过心跳线相连,在一台服务器出现故障时,另一台机器能够承担全部的工作负荷,真正解决了集中管理与安全稳定的问题。

#p#

可维护性是指整个IT系统非常巨大,而又要求实时、动态和效率时,其承载平台要有非常出色的扩展能力。比如在需要高性能的时候需要增加处理器数量,内存的扩充和硬盘的扩充等等,就像宝德的模块化服务器、存储服务器等,提供快速的解决问题的能力。

 

[[81900]]
银行IT系统

例如,在银行的核心业务数据库方面,其要求确保7*24小时业务不当机。如何解决这个难题呢?宝德服务器针对这个需求将银行的核心业务部署在宝德的PR6850N服务器双击系统上,该服务器为6U四路服务器,拥有超过20项的RAS特性。

在发生故障后,两台PR6850N部署的虚拟机可以实现互相的接管,保证业务的不中断,同时虚拟机部署的存储实现整个虚拟机连同业务和数据库的备份。而且这个方面还拥有非常出色的扩展能力。。

 

文章总结:服务器RAS性能能够大幅提升系统的安全性,保证用户的关键业务不间断运行,但是在提升RAS性能方面,随之成本也会随之上升。所以对于用户来说,还应该安装自己行业的业务性能来选择服务器。让企业IT基础架构实现***性价比的配置。

责任编辑:路途 来源: zol
相关推荐

2013-04-09 20:44:38

服务器RAS性能

2020-04-13 22:19:10

物联网IOT物联网技术

2022-01-24 13:53:06

云计算大数据网络安全

2020-03-03 15:04:49

物联网应用物联网IOT

2021-08-13 10:10:17

物联网智能物联网IoT

2020-12-03 16:58:20

5G移动通信网络

2010-05-17 14:53:00

统一通信系统平台

2020-08-29 18:34:24

物联网设备物联网安全物联网安

2023-09-11 14:37:15

2017-12-07 08:49:02

2023-12-13 15:17:54

大数据大数据分析人工智能

2023-06-14 15:46:10

综合布线医疗保健

2023-04-27 14:50:58

大数据发展趋势

2010-03-02 10:18:59

Android应用程序

2015-09-24 15:39:45

资深架构师 架构

2013-03-25 09:42:41

日东工业

2013-09-30 10:18:05

Web服务器宕机诊断

2014-02-21 09:59:30

华为服务器华为

2011-05-26 17:14:58

亚马逊服务器宕机

2009-08-24 17:20:29

IBM刀片服务器宕机
点赞
收藏

51CTO技术栈公众号