海量监控的现状及发展趋势研究

网络
近十年来,网络化和信息化成为各行各业发展的趋势,相应的,大大小小的数据中心、信息中心如雨后春笋般在全国各地建立起来,并且规模越来越大、应用越来越复杂。数据中心、信息中心的建立初衷,是以业务开展为主导,为实现智能管理和自动办公提供各种技术手段,可以说它们是为简化或方便管理而诞生的。

【51CTO.com综合报道】近十年来,网络化和信息化成为各行各业发展的趋势,相应的,大大小小的数据中心、信息中心如雨后春笋般在全国各地建立起来,并且规模越来越大、应用越来越复杂。数据中心、信息中心的建立初衷,是以业务开展为主导,为实现智能管理和自动办公提供各种技术手段,可以说它们是为简化或方便管理而诞生的。但随着数据中心、信息中心的不断发展,它们自身的监控管理越来越受到重视,成为IT部门工作中不可缺少的一部分。

目前国内网管市场可以简单地划分为三大阵营。***大阵营是以HP、IBM为代表的国外四大家,他们网管产品在对服务器监测方面,主要是通过Agent代理监测的方式来实现。这类产品的性能稳定,占据了金融、电信市场的半壁江山,但四大家产品的高成本也在一定程度上制约了国内网管市场的发展。第二大阵营以本土厂商为代表,包括MXsoft(美信)、游龙、北塔、摩卡、广通等企业。这些企业依靠相对便宜的二次开发、本土化的技术支持和服务获得越来越多的市场占有额。同时,随着客户和项目的积累,产品也逐渐趋于成熟。三线阵营中,则由全国近百家不知名的相关软件厂商所组成。

与此同时,网络监控管理则从最早的自带工具发展至现在的全面管理系统,其架构和技术都发生了一系列的变化:

1.在架构设计上,从单套部署的工具集发展到以服务器池为基础的云网管监控架构;

2.在检测手段上,从单一的Agent代理监测、SNMP监测发展到兼容Agent代理监测和各种非代理监测;

3.在拓扑管理领域,从基于子网的拓扑技术发展到自动搜索的物理拓扑图,再到手工定制的VISIO拓扑图,甚至是多种拓扑技术的融合;

4.在运用方面,发展到能够支持各种操作系统、数据库、网络设备和中间件,以及各种业务应用系统;

5.在告警方式上,从单一的界面告警发展到短信、邮件、声音和颜色等综合手段的预告警。

以上技术分散在不同的厂商和产品中,在实践中体现为以下几种监控方式:设备网管软件监控、通用网管软件监控和云网管监控。

网络设备厂商通过自带网管软件进行监控,比如思科、H3C等设备厂商都有专用的网管软件。不过由于这些厂商的网管软件只能对本厂商的设备进行监控,不能对用户的所有设备、网络和应用系统进行全面、统一监控,所以在使用中有很大的局限性。

购买通用网管软件进行监控。传统的通用网管产品都是以单套部署的原理来工作。即一套产品只能安装在一台监控服务器上,这种模式有一定的局限性,其监控能力和规模都受限于这台监控服务器的性能。当被监控规模超过这台服务器监控极限时,用户不得不再购买一套产品,安装在另一台监控服务器上,对超出部分的被监控对象行进监控。同时,还需要对用户、权限和预告警数值等参数重新设置。这无疑会大大增加人力、物力上的成本。监控的目的是为了提高工作效率,多套传统网管产品的部署在解决问题的同时却大大增加了对管理工作的复杂度。所以传统网管产品对于海量监控往往力不从心。而目前,有很大一部分的用户需要监测的对象越来越多,比较典型的是门户网站、网游公司和银行、电信等的大型企业,动辄就要监测上千台服务器。传统网管软件已渐渐无法满足这类大中型规模企业的需求了。

在这种背景下,MXsoft(美信)适时的推出了CreCloud云网管解决方案,CreCloud云网管将云计算技术的虚拟化和扩容性恰当地应用到了海量监控的管理实践中,***地解决了海量监控的各种问题。它的工作原理可以简单概括为:将多台普通监控服务器虚拟为一台计算能力强、运行稳定的大型监控服务器,帮助用户在低成本的情况下,实现对海量设备、网络和应用系统的监控;同时可根据被监控对象的规模大小动态的增减监控服务器。

比如中石油目前有超过20000个加油站,总部需要对各加油站业务系统进行管理,实时监控其网络状况、文件系统、日志、CPU利用率、内存使用情况、网口流量、系统crash 、重要业务系统进程、磁盘空间分配、网络流量等等。需要监控的设备数量达到10万台,监测点则近百万。如何解决这一巨大规模的监控问题呢?通过采用CreCloud云网管监控方案,不但性能稳定,更能应对今后的扩容需求。

中石油通过实施MXsoft(美信)的CreCloud云网管监控方案实现以下优势:

虚拟化,大大增强平台监控能力。将多台普通监控服务器虚拟为一台计算能力强、运行稳定的大型监控服务器,或称之为监测云,可以监控目前任何规模的服务器群。

动态扩容,即支持监测服务器热插拔。当企业的监控规模增加或减少时,监控管理人员只需要动态的增加或减少监测服务器,即可满足监控需求。

自动负载均衡。主控服务器会根据监控服务器的性能自动分配任务,而不需要监控管理人员手动分配;如果监测服务器中的某一台或几台发生了宕机,其它监测服务器就自动接管它们的任务,保障业务7天*24小时不间断运行。

秒级轮询。云网管海量监测将监测点的颗粒度精确到秒级,以保证监测数据的实时性和精确性,做到当客户关键设备出现异常时能在***时间里发现问题,发出报警,为客户解决问题赢得宝贵的时间。

在目前的网络监控管理实践中,随着用户业务的不断发展以及数据中心建设的不断扩大,海量监控的需求越来越突出。特别是门户网站、网络游戏、电信、银行和石化等大中型企业,IT业务复杂、系统庞大、设备繁多,海量监控是势在必行的趋势。

从2000年到现在,国内网络监控软件行业已经走过了10个年头。这10年历程中,国内网管技术不断创新,从对国外技术的简单模仿到推陈出新,再到国际领先,国内网管厂商正在变得越来越成熟。

责任编辑:林琳 来源: 51CTO.com
相关推荐

2021-12-28 11:00:28

芯片半导体技术

2010-06-17 17:44:55

UML发展

2010-03-02 21:46:18

运维管理Mocha BSM摩卡软件

2009-11-24 09:46:35

2020-11-18 09:54:31

人脸识别AI人工智能

2012-04-27 14:23:08

开放平台

2010-04-09 09:29:13

云计算现状

2013-10-11 13:34:59

NFC现状趋势

2016-01-08 09:37:12

大数据现状趋势预测

2020-05-15 09:58:26

云计算容器软件

2021-06-17 10:44:08

混合云云计算私有云

2018-06-13 23:50:58

2011-10-26 11:26:14

2021-11-10 15:35:02

大数据

2021-01-13 19:00:36

人工智能AI

2015-02-10 09:54:48

云数据中心发展现状趋势

2021-08-17 06:42:43

云计算政务云云应用

2017-07-18 10:05:42

金融云

2010-01-14 09:40:27

2017-03-24 08:39:53

机器人现状技术
点赞
收藏

51CTO技术栈公众号