社区编辑申请
注册/登录
不做运维大冤种!锐捷乐享智能运维管理平台提供新解 原创
运维 自动化
如何实现IT运维的自动化,改变被动救火式的工作状态,逐渐成为摆在众多企业面前的首要问题。

  运维怕什么?系统一直在报警;

  运维最怕什么?一天都没有报警。

  网上调侃运维的段子数不胜数。作为IT管理的重点环节,IT运维可以说是IT部门中工作内容最为繁重琐碎的组成部分,运维人员也往往自嘲是“5*8小时的管家,7*24小时的保姆”。

  据中研产业研究院公布的《2022-2027年中国IT运维管理行业竞争分析及发展预测报告》,随着信息技术的不断深入,企业和机构的IT系统日渐复杂,一方面,IT系统的运营、维护和管理的难度不断加大。另一方面,企业业务对IT系统的依赖性越来越强,IT已经成为很多业务流程赖以展开的基础。因此,如何实现IT运维的自动化,改变被动救火式的工作状态,就成为了摆在众多企业面前的首要问题。

  日前,锐捷网络正式发布锐捷乐享智能运维管理平台,致力于通过自动化运维平台,带来崭新运维体验,在安全、稳定的前提下,为企业带来IT作业效率的提升。会上,睿智产品事业部产品总监骆杰就产品发布及相关问题进行了详细阐释。

  困境:运维的本质问题处理起来仍是“一地鸡毛”

  骆杰提到,无论是基于权威调查机构的相关报告还是基于锐捷网络多年来深入行业客户的实践经验,都可以发现,时至今日,如何提升运维效率,如何减少用户抱怨,尽快确定故障原因,依旧是运维团队关注的焦点。

  无论身处什么行业,运维团队面临的最本质的问题也是相似的:运维晚于用户发现故障,导致运维工作开展被动;定位和解决问题需要很长时间;同样的问题重复出现……诸如此类的问题都没有得到很好的解决。

  值得注意的是,长久以来,运维的业务目标和工作任务并没有发生多大变化,但业务对IT的依赖、IT软硬件环境的变化都让这些问题越来越难解,比如,大量应用系统建设导致IT基础设施的规模呈倍数级增长,云化的趋势造成IT环境的复杂性与日俱增,大量新型的资源类型、复杂调用也带来了重重挑战,多种因素作用下很可能导致运维陷入“一地鸡毛”的困境。

  要解运维之困,锐捷网络在产品设计与规划中致力于实现以下三个方面:

  “为执行赋能”:让运维中重复的工作自动化,从而化繁为简,将运维人员从分身乏术、身心俱疲的境地中解放出来。

  “为管理赋知”:能够支撑运维管理者的管理诉求,让所有事件问题有闭环,管理落地有抓手,团队经验可积累、可复制。

  “为决策赋见”:可以为IT相关部署和决策提供全局的数据支撑,对运行态势成竹在胸,不用再拍脑袋决定,降低决策风险。

  为了践行这一愿景,锐捷网络深耕用户IT运维场景,正式推出了锐捷乐享智能运维管理平台。

  新解:助力企业构建“先见先行”的运维数据洞察能力

  锐捷乐享智能运维管理平台直指运维场景痛点,志在助力企业构建“先见先行”的运维数据洞察能力,打造“以用户体验为核心”的业务连续性保障体系。

  骆杰介绍,所谓“先见先行”的运维数据洞察,就是要做到对问题隐患的“先见”,以及对处置防范的“先行”。其核心思路是——“本质是将分散的IT运维数据,设备运行的、数据库里的、用户产生的等等数据,全部对接起来形成关系网,把这些数据变成运维可直接消费的数据。再结合产品设计能力,将风险、问题和故障形成一个组织的闭环。”

  l 经由多源数据接入,通过关系洞察形成运维图谱:自动发现资源间关系,并形成立体的关系网,实现应用的影响与关联识别;

  l 由路径洞察找到真实路径:快速、准确地从业务视角识别端到端访问路径,缩小问题定位范围;

  l 数据洞察形成行动指标体系:通过分层指标体系,将海量的性能、状态数据清洗,转换,聚合为具备行动力的信息,实现将分散的设备运行数据转化为具有高消费价值的信息和知识。

  基于“先行先见”的理念,锐捷乐享智能运维管理平台重点打造了三大体系:以指标体系为核心的全域资源监控,以风险预防为核心的健康检查,以用户体验为核心的业务监控。对此,骆杰作了进一步说明。

  全域资源监控:平台通过对全类型异构IT资源自动发现及智能关联,以黄金指标体系重新定义资源监控维度,剔除无用的监控指标,从而降低和减少无效的数据带来的噪音干扰,从根源上解决了数据无效、不准的问题。依托“卡点算法”有效实现告警风暴抑制,并提供原因和影响分析、处理建议等有行动力的信息,加速故障的解决和闭环。

  健康检查:平台的健康检查功能具备开箱即用的风险隐患排查能力,降低了风险预防技术门槛。以Oracle数据库为例,该平台内置的专家经验可预防常见的多达24类风险隐患,并提供63种风险分析逻辑和处理建议,可支撑运维从风险识别、分析到处置的闭环。相较传统巡检,平台支持多维度的风险识别能力,且可以支撑组织风险识别经验的内化。

  业务监控:平台的业务监控功能,可从用户视角实时感知问题,量化真实用户访问应用系统时的体验,帮助运维人员真正从用户视角感知并分析异常。通过纵览全局的应用看板,便于实时感知业务异常,借助业务部署拓扑及数据调用关系的构建,精准定位异常原因,助力运维人员掌控全局业务运行态势。

  此外,面向不同角色的运维管理人员,平台提供了个性化的工作中心搭建能力,通过低代码“拖拉拽式”自定义,可以灵活打造千人千面的数据看板,帮助运维工程师实现登录即工作的便捷,同时为管理者带来掌控全局的管理驾驶舱,真正达成化繁为简、十人十色。

管理者视图

工程师视图

  【结语】目前,先进的自动化运维管理平台基本具备标准化、流程化、智能化、模块化等特点,统一运维标准,自动化运维流程,最大程度降低人工干预、排除人为失误。锐捷乐享智能运维管理平台的推出同样印证了这一点,其先见先行的数据洞察理念进一步说明,运维要真正提升效率,必须完成从被动响应到主动预防的完整蜕变。

责任编辑:张洁
相关推荐

2022-05-09 15:01:51

运维转型技术

2022-04-18 10:39:59

运维锐捷网络

2019-02-19 09:14:52

IT运维系统

2022-04-18 18:04:16

锐捷平台

2020-07-15 08:07:51

运维管理技术

2012-12-28 16:30:05

2022-06-09 15:21:09

锐捷

2017-12-21 15:41:11

华为云

2010-11-17 16:28:45

IT服务运维管理锐捷网络

2010-11-17 15:52:40

IT服务运维管理锐捷网络

2021-06-07 22:09:46

办公

2020-11-23 14:03:37

向日葵远程运维

2018-11-15 12:19:07

运维管理业务

2013-09-27 17:29:16

清华大学IT运维RIIL

2020-06-30 09:35:25

智能运维云架构IT运营

2016-01-08 10:04:29

华三智动运维

2018-07-30 15:38:46

智能运维

2020-06-08 14:44:19

运维智能技术

2015-01-08 15:36:47

IT运维

2020-07-17 07:46:04

运维开发技术

同话题下的热门内容

大意了!平常不重视慢SQL,搞得现在系统要重构……传统数据库运维人员如何应对开源和分布式转型?揭秘运维工程师职业生涯天花板 SRE (Site Reliability Engineering) 的工作职责Hessian 序列化、反序列化SQLite切换日志模式优化基于 Flink 构建大规模实时风控系统在阿里巴巴的落地

编辑推荐

官方自爆了!去年今天的B站原来是这样崩溃的……日志系统成本飙升千万,吓得我赶紧把ES换成ClickHouse……不做运维大冤种!锐捷乐享智能运维管理平台提供新解运维大牛万字自述:道尽十多年血泪史与转型自救路自从上了 Prometheus 监控,睡觉真“香”
我收藏的内容
点赞
收藏

51CTO技术栈公众号