Zabbix5.2由浅入深系列之制作网络设备监控项

运维 系统运维
众所周知,Zabbix监控的表面逻辑非常简单,分为三个动作,采集数据(监控项),判断采集的数据是否超过定义的阈值(触发器),产生告警(邮件、短信等等)。当然这仅仅是表面,内部的一些函数判断实际上很复杂,这些不是我们探讨的重点。如果当你的监控设备种类繁多,监控指标复杂,那么只能通过自作模板实现你的监控工作。

[[361090]]

 众所周知,Zabbix监控的表面逻辑非常简单,分为三个动作,采集数据(监控项),判断采集的数据是否超过定义的阈值(触发器),产生告警(邮件、短信等等)。当然这仅仅是表面,内部的一些函数判断实际上很复杂,这些不是我们探讨的重点。如果当你的监控设备种类繁多,监控指标复杂,那么只能通过自作模板实现你的监控工作。

正文

Zabbix监控项分为很多种,由于今天讨论的焦点为网络设备,自然而然选择的为SNMP这种类型,相信大家对SNMP多多少少也有些了解,如果不理解的也没关系,可以查找互联网其他优质的文章也有介绍,或者等我下期文章也行。

监控项组成

  • 名称
  • 键值
  • 类型
  • 信息类型
  • 更新时间

制作过程思路

1.寻找监控项的OID

2.利用snmpwalk工具取值检验OID是否存在

3.制作监控项

制作前准备工作

1.如果出现下图中的报错,需要安装net-snmp-utils,以CentOS 8为例

  1. dnf -y install net-snmp-utils 

 

2.开启设备snmp配置(以华为为例,其他自查)

  1. snmp-agent 
  2. snmp-agent sys-info version v2c 
  3. snmp-agent community read cipher Huawei@123 

 3.snmpwalk用法

snmpwalk用在Zabbix Server端,主要语法为(斜体为可变,根据自身环境修改):

snmpwalk -v 2c -c Huawei@123 10.0.0.10 OID

制作案例

案例主题为监控华为CE58系列交换机CPU利用率。

1.通过官网查询其CPU相关OID或者下载相关mib用mib浏览器查看,推荐采用mib browser,mib文件可以在官网下载到或者找相关厂商要即可,下面是查询到的相关OID,其实用到hwEntityCpuUsage就可以了,但是如果有框式设备就不一样了,有些板卡上自带CPU,文末我会放出框式设备的CPU利用率。

  1. entPhysicalName                1.3.6.1.2.1.47.1.1.1.1.7 
  2. entPhysicalClass               1.3.6.1.2.1.47.1.1.1.1.5 
  3. hwEntityCpuUsage               1.3.6.1.4.1.2011.5.25.31.1.1.1.1.5 

 2.查询各个OID所代表的的意思。

  1. snmpwalk -v 2c -c huawei@123 10.240.255.10 1.3.6.1.2.1.47.1.1.1.1.7 
  2. 可以看出为实体名称。 

 

  1. snmpwalk -v 2c -c huawei@123 10.240.255.10 1.3.6.1.2.1.47.1.1.1.1.5 
  2. 查询的是物理实体的通用类型,不知道取值代表什么意思?看看下图二 

 

Zabbix5.2由浅入深系列之制作网络设备监控项

该OID详解

  1. snmpwalk -v 2c -c huawei@123 10.240.255.10 1.3.6.1.4.1.2011.5.25.31.1.1.1.1.5 
  2. 查询CPU利用率,字面理解 

 

3.通过查询对比分析。

首先查询CPU利用率,只有一个值有数据,如下,但是由于通过获取的结果无法看出是什么,只知道索引值为16842753的实体的CPU利用率为23%,所以需要进一步分析。

  1. SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753 = INTEGER: 23 

 Zabbix5.2由浅入深系列之制作网络设备监控项

该OID介绍

查询该实体名称

通过下面命令得出结果为"CE5855-48T4S2Q-EI 1",这个就是实体名称,盒式设备的CPU利用率一般是设备本身,所以可以理解为CE5885的CPU利用率的OID就是SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753,如果是堆叠环境就存在两个,另外一个就是"CE5855-48T4S2Q-EI 2"。

  1. snmpwalk -v 2c -c huawei@123 10.240.255.10 1.3.6.1.2.1.47.1.1.1.1.7.16842753 

 

得出结果

创建主机并测试


创建主机


修改团体字(读或者写)


创建监控项


写完后,确定即可


查看最新数据正常,点击图形下一步


出图正常

附录

mib browser截图


用mib browers查看mib文件

为什么需要查询多个值关联分析

以12804为例子,如下图,可以发现框式设备多了很多CPU实体,由于每板卡一个CPU,所以如果不判断哪个实体的CPU是你想要的,很容易出错,这也是为什么需要去关联分析,其次通过关联分析引出的另外一个内容就是自动发现规则,如果每次都是如此去添加,就太过麻烦了,而且每个设备的索引值都有可能不一样,所以这些变化比较大的,CPU、内存、接口等等都适合自动发现,在下一篇文章我会写到。


得出的结果

常用的OID值


总结

如果对于SNMP的相关知识不理解的朋友更加需要自己测试,加深自己的理解,活学活用,如果要找一个端口的流量,应该先找到该端口的名称主体索引,再查找流量值,mib的运用在后续的snmptrap我们还会碰到,其实这个内容的难点在于找MIB,找到mib需要花大量的时间去验证OID是否合适,另外mib文件需要专用的软件查看,最后还是得说一句,监控领域长路漫漫,绝非一朝一夕,大量的测试和验证才是真理。

 

责任编辑:姜华 来源: 今日头条
相关推荐

2021-07-13 07:12:04

Zabbix监控网络设备

2021-04-23 08:41:17

Zabbix 5.2Nginx监控

2021-04-15 08:45:25

Zabbix 5.2Apache监控

2021-02-01 09:13:34

Zabbix5.2拓扑图运维

2021-03-19 08:47:38

Zabbix 5.2VMware监控

2021-04-25 08:28:44

Zabbix 5.2监控IIS服务运维

2020-12-31 08:36:03

Zabbix邮箱告警Python

2021-05-20 06:14:00

Zabbix 5.2华为交换机监控

2021-05-12 08:13:31

Zabbix 5.2php-fpm监控

2021-05-13 07:42:06

Zabbix汉化调整开源

2021-01-15 09:29:48

ZabbixHttpsSSL

2021-02-07 09:22:42

Zabbix5.2拓扑图运维

2021-05-28 08:31:51

Zabbix监控公有云

2021-04-26 08:37:24

Zabbix5.2基础设施监控运维

2021-01-04 08:55:07

ZabbixProxy分布式部署

2021-01-14 10:57:29

Zabbix监控网络设备

2021-01-29 15:00:04

Zabbix5.2Grafana仪表盘

2021-06-11 06:54:00

Zabbix 5.2yum仓库监控

2021-08-11 06:34:14

ZabbixDocker运维

2021-03-25 08:21:07

Zabbix主机群组监控
点赞
收藏

51CTO技术栈公众号