十个Nagios故障解决技巧

安全 网站安全
如何添加一个管理插件的配置?如何添加一台监控 38101 端口的Linux服务器?又怎么样比较清晰的管理尽千台主机?本文就来为你一一解答与nagios有关的十个问题。

Nagios问题处理如下所述:

1、监控状态不正常怎么办?

答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。

2、nrpe在 ./configure时提示:

checking for SSL... configure: error: Cannot find ssl libraries

答、把openssl-devel装上就可以了.

3、nagios web界面提示:

It appears as though you do not have permission to view information for any of the services you requested...

答、打开cgi.cfg配置文件, use_authentication=1

为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。

4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?

答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$

-p 指定 port -s   指定 password

5、Service Commands 中Enable notifications for this service时报错:

Sorry Dave, I can't let you do that...

It seems that you have chosen to not use the authentication functionality of the CGIs.

答、修改cgi.cfg文件

修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。

6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server

Server (nagios服务端192.168.0.132)

#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu

此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server

答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:

mysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';

mysql>flush privileges;

7、如何添加一台监控 38101 端口的Linux服务器?

答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义)

然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101

然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;

检查配置文件正确性,并重启 nagios 使配置生效。

8、怎么样比较清晰的管理尽千台主机?

答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。

9、如何添加一个管理插件的配置?

答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!

10、我装了nagios-plugin没有check_mysql  check_snmp 等插件都没有,为什么?

答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!

11、能举例说明一下配置文件参数的意义么?

监控windows服务器运行的时间:

check_command  check_nt!UPTIME

监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical

check_command  check_nt!CPULOAD!-l 5,80,90

监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical

check_command  check_nt!MEMUSE!-w 80 -c 90

监控Windows服务器C:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符

check_command  check_nt!USEDDISKSPACE!-l c -w 80 -c 90

监控Windows服务器D:\盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical

check_command  check_nt!USEDDISKSPACE!-l d -w 80 -c 90

监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical

check_command  check_nt!SERVICESTATE!-d SHOWALL -l W3SVC

监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical

check_command  check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe

command.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$   中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!21

nagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios修改Apache配置?监控Linux服务器?Nagios 3.0初步安装配置监控Windows服务器

责任编辑:佚名 来源: 网易
相关推荐

2022-11-07 16:06:15

TypeScript开发技巧

2023-10-16 07:55:15

JavaScript对象技巧

2022-05-12 08:12:51

PythonPip技巧

2023-01-17 16:43:19

JupyterLab技巧工具

2010-09-02 09:21:45

CSS兼容

2010-09-08 14:35:22

CSS

2024-01-30 00:40:10

2011-03-14 09:35:22

2023-08-08 11:36:15

光纤电缆电缆测试

2010-12-06 09:49:28

Linux快速启动

2013-09-29 13:36:07

虚拟SAN

2015-08-24 09:12:00

Redis 技巧

2023-07-02 14:21:06

PythonMatplotlib数据可视化库

2023-04-17 16:19:32

编程语言JavaScript开发

2011-06-01 09:59:52

2021-05-12 09:00:00

WebReactJavaScript

2023-07-24 07:11:43

2022-10-19 15:20:58

pandas数据处理库技巧

2010-08-18 09:55:38

IE6

2023-02-09 16:15:27

JavaScript编程语言字符串
点赞
收藏

51CTO技术栈公众号