今天要监控一个服务的进程___xl2tpd;该服务有几个IP就会有几个进程;
从网站建设到定制行业解决方案,为提供网站制作、网站设计服务体系,各种行业企业客户提供网站建设解决方案,助力业务快速发展。创新互联将不断加快创新步伐,提供优质的建站服务。本来是想利用nagios的check_nrpe插件取值,然后判断报警,脚本写好了,本地测试正常,可是部署上去发现每次都取得反值,比如,现在有2个进程(2个IP),结果监控端取到值就是crit;郁闷啊;不知道这个nagios的check_nrpe是什么机制,第一次自定义;
最后没办法使用了check_pros
command[check_aa]=/usr/local/nagios/libexec/check_procs -c 2:2 -a '/usr/sbin/xl2tpd'
这样是正常的,可是我的脚本感觉也没错,虽然写的粗糙了点;
vim check_srv.pl
#!/usr/bin/perl
use Getopt::Std;
use strict;
use vars qw($opt_m $opt_c $opt_h);
getopts('m:c:h');
my ($srv_name,$srv_count,$back,$output,$help);
my $sr_count=`netstat -naputl |grep -c "$opt_m"`;
my %re;
$re{ok}=0;
$re{crit}=2;
& main();
sub main {
get_args();
check_result();
warning();
}
sub get_args{
$srv_name = $opt_m if $opt_m;
$srv_count = $opt_c if $opt_c;
&Usage() if (!defined($srv_name) || !defined($srv_count));
}
sub check_result {
if ($sr_count == $srv_count) {
$back=$re{ok};
$output="$srv_name service is ok";
}else{
$back=$re{crit};
$output="$srv_name service is crit";
}
}
sub warning{
print "$output\n";
exit $back;
}
sub Usage {
print << "END";
./check_service.pl -m
END
exit 2;
}
##################################END##########################################
本地执行./check_srv.pl -m xl2tpd -c 2
xl2tpd_service is ok!
可是在监控端执行./check_nrpe -H hostip -c check_aa
就是不行,得到空值;
今天接着弄:
将日志打到一个文件中瞧瞧吧;
command[check_aa]=/usr/local/nagios/libexec/check_srv.pl -m xl2tpd -c 2 >> /tmp/output 2>&1
打开看看:
(Not all processes could be identified, non-owned process info
will not be shown, you would have to be root to see it all.)
xl2tpd_service is crit;
发现是权限问题:
在被监控端;
vim /etc/sudoers
nagios ALL=NOPASSWD:ALL (新增)
然后执行 ./check_nrpe -H hostip -c check_aa
发现OK了,哈哈,
那就到此为止吧
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。