微信告警的zabbix监控系统 监控整个NGINX集群


Posted in Servers onApril 18, 2022

项目描述

本项目的目的是构建一个能实现微信告警的zabbix监控系统,方便的监控整个NGINX集群,同时能批量的去部署和管理整个集群。

项目步骤

  • zabbix服务端(192.168.2.138)安装好zabbix server,nginx端安装好zabbix agent(192.168.2.58),配置好Nginx负载均衡集群,并打开状态统计。
  • nginx端编写监控脚本,取到nginx的状态。
  • 服务端web添加监控项,出图。
  • 注册企业微信,配置好微信接口。
  • zabbix服务端添加接口推送脚本,测试接口正常。
  • 在web端配置报警媒介,群组和用户,添加相关触发器和动作。
  • nginx关停服务,测试是否能通过微信告警。

项目心得

在测试接收消息过程中,返回值一直是参数{ALTER.MESSAGE},排查脚本问题,版本问题,最后发现是参数{ALERT.MESSAGE},所以打字一定要细心,认真。同时对监控也有了一定的认识,运维人员不可能7*24小时盯着zabbix看,所以做到及时告警是非常必要的,对之前的高可用web集群项目叶可以进行完善。

详细步骤

zabbix-agent客户端nginx配置监控

nginx打开状态统计功能

nginx配置增加stub_status模块

location = /wyt_status{
stub_status;}

测试状态统计功能是否打开

http://192.168.2.58/wyt_status\

nginx端(zabbix客户端)编写监控脚本

cd /etc/zabbix/zabbix_agentd.d 
#在zabbix_agentd.d目录下编写监控脚本
vim zabbix-nginx_status.sh
#!/bin/bash
case $1 in
        active)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk '/Active/ {print $NF}'
                ;;
        accepts)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk 'NR==3 {print $1}'
                ;;
        handled)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $2}'
                ;;
        requests)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $3}'
                ;;
        reading)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $2}'
                ;;
        writing)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $4}'
                ;;
        waiting)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $NF}'
                ;;
           ping)
                pidof nginx |wc -l
                #通过查询进程PID值,测试nginx存活状态
                ;;
esac
vim userparameter_nginx.conf
#在zabbix_agentd.d目录下自定义参数配置文件
UserParameter=nginx.status[*],/etc/zabbix/zabbix_agentd.d/zabbix-nginx_status.sh $1
#指定动作
chmod +x zabbix-nginx_status.sh
#授予可执行权限
service zabbix-agent restart
#刷新服务
zabbix_get -k nginx.status[ping] -s 192.168.2.58
#去服务端测试是否返回参数1

zabbix-server-web配置监控

先创建nginx主机master-nginx

微信告警的zabbix监控系统 监控整个NGINX集群

添加应用集nginx

微信告警的zabbix监控系统 监控整个NGINX集群

在应用集nginx增加监控项

微信告警的zabbix监控系统 监控整个NGINX集群

自定义触发器nginx-up-down,监控项为nginx-ping,正常为1,每5s监控一次,若为0,严重警告。

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

除nginx-ping,nginx-accepts外,需要添加所有状态监控项,只有nginx-ping创建触发器,这里不一一举例。

微信告警的zabbix监控系统 监控整个NGINX集群

添加好所有监控项,下一步制图,图中包含所有监控项

微信告警的zabbix监控系统 监控整个NGINX集群

因为我们监控实际上就是在一直请求,所以看到nginx-requests在不断增加。

微信告警的zabbix监控系统 监控整个NGINX集群

注册企业微信接口

注册成功之后创建一个运维部门

微信告警的zabbix监控系统 监控整个NGINX集群

记住自己的企业ID

微信告警的zabbix监控系统 监控整个NGINX集群

自建应用

微信告警的zabbix监控系统 监控整个NGINX集群

应用名称为zabbix监控

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

创建成功后,查看信息记住自己的AgentId和Secret

微信告警的zabbix监控系统 监控整个NGINX集群

微信扫码企业微信插件就可以在微信接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-server接口脚本配置告警

Shell脚本

cd /usr/lib/zabbix/alertscripts
进入脚本配置文件夹
vim weixin.sh
#!/bin/bash

CorpID="wwaa6fb8ff1b81aa77"     # 你的企业id
Secret="Cxyd*****"    #你的SecretID
GURL="https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=$CorpID&corpsecret=$Secret"
Token=$(/usr/bin/curl -s -G $GURL |awk -F\": '{print $4}'|awk -F\" '{print $2}')
# echo $Token
PURL="https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token=$Token"

function body(){
        local int agentid=1000002               # 你的agentdid
        local UserID="@all"                 # 发送的用户ID
        local PartyID=1                  # 部门ID
        local Msg=$(echo "$@" | cut -d" " -f3-) # 发送给所有人
        printf '{\n'
        printf '\t"touser": "'"$UserID"\"",\n"
        printf '\t"toparty": "'"$PartyID"\"",\n"
        printf '\t"msgtype": "text",\n'
        printf '\t"agentid": "'"$agentid"\"",\n"
        printf '\t"text": {\n'
        printf '\t\t"content": "'"$Msg"\""\n"
        printf '\t},\n'
        printf '\t"safe":"0"\n'
        printf '}\n'
}
/usr/bin/curl --data-ascii "$(body $1 $2 $3)" $PURL

测试脚本能否正常接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

可以看到正常接收。

微信告警的zabbix监控系统 监控整个NGINX集群

然后我们回到zabbix-server-web配置

zabbix-server-web配置告警

管理->报警媒介类型->创建媒体类型

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户群组

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户

微信告警的zabbix监控系统 监控整个NGINX集群

报警媒介

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

权限->超级管理员

微信告警的zabbix监控系统 监控整个NGINX集群

配置->动作

添加触发器

微信告警的zabbix监控系统 监控整个NGINX集群

操作

故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生{TRIGGER.NAME}故障!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

恢复操作

恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-agent关停nginx服务测试

微信告警的zabbix监控系统 监控整个NGINX集群


可以看到推送成功

微信告警的zabbix监控系统 监控整个NGINX集群

Python webhook机器人脚本

新建一个测试群聊,在群里添加机器人,记住webhook地址

微信告警的zabbix监控系统 监控整个NGINX集群

除了使用Shell脚本配置接口之外,还可以使用Python脚本

#!/usr/bin/python
#-*- coding: utf-8 -*-
import requests
import json
import sys
import os

headers = {'Content-Type': 'application/json;charset=utf-8'}
api_url = "https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=****”
#填写自己的webhook地址
def msg(text):
    json_text= {
     "msgtype": "text",
        "text": {
            "content": text
        },
    }
    print requests.post(api_url,json.dumps(json_text),headers=headers).content

if __name__ == '__main__':
    text = sys.argv[1]
    msg(text)

测试

python weixin.py test

web配置同上

微信告警的zabbix监控系统 监控整个NGINX集群

总结 

到此这篇关于Zabbix自定义脚本监控nginx以及微信告警的文章就介绍到这了!

Servers 相关文章推荐
Nginx中break与last的区别详析
Mar 31 Servers
Nginx开启Brotli压缩算法实现过程详解
Mar 31 Servers
fastdfs+nginx集群搭建的实现
Mar 31 Servers
使用nginx配置访问wgcloud的方法
Jun 26 Servers
Nginx中使用Lua脚本与图片的缩略图处理的实现
Mar 18 Servers
HDFS免重启挂载新磁盘
Apr 06 Servers
CentOS安装Nginx并部署vue
Apr 12 Servers
排查Tomcat进程假死的问题
May 06 Servers
详解Nginx的超时keeplive_timeout配置步骤
May 25 Servers
nginx之内存池的实现
Jun 28 Servers
Zabbix对Kafka topic积压数据监控的解决方案
Jul 07 Servers
Nginx报404错误的详细解决方法
Jul 23 Servers
nginx配置之并发频次限制
如何通过cmd 连接阿里云服务器
Linux中如何安装并部署Redis
Apr 18 #Servers
nginx搭建NFS网络文件系统
Mac电脑OS系统下安装Nginx的详细教程
Docker 镜像介绍以及commit相关操作
Docker官方工具docker-registry案例演示
Apr 13 #Servers
You might like
浅析PHP原理之变量(Variables inside PHP)
2013/08/09 PHP
PHP仿微信发红包领红包效果
2016/10/30 PHP
thinkPHP框架中执行事务的方法示例
2018/05/31 PHP
如何在Laravel5.8中正确地应用Repository设计模式
2019/11/26 PHP
通过PHP的Wrapper无缝迁移原有项目到新服务的实现方法
2020/04/02 PHP
Javascript String对象扩展HTML编码和解码的方法
2009/06/02 Javascript
js不能跳转到上一页面的问题解决方法
2013/03/01 Javascript
Firefox下无法正常显示年份的解决方法
2014/09/04 Javascript
浅谈JavaScript的push(),pop(),concat()方法
2016/06/03 Javascript
详解Vue.js 2.0 如何使用axios
2017/04/21 Javascript
JS实现的tab页切换效果完整示例
2018/12/18 Javascript
JS实现点击li标签弹出对应的索引功能【案例】
2019/02/18 Javascript
Vue.extend实现挂载到实例上的方法
2019/05/01 Javascript
Vue中全局变量的定义和使用
2019/06/05 Javascript
javascript简单实现深浅拷贝过程详解
2019/10/08 Javascript
[01:15]《辉夜杯》北京网鱼队巡礼
2015/10/26 DOTA
[43:49]LGD vs CHAOS 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
Python内置数据类型详解
2014/08/18 Python
Python实现导出数据生成excel报表的方法示例
2017/07/12 Python
python matplotlib坐标轴设置的方法
2017/12/05 Python
在pandas中一次性删除dataframe的多个列方法
2018/04/10 Python
python中cPickle类使用方法详解
2018/08/27 Python
python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法
2018/09/13 Python
Django之创建引擎索引报错及解决详解
2019/07/17 Python
基于nexus3配置Python仓库过程详解
2020/06/15 Python
Python爬虫小例子——爬取51job发布的工作职位
2020/07/10 Python
Python用access判断文件是否被占用的实例方法
2020/12/17 Python
英国护肤品购物网站:Beauty Expert
2016/08/19 全球购物
英国航空官网:British Airways
2016/09/11 全球购物
Yves Rocher伊夫·黎雪美国官网:法国始创植物美肌1959
2019/01/09 全球购物
小学班级口号
2014/06/09 职场文书
领导班子在批评与自我批评座谈会上的发言
2014/09/28 职场文书
暂住证证明
2015/06/19 职场文书
航班延误投诉信
2015/07/02 职场文书
2016年寒假社会实践活动心得体会
2015/10/09 职场文书
学生检讨书范文
2019/06/24 职场文书