ConsulManager/docs/blackbox站点监控.md

2.5 KiB
Raw Blame History

Consul字段设计说明

  • 所有数据存在一个名为blackbox_exporter的Services项中每个监控目标为一个子Service。
  • 每个Service使用Meta的kv保存监控目标的属性modulecompanyprojectenvnameinstance分别表示监控类型公司部门项目环境名称实例url。
  • 新增监控时,监控类型字段(module)和Blackbox配置中的module必须保持一致。
  • 前5个字段合并即为consul的serviceID作为唯一监控项标识

配置Prometheus与Blackbox

原理基于Consul实现Prometheus的自动发现功能配置

  • 把Consul每个service的Meta的KV关联到Prometheus每个指标的标签。
  • 根据每个指标的标签来对监控目标分类,分组,方便管理维护。
1. 配置Blackbox_Exporter
  • 在Web页面点击Blackbox 站点监控/Blackbox 配置,点击复制配置
  • 编辑blackbox_exporter的blackbox.yml清空已有的配置把复制的内容粘贴进去重启blackbox_exporter。
2. 配置Prometheus
  • 在Web页面点击Blackbox 站点监控/Prometheus 配置,点击复制配置
  • 编辑Prometheus的prometheus.yml把复制的内容追加到最后reload或重启Prometheus。
3. 配置Prometheus告警规则
  • 在Web页面点击Blackbox 站点监控/告警规则,点击复制配置
  • 编辑Prometheus的rules.yml把复制的内容追加到最后reload或重启Prometheus。
4. 查看Prometheus
  • 在Prometheus的Web页面中点击Status-Targets能看到新增的Job即表示数据同步到Prometheus。
5. 导入Blackbox Exporter Dashboard
  • 支持Grafana 8基于blackbox_exporter 0.19.0设计
  • 采用图表+曲线图方式展示TCPICMPHTTPS的服务状态各阶段请求延时HTTPS证书信息等
  • 优化展示效果,支持监控目标的分组、分类级联展示,多服务同时对比展示。
  • 导入ID9965
  • 详细URLhttps://grafana.com/grafana/dashboards/9965

批量导入脚本

在units目录下instance.list中写入监控目标的信息JOB名称公司/部门项目环境名称实例url每行一个空格分隔。

注意前5个字段组合起来必须唯一作为一个监控项的ID。即Consul的ServiceID

修改units目录下导入脚本中的consul_token和consul_url保存后执行input.py即可导入所有监控目标到Consul并符合Prometheus的自动发现配置。