ConsulManager/docs/ECS主机监控.md

3.1 KiB
Raw Blame History

Consul字段设计说明

  • 服务首次启动时会创建一个随机秘钥存放到consul_kv的/ConsulManager/assets/secret/skey该秘钥用于对登录Token各云厂商账号AKSK的加解密使用。
  • 云厂商的每个账号下的ECS实例信息会存储到Consul的对应Services下的实例中ECS的实例ID会作为ServiceID。
  • 云厂商的每个账号下的AKSK和分组信息存放到consul_kv的/ConsulManager/assets下各个云厂商的目录下的aksk(加密存储)和group目录。
  • 分组字段:是采集云厂商用于资源分组的字段,阿里云:资源组,华为云:企业项目,腾讯云:所属项目。请在创建云主机时设置好属组。
  • 新增的各个云厂商的ECS同步任务会存放到consul_kv的/ConsulManager/jobs下,服务启动的时候会加载这些任务。
  • 每次同步任务的执行结果:会存储到consul_kv的/ConsulManager/record/jobs的各个云厂商目录下。
  • 新增云厂商的数据源之后会自动同步一次分组信息ECS信息则会在设置的时间间隔之后才会同步可以手动点击同步按钮同步一次。

配置说明

1. 新增同步源
  • 在Web页面点击ECS 云主机监控/接入数据源,点击新增同步源,输入各字段:
  • 账户可随意填写,用来区分云厂商不同云账户的标识,支持中文,例如用主账户的名称。
  • 填写的AKSK需要有获取ECS的权限以及各云厂商分组信息的权限。注意腾讯云的分组信息因为在ECS中没有找到对应接口是从分布式数据库TDSQL-查询项目列表 (DCDB)的接口中获取的AKSK需要有对应权限。
  • 选择好对应的ECS所在区域暂支持国内以及分组与ECS的刷新间隔确认即可分组信息会自动同步一次ECS信息则会在设置的时间间隔之后才会同步可以手动点击同步按钮同步一次。
2. 查看云主机列表
  • 可以点击查看按钮或者在云主机列表中查看同步后的ECS信息。华为云暂未获取到ECS到期日信息
3. 配置Prometheus
  • 点击ECS 云主机监控/Prometheus 配置根据需要来生产各账号、系统均支持多选的Prometheus配置信息复制配置后追加到prometheus.yml的末尾重启Prometheus即可。
4. 查看Prometheus
  • 在Prometheus的Web页面中点击Status-Targets能看到新增的Job即表示数据同步到Prometheus。
5. 导入Node Exporter Dashboard
  • 更新了主机监控的grafana看板可匹配自动同步方式采集ECS信息字段的展示。
  • 优化了大量图表,使用新版表格重建,新增健康评分概念,并新增了整体资源消耗信息的一些图表。
  • 导入ID8919
  • 详细URLhttps://grafana.com/grafana/dashboards/8919
主动关机的ECS会在同步时候从Consul中清除即会在Prometheus中去除(减少无效的告警),重新开机后会增加回去。
注意各ECS的Node_exporter需要自行安装。