History

Ulric Qin 5c8fdb026b move types.PushSamples to inputs.PushSamples		2022-07-12 14:44:27 +08:00
..
README.md	update kubernetes README	2022-06-28 19:58:57 +08:00
kube_resources_dash.json	update other promql base on pod and container	2022-07-12 13:23:49 +08:00
kubelet-metrics-dash.json	add kubelet dashboard json and modify readme	2022-06-23 16:52:02 +08:00
kubernetes.go	move types.PushSamples to inputs.PushSamples	2022-07-12 14:44:27 +08:00
kubernetes_metrics.go	add kubernetes plugin	2022-06-14 17:03:52 +08:00
kubernetes_pods.go	add kubernetes plugin	2022-06-14 17:03:52 +08:00

README.md

kubernetes

forked from telegraf/kubernetes. 这个插件的作用是通过kubelet提供的API获取监控数据，包括系统容器的监控数据、node的、pod数据卷的、pod网络的、pod容器的

Change

增加了一些控制开关：

gather_system_container_metrics = true

是否采集 system 容器（kubelet、runtime、misc、pods），比如 kubelet 一般就是静态容器，非业务容器

gather_node_metrics = true

是否采集 node 层面的指标，机器层面的指标其实 categraf 来采集了，这里理论上不需要再采集了，可以设置为 false，采集也没问题，也没多少数据

gather_pod_container_metrics = true

是否采集 Pod 中的容器的指标，这些 Pod 一般是业务容器

gather_pod_volume_metrics = true

是否采集 Pod 的数据卷的指标

gather_pod_network_metrics = true

是否采集 Pod 的网络监控数据

容器监控

通过这些开关可以看出，kubernetes 这个插件，采集的只是 pod、容器的监控指标，这些指标数据来自 kubelet 的 /stats/summary /pods 等接口。那么问题来了，容器监控到底是应该读取 /metrics/cadvisor 接口还是应该用这个 kubernetes 插件？有几个决策依据：

/metrics/cadvisor 采集的数据没有业务自定义标签，kubernetes 这个插件会自动带上业务自定义标签。但是业务标签可能比较混乱，建议每个公司制定规范，比如要求业务只能打 project、region、env、service、app、job 等标签，其他标签都过滤掉，通过 kubernetes 插件的 label_include label_exclude 配置，可以做标签过滤。
kubernetes 这个插件采集的数据比 /metrics/cadvisor 吐出的指标要少，不过常见的 cpu、mem、net、volume 相关的也都有。

kubelet 监控

kubelet 的监控更推荐的做法：使用 prometheus 插件采集其 /metrics 接口，针对这种方式采集的数据，我们提供了监控大盘，在本 README 的同级目录下：kubelet-metrics-dash.json，可以直接导入夜莺使用。请使用 Categraf v0.1.7 以上的版本。

README.md Unescape Escape

kubernetes

Change

容器监控

kubelet 监控

README.md