插件简介

云原生监控插件（kube-prometheus-stack）通过使用Prometheus-operator和Prometheus，提供简单易用的端到端Kubernetes集群监控能力。

使用kube-prometheus-stack可将监控数据与容器智能分析对接，在容器智能分析控制台查看监控数据，配置告警等。

开源社区地址：https://github.com/prometheus/prometheus

约束与限制

在默认配置下，插件中的kube-state-metrics组件不采集Kubernetes资源的所有的labels和annotation。如需采集，您需要手动在启动参数中开启采集开关，并同时检查名称为kube-state-metrics的ServiceMonitor中采集白名单是否添加相应指标，详情请参见采集Pod所有labels和annotations。

安装插件

步骤 1 登录CCE控制台，单击集群名称进入集群，在左侧导航栏中选择“插件管理”，在右侧找到 kube-prometheus-stack ，单击“安装”。

步骤 2 在安装插件页面，选择插件规格，并配置相关参数。

开启智能分析 ：默认不开启。开启后需选择智能分析工作区，在容器智能分析控制台查看监控数据，配置告警等。
对接第三方 ：将普罗数据上报至第三方监控系统，需填写第三方监控系统的地址和Token，并选择是否跳过证书认证。
普罗高可用 ：高可用会在集群中将Prometheus-server、Prometheus-operator、thanos-query、custom-metrics-apiserver、alertmanager组件按多实例方式部署。
安装grafana ：通过grafana 可视化浏览普罗监控数据。grafana 会默认创建大小为 5 GiB 的存储卷，卸载插件时 grafana 的 存储卷不随插件被删除 。首次登录默认用户名与密码均为admin，登录后会立即让您修改密码。
采集周期 ：采集监控数据的周期。
数据保留期 ：监控数据保留的时长。
存储：选择用于存储监控数据的磁盘类型和大小。
调度策略 ：可单独配置插件各个组件的节点亲和性和污点容忍能力。可以配置多个调度策略，不配置亲和节点键和容忍节点污点键则默认不开启对应的调度策略。
- 作用范围：可选择调度策略生效的插件实例，默认对全部实例生效。当指定组件实例名称时，将覆盖全部实例所配置的调度策略。
- 亲和节点标签键：填写节点标签键，为插件实例设置节点亲和性。
- 亲和节点标签值：填写节点标签值，为插件实例设置节点亲和性。
- 容忍节点污点键：目前仅支持污点键级别的污点容忍策略，组件可以调度到拥有该污点键的节点。

步骤 3 完成以上配置后，单击“安装”。

配置自定义指标

新版本的kube-prometheus-stack插件不再提供自定义配置的指标，即user-adapter-config配置项（历史版本插件中该配置项的名称为adapter-config）中不再配置指标采集规则，请您自行添加。关于采集规则配置详情请参见Metrics Discovery and Presentation Configuration。如您从老版本插件升级至新版，则原有的该配置会被继承，不会丢失。

步骤 1 登录CCE控制台，单击集群名称进入集群，在左侧导航栏中选择“配置项与密钥”。

步骤 2 切换至“monitoring”命名空间，在“配置项”页签找到user-adapter-config配置项（历史版本插件中该配置项的名称为adapter-config），并单击“更新”。

图片13.png

步骤 3 在“配置数据”中单击config.yaml对应的“编辑”按钮，在rules字段下添加自定义指标采集规则。修改完成后单击“确定”保存配置。

如果您需要增加多个采集规则，可在rules字段下添加多个配置，关于采集规则配置详情请参见Metrics Discovery and Presentation Configuration。

自定义采集规则示例如下：

rules: 
- seriesQuery: '{__name__=~"^container_.*",container!="POD",namespace!="",pod!=""}' 
  resources: 
    overrides: 
      namespace: 
        resource: namespace 
      pod: 
        resource: pod 
  name: 
    matches: "^container_(.*)_seconds_total$" 
  metricsQuery: 'sum(rate(<<.Series>>{<<.LabelMatchers>>,container!="POD"}[2m])) by (<<.GroupBy>>)'

图片14.png

步骤 4 重新部署monitoring命名空间下的custom-metrics-apiserver工作负载。

图片16.png

组件说明

安装kube-prometheus-stack插件创建的Kubernetes资源，全部都创建在monitoring命名空间下。

有状态负载：

prometheus-server
alertmanager-alertmanager

无状态负载：

thanos-query
event-exporter
custom-metrics-apiserver
grafana
kube-state-metric
prometheus-operator

访问grafana

如果在安装插件时安装了grafana，可以通过名为grafana的Service访问，grafana Service类型为节点访问，如果是从外网访问，可以给节点绑定EIP，通过节点端口访问。

如下图，访问地址为http://{{节点IP}}:30433

图片17.png

采集Pod所有labels和annotations

步骤 1 登录CCE控制台，单击集群名称进入集群，在左侧导航栏中选择“工作负载”。

步骤 2 切换至“monitoring”命名空间，在“无状态负载”页签找到kube-state-metrics负载，并单击“升级”。

步骤 3 在容器配置的“生命周期”中，编辑启动命令。

图片18.png

在原有的kube-state-metrics的启动参数最后添加：

--metric-labels-allowlist=pods=[*],nodes=[node,failure-
domain.beta.kubernetes.io/zone,topology.kubernetes.io/zone]

如需采集annotations时，则在启动参数中以相同方法添加参数：

--metric-annotations-allowlist=pods=[*],nodes=[node,failure-
domain.beta.kubernetes.io/zone,topology.kubernetes.io/zone]


                    注意
                    编辑启动命令时，请勿修改其他原有的启动参数，否则可能导致组件异常。

步骤 4 kube-state-metrics将开始采集Pod和node的labels/annotations指标，查询kube_pod_labels/kube_pod_annotations是否在普罗的采集任务中。

kubectl get servicemonitor kube-state-metrics -nmonitoring -oyaml | kube_pod_labels

更多kube-state-metrics的启动参数请参见kube-state-metrics/cli-arguments。

版本记录

表 CCE插件版本记录

插件版本 支持的集群版本 社区版本（仅1.17及以上版本集群支持）
3.6.6 /v1.(19|21|23|25).*/ 2.35.0
3.5.1 /v1.(19|21|23).*/ 2.35.0
3.5.0 /v1.(19|21|23).*/ 2.35.0

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

云容器引擎

云容器引擎

插件简介

约束与限制

安装插件

配置自定义指标

组件说明

访问grafana

采集Pod所有labels和annotations

版本记录

插件版本	支持的集群版本	社区版本（仅1.17及以上版本集群支持）
3.6.6	/v1.(19\|21\|23\|25).*/	2.35.0
3.5.1	/v1.(19\|21\|23).*/	2.35.0
3.5.0	/v1.(19\|21\|23).*/	2.35.0

活动

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

云容器引擎

云容器引擎

插件简介

约束与限制

安装插件

配置自定义指标

组件说明

访问grafana

采集Pod所有labels和annotations

版本记录