Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统,由工作在SoundCloud的Google前员工在2012年创建,作为社区开源项目进行开发,并于2015年正式发布。2016年,Prometheus正式加入Cloud Native Computing Foundation,成为受欢迎度仅次于Kubernetes的项目。
在云容器引擎CCE中,支持以插件的方式快捷安装Prometheus。
开源社区地址:https://github.com/prometheus/prometheus
作为新一代的监控框架,Prometheus具有以下特点:
- 强大的多维度数据模型:
a. 时间序列数据通过metric名和键值对来区分。
b. 所有的metrics都可以设置任意的多维标签。
c. 数据模型更随意,不需要刻意设置为以点分隔的字符串。
d. 可以对数据模型进行聚合,切割和切片操作。
e. 支持双精度浮点类型,标签可以设为全unicode。
- 灵活而强大的查询语句(PromQL):在同一个查询语句,可以对多个metrics进行乘法、加法、连接、取分数位等操作。
- 易于管理:Prometheus server是一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。
- 高效:平均每个采样点仅占 3.5 bytes,且一个Prometheus server可以处理数百万的metrics。
- 使用pull模式采集时间序列数据,这样不仅有利于本机测试而且可以避免有问题的服务器推送坏的metrics。
- 可以采用push gateway的方式把时间序列数据推送至Prometheus server端。
- 可以通过服务发现或者静态配置去获取监控的targets。
- 有多种可视化图形界面。
- 易于伸缩。
需要指出的是,由于数据采集可能会有丢失,所以Prometheus不适用对采集数据要100%准确的情形。但如果用于记录时间序列数据,Prometheus具有很大的查询优势,此外,Prometheus适用于微服务的体系架构。
1.11及以上版本的CCE集群支持此插件功能。
步骤 1 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件市场”页签下,单击Prometheus下的“安装插件”按钮。
步骤 2 在安装插件页面,选择安装的集群和插件版本,单击“下一步:规格配置”。
步骤 3 在“规格配置”步骤中,配置以下参数:
表-Prometheus配置参数说明
参数 | 参数说明 |
插件规格 | 根据业务需求,选择插件的规格,包含如下选项:
|
实例数 | 选择上方插件规格后,显示插件中的实例数,此处仅作显示。 |
容器 | 选择插件规格后,显示插件容器的CPU和内存配额,此处仅作显示。 |
监控数据保留期 | 自定义监控数据需要保留的天数,默认为15天。 |
存储 | 按照界面提示配置如下参数:
说明:若命名空间monitoring下已存在pvc,将使用此存储作为存储源。 |
步骤 4 单击“安装”。
待插件安装完成后,单击“返回”,在“插件实例”页签下,选择对应的集群,可查看到运行中的实例,这表明该插件已在当前集群的各节点中安装。
步骤 5 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件实例”中,单击“Prometheus”进入详情页,可以查看插件实例的详细情况。
步骤 1 登录CCE控制台,在左侧导航栏中选择“插件管理”,在“插件实例”页签下,选择对应的集群,单击“Prometheus”下的“ 升级”。
说明:
- 如果升级按钮处于冻结状态,则说明当前插件版本是最新的版本,不需要进行升级操作。
- 升级“Prometheus”插件时,会替换原先节点上的旧版本的“Prometheus”插件,安装最新版本的“Prometheus”插件以实现功能的快速升级。
步骤 2 在基本信息页面选择插件版本,单击“下一步”。
步骤 3 参考安装插件中参数说明配置参数后,单击“升级”即可升级“Prometheus”插件。
步骤 1 在CCE控制台中,单击左侧导航栏的“插件管理”,在“插件实例”页签下,选择对应的集群,单击Prometheus下的“卸载”。
步骤 2 在弹出的窗口中,单击“是”,可卸载该插件。
- Prometheus概念及详细配置请参阅Prometheus 官方文档
- Node exporter安装请参考node_exporter github 仓库