Elasticsearch 集群健康状态监控接口-天翼云

Elasticsearch 集群健康状态监控接口

2023-06-01 06:35:26 阅读次数：155

说到 Elasticsearch 集群监控，首先我们肯定是需要一个从总体意义上的概要。不管是多大规模的集群，告诉我正常还是不正常？没错，集群健康状态接口就是用来回答这个问题的，而且这个接口的信息已经出于意料的丰富了。

命令示例

# curl -XGET 127.0.0.1:9200/_cluster/health?pretty
{
  "cluster_name" : "jiankunking-log",
  "status" : "green",
  "timed_out" : false,
  "number_of_nodes" : 3,
  "number_of_data_nodes" : 3,
  "active_primary_shards" : 2722,
  "active_shards" : 5444,
  "relocating_shards" : 0,
  "initializing_shards" : 0,
  "unassigned_shards" : 0,
  "delayed_unassigned_shards" : 0,
  "number_of_pending_tasks" : 0,
  "number_of_in_flight_fetch" : 0,
  "task_max_waiting_in_queue_millis" : 0,
  "active_shards_percent_as_number" : 100.0
}

状态信息

输出里最重要的就是 status 这行。很多开源的 ES 监控脚本，其实就是拿这行数据做报警判断。status 有三个可能的值：

green 绿灯，所有分片都正确运行，集群非常健康。
yellow 黄灯，所有主分片都正确运行，但是有副本分片缺失。这种情况意味着
ES 当前还是正常运行的，但是有一定风险。注意，在 Kibana4 的 server 端启
监控方案启动逻辑中，即使是黄灯状态，Kibana 4 也会拒绝启动，死循环等待集群状态变成绿灯后才能继续运行。
red 红灯，有主分片缺失。这部分数据完全不可用。而考虑到 ES 在写入端是
简单的取余算法，轮到这个分片上的数据也会持续写入报错。

其他数据解释

number_of_nodes 集群内的总节点数。
number_of_data_nodes 集群内的总数据节点数。
active_primary_shards 集群内所有索引的主分片总数。
active_shards 集群内所有索引的分片总数。
relocating_shards 正在迁移中的分片数。
initializing_shards 正在初始化的分片数。
unassigned_shards 未分配到具体节点上的分片数。
delayed_unassigned_shards 延时待分配到具体节点上的分片数。

显然，后面 4 项在正常情况下，一般都应该是 0。

level 请求参数

接口请求的时候，可以附加一个 level 参数，指定输出信息以 indices 还是 shards级别显示。当然，一般来说，indices 级别就够了。

# curl -XGET http://127.0.0.1:9200/_cluster/health?level=indices
{
    "cluster_name": "jiankunking-log",
    "status": "green",
    "timed_out": false,
    "number_of_nodes": 3,
    "number_of_data_nodes": 3,
    "active_primary_shards": 2722,
    "active_shards": 5444,
    "relocating_shards": 0,
    "initializing_shards": 0,
    "unassigned_shards": 0,
    "delayed_unassigned_shards": 0,
    "number_of_pending_tasks": 0,
    "number_of_in_flight_fetch": 0,
    "task_max_waiting_in_queue_millis": 0,
    "active_shards_percent_as_number": 100.0,
    "indices": {
        "metrics-daily-2018-03-19": {
            "status": "green",
            "number_of_shards": 6,
            "number_of_replicas": 1,
            "active_primary_shards": 6,
            "active_shards": 12,
            "relocating_shards": 0,
            "initializing_shards": 0,
            "unassigned_shards": 0
        },
        "metrics-daily-2018-03-14": {
            "status": "green",
            "number_of_shards": 6,
            "number_of_replicas": 1,
            "active_primary_shards": 6,
            "active_shards": 12,
            "relocating_shards": 0,
            "initializing_shards": 0,
            "unassigned_shards": 0
        },
        //......省略其他index.......
    }
}

不过，一般来说，集群健康接口，还是只用来简单监控一下集群状态是否正常。一旦收到异常报警，具体确定 unassign shard 的情况，更推荐使用 kopf 工具在页面查看。

本文整理自：elk-stack-guide-cn.pdf

更加详细的获取集群、index信息的接口，可以下载elk-stack-guide-cn.pdf来查看（400到432页）。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Elasticsearch 集群健康状态监控接口

Elasticsearch 集群健康状态监控接口

命令示例

状态信息

其他数据解释

level 请求参数

相关文章

配置集群免密登录

【漏洞复现】CVE-2015-5531 Arbitrary File Reading

redis-cluster分布式集群安装部署

大数据平台的运维与管理技巧

【图论】【 割边】【C++算法】1192. 查找集群内的关键连接

oracle 11.2.0.4 asm单实例不随系统启动而自动开启

k8s-监控与日志收集

redis主从复制集群环境搭建

执行start-dfs.sh后，datenode没有启动的最全解决办法（全网最全）

【Kubernets】kubenets基础-kubectl常用命令行

作者介绍

最新文章

【图论】【 割边】【C++算法】1192. 查找集群内的关键连接

SpringBoot ElasticSearch 实现订单的分页查询 【SpringBoot系列17】

Java ElasticSearch 操作

ElasticSearch - 基于 JavaRestClient 操作索引库和文档

课程表。你这个学期必须选修 numCourses 门课程，记为 0 到 numCourses - 1 。

elasticsearch查询操作（API方式）

热门文章

Elasticsearch 处理并发读写操作

Kafka集群吞吐量测试（生产者和消费者）

Java API 基础操作ES

（二十一）高并发redis学习笔记：搭建redis cluster集群

Java API操作ES 高级查询

Java ElasticSearch 操作

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

ElasticSearch之cat component templates API

ElasticSearch之Delete index API

Java API 基础操作ES

11、使用Java High Level REST Client操作elasticsearch

9、使用Java High Level REST Client操作elasticsearch

ElasticSearch之Create index API

【图论】【割边】【C++算法】1192. 查找集群内的关键连接

【图论】【割边】【C++算法】1192. 查找集群内的关键连接

SpringBoot ElasticSearch 实现订单的分页查询【SpringBoot系列17】