Elasticsearch优化-- ES是如何消费heap内存-天翼云

Elasticsearch优化-- ES是如何消费heap内存

2023-06-12 09:39:03 阅读次数：385

ES的Heap内存基本上被Segment Memory、Filter Cache、Field Data Cache、Bulk Queue、Indexing Buffer、Cluster State Buffer、各类聚合查询的结果集fetch所消耗掉，具体情况如下：

一、Segment Memory 1、Segment不是file吗？segment memory又是什么？前面提到过，一个segment是一个完备的lucene倒排索引，而倒排索引是通过词典 (Term Dictionary)到文档列表(Postings List)的映射关系，快速做查询的。由于词典的size会很大，全部装载到heap里不现实，因此Lucene为词典做了一层前缀索引(Term Index)，这个索引在Lucene4.0以后采用的数据结构是FST (Finite State Transducer)。这种数据结构占用空间很小，Lucene打开索引的时候将其全量装载到内存中，加快磁盘上词典查询速度的同时减少随机磁盘访问次数。

Elasticsearch优化-- ES是如何消费heap内存总之，要传达的一个意思就是，ES的data node存储数据并非只是耗费磁盘空间的，为了加速数据的访问，每个segment都有会一些索引数据驻留在heap里。因此segment越多，瓜分掉的heap也越多，并且这部分heap是无法被GC掉的！理解这点对于监控和管理集群容量很重要，当一个node的segment memory占用过多的时候，就需要考虑删除、归档数据，或者扩容了。

怎么知道Segment Memory占用情况呢？可通过cat API可以给出答案 1、查看一个索引所有segment的memroy占用情况： GET _cat/segments/elk-info-test-2020-07-02/?v&h=ip,shard,segment,size,size.memory Elasticsearch优化-- ES是如何消费heap内存 2、查看一个node上所有segment占用的memory总和 GET _cat/nodes?v&h=name,port,sm

2、怎样减少data node上segment memory占用。 2.1、删除不用的索引 2.2、关闭索引（文件仍存在与磁盘，只是释放掉内存），需要的时候可以重新打开 2.3、定期对不再更新的索引做optimize（）定期对不再更新的索引做optimize 。Optimze的实质是对segment file强制做合并，可以节省大量的segment memory。

二、Filter Cache Filter cache是用来缓存使用过的filter的结果集的，需要注意的是这个缓存也是常驻heap，无法GC的。默认的10% heap size设置工作得够好了，如果实际使用中heap没什么压力的情况下，才考虑加大这个设置。

三、Field Data Cache

对搜索结果做排序或者聚合操作，需要将倒排索引里的数据进行解析，然后进行一次倒排。在有大量排序、数据聚合的应用场景，可以说field data cache是性能和稳定性的杀手。这个过程非常耗费时间，因此ES 2.0以前的版本主要依赖这个cache缓存已经计算过的数据，提升性能。但是由于heap空间有限，当遇到用户对海量数据做计算的时候，就很容易导致heap吃紧，集群频繁GC，根本无法完成计算过程。ES2.0以后，正式默认启用Doc Values特性(1.x需要手动更改mapping开启)，将field data在indexing time构建在磁盘上，经过一系列优化，可以达到比之前采用field data cache机制更好的性能。因此需要限制对field data cache的使用，最好是完全不用，可以极大释放heap压力。这里需要注意的是，排序、聚合字段必须为not analyzed。设想如果有一个字段是analyzed过的，排序的实际对象其实是词典，在数据量很大情况下这种情况非常致命。

四、Bulk Queue Bulk Queue是做什么用的？当所有的bulk thread都在忙，无法响应新的bulk request的时候，将request在内存里排列起来，然后慢慢清掉。一般来说，Bulk queue不会消耗很多的heap，但是见过一些用户为了提高bulk的速度，客户端设置了很大的并发量，并且将bulk Queue设置到不可思议的大，比如好几千。这在应对短暂的请求爆发的时候有用，但是如果集群本身索引速度一直跟不上，设置的好几千的queue都满了会是什么状况呢？取决于一个bulk的数据量大小，乘上queue的大小，heap很有可能就不够用，内存溢出了。一般来说官方默认的thread pool设置已经能很好的工作了，建议不要随意去“调优”相关的设置，很多时候都是适得其反的效果。

五、Indexing Buffer Indexing Buffer是用来缓存新数据，当其满了或者refresh/flush interval到了，就会以segment file的形式写入到磁盘。这个参数的默认值是10% heap size。根据经验，这个默认值也能够很好的工作，应对很大的索引吞吐量。但有些用户认为这个buffer越大吞吐量越高，因此见过有用户将其设置为40%的。到了极端的情况，写入速度很高的时候，40%都被占用，导致OOM。

六、Cluster State Buffer ES被设计成每个Node都可以响应用户的api请求，因此每个Node的内存里都包含有一份集群状态的拷贝。这个Cluster state包含诸如集群有多少个Node，多少个index，每个index的mapping是什么？有少shard，每个shard的分配情况等等(ES有各类stats api获取这类数据)。在一个规模很大的集群，这个状态信息可能会非常大的，耗用的内存空间就不可忽视了。并且在ES2.0之前的版本，state的更新是由Master Node做完以后全量散播到其他结点的。频繁的状态更新都有可能给heap带来压力。在超大规模集群的情况下，可以考虑分集群并通过tribe node连接做到对用户api的透明，这样可以保证每个集群里的state信息不会膨胀得过大。

七、超大搜索聚合结果集的fetch ES是分布式搜索引擎，搜索和聚合计算除了在各个data node并行计算以外，还需要将结果返回给汇总节点进行汇总和排序后再返回。无论是搜索，还是聚合，如果返回结果的size设置过大，都会给heap造成很大的压力，特别是数据汇聚节点。

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Elasticsearch优化-- ES是如何消费heap内存

Elasticsearch优化-- ES是如何消费heap内存

相关文章

【漏洞复现】CVE-2014-3120 & CVE-2015-1427 Expression Injection

每日学习一个数据结构-FST数据结构与算法

SpringCloud-ElasticSearch介绍

在淘客返利系统中使用Elasticsearch实现搜索引擎优化

Elasticsearch 精粹：一站式学习全方位搜索技术

yum安装elasticsearch6.x

【Elasticsearch6】安装笔记

Springboot2.x整合ElasticSearch7.x实战（二)

Docker启动Elasticsearch时报错

十五、微服务之-内聚

作者介绍

最新文章

【Elasticsearch6】安装笔记

热门文章

【Elasticsearch6】安装笔记

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【Elasticsearch6】安装笔记

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Elasticsearch优化-- ES是如何消费heap内存

Elasticsearch优化-- ES是如何消费heap内存

相关文章

【漏洞复现】CVE-2014-3120 & CVE-2015-1427 Expression Injection

每日学习一个数据结构-FST数据结构与算法

SpringCloud-ElasticSearch介绍

在淘客返利系统中使用Elasticsearch实现搜索引擎优化

Elasticsearch 精粹：一站式学习全方位搜索技术

yum安装elasticsearch6.x

【Elasticsearch6】安装笔记

Springboot2.x整合ElasticSearch7.x实战（二)

Docker启动Elasticsearch时报错

十五、微服务之-内聚

作者介绍

最新文章

【Elasticsearch6】安装笔记

热门文章

【Elasticsearch6】安装笔记

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【Elasticsearch6】安装笔记