Kafka性能调优-天翼云

Kafka性能调优

2023-05-30 07:50:54 阅读次数：381

Kafka的配置详尽、复杂，想要进行全面的性能调优需要掌握大量信息，这里只记录一下我在日常工作使用中走过的坑和经验来对kafka集群进行优化常用的几点。

1.JVM的优化

java相关系统自然离不开JVM的优化。首先想到的肯定是Heap Size的调整。

vim bin/kafka-server-start.sh     
调整KAFKA_HEAP_OPTS="-Xmx12G -Xms12G”的值

推荐配置：一般HEAP SIZE的大小不超过主机内存的50%。

2.网络和ios操作线程配置优化：

# broker处理消息的最大线程数
num.network.threads=17
# broker处理磁盘IO的线程数
num.io.threads=32

推荐配置：

num.network.threads主要处理网络io，读写缓冲区数据，基本没有io等待，配置线程数量为cpu核数加1。

num.io.threads主要进行磁盘io操作，高峰期可能有些io等待，因此配置需要大些。配置线程数量为cpu核数2倍，最大不超过3倍。

3.socket server可接受数据大小(防止OOM异常)：

socket.request.max.bytes=2147483600

推荐配置：

根据自己业务数据包的大小适当调大。这里取值是int类型的，而受限于java int类型的取值范围又不能太大：java int的取值范围为（-2147483648~ 2147483647），占用4个字节（-2的31次方到2的31次方-1，不能超出，超出之后报错：org.apache.kafka.common.config.ConfigException: Invalid value 8589934592 for configuration socket.request.max.bytes: Not a number of type INT。

4.log数据文件刷盘策略

# 每当producer写入10000条消息时，刷数据到磁盘
log.flush.interval.messages=20000
# 每间隔1秒钟时间，刷数据到磁盘
log.flush.interval.ms=2000

推荐配置：

为了大幅度提高producer写入吞吐量，需要定期批量写文件。一般无需改动，如果topic的数据量较小可以考虑减少log.flush.interval.ms和log.flush.interval.messages来强制刷写数据，减少可能由于缓存数据未写盘带来的不一致。推荐配置分别message 20000，间隔2s。

5.日志保留策略配置

# 日志保留时长
log.retention.hours=72
# 段文件配置
log.segment.bytes=1073741824

推荐配置：

日志建议保留三天，也可以更短；段文件配置1GB，有利于快速回收磁盘空间，重启kafka加载也会加快（kafka启动时是单线程扫描目录(log.dir)下所有数据文件）。如果文件过小，则文件数量比较多。

6.replica复制配置

num.replica.fetchers=3
replica.fetch.min.bytes=1
replica.fetch.max.bytes=5242880

推荐配置：

每个follow从leader拉取消息进行同步数据，follow同步性能由这几个参数决定，分别为:拉取线程数(num.replica.fetchers):fetcher配置多可以提高follower的I/O并发度，单位时间内leader持有更多请求，相应负载会增大，需要根据机器硬件资源做权衡，建议适当调大；最小字节数(replica.fetch.min.bytes):一般无需更改，默认值即可；最大字节数(replica.fetch.max.bytes)：默认为1MB，这个值太小，推荐5M，根据业务情况调整，最大等待时间(replica.fetch.wait.max.ms):follow拉取频率，频率过高，leader会积压大量无效请求情况，无法进行数据同步，导致cpu飙升。配置时谨慎使用，建议默认值，无需配置。

7.分区数量配置

num.partitions=6

推荐配置：

默认partition数量1，如果topic在创建时没有指定partition数量，默认使用此值。Partition的数量选取也会直接影响到Kafka集群的吞吐性能，配置过小会影响消费性能，建议改为6。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Kafka性能调优

Kafka性能调优

相关文章

使用ZipEntry解压zip文件报错: java.lang.IllegalArgumentException: MALFORMED

kafka自定义partition分发策略实例(含生java生产者实例代码和消费者实例代码)

java9系列第二篇-资源自动关闭的语法增强

Java实战之管家婆记账系统（15）——按备注条件查询界面及功能实现

Java实战之亲戚关系计算器（swing版）（3）——界面设计

java使用poi实现excel保护工作表实例代码（支持.xls和.xlsx）

总结java中文件拷贝剪切的5种方式-JAVA IO基础总结第五篇

javascript 西瓜一期 05-08 计算机的基本组成

javascript 西瓜一期 15 数据的存储单位

S2-007 远程代码执行漏洞检测与利用

作者介绍

最新文章

Flask ORM 学习笔记Part05：marshmallow的使用（中）

TCP头部信息有哪些？

线性表之数组

机器学习和深度学习的区别

带你解析JS深/浅拷贝

知识图谱的演化：从语义网络到智能决策的关键

热门文章

5、使用PyTorch 实现线性回归

Lc70_爬楼梯

一次k8s 数据卷异常问题的解决

Dataloader有哪些使用方法

Vue:自定义v-model数据双向绑定

2022-04-01 访问k8s内的etcd的数据

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【RDMA】深入浅出全面解析RDMA -- 研读

Vue学习笔记：插槽Slot

【机器学习】简单易懂的聚类算法K-Means

Redis 为何使用近似 LRU 算法淘汰数据，而不是真实 LRU？

【JAVA】-- Swing常用组件(JFrame、JDialog、JButton、JCheckBox、JComboBox、JLabel、JRadioButton、JTextField等)

Hibernate之刷新点与同步点