Kafka Partition分发策略-天翼云

Kafka Partition分发策略

2023-05-30 08:06:30 阅读次数：379

今天突然想起一个问题，当producer往kafka写数据的时候，如果不指定Patition，也没有指定Key的话，那么它是怎么做的负载均衡？

通过查看kafka源码，发现Kafka Java客户端有默认的partition分配机制。

实现如下：

 /**
     * Compute the partition for the given record.
     *
     * @param topic The topic name
     * @param key The key to partition on (or null if no key)
     * @param keyBytes serialized key to partition on (or null if no key)
     * @param value The value to partition on or null
     * @param valueBytes serialized value to partition on or null
     * @param cluster The current cluster metadata
     */
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        if (keyBytes == null) {
            int nextValue = nextValue(topic);
            List<PartitionInfo> availablePartitions = cluster.availablePartitionsForTopic(topic);
            if (availablePartitions.size() > 0) {
                int part = Utils.toPositive(nextValue) % availablePartitions.size();
                return availablePartitions.get(part).partition();
            } else {
                // no partitions are available, give a non-available partition
                return Utils.toPositive(nextValue) % numPartitions;
            }
        } else {
            // hash the keyBytes to choose a partition
            return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions;
        }
    }

    private int nextValue(String topic) {
        AtomicInteger counter = topicCounterMap.get(topic);
        if (null == counter) {
            counter = new AtomicInteger(ThreadLocalRandom.current().nextInt());
            AtomicInteger currentCounter = topicCounterMap.putIfAbsent(topic, counter);
            if (currentCounter != null) {
                counter = currentCounter;
            }
        }
        return counter.getAndIncrement();
    }

从源码可以看出，首先获取topic的所有Patition，如果客户端不指定Patition，也没有指定Key的话，使用自增长的数字取余数的方式实现指定的Partition。这样Kafka将平均的向Partition中生产数据。

如果想要控制发送的partition，则有两种方式，一种是指定partition，另一种就是根据Key自己写算法。继承Partitioner接口，实现其partition方法。并且配置启动参数

props.put("partitioner.class","TestPartitioner")

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Kafka Partition分发策略

Kafka Partition分发策略

相关文章

kafka自定义partition分发策略实例(含生java生产者实例代码和消费者实例代码)

【快速搭建】kafka基础（2）：kafka quickstart

Podman安装部署kafka和管理界面（快速跑起来）

【队列】Kafka和Rabbitmq的最大区别

kafka集群重启方法

kafka ksql && docker 安装试用

Logstash input插件

K8s部署zk集群和kafka集群

Druid 使用 Kafka 数据加载教程——下载和启动 Kafka

Kafka安装记录

作者介绍

最新文章

【快速搭建】kafka基础（2）：kafka quickstart

kafka集群重启方法

kafka ksql && docker 安装试用

Logstash input插件

发送kafka消息的shell脚本

flink获取kafka的key value timestamp header

热门文章

Kafka-Kraft 模式（不依赖Zookeeper）

flink获取kafka的key value timestamp header

Kafka快速入门（安装集群）

Docker Kafka Linux安装教程

kafka zookeeper docker容器互联

Kafka

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

flink获取kafka的key value timestamp header

Logstash input插件

发送kafka消息的shell脚本

Kafka-Kraft 模式（不依赖Zookeeper）

Kafka

kafka ksql && docker 安装试用