功能入口
- 选择目标资源池,并登录APM组件控制台。
- 在左侧导航栏中选择「应用监控」-「应用列表」。
- 在应用列表中选择您想查看的应用,点击「应用名称」打开新的应用详情链接。
- 在左侧导航栏中选择「应用详情」,您可以在应用详情页面切换至「消息监控」页签,在左侧关键指标中选择不同的应用实例,可查看该应用实例相应的概览信息。
功能说明
KafkaProducer
总发送次数&总发送字节数
显示总发送次数和总发送字节数的趋势图。
- 总发送次数:这是指生产者在其生命周期内成功发送到Kafka broker的消息数量。这个数字可以帮助我们了解生产者在实际运行中的消息处理能力和稳定性。例如,如果一个生产者在一段时间内发送了10000条消息,那么它的总发送次数就是10000。
- 总发送字节数:这是指生产者在其生命周期内发送到Kafka broker的所有消息的总字节数。这个数字反映了生产者传输的数据量,是评估生产者负载和资源消耗的一个重要指标。例如,如果生产者发送了10000条消息,每条消息大小为1KB,则总发送字节数为10000 * 1024 = 10,485,760字节。
这两个指标通常用于监控和优化Kafka生产者的性能,确保其能够高效、稳定地处理消息。通过这些数据,可以发现生产者是否存在瓶颈或问题,并进行相应的调整和优化。
通过消息队列发送消息
显示topic列表,表头如下。
- Topic:是指消息发送到消息队列中的特定主题(topic)。主题是消息队列中的逻辑分类,用于将相关的消息归类和分组。每个topic可以包含多条消息,每条消息都有一个特定的主题标签。
- 调用次数:表示当前这个Topic在一段时间内,通过消息队列发送消息的总调用次数。每次发送消息都会被计算为一次调用。
- 平均响应时间(ms):是指在发送消息的过程中,从发送请求到接收到响应的平均时间。它表示了发送消息的速度和效率。
- 错误数:表示在发送消息的过程中发生的错误次数。这些错误可能包括发送消息失败、网络连接问题或其他异常情况。
- 最慢调用(ms):是指在一段时间内,发送消息过程中最耗时的一次调用的时间。它反映了发送消息中的性能瓶颈或延迟情况。
- 操作:点击详情,出现弹层显示调用次数、平均响应时间(ms)、错误数在筛选时间段内的趋势图。
这些指标可以帮助您监控和分析通过消息队列发送消息的性能和健康状况。通过追踪调用次数、平均响应时间、错误数和最慢调用时间,您可以了解消息发送的频率、效率、稳定性和延迟情况,从而进行性能优化、故障排除和容量规划等方面的工作。
topic监控
显示实例纬度监控列表,表头如下。
- Topic:这是一个特定的命名空间,用于组织、过滤和路由消息。在Kafka中,每个Topic代表了一个主题,可以被不同的生产者和消费者使用来发送和接收消息。
- ID:每个Topic都有一个唯一的ID,这个ID用于标识该Topic。在监控系统中,通常会通过这个ID来追踪和管理Topic的相关数据。
- 总发送次数:这是指在监控周期内,所有生产者向该Topic发送消息的总次数。这是一个衡量消息吞吐量的重要指标,可以反映出Topic的活跃度和负载情况。
- 总发送字节数:这是指在监控周期内,所有生产者向该Topic发送的数据总量(以字节为单位)。这个指标可以帮助我们了解Topic的数据传输量,是评估网络带宽需求的一个重要参数。
- 每秒发送数:这是指在一秒钟内,成功发送到该Topic的消息数量。这个指标可以用来衡量Topic的实时吞吐量,是评估系统性能的一个重要指标。
- 每秒发送字节数:这是指在一秒钟内,所有生产者向该Topic发送的数据量(以字节为单位)。这个指标可以用来衡量Topic的实时数据传输速率,对于优化网络性能和资源分配非常有帮助。
- 每秒错误数:这是指在一秒钟内,由于各种原因导致的消息发送失败的次数。这个指标可以帮助我们了解消息传输过程中的问题,比如网络问题或消息格式错误等。
- 每秒重试数:这是指在一秒钟内,因发送失败而被重试的消息数量。这个指标可以帮助我们了解消息重试机制的效果,以及是否需要调整重试策略以提高系统的稳定性和可靠性。
- 操作:点击调用链查询切换至调用链查询tab,并带入相关查询条件,展示当前topic的调用链信息。
通过这些监控指标,我们可以全面了解Topic的性能和状态,从而进行相应的优化和调整,以确保系统的高效运行。
KafkaConsumer
总消费次数&总消费字节数
显示总消费次数和总消费字节数的趋势图。
- 总消费次数:这个指标表示消费者从Kafka中成功读取并处理的消息数量。它是一个计数器,用于跟踪消费者在其生命周期内接收到的消息总数。这对于监控消费者的工作负载和性能非常有用,可以帮助开发者了解消费者是否有效地从生产者那里获取了数据。
- 总消费字节数:这个指标表示消费者从Kafka中成功读取的数据总量,以字节为单位。它考虑了每条消息的大小,并累加起来给出一个总和。这对于评估网络带宽使用情况、存储需求以及数据传输效率等方面非常重要。例如,如果一个主题有20个分区和5个消费者,每个消费者需要至少4MB的可用内存来接收记录。因此,通过监控总消费字节数,可以更好地理解数据流的规模和处理速度。
这两个指标共同提供了对Kafka消费者行为的全面视图,使得开发者能够优化系统性能,确保数据处理的高效性和稳定性。
通过消息队列接收消息
显示topic列表,表头如下。
- topic:是指消息队列中接收到的特定主题(topic)的消息。主题用于将相关的消息进行归类和分组。
- 调用次数:是指在一段时间内,通过消息队列接收消息的总调用次数。每次调用消息队列的接收操作(例如KafkaConsumer的poll()方法)并成功获取一条消息都会被计算为一次调用。
- 平均响应时间(ms):是指从发起接收请求到接收到消息的平均时间。它表示了接收消息的速度和效率。
- 错误数:表示在接收消息的过程中发生的错误次数。这些错误可能包括接收消息失败、网络连接问题或其他异常情况。
- 最慢调用(ms):是指在一段时间内,接收消息过程中最耗时的一次调用的时间。它反映了接收消息中的性能瓶颈或延迟情况。
- 操作:点击详情,出现弹层显示调用次数、平均响应时间(ms)、错误数在筛选时间段内的趋势图。
这些指标共同构成了对消息队列系统性能和可靠性的全面评估,有助于管理员和开发者优化系统配置,提高系统的稳定性和效率。
topic监控
显示实例纬度监控列表,表头如下。
- Topic:这是消息队列中的一个概念,通常用于分类和组织消息。每个Topic可以包含多个Partition,每个Partition可以被不同的Consumer Group消费。
- ID:这是Topic的一个唯一标识符,用于在系统中唯一标识该Topic。
- 总消费次数:这是指在监控周期内,所有从该Topic消费消息的总次数。
- 总消费字节数:这是指在监控周期内,所有从该Topic中消费的数据总量(以字节为单位)。
- 每秒消费数:这是指在一秒内从特定Topic中消费的平均消息数量。这是一个衡量系统吞吐量的重要指标,可以帮助我们了解系统处理消息的能力。
- 每秒消费字节数:这是指在一秒内从特定Topic中消费的平均字节数。这是一个衡量系统吞吐量的重要指标,可以帮助我们了解系统处理数据的能力。
- 请求获取平均字节:这是指在一次请求中从特定Topic中获取的平均字节数。这可以帮助我们了解单次请求的大小,从而评估系统的负载情况。
- 请求获取最大字节:这是指在一次请求中从特定Topic中获取的最大字节数。这可以帮助我们了解系统可能面临的峰值负载情况。
- 单次请求平均消息数:这是指在一次请求中从特定Topic中获取的平均消息数量。这可以帮助我们了解系统在处理消息时的效率。
- 操作:点击调用链查询切换至调用链查询tab,并带入相关查询条件,展示当前topic的调用链信息。
通过监控这些指标,我们可以及时发现系统中的问题,如消息堆积、延迟等,并进行相应的优化和调整,以确保系统的高性能和稳定性。
RabbitMQProducer
和KafkaProducer类似,RabbitMQProducer主要负责发送消息到RabbitMQ,监控在这一过程中的各项指标,包括:
- 总发送次数趋势图、总发送字节数趋势图。
- 不同exchange的调用次数、平均响应时间、错误数、最慢调用信息和总发送字节数。
这些指标可以帮助识别生产者在消息发送过程中可能遇到的问题,如网络延迟、服务器负载过高或配置错误等。
RabbitMQConsumer
和KafkaConsumer类似,RabbitMQConsumer主要负责处理接收到的消息,监控在这一过程中的各项指标,包括:
- 总消费次数趋势图、总消费字节数趋势图。
- 不同consumerTag/consumerClass的调用次数、平均响应时间、错误数、最慢调用信息和总消费字节数。
这些指标有助于了解消费者的健康状况,例如是否存在未确认的消息积压,消费者是否能够及时处理消息,以及队列是否因为消费者处理不及时而积压。
统一交互操作说明:
- 将光标移到统计图上,可以查看光标所至时间点的数据详情。
- 单击图标,可以将当前图表放大显示。