分布式缓存Redis管理控制台支持监控告警功能,同时支持对事件告警或阈值告警进行配置。
操作步骤
- 登录 Redis管理控制台。
- 在管理控制台右上角选择实例所在的区域。
- 在实例列表页,单击目标实例名称进入实例详情管理。
- 点击【告警管理】,进入告警配置管理页面。
- 设置通知组,先"新建联系人组",再新建联系人”,填写告警通知联系方式。
- 点击"创建通知策略",设置通知信息模板。
- 创建告警规则。
- 查看已设置的告警规则,在该页面可新增、删除告警规则。
告警指标以及告警策略配置建议
指标名称 | 取值范围 | 说明 | 告警阈值设置建议 | 告警处理建议 |
---|---|---|---|---|
redis客户端连接数过高告警 | 0-10000 | 该指标用于统计redis的已连接的客户端数。 | 建议告警阈值:8000。 | 应避免连接数超过最大上限,可以根据您的实际业务情况调整。 |
redis缓存命中率低 | 0-100% | 该指标用于统计Redis的缓存命中率,其命中率算法为:keyspace_hits/(keyspace_hits+keyspace_misses)单位:%。 | 建议告警阈值:80%。 | 建议:较低的缓存命中率可能表示缓存数据不够完整或缓存策略不够有效,导致大量请求无法从Redis缓存中获取数据,增加了对后端资源的访问负载。建议合理设置缓存过期时间、使用合适的缓存淘汰策略、对热点数据进行预热等方式提高缓存命中率。 |
redis等待阻塞命令的客户端数告警 | 0-10000 | 该指标用于被阻塞操作挂起的客户端的数量。阻塞操作如BLPOP,BRPOP,BRPOPLPUSH。 | 根据业具体业务制定,建议阈值:50。 | 处理:检查是否存在慢请求;建议:优化调整Redis的配置参数,例如最大连接数、最大客户端等,确保其数值适当。 |
redis内存使用率告警 | 0-100% | 该指标用于统计redis实例当前节点的内存使用情况。 | 建议告警阈值:70%。 | 处理:检查是否可以清理不必要的redis内存数,降低内存使用率。建议:如果无法清理现有的缓存数据,建议进行扩容。 |
redis cpu使用率告警 | 0-100% | 该指标用于统计redis实例当前节点的cpu使用情况。 | 建议告警阈值:70%。 | 处理:检查当前业务是否存在查询大key、热key的请求等建议:如果存在大key、热key,请参考常见问题中的为了减少大Key和热Key过大,有什么使用建议? |
access客户端连接数告警 | 0-10000 | 该指标用于统计代理节点的已连接的客户端数。 | 告警阈值:8000。 | 主处理:检查业务请求量是否为正常业务,如果业务请求正常可以持续观察一段时间;建议:应避免连接数超过最大上限,可以根据您的实际业务情况调整。检查业务是否当前连接数量是否正常。 |
access qps过高告警 | 0-100000 | 该指标用于统计代理节点的qps。 | 告警阈值:10000。 | 处理:检查业务请求是否为正常业务,如果业务请求正常可以持续观察一段时间。 |