注意事项
- 健康度评分实行多维度评分制,每个评分维度采用百分制,存在告警直接扣分,得分不低于0分。
- 实例健康度评分取五个维度评分中的最低分。
- 阈值类告警扣分项需满足条件持续60秒进行触发,事件类告警扣分项需满足条件持续90秒进行触发。
评分规则表
天翼云RDS MySQL:
扣分项 含义 扣分子项 条件 所扣分数 评分维度 服务状态异常 mysqld服务心跳检测不通过。 严重 serviceDown=1 50
数据库可用性 主从GTID不一致 当前主从GTID不一致。 警告 GTID=0 5 数据库可用性 主从复制延迟 主从复制发生长时间延迟。 警告 30 min>=replDelayTime>10 min 10 数据可靠性
严重 replDelayTime>30 min 15 复制IO线程中断 主从中断,复制 IO 线程中断。 严重
slave_IO_Running=NO 10
数据可靠性 复制SQL线程中断 主从中断,复制 SQL 线程中断。
严重 slave_SQL_Running=NO 10 数据可靠性 备份失败 当前实例备份失败。 严重 BACK_UP=0 10 数据可靠性 备份超时 备份超时,耗时3小时以上 严重 BACK_UP=0 10 数据可靠性 CPU使用率 当前CPU使用率,多核CPU换算成单核计算。
警告 80%>=cpuUsage>70%
5 数据库性能
严重 cpuUsage>80%
10 内存使用率 当前内存使用率。 警告 90%>=memUsage>80%
5 数据库性能
严重 memUsage>90%
10 连接使用率 当前连接使用数 / 最大允许连接数 * 100%。 警告 80%>=connectionRate>70% 5 数据库性能
严重 connectionRate>80% 10 IO使用率 当前IO值 / 最大允许IO值 * 100%。
警告 90%>=ioUsage>70%
5 数据库性能
严重 ioUsage>90%
10 活动线程数
当前活跃会话数。
警告 min(4*cpuCores+8,96)>=threadRunning>min(2*cpuCores+8,64) 10
数据库性能
严重 maxConnections>threadRunning>min(4*cpuCores+8,96)
50 慢SQL 当前慢SQL总数相较前一采集时间点慢SQL总数的增量。
提示 10>=slowSqlCount>0 5 数据库性能
警告 50>=slowSqlCount>10
20 严重 slowSqlCount>50
50 行锁等待
当前发生行锁等待。
严重
rowLockWait>0 5 数据库性能 元数据锁 近一分钟存在waiting_for_table_metadata_lock 严重 waiting_for_table_metadata_lock>0 10 数据库性能 磁盘使用率 当前磁盘空间实际使用率。 警告 90%>=usedSpaceUtil>80% 10 数据库可维护性 严重 usedSpaceUtil>90% 50