告警规则名称 | 告警级别 | 告警条件 | 自动解除条件 | 告警失败条件 | 是否允许手动解除 | 告警邮件发送频率 |
---|---|---|---|---|---|---|
数据目录读写错误 PathIOError | 重要 | 数据目录状态为坏盘 | 数据目录状态为正常 | 数据目录被移除,数据目录从存储池中移除,或数据目录所在服务器被移除 | 是 | 每天一次 |
数据目录所在磁盘写入速度慢 DiskWriteSlow | 警告 | 数据目录所在磁盘写入速度慢 | 数据目录所在盘恢复正常 | 数据目录被移除,数据目录从存储池中移除,或数据目录所在服务器被移除 | 是 | 每天一次 |
许可证即将到期 LicenseWillExpire | 警告 | 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的到期时间<=15天且>0天 | 当前时间(告警模块所在服务器的系统时间)距离告警许可证的到期时间>15天 | 许可证过期,或导入新的许可证(不同id的许可证) | 是 | 每天一次 |
许可证过期 LicenseExpired | 严重 | 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的到期时间<= 0天 | 当前时间(告警模块所在服务器的系统时间)距离告警许可证的到期时间>0天 | 导入新的许可证(不同id的许可证) | 是 | 每天一次 |
许可证维保即将到期 LicenseMaintenanceWillExpire | 警告 | 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的维保到期时间<=15天且>0天 | 当前时间(告警模块所在服务器的系统时间)距离告警许可证的维保到期时间>15天 | 许可证过期,或导入新的许可证(不同id的许可证) | 是 | 每天一次 |
许可证过保 LicenseMaintenanceExpired | 警告 | 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的维保到期时间<= 0天 | 当前时间(告警模块所在服务器的系统时间)距离告警许可证的维保到期时间>0天 | 导入新的许可证 | 是 | 每天一次 |
试用期即将到期 TrialVersionWillExpire | 警告 | 当前未导入生效的许可证,并且当前时间(告警模块所在服务器的系统时间)距离试用期过期时间<=15天且>=0天 | 无解除条件,只能手动解除 | 导入新的许可证 | 是 | 每天一次 |
资源用量接近使用上限 ResourceUsageApproachingLimit | 重要 | 本地卷总容量>=许可证容量的80% | 本地卷总容量<许可证容量的75% | 导入新的许可证 | 是 | 每天一次 |
告警中的告警条数接近上限 AlarmNumberApproachingLimit | 严重 | 告警中的告警条数>=8000 | 告警条数<7500 | 无 | 是 | 每天一次 |
告警邮件发送失败 FailToSendAlarmEmail | 严重 | 告警邮件发送失败 | 告警邮件发送成功 | 邮件配置被删除,或邮件发送设置为disable | 是 | 每天一次 |
配额使用率超阈值 CapacityQuotaUsageExceedsThreshold | 警告 | 存储池中数据目录关联磁盘的Path_Cap_Quota_Rate>=80%, 数据目录层级的数据目录关联磁盘的Path_Cap_Quota_Rate>=80% 说明 数据目录未设置容量配额,则按容量配额=磁盘总容量计算。 | 存储池中数据目录关联磁盘的Path_Cap_Quota_Rate<75%,或数据目录层级的数据目录关联磁盘的Path_Cap_Quota_Rate<75% 说明 数据目录未设置容量配额,则按容量配额=磁盘总容量计算。 |
| 是 | 每天一次 |
配额用尽 CapacityQuotaUsageApproachLimit | 严重 | 基础存储池中数据目录对应磁盘总配额使用率>=95% | 基础存储池中数据目录对应磁盘总配额使用率<90% | 基础存储池名称变更 | 是 | 每天一次 |
配额用尽 CapacityQuotaUsageApproachLimit | 警告 | 非基础存储池中数据目录对应磁盘总配额使用率>=95%,或数据目录对应磁盘配额使用率>=95% | 非基础存储池中数据目录对应磁盘总配额<90%,或数据目录对应磁盘配额使用率<90% |
| 是 | 每天一次 |
磁盘使用率超阈值 DiskUsageExceedsThreshold | 警告 | 存储池中数据目录对应磁盘的Path_Rate>=80%,或数据目录对应磁盘的Path_Rate>=80% | 存储池中数据目录对应磁盘的Path_Rate<75%,或数据目录对应磁盘的Path_Rate<75% |
| 是 | 每天一次 |
可用故障域数量不满足卷写入要求 InsufficientFDForLUNToWrite | 警告 | 卷所在缓存存储池或存储池的可用故障域数量及健康数据目录数量不满足卷的最小副本数要求 | 告警存储池的可用故障域数量及健康数据目录数量满足卷的最小副本数要求 |
| 是 | 每天一次 |
数据目录健康状态变为警告 DiskPathHealthStatusWarning | 警告 | 数据目录健康状态变为警告 | 数据目录健康状态恢复正常 |
| 是 | 每天一次 |
数据目录健康状态变为错误 DiskPathHealthStatusError | 警告 | 数据目录健康状态变为错误 | 数据目录健康状态恢复正常 |
| 是 | 每天一次 |
数据服务健康状态变为警告 DataServiceHealthStatusWarning | 警告 | 数据服务健康状态变为警告 | 数据服务健康状态恢复正常 |
| 是 | 每天一次 |
数据服务健康状态变为错误 DataServiceHealthStatusError | 重要 | 数据服务健康状态变为错误 | 数据服务健康状态恢复正常 |
| 是 | 每天一次 |
协议解析服务异常 ProtocolServiceAbnormal | 重要 | 协议解析服务异常 | 协议解析服务恢复正常 |
| 是 | 每天一次 |
故障域状态变为警告 FaultDomainWarning | 警告 | 故障域状态变为警告 | 故障域状态恢复正常 |
| 是 | 每天一次 |
故障域状态变为错误 FaultDomainError | 重要 | 故障域状态变为Error | 故障域状态变为非Error |
| 是 | 每天一次 |
无法连接到云 CannotConnectToCloud | 严重 | 与云端连接断开超过10分钟 | 卷通过此服务器向云端读取或写入成功一次 |
| 是 | 每天一次 |
云账户异常 CloudAccountAbnormal | 严重 | 云端读取或写入失败:欠费冻结、欠费冻结或违规冻结 | 云端读取或写入成功一次 | 卷被删除、卷禁用或卷删除失败 | 是 | 每天一次 |
卷云端数据冲突 LUNCloudDataConflict | 严重 | 卷对应的云端数据出现比本地更新的版本 | 卷对应的云端数据版本全部比本地旧 | 卷被删除、卷禁用或卷删除失败 | 是 | 每天一次 |
卷云端心跳冲突 LUNCloudHeartbeatConflic | 严重 | 卷的云端出现来自非本集群的心跳 | 卷的云端心跳仅来自本集群 | 卷被删除、卷禁用或卷删除失败 | 是 | 每天一次 |
客户端连接断开 InitiatorConnectionFailed | 警告 | 因为客户端的原因,HBlock无法收到客户端心跳,导致HBlock认为和客户端连接断开,立即告警。但是客户端主动断开连接的情况除外 | 该客户端与Target连接成功。 |
| 是 | 每天一次 |
安装目录剩余空间不足 InsufficientSpaceonInstallationPath | 严重 | 安装目录所在磁盘的文件系统剩余空间<=4GiB | 安装目录所在磁盘的文件系统剩余空间>5GiB | 服务器被移除 | 是 | 每天一次 |
基础服务异常 BaseServiceAbnormal | 严重 | 发生以下任一情况时,分别发出相应告警实例的告警:
| 匹配的告警实例恢复到以下程度:
| 告警机器上的基础服务迁移完成 | 是 | 每天一次 |
基础服务异常 BaseServiceAbnormal | 严重 | 发生以下任一情况时,分别发出相应告警实例的告警:
| 匹配的告警实例恢复到以下程度:
| 告警机器上的基础服务迁移完成 | 是 | 每天一次 |
基础服务数据目录剩余空间不足 InsufficientSpaceonMetaDir | 严重 | 基础服务数据目录所在磁盘的文件系统剩余空间<=4GiB | 基础服务数据目录所在磁盘的文件系统剩余空间>5GiB | 服务开始迁移 | 是 | 每天1次 |