./stor alarm ls [ -S { Resolved | Expired } [ --alarm-severity ALARM_SEVERITY ] [ --num NUMBER ]
此命令用来查看已解除或者已失效的告警。
./stor alarm ls [ -S Unresolved ] [ --alarm-severity ALARM_SEVERITY ] [ --mute-status MUTE_STATUS ] [ --num NUMBER ]
此命令用来查看告警中的告警。
./stor alarm ls [ { -n | --alarm } ALARM_ID ]
此命令用来查看告警状态为告警中的单条告警。
说明告警数据以服务器系统时间为准进行记录。时间被调整,或集群中服务器时间不统一,都可能导致告警数据不准确。但用户的业务数据不会受到影响。
注意告警状态为告警中的数据存储上限为10000条,达到上限后,新的告警无法触发。届时请尽快解决相关故障,或者尝试手动解除告警。
参数
参数 描述 -S Resolved 查看告警状态为已解除的告警。 -S Expired 查看告警状态为已失效的告警。 -S Unresolved 查看告警状态为告警中的告警。
如果未指定告警状态,默认查看告警状态为告警中的告警。
--alarm-severity ALARM_SEVERITY 告警级别:
Warning:警告。
Major:重要。
Critical:严重。
默认查看所有级别的告警。
--num NUMBER 指定查询的告警数量。取值为[2, 1000]。
如果不指定查询告警数量,则最多列出10000条告警记录。
--mute-status MUTE_STATUS 告警的静默状态:
Normal:正常
Muted:已静默
默认值为Normal。
-n ALARM_ID 或 --alarm ALARM_ID 告警ID。
示例
查询已解除的告警。
[root@hblockserver CTYUN_HBlock_Plus_3.7.0_x64]# ./stor alarm ls -S Resolved
+----------+-------------------------+------------------------------------+----------+---------------------+-------------+---------------------+---------------+-----------+--------------+
| Alarm ID | Instance ID | Alarm Rule | Severity | Alarm Time | Alarm Value | Resolve Time | Resolve Value | Duration | Resolve Type |
+----------+-------------------------+------------------------------------+----------+---------------------+-------------+---------------------+---------------+-----------+--------------+
| 4jlSnwld | hblock_3:/mnt/stor | CapacityQuotaUsageExceedsThreshold | Warning | 2024-01-08 11:21:11 | 93.69% | 2024-01-08 11:31:14 | 5.06% | 10m 3s | Auto |
| 4jlSnJ9h | hblock_3 | CapacityQuotaUsageExceedsThreshold | Warning | 2024-01-08 11:21:11 | 93.69% | 2024-01-08 11:31:14 | 5.06% | 10m 3s | Auto |
| 4jlSmXuZ | hblock_3:/mnt/stor | FaultDomainWarning | Warning | 2024-01-08 11:21:10 | - | 2024-01-08 11:31:14 | - | 10m 3s | Auto |
| 4jlSmPPo | hblock_3:/mnt/stor | DataServiceHealthStatusWarning | Warning | 2024-01-08 11:21:10 | - | 2024-01-08 11:31:13 | - | 10m 2s | Auto |
| 4ilZH7wX | hblock_1 | ProtocolServiceAbnormal | Major | 2024-01-05 17:16:37 | - | 2024-01-08 09:20:46 | - | 2d 16h 4m | Auto |
| 4hDwJnaH | hblock_3 | ProtocolServiceAbnormal | Major | 2024-01-03 17:47:45 | - | 2024-01-03 17:53:47 | - | 6m 1s | Auto |
| 4hD1BMWS | hblock_4 | ProtocolServiceAbnormal | Major | 2024-01-03 17:15:35 | - | 2024-01-03 17:53:46 | - | 38m 11s | Auto |
| 4hD2AgSt | hblock_1:/mnt/stor | FaultDomainError | Major | 2024-01-03 17:16:36 | - | 2024-01-03 17:17:37 | - | 1m 1s | Auto |
| 4hD2zESY | hblock_1:/mnt/stor | DataServiceHealthStatusError | Major | 2024-01-03 17:16:35 | - | 2024-01-03 17:17:36 | - | 1m 1s | Auto |
| 4hCtBCK5 | hblock_4:/mnt/storage01 | DataServiceHealthStatusError | Major | 2024-01-03 16:40:27 | - | 2024-01-03 16:41:27 | - | 1m 0s | Auto |
+----------+-------------------------+------------------------------------+----------+---------------------+-------------+---------------------+---------------+-----------+--------------+
查询告警中的告警。
[root@hblockserver CTYUN_HBlock_Plus_3.7.0_x64]# ./stor alarm ls
+----------+-------------+-------------------------+----------+---------------------+-------------+---------------+----------+-------------+
| Alarm ID | Instance ID | Alarm Rule | Severity | Alarm Time | Alarm Value | Current Value | Duration | Mute Status |
+----------+-------------+-------------------------+----------+---------------------+-------------+---------------+----------+-------------+
| 4jlhtUel | hblock_4 | ProtocolServiceAbnormal | Major | 2024-01-08 10:43:03 | - | - | 20s | Normal |
+----------+-------------+-------------------------+----------+---------------------+-------------+---------------+----------+-------------+
查询告警级别为Warning的告警。
[root@hblockserver CTYUN_HBlock_Plus_3.7.0_x64]# ./stor alarm ls -S Unresolved --alarm-severity Warning
+----------+--------------------------------------+-------------------+----------+---------------------+-------------+---------------+-------------+-------------+
| Alarm ID | Instance ID | Alarm Rule | Severity | Alarm Time | Alarm Value | Current Value | Duration | Mute Status |
+----------+--------------------------------------+-------------------+----------+---------------------+-------------+---------------+-------------+-------------+
| 1kyvM3zJ | ehc2b6a9-f3fb-4098-a6b3-3652a5d76269 | LicenseWillExpire | Warning | 2022-08-16 17:26:02 | - | - | 16h 26m 41s | Normal |
+----------+--------------------------------------+-------------------+----------+---------------------+-------------+---------------+-------------+-------------+
查询告警ID为4jlhtUel的告警。
[root@hblockserver CTYUN_HBlock_Plus_3.7.0_x64]# ./stor alarm ls -n 4jlhtUel
Alarm Id: 4jlhtUel
Instance Id: hblock_4
Instance Snapshot: hblock_4,ecs-9689-0915141,192.168.0.202
Severity: Major
Alarm Rule: ProtocolServiceAbnormal
Alarm Time: 2024-01-08 10:43:03
Alarm Value: -
Current Value: -
Duration: 2m 0s
Alarm Status: Unresolved
Mute Status: Normal
Mute Operations: -
告警信息描述 项目 描述 Alarm ID 告警ID。 Instance ID 告警实例ID。 Alarm Rule 告警规则。告警规则具体描述详见告警列表。 Severity 告警级别:
Warning:警告。
Major:重要。
Critical:严重。
Alarm Time 告警发生时间。 Alarm Value 告警时数值。仅有数值型指标对应的告警会有数值显示,以下告警规则会涉及数值型指标:
AlarmNumberApproachingLimit:告警中的告警条数接近上限,显示告警中的告警总条数/告警中条数上限,百分数,单位是%。计算公式:(告警中的告警总条数/告警中条数上限)*100%。
ResourceUsageApproachingLimit:资源用量接近使用上限,显示许可证已用容量使用率,百分数,单位是%。计算公式:(本地卷总容量/许可证允许的容量)*100%。
CapacityQuotaUsageExceedsThreshold:配额使用率超阈值,显示存储池或数据目录关联磁盘的配额使用率(Path_Cap_Quota_Rate),百分数,单位是%。
CapacityQuotaUsageApproachLimit:配额用尽,显示存储池或数据目录关联磁盘的配额使用率(Path_Cap_Quota_Rate),百分数,单位是%。
DiskUsageExceedsThreshold:磁盘使用率超阈值,显示存储池或数据目录关联磁盘的使用率(Path_Rate),百分数,单位是%。
InsufficientSpaceonInstallationPath:安装目录剩余空间不足,显示目录所在磁盘的文件系统剩余空间,单位是GiB。
Current Value 当前数值。仅有数值型指标对应的告警会有数值显示,以下告警规则会涉及数值型指标:
AlarmNumberApproachingLimit:告警中的告警条数接近上限,显示显示告警中的告警总条数/告警中条数上限,百分数,单位是%。计算公式:(告警中的告警总条数/告警中条数上限)*100%。
ResourceUsageApproachingLimit:资源用量接近使用上限,显示许可证已用容量使用率,百分数,单位是%。计算公式:(本地卷总容量/许可证允许的容量)*100%。
CapacityQuotaUsageExceedsThreshold:配额使用率超阈值,显示存储池或数据目录关联磁盘的配额使用率(Path_Cap_Quota_Rate),百分数,单位是%。
CapacityQuotaUsageApproachLimit:配额用尽,显示存储池或数据目录关联磁盘的配额使用率(Path_Cap_Quota_Rate),百分数,单位是%。
DiskUsageExceedsThreshold:磁盘使用率超阈值,显示存储池或数据目录关联磁盘的使用率(Path_Rate),百分数,单位是%。
InsufficientSpaceonInstallationPath:安装目录剩余空间不足,显示目录所在磁盘的文件系统剩余空间,单位是GiB。
Duration 告警持续时长。 Mute Status 静默状态:
Muted:静默。
Normal:正常。
Resolve Time 告警解除时间。 Resolve Value 告警解除值。 Resolve Type 告警解除方式:
Auto:自动解除。
Manual:手动解除。
Instance Snapshot 告警实例快照,即告警发生时告警实例的详细信息。 Alarm Status 告警状态:
Resolved:已解除。
Expired:已失效。
Unresolved:告警中。
Mute Operations 静默操作记录,包括:
operTime:操作时间。
operType:静默操作类型:
Mute:静默。
AutoUnmute:自动解除静默。
ManualUnmute:手动解除静默。
reason:静默/解除静默的原因。
dueTime:静默截止时间。