操作场景
FusionInsight Manager支持配置监控指标阈值用于关注各指标的健康情况,如果出现异常的数据并满足预设条件后,系统将会触发一条告警信息,并在告警页面中出现此告警信息。
操作步骤
- 登录FusionInsight Manager。
- 选择“运维 > 告警 > 阈值设置”。
- 在监控分类中选择集群内指定主机或服务的监控指标。
详见下图:配置指标阈值
例如“主机内存使用率”,界面显示此阈值的信息:
- 发送告警开关指示为表示将触发告警。
- “告警ID”和“告警名称”包含阈值将触发的告警信息。
- Manager会检查监控指标数值是否满足阈值条件,若连续检查且不满足的次数等于“平滑次数”设置的值则发送告警,支持自定义。
- “检查周期(秒)”表示Manager检查监控指标的时间间隔。
- 规则列表中的条目为触发告警的规则。
- 单击“添加规则”,可以新增指标的监控行为。
监控指标规则参数
参数名 参数解释 参数值 规则名称 规则名称
CPU_MAX(举例)
告警级别
告警级别
l 紧急
l 重要
l 次要
l 提示
l 紧急
l 重要
l 次要
l 提示
阈值类型
选择某指标的最大值或最小值,类型为“最大值”表示指标的实际值大于设置的阈值时系统将产生告警,类型为“最小值”表示指标的实际值小于设置的阈值时系统将产生告警。
l 最大值
l 最小值
日期
设置规则生效的日期,即哪一天运行规则。
l 每天
l 每周
l 其他
添加日期
仅在“日期”模式为“其他”时可见,设置规则运行的自定义日期,支持多选。
09-30
阈值设置
设置规则运行的具体时间范围。
起止时间:00:00-8:30
设置规则监控指标的阈值
阈值:10
说明支持单击或设置多个阈值时间条件。
支持单击或设置多个阈值时间条件。
- 单击“确定”保存规则。
- 在新添加规则所在的行,单击“操作”中的“应用”,此时规则的“生效状态”变成“生效”。
当前已创建的规则单击“取消应用”后,才能应用新规则。
监控指标参考
FusionInsight Manager转告警监控指标可分为节点信息指标与集群服务指标。下表表示节点中可配置阈值的指标。
节点信息监控指标转告警列表
监控指标组名称 监控指标名称 指标含义 默认阈值 CPU 主机CPU使用率
描述周期内当前集群的运算和控制能力,可通过观察该统计值,了解集群整体资源的使用情况。
90.0%
磁盘
磁盘使用率
描述主机磁盘的使用率。
90.0%
磁盘inode使用率
统计采集周期内磁盘inode使用率。
80.0%
内存
主机内存使用率
统计当前时间点的内存平均使用率。
90.0%
主机状态
主机文件句柄使用率
统计采集周期内该主机的文件句柄使用率。
80.0%
主机PID使用率
主机PID使用率。
90%
网络状态
TCP临时端口使用率
统计采集周期内该主机的TCP临时端口使用率。
80.0%
网络读信息
读包错误率
统计采集周期内该主机上该网口的读包错误率。
0.5%
读包丢包率
统计采集周期内该主机上该网口的读包丢包率。
0.5%
读吞吐率
统计周期内网口的平均读吞吐率(MAC层)。
80%
网络写信息
写包错误率
统计采集周期内该主机上该网口的写包错误率。
0.5%
写包丢包率
统计采集周期内该主机上该网口的写包丢包率。
0.5%
写吞吐率
统计周期内网口的平均写吞吐率(MAC层)。
80%
进程
D状态进程总数
统计周期内主机上D状态进程数量。
0
omm进程使用率
统计周期内omm进程使用率。
90