告警解释
每天零点系统检查熵值,每次检查都连续检查五次,首先检查是否启用并正确配置了rng-tools工具或者haveged工具,如果没有配置,则继续检查当前熵值,如果五次均小于100,则上报故障告警。
当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数或者没有配置但是五次检查中,至少有一次熵值大于等于100,则告警恢复。
告警属性
告警ID | 告警级别 | 是否自动清除 |
---|---|---|
12040 | 重要 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
来源 | 产生告警的集群或系统名称。 |
服务名 | 产生告警的服务名称。 |
角色名 | 产生告警的角色名称。 |
主机名 | 产生告警的主机名。 |
对系统的影响
影响系统正常运行。
可能原因
haveged服务或者rngd服务异常。
处理步骤
检查并手动配置系统熵值
1.在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。
2.查看该“定位信息”中对应的“主机名”字段值,获取该告警产生的主机名。
3.以root用户登录告警所在节点。
4.执行 /bin/rpm -qa | grep -w "haveged" 命令查看haveged安装情况,观察命令返回结果是否为空。
- 是,执行步骤7。
- 否,执行步骤5。
5.执行 /sbin/service haveged status |grep "running" ,查看返回结果。
- 如果执行成功,表示haveged服务安装并正常配置运行,执行步骤10。
- 如果执行不成功,表示haveged服务没有正常运行。执行步骤7。
6.执行 /bin/rpm -qa | grep -w "rng-tools" 命令,查看rng-tools安装情况,观察命令返回结果是否为空。
- 是,执行步骤8。
- 否,执行步骤7。
7.执行 ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep"-o/dev/random" | grep "-r/dev/urandom" ,查看返回结果。
- 如果执行成功,表示rngd服务安装并正常配置运行,执行步骤10。
- 如果执行不成功,表示rngd服务并没有正常运行,执行步骤8
8.手动配置系统熵值设置,设置方法参见参考信息。
9.等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。
- 是,操作结束。
- 否,执行步骤10。
收集故障信息
10.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
11.在“服务”中勾选“NodeAgent”,单击“确定”。
12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
13.请联系运维人员,并发送已收集的故障日志信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
手动检查操作系统熵值
以root用户登录节点,执行cat/proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足集群的安装要求(不低于500)。如果低于500,可使用以下两种方式之一进行配置:
- 方式一:使用“haveged”工具(真随机数方式):请联系OS供应商安装并启动该工具。
银河麒麟:执行以下命令进行配置
vi/usr/lib/systemd/system/haveged.service
编辑[Service]项中Type、ExecStar、SuccessExitStatus、Restart参数值如下所示:
Type=simple
ExecStar=/usr/sbin/haveged -w 1024 -v 1 –Foreground
SuccessExitStatus=137 143
Restart=always
- 方式二:使用“rng-tools”工具(伪随机数方式):请联系OS供应商安装该工具,并根据操作系统类型进行配置。
−Red Hat和CentOS下:执行以下命令进行配置
echo 'EXTRAOPTIONS="-r /dev/urandom -o /dev/random -t 1-i"' >> /etc/sysconfig/rngd
service rngd start
chkconfig rngd on
−SUSE下:执行以下命令进行配置
rngd -r /dev/urandom -o /dev/random
echo "rngd -r /dev/urandom -o /dev/random" >>
/etc/rc.d/after.local
−银河麒麟:在告警上报节点使用root用户执行以下命令进行配置
vi /usr/lib/systemd/system/rngd.service
编辑[Service]项中ExecStart参数值如下:
ExecStart=/sbin/rngd -f -r /dev/urandom -s 2048