背景信息
为避免监控服务对您的资源使用造成影响,当监控Agent占用资源超过阈值时,监控Agent将自动退出。本文将介绍当主机监控Agent自动退出时的解决方法。
操作步骤
Linux系统
1.以root用户登录云主机。
2.执行以下命令,在dmesg日志中,查看telegraf相关日志。
dmesg | grep telegraf
如果文件dmesg中的日志出现Memorycgroup out of memory字样,则说明资源消耗超过阈值,例如:
3.在云主机监控Agent服务所在目录/usr/lib/systemd/system/(ubuntu系列发行版 /etc/systemd/system/)中,修改文件telegraf.service中资源限制相关参数。
1)执行以下命令,修改目录/usr/local/cloudmonitor/local_data中的文件agent.properties。
cd /usr/lib/systemd/system/
vi telegraf.service
请您根据实际资源占用情况设置资源限制参数,以下数据仅做参考:
- CPU限制为单核10%。CPUShares=1024
- 内存限制,单位为MB。MemoryLimit=200M
2)按Esc键,输入:wq,再按Enter键,保存并退出文件telegraf.service。
4.执行以下命令,重新加载云主机监控Agent服务配置文件telegraf.service。
systemctl daemon-reload
5.执行以下命令,重启云主机监控Agent。
systemctl restart telegraf