操作场景
本章节指导用户安装指标采集插件,用于采集GPU类指标和RAID类指标。
说明
ECS支持GPU类指标,BMS暂不支持。
BMS支持RAID类指标,ECS暂不支持。
若Agent升级到1.0.5及以上版本,对应插件需使用最新的版本,否则会出现指标采集异常。
前提条件
- 已安装Agent并处于正常运行状态。
- GPU类指标采集需弹性云主机支持GPU。
操作步骤
- 使用root帐号,登录ECS。
说明
若要监控BMS的软RAID指标,请登录BMS。
以下以安装GPU插件为例,安装监控软RAID插件类似。
-
执行以下命令,进入Agent安装路径。
cd /usr/local/telescope
-
执行以下命令,创建plugins文件夹。
mkdir plugins
-
执行以下命令,进入plugins文件夹。
cd plugins
-
执行如下命令,下载采集插件脚本(以下以GPU插件为例)。
wget http://telescope-cn-xxx/gpu_collector
说明RAID插件地址路径:http://telescope-{region_Id}.obs.{region_Id}/raid_monitor.sh
以广州4资源池为例,Region_Id为:cn-gdgz1
插件包地址为:http://telescope-cn-gdgz1.obs.cn-gdgz1.ctyun.cn/raid_monitor.sh
GPU插件地址路径:http://telescope-{region_Id}.obs.{region_Id}/gpu_collector
以广州4资源池为例,Region_Id为:cn-gdgz1,
插件包地址为:http://telescope-cn-gdgz1.obs.cn-gdgz1.ctyun.cn/gpu_collector
-
执行如下命令,添加脚本执行权限。
chmod 755 gpu_collector
-
执行如下命令,新建conf.json文件并添加配置内容,配置插件路径和指标采集周期crontime(单位:秒)。
vi conf.json
GPU指标插件配置
{ "plugins": [ { "path": "/usr/local/telescope/plugins/gpu_collector", "crontime": 60 } ] }
RAID指标插件配置
{ "plugins": [ { "path": "/usr/local/telescope/plugins/raid_monitor.sh", "crontime": 60 } ] }
说明
path路径后的参数为gpu_collector和raid_monitor.sh分别为GPU插件和RAID插件配置内容。
插件采集周期为60s,若采集周期配置错误,会导致指标采集异常。
插件路径path请勿私自修改,否则指标采集异常。
- 打开/usr/local/telescope/bin路径下的conf_ces.json文件,新增配置项"EnablePlugin":true,开启插件采集开关。
{ "Endpoint": "所在区域地址,默认无需修改", "EnablePlugin": true }
- 执行如下命令,重启Agent。
/usr/local/telescope/telescoped restart