searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

AOM业务架构介绍(四)- 告警

2024-06-25 09:47:39
4
0

告警

AOM支持两类告警:指标告警和日志告警,分别基于AOM的指标监控和日志搜索。

 

下图说明了告警的一般逻辑,AOM也遵循这个一般逻辑。

 

指标告警与日志告警的本质区别就是指标不同:

  1. 指标告警的指标,为ICAgent、APM探针、CES采集的各种资源指标
  2. 日志告警的指标,为经过LTS分析日志数据生成的各种指标

这导致了AOM使用不同的方式实现这两种告警功能。

指标告警

监控章节中,我们已经说明了资源的指标数据是以Prometheus格式存储在AOM上的,并且其告警也是基于Prometheus的AlertManager。指标告警可以关联到应用。

 

事件告警

事件告警可以看做是指标告警的一个补充:

  1. 指标告警无法监控系统的某些变化,比如工作负载部署失败、节点扩容等
  2. AOM将生成一条告警也当做是一个事件,可以简化告警通知

 

日志告警

日志指标来源于LTS解析日志,AOM的日志集成了LTS,也包括LTS的告警功能。日志告警没有关联到应用。

 

  • 采集的原始日志数据,经过解析与结构化,变为结构化数据存储在LTS
  • AOM的告警行动规则与告警规则是通过接口与LTS进行交互的,AOM并不存储这部分数据
  • 告警的生成与后续处理也是LTS的功能
  • 关于告警数据,是从LTS同步到AOM,AOM和LTS分别存储了一份
    • 在AOM指标告警与日志告警是一起展示的,并且需要排序、分页
    • 事件告警所介绍的,告警也算是一种事件,所以日志告警要和指标告警一起被计算
  • 关于告警规则,是通过接口从LTS查询的
    • 指标告警规则与日志告警规则是不同的页面,不存在需要一起展示的情况
  • 关于告警行动规则,是通过接口从LTS查询的
    • 虽然在AOM,指标的告警行动规则与日志的告警行动规则是在一个页面展示,但是无分页、排序,并且日志的告警行动规则默认按时间序在前面
0条评论
0 / 1000
郭****雨
4文章数
1粉丝数
郭****雨
4 文章 | 1 粉丝
原创

AOM业务架构介绍(四)- 告警

2024-06-25 09:47:39
4
0

告警

AOM支持两类告警:指标告警和日志告警,分别基于AOM的指标监控和日志搜索。

 

下图说明了告警的一般逻辑,AOM也遵循这个一般逻辑。

 

指标告警与日志告警的本质区别就是指标不同:

  1. 指标告警的指标,为ICAgent、APM探针、CES采集的各种资源指标
  2. 日志告警的指标,为经过LTS分析日志数据生成的各种指标

这导致了AOM使用不同的方式实现这两种告警功能。

指标告警

监控章节中,我们已经说明了资源的指标数据是以Prometheus格式存储在AOM上的,并且其告警也是基于Prometheus的AlertManager。指标告警可以关联到应用。

 

事件告警

事件告警可以看做是指标告警的一个补充:

  1. 指标告警无法监控系统的某些变化,比如工作负载部署失败、节点扩容等
  2. AOM将生成一条告警也当做是一个事件,可以简化告警通知

 

日志告警

日志指标来源于LTS解析日志,AOM的日志集成了LTS,也包括LTS的告警功能。日志告警没有关联到应用。

 

  • 采集的原始日志数据,经过解析与结构化,变为结构化数据存储在LTS
  • AOM的告警行动规则与告警规则是通过接口与LTS进行交互的,AOM并不存储这部分数据
  • 告警的生成与后续处理也是LTS的功能
  • 关于告警数据,是从LTS同步到AOM,AOM和LTS分别存储了一份
    • 在AOM指标告警与日志告警是一起展示的,并且需要排序、分页
    • 事件告警所介绍的,告警也算是一种事件,所以日志告警要和指标告警一起被计算
  • 关于告警规则,是通过接口从LTS查询的
    • 指标告警规则与日志告警规则是不同的页面,不存在需要一起展示的情况
  • 关于告警行动规则,是通过接口从LTS查询的
    • 虽然在AOM,指标的告警行动规则与日志的告警行动规则是在一个页面展示,但是无分页、排序,并且日志的告警行动规则默认按时间序在前面
文章来自个人专栏
AOM业务架构介绍
4 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0