应用运维管理(Application Operations Management)是云上应用的一站式立体化运维管理平台,实时监控用户的应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。
AOM作为云上应用的一站式立体化运维管理平台,可以实现对云主机、存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的角度看业务,满足企业对业务的高效和快速迭代的需求,可帮助企业实现 IT 对业务的有效支撑,保护、优化IT资产投资,使企业更好的达到其战略目标并实现IT资产调优。
控制台说明
类别 说明 总览 提供监控概览及仪表盘功能。
监控概览
“监控概览”界面提供了资源、应用、应用用户体验的全链路、多层次、一站式运维界面。
仪表盘
通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。告警 提供告警列表、事件列表、告警规则、告警通知等功能。
告警列表
告警是指AOM自身或外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。
告警列表展示已设时间范围内产生的告警。
事件列表
事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。
事件列表展示已设时间范围内产生的事件。
告警规则
通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件,以便您在第一时间发现异常并进行处理。监控 提供应用监控、组件监控、主机监控、容器监控、指标浏览等功能。
应用监控
应用是您根据业务需要,对相同或者相近业务的一组组件进行逻辑划分,AOM提供以应用维度整体进行监控。
组件监控
组件即您部署的服务,包括容器和普通进程。
组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,AOM支持从组件下钻到实例,从实例下钻到容器。通过各层状态,您可完成对组件的立体监控。
主机监控
通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。
容器监控
容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。
指标浏览
指标浏览展示了各资源的指标数据,您可实时监控指标值及趋势,还可将关注的指标添加到仪表盘,对其创建阈值规则和导出监控报告等操作,以便实时查看业务及分析数据。日志 提供日志搜索、日志文件、日志转储、日志路径等功能。
日志搜索
当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。
日志文件
您可快速查看组件实例的日志文件,以便定位问题。
日志转储
AOM支持将日志转储到对象存储服务(Object Storage Service,简称OBS)的OBS桶中,以便进行长期存储。
日志路径
AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云主机或物理机)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径。配置管理 提供ICAgent管理、应用发现、日志配置等功能。
ICAgent管理
ICAgent用于采集指标、日志和应用性能数据。对于在ECS、BMS控制台直接购买的主机,您需手动安装ICAgent。对于通过CCE间接购买的主机,ICAgent会自动安装,您不用安装ICAgent。
数据订阅
支持用户订阅指标或者告警信息,订阅后可以将数据转发到用户配置的kafka或DMS的Topic中,供消费者消费转发的订阅的信息。
应用发现
应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。
日志配置
提供日志配额和分词设置功能。
配额配置
当指标超过配额时,时间较早的指标将会被删除。
指标配置
指标采集开关用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。