背景:传统监控面临诸多问题
随着云和云原生技术的发展,软件基础设施和架构正在向着更加轻量、灵活和高效的方向演进。这虽然为企业提供了更多的选择和可能性,但也暴露出传统监控的诸多问题。
- 传统监控割裂分散,运维监控手段和工具的多样化和碎片化。在这种模式下,各个系统、设备或服务之间的数据无法实现有效的整合和关联,使得故障的定位变得困难,也使得事件分析和数据的应用变得更加复杂。
- 传统监控主要关注于基础设施层面的指标型数据,忽略了对应用服务层的关注。这种做法导致运维人员难以全面了解和评估整体业务运行的健康状态,无法进行有效的全局监测和判断。
- 传统监控在面对故障时,往往难以精确判断故障对业务的具体影响,从而无法迅速采取有效的应对措施,这不仅包括了对故障影响的误判误报,还包括了对某些实际已经影响到业务运行的故障的漏报。同时,在故障定位方面,由于现场还原困难、故障定位和恢复效率低下等问题,也严重影响了问题的解决效率。
APM为您的应用健康保驾护航
可观测体系产品在面对云原生架构下的大规模集群以及海量灵活的微服务应用时,可以明确知道集群中运行的详细信息,清晰地发现和记录主机快速变化的应用行为,清晰地观察到应用之间复杂的调用关系。
而应用性能监控(Application Performance Monitoring,APM)作为天翼云可观测体系中的关键产品,可以为容器应用、虚机应用等不同对象提供全链路一体化的监控解决方案,帮助您实现全栈性能监控与端到端追踪诊断,为您的应用健康保驾护航。
关键特性
- 可视化监控:无需配置,自动监控JVM、基础资源、URL、Exception、SQL等各类监控指标,并提供可视化图表展示。
- 全链路追踪:自动发现应用的上下游依赖关系,捕获计算并立体展示不同应用之间组成的调用链,进行全链路拓扑化追踪,轻松发现异常调用。
- 灵活告警:提供几十项告警指标配置,具备静默策略等告警收敛能力,支持短信、邮件、IM应用等多通知渠道,满足客户各场景的灵活告警诉求。
客户价值
支撑云上业务的可观测诉求,保障应用健康。
- 全局一站式管理:深度融合OpenTracing标准,拥抱开源生态,支持Java、Golang、Python、Node.Js等多语言应用接入,方便客户对多个应用以全局视角进行一站式管理。
- 降低运维成本:全托管式监控服务,免基础人力运维,按真实用量付费,降低成本。
- 提升运维效率:立体化监控,隐患主动告警,故障快速诊断,化被动为主动,高效运维。