故障演练建立了一套标准的演练流程,包含准备/配置阶段、执行阶段、监控阶段和恢复阶段。通过四阶段的流程,覆盖用户从计划到还原的完整演练过程,并通过可视化的方式清晰的呈现给用户。
前序步骤
进行故障演练前,需完成命名空间创建、容灾管理中心配置、应用接入。
使用限制
- 演练次数耗尽前,不支持再次购买故障演练包。
创建同城多活形态下的故障演练
- 进入多活容灾控制台-故障管理-故障演练页,在列表上方下拉菜单中选择需要进行故障演练的命名空间。此处选择同城多活形态的命名空间。
-
点击“创建故障演练”按钮。
-
演练对象配置。
a. 演练场景:演练场景可选择主机级、应用级、机房级。当前仅支持主机级故障演练。
b. 演练范围:演练范围可选择云主机、数据库、存储。当前仅支持云主机范围。
c. 演练故障:选择需要演练的故障,当前仅支持选择宕机、重启。
d. 填写演练名称。
e. 云主机实例:选择进行故障演练的云主机。在下拉框中选择当前命名空间下的容灾管理中心,选择该容灾管理中心中的云主机部署故障演练。仅可选择一个分区下的云主机,云主机支持多选。 -
演练策略配置。
a. 选择演练流程,当前仅支持顺序流程。
b. 选择演练范围。当前仅支持云主机范围。
c. 选择守护策略。点击“新增策略”按钮,弹出新增守护策略弹窗。守护策略支持CPU指标、网卡指标、内存指标、磁盘指标。
守护策略配置解释示例:
例如配置恢复策略为:当70%的机器满足mem_util(内存使用率)≥90%且持续30s时,即可解除CPU满载,恢复初始CPU使用率。
d. 设置自动恢复时间。从开始演练记时,到设置的自动恢复时间以后停止演练业务恢复。
-
点击“立即创建”按钮,完成故障演练创建。
创建同城主备形态下的故障演练
- 进入多活容灾控制台-故障管理-故障演练页,在列表上方下拉菜单中选择需要进行故障演练的命名空间。此处选择同城主备形态的命名空间。
-
点击“创建故障演练”按钮。
-
演练对象配置。
a. 演练场景:演练场景可选择主机级、数据库级。
b. 演练范围:演练范围可选择云主机范围。
c. 演练故障:选择需要演练的故障,当前仅支持选择备库拉起。
d. 填写演练名称。
e. 云主机实例:选择进行故障演练的云主机。在下拉框中选择当前命名空间下的容灾管理中心,选择该容灾管理中心中的云主机部署故障演练。云主机支持多选。 -
演练策略配置。
a. 选择演练流程,当前仅支持顺序流程。
b. 选择演练范围。当前仅支持云主机范围。
c. 选择守护策略。点击“新增策略”按钮,弹出新增守护策略弹窗。守护策略支持CPU指标、网卡指标、内存指标、磁盘指标。
守护策略配置解释示例:
例如配置恢复策略为:当70%的机器满足mem_util(内存使用率)≥90%且持续30s时,即可解除CPU满载,恢复初始CPU使用率。
d. 设置自动恢复时间。从开始演练记时,到设置的自动恢复时间以后停止演练业务恢复。
-
点击“立即创建”按钮,完成故障演练创建。