目标
- 服务连续性:
通过人员、资源等的及时调配和安排,确保TeleDB服务的连续性和服务质量。
- 降低风险:
应急方案必须采取各种措施,尽快解决发生的问题,将由故障产生的影响降到最低。
- 减少损失:
对于可能产生的影响,提出技术和管理方面的改进建议,尽量将各种损失减少到最低。
应急保障小组
为保障节点及重大活动顺利开展,应提前成立应急保障小组,随时待命:
- 项目经理:负责整个项目协调和管理工作。
- 网络工程师:负责网络巡检和相关问题处理。
- 数据库工程师:负责TeleDB数据库巡检和相关问题处理。
- 操作系统工程师:负责操作系统巡检和相关问题处理。
同时安排后端相关专家人员,随时待命,有问题可随时介入。
相关人员A/B角配置
- 应急小组成员,都需要按AB角色配置,互相补位,当工程师A某种原因无法及时提供服务时,由项目经理,在区域范围内安排合适的备份工程师B进行相关的服务;
- 如果区域人员无法满足要求,由项目经理向技术支持中心经理申请专家技术支持。
- 专家参与事件不能按时完成情况,则由项目经理申请更高级别技术支持。
下文是TeleDB服务出现故障时的常见应急处理方案,更多故障处理参数故障处理手册。