searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享

灾备关键技术之RTO和RPO

2023-10-25 09:49:27
555
0
我们都知道数据备份最主要的目的是在灾难发生的时候能够恢复数据,最大程度的降低损失。
备份是容灾的关键,至于备份和容灾要达到什么程度,有2个关键的技术指标:RTO和RPO
             RTO:Recovery Time Objective:恢复时间目标             
             RPO:Recovery Point Objective:恢复点目标       
       RTO:是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金 。
举例:比如服务发生故障后,十小时内需要恢复,RTO值就是十小时,RTO具体时间长短只是从故障发生后,从系统宕机导致应用停顿之刻开始,到系统恢复至可以支持各部门运作之时,此两点之间的时间段。RTO表示业务恢复的及时性指标,RTO值越小,表示业务恢复的能力越强。
      RPO:指的是在系统发生损毁后,你希望你的系统能够恢复到什么状态,也就是说你可以容忍的数据丢失程度。例如你可以容忍丢失12小时内的数据,或者可以容忍丢失24小时的数据等等。如果你希望RPO为0,那就需要采用同步复制等技术去支撑是反映恢复数据完整性的指标,在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据库与容灾备份数据库的SCN的时间差。
举例:指容忍的最大数据丢失量,比如说业务故障到业务恢复,恢复的数据所对应的时间点,比如说企业4小时一备份,那么备份和数据之间间隔最大为4小时,RTO值越小,表示数据丢失越小。单个RPO的范围通常为24小时、12小时、8小时、4小时。以秒为单位测量到接近零。只要对生产系统的影响最小,8小时以上的RPO就可以利用现有的备份解决方案。4小时的RPO将需要计划的快照复制,而接近零的RPO将需要连续复制。在RPO和RTO都接近于零的情况下,将连续复制与故障转移服务结合使用,以实现接近100%的应用程序和数据可用性。

RTO和RPO之间的关系

从图中我们可以看出,RPO指标来自于故障发生前,而RTO指标来自故障发生后,两者的数值越小,就能有效缩短业务正常到业务过渡期的时间间隔,单一地提升RTO或RPO指标也可以缩减业务故障到过渡期的时间,具体从哪个指标上来改善,就要结合的实际情况分析,提升那个指标代价最小,效果更明显。当然完美的方案当然是RTO和RPO都为零,这表示当故障发生后,系统立即回复,而且完全没有数据丢失,要达到这样的目标系统设计是及其复杂的,而且造价也是非常昂贵的。

 

0条评论
0 / 1000
刘****红
1文章数
0粉丝数
刘****红
1 文章 | 0 粉丝
刘****红
1文章数
0粉丝数
刘****红
1 文章 | 0 粉丝

灾备关键技术之RTO和RPO

2023-10-25 09:49:27
555
0
我们都知道数据备份最主要的目的是在灾难发生的时候能够恢复数据,最大程度的降低损失。
备份是容灾的关键,至于备份和容灾要达到什么程度,有2个关键的技术指标:RTO和RPO
             RTO:Recovery Time Objective:恢复时间目标             
             RPO:Recovery Point Objective:恢复点目标       
       RTO:是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金 。
举例:比如服务发生故障后,十小时内需要恢复,RTO值就是十小时,RTO具体时间长短只是从故障发生后,从系统宕机导致应用停顿之刻开始,到系统恢复至可以支持各部门运作之时,此两点之间的时间段。RTO表示业务恢复的及时性指标,RTO值越小,表示业务恢复的能力越强。
      RPO:指的是在系统发生损毁后,你希望你的系统能够恢复到什么状态,也就是说你可以容忍的数据丢失程度。例如你可以容忍丢失12小时内的数据,或者可以容忍丢失24小时的数据等等。如果你希望RPO为0,那就需要采用同步复制等技术去支撑是反映恢复数据完整性的指标,在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据库与容灾备份数据库的SCN的时间差。
举例:指容忍的最大数据丢失量,比如说业务故障到业务恢复,恢复的数据所对应的时间点,比如说企业4小时一备份,那么备份和数据之间间隔最大为4小时,RTO值越小,表示数据丢失越小。单个RPO的范围通常为24小时、12小时、8小时、4小时。以秒为单位测量到接近零。只要对生产系统的影响最小,8小时以上的RPO就可以利用现有的备份解决方案。4小时的RPO将需要计划的快照复制,而接近零的RPO将需要连续复制。在RPO和RTO都接近于零的情况下,将连续复制与故障转移服务结合使用,以实现接近100%的应用程序和数据可用性。

RTO和RPO之间的关系

从图中我们可以看出,RPO指标来自于故障发生前,而RTO指标来自故障发生后,两者的数值越小,就能有效缩短业务正常到业务过渡期的时间间隔,单一地提升RTO或RPO指标也可以缩减业务故障到过渡期的时间,具体从哪个指标上来改善,就要结合的实际情况分析,提升那个指标代价最小,效果更明显。当然完美的方案当然是RTO和RPO都为零,这表示当故障发生后,系统立即回复,而且完全没有数据丢失,要达到这样的目标系统设计是及其复杂的,而且造价也是非常昂贵的。

 

文章来自个人专栏
云容灾
1 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0