什么是容灾?
容灾的主要目的是当自然或人为的原因导致生产系统发生故障时,能够尽可能地保证业务的连续性。
容灾就是在自然灾害、设备故障、人为操作破坏等灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生产系统的业务不间断地运行。
云容灾有哪些功能?
云容灾具有以下主要功能:
-
云主机跨可用区容灾
当出现机房级故障(如电力故障、网络故障、空调故障等)时,生产中心故障导致业务中断,云容灾服务可提供云主机跨可用区秒级RPO、分钟级RTO的容灾保护。通过简单的配置,即可在容灾中心拉起容灾云主机,迅速接管业务。
-
容灾演练
在不影响业务的情况下,通过模拟真实的容灾恢复场景,确保在生产中心发生故障时能够顺畅地进行故障切换,且容灾中心云主机能够正常拉起、接管业务。
-
故障切换
定期的容灾演练保障了业务可以随时在云上拉起。当生产中心发生重大故障时,通过故障切换操作可以在云上迅速恢复业务。
什么是复影云主机和容灾云主机?
- 复影云主机:云容灾为充分减少容灾闲置资源带来的开销,在容灾端采用复影云主机,在减少资源消耗的同时又能够提供良好的RTO。启动容灾复制后,生产中心受保护的云主机的数据会实时复制至复影云主机;容灾演练/故障切换时,复影云主机中的数据会传输至容灾云主机用于业务恢复。确认故障切换完成后,复影云主机会被自动删除。容灾复制期间,建议不要对复影云主机进行任何操作。
- 容灾云主机:进行容灾演练或故障切换时,系统在容灾中心创建的用于恢复业务的云主机,称为容灾云主机。
云容灾服务可以达到什么样的RPO和RTO?
云容灾采用持续数据保护(CDP)技术,支持字节级数据复制,RPO可达秒级、RTO可达分钟级。
- RPO:Recovery Point Objective(恢复点目标),指故障发生时数据可以恢复到的时间点,决定生产中心发生故障时的数据丢失量。例如,RPO = 30秒,表示在生产中心发生故障时,最近30秒的数据无法恢复。
- RTO:Recovery Time Objective(恢复时间目标),指故障发生后云主机从中断到恢复运行所需要的时间。例如,RTO = 1分钟,表示在生产中心发生故障时,需要1分钟才能恢复正常运行
云容灾可以对物理机容灾吗?
云容灾暂不支持物理机容灾,后续将逐渐完善功能。
如果您有具体需求,可以通过客服电话等方式联系产品售前经理或解决方案经理,我们会根据您的业务为您定制合适的解决方案。
云容灾支持哪些弹性云主机?
目前仅支持64位操作系统,且云主机的规格不能小于2CPU+4GB内存。
支持的操作系统版本如下表所示:
操作系统类型 | 操作系统版本 | 位数 |
---|---|---|
CentOS | 7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9 | 64 |
Ubuntu | 18.04 | 64 |
云备份产品和云容灾产品的区别?
产品 | 应用场景 | 使用目的 | RPO | RTO |
---|---|---|---|---|
云容灾 | 主要针对火灾、地震等重大自然灾害,因此生产中心和容灾中心之间必须保证一定的安全距离。 | 避免业务中断,在灾难发生后,可以在容灾中心启动容灾主机,保证业务的连续性。 | 秒级 | 分钟级 |
云备份 | 当发生软件错误、病毒入侵、人为删除等事件时,可将数据恢复到任意备份点。 | 避免数据丢失,出现故障后,可通过备份将数据恢复至最近的备份点。 | 小时级~天级 | 分钟级~小时级 |
云容灾服务是如何收费的?
云容灾服务会收取容灾客户端的费用,容灾中产生的云主机费用、云硬盘费用、云硬盘快照费用由对应的服务收取。
云容灾服务的计费说明如下表所示:
计费项 | 说明 | 计费方式 | 收费方 |
---|---|---|---|
容灾客户端 | 指授权部署在云主机上被保护的客户端。 | 公测期间免费试用。 注意: 容灾使用的其他服务,如云主机、云硬盘、云硬盘快照等正常计费。 |
云容灾 |
云主机 | 当故障切换或容灾演练时,对连续复制时使用的容灾中心复影云主机或云上容灾恢复拉起时部署的云主机进行收费。 | 仅支持按需计费。 收费标准按照云主机标准资费收取。 |
弹性云主机 |
云硬盘 | 挂载在容灾中心云主机下,存放实时复制的数据。 | 仅支持按需计费。 收费标准按照云硬盘标准资费收取。 |
云硬盘 |
云硬盘快照 | 对容灾中心云主机下的磁盘的历史时间节点打快照,供容灾恢复使用。 | 仅支持按需计费。 收费标准按照云硬盘快照标准资费收取。 |
云硬盘 |
容灾资源是否需要手动创建?
云容灾会自动创建容灾中心所需的云资源,不需要用户手动进行创建。
创建的容灾中心云资源,需要按需收取所使用的云主机和云硬盘的费用。收费标准按照云主机标准资费和云硬盘标准资费收取。
云容灾支持哪些类型云资源或工作负载的容灾?
支持云主机的容灾。
- 目前仅支持64位操作系统,建议运行容灾客户端的机器使用双核,并配备4GB以上的可用内存。
- Linux系统的/boot分区和/分区必须在同一磁盘,若不满足同一磁盘要求,建议手动调整磁盘后,再注册受保护实例进行容灾。
- 支持的云主机操作系统版本请参见支持的操作系统版本。
云容灾复制是否支持断点续传?
支持。
云容灾支持复制停止后,通过“重启复制”操作再次重启之前的复制过程,此过程是断点续传的过程。具体操作请参见重启容灾复制。
除此之外,复制过程中若发生断网等异常情况,云容灾也支持恢复后断点续传。
云容灾有配额限制吗?
为避免资源浪费,服务供应商限定了各服务资源的配额,对用户可使用的资源数量和容量等做了限制。
云容灾的具体配额如下:单租户在一个地域内,默认最多可以创建20个容灾客户端。
如有更大需求可以提工单申请,最大支持200个。
云容灾复制过程是否可以对云主机增扩盘?
不建议在复制过程中对云主机进行增扩盘操作,当磁盘发生变化的时候会导致复制错误。
如果您对云主机的磁盘容量、数量进行变更导致容灾受保护服务器复制出错,需要重新建立复制关系。
如果生产站点云主机使用密码登录,可以正常使用云容灾服务吗?
如果生产站点云主机(即受保护的服务器)设置为密码方式登录,可以正常使用云容灾服务,如添加受保护服务器、进行容灾演练、故障切换等操作。
但容灾演练和故障切换所创建的容灾云主机,不会保留生产站点云主机的密码信息,您可以先进行重置密码,然后登录容灾云主机。
什么是生产中心和容灾中心?
- 生产中心指需要容灾的服务器在云上的位置,即承载租户业务的服务器所在的地域和可用区,需在创建保护组时指定。
- 容灾中心指灾备用的计算和存储资源在云上的位置。当前仅支持容灾中心与生产中心在同一个地域的不同可用区。
哪些资源池/节点支持云容灾服务?
当前只有华东1资源池支持云容灾服务,您可以在帮助中心文档右上角,点击当前所选择的产品区域来查看支持云容灾服务的节点信息,如下图所示:
当受保护的服务器状态显示“容灾功能所需源端磁盘空间不足”该如何操作?
当受保护服务器状态显示“容灾功能所需源端磁盘空间不足”时,请执行如下操作:
步骤1:进入到被保护服务器的终端页面;
步骤2:切换到root用户下;
步骤3:执行入如下命令: /opt/cstor/cdr/scripts/cdr_checkcap.sh 如出现如下回显: Check the follwing file system cap
请执行步骤4。否则请联系运维人员;
步骤4:检查步骤3中目录(如上图所示:/mnt/test)的可用空间,如空间不足,执行步骤5;
步骤5:清理步骤3中目录(如上图所示:/mnt/test),建议该路径下的空闲空间比例大于原始磁盘20%的;
步骤6:刷新容灾管理页面;观察当空间释放后,重新刷新云容灾受保护服务器页面,错误状态是否会自动更正。 如未更正,请重复检测步骤3-5,如重复执行后仍未恢复,请联系运维人员。
注意:
- 步骤5中清理文件释放空间时请勿清理带有前缀.cbrsnp_的隐藏文件,否则无法保证容灾端数据的正确性。
- 容灾运行中请勿删除带有前缀.cbrsnp_的隐藏文件,否则无法保证容灾端数据的正确性。