社区专栏>国产化云操作系统虚拟网络支持的高可用方式和支持的高可用场景>
原创
国产化云操作系统虚拟网络支持的高可用方式和支持的高可用场景
高可用实现方式:
虚拟网络和物理网络解耦:
- 更大规模: 物理网络三层架构,宿主机规模可以横向扩展POD。例如上层增加super spine或leaf下增加ToR.单个region支持千万活跃云主机、万级物理机
- 对物理网络交换机依赖更低:单层业务隧道
- 故障域更小: Leaf下有环路只会影响本leaf下网络。
- 网元集群架构:网元可以集群架构 (BGP anycast)
- 更高可用性:子网跨AZ
冗余部署----网元集群部署,弹性可扩展
支持的高可用场景:
控制面支持的高可用场景如下:
- 网卡故障:通过管理口Bond,单个网卡故障不会影响服务可用性
- 单机故障:通过服务集群化部署,单机故障时,其他服务工作依然正常,不影响服务可用性
- AZ故障:服务跨az部署,每个AZ需要部署至少2个以上服务副本,单AZ故障,服务依然可用
- 管理网故障:即使整个管理网故障,对于存量网络转发不会受影响,但是新的网络变更会失败。
数据面支持的高可用场景如下:
- 同AZ下的单个网元节点出现故障,控制器会自动摘除故障网元节点、将流量分发到健康网元节点上
- 多个AZ场景下,单个AZ出现故障导致没有可用的网元节点时,流量会通过AZ间的DCI调度到其他可用的AZ网元节点
- 网元采用虚拟机方式部署在网元服务器上,监控网元服务器资源消耗情况,设置阈值,资源消耗超过阈值后,通知运维手动扩容物理网元服务器。
原创
国产化云操作系统虚拟网络支持的高可用方式和支持的高可用场景
高可用实现方式:
虚拟网络和物理网络解耦:
- 更大规模: 物理网络三层架构,宿主机规模可以横向扩展POD。例如上层增加super spine或leaf下增加ToR.单个region支持千万活跃云主机、万级物理机
- 对物理网络交换机依赖更低:单层业务隧道
- 故障域更小: Leaf下有环路只会影响本leaf下网络。
- 网元集群架构:网元可以集群架构 (BGP anycast)
- 更高可用性:子网跨AZ
冗余部署----网元集群部署,弹性可扩展
支持的高可用场景:
控制面支持的高可用场景如下:
- 网卡故障:通过管理口Bond,单个网卡故障不会影响服务可用性
- 单机故障:通过服务集群化部署,单机故障时,其他服务工作依然正常,不影响服务可用性
- AZ故障:服务跨az部署,每个AZ需要部署至少2个以上服务副本,单AZ故障,服务依然可用
- 管理网故障:即使整个管理网故障,对于存量网络转发不会受影响,但是新的网络变更会失败。
数据面支持的高可用场景如下:
- 同AZ下的单个网元节点出现故障,控制器会自动摘除故障网元节点、将流量分发到健康网元节点上
- 多个AZ场景下,单个AZ出现故障导致没有可用的网元节点时,流量会通过AZ间的DCI调度到其他可用的AZ网元节点
- 网元采用虚拟机方式部署在网元服务器上,监控网元服务器资源消耗情况,设置阈值,资源消耗超过阈值后,通知运维手动扩容物理网元服务器。