升级集群的好处
云容器引擎使用kubernetes的原生v<主要版本>.<次要版本>.<补丁版本>版本语义,目前尚只支持4个次要版本,分别为v1.23.3, v1.25.6, v1.27.8, v1.29.3版本。云容器引擎会定期发布支持的Kubernetes版本并逐步停止对过期版本的技术支持。建议使用v1.23.3版本的用户建议尽快升级到更高版本kubernetes,已获得更好的使用体验。
主动升级集群有以下好处:
- 降低安全和稳定性风险:随着Kubernetes版本迭代,会不断优化及修复发现的安全及稳定性漏洞,长久使用过期版本集群会给业务带来安全和稳定性风险。
- 享受更好的维护支持:对于过期Kubernetes版本,云容器引擎不再提供安全补丁和问题修复,也无法保证过期版本的技术支持质量。使用新版本能够让您享受更好的技术支持和答疑服务。
- 使用新版本的新功能:随着社区Kubernetes版本的演进,新版本包含新的功能和改进,云容器引擎也将适配新版本,为您带来更好的开发和运维体验。
注意事项
1、版本升级策略说明
云容器引擎集群使用kubernetes的官方工具kubeadm升级集群,单次升级只能升级一个次要版本。例如,Kubernetes版本为v1.23.3的云容器引擎集群升级到v1.25.6时,需要进行两次集群升级,即先升级到v1.24.17版本,再升级到v1.25.6版本。其中v1.24.17版本为过渡版本,云容器引擎并未提供正式的版本支持,用户需尽快升级至v1.25.6版本。
2、注意事项说明
用户可以登录云容器引擎控制台,在集群页面可查看到已有的集群实例,在集群列表右侧功能区选择更多->升级,进入版本升级操作界面,初次打开实例的集群升级操作界面时会检测集群是否已安装。
cube-system-upgrade-controller和node-problem-detector插件,这两个插件需要安装到待升级的集群实例才能使用云容器引擎服务的集群升级功能,检测到未安装时控制台页面会有相关提示,用户点击安装插件按钮即可安装这两个插件。
集群升级是一项有风险的操作,云容器引擎的将集群升级分为集群预检和升级两个步骤,集群预检功能会评估集群健康状态以及升级至下一个版本时存在的API兼容性风险,侦测到风险时会提醒用户存在的风险项,用户可根据页面提示修复风险项后再执行升级操作。
3、使用了自定义配置
如果您对集群曾有自定义配置,请仔细阅读以下说明。
配置项 说明 节点规格 节点资源不足或执行过节点规格缩容操作有可能会影响集群升级。 自定义操作系统镜像 自定义操作系统镜像未经过官方严格验证可能导致集群升级不成功。 手工变更集群配置 如果对集群配置有过修改,例如修改了容器运行时配置、直接手工编辑过kubelet的配置文件,集群升级过程有可能失败或自定义配置有可能丢失。
升级流程、方式及所需时间
升级流程
- 准备工作:当前云容器引擎一次只能往前升级一个次要版本,升级至下一个云容器引擎支持的次要版本时需要执行两次升级操作。升级前请先参考上文注意事项相关描述。
- 前置检查:执行前置检查,若有检测到风险项,请按控制台提示进行操作。
- 集群升级:前置检查通过后,可开始集群升级,云容器引擎会依次升级控制节点和节点池节点。
- 集群升级后:核验集群、检查节点池运行是否正常,检查集群业务是否运行正常。
升级方式
云容器引擎专有集群是采用原地升级方式,首先升级Master节点,Master节点升级是串行的,一次只升级一个Master节点。升级Master组件,包括kube-apiserver、kube-controller-manager、kube-scheduler、Kube-proxy、Etcd、Kubelet等。
云容器引擎当前尚不支持按节点池升级Worker节点,Master节点升级完毕后自动开始升级Worker节点,Worker节点升级可并发执行,并发数通过每批次最大并行数进行配置,每批次最大并行数最大值不能超过Worker节点数量的1/2。
升级所需时间
云容器引擎专有集群的Master节点需逐个、串行升级,每个Master节点升级时间约为8分钟,Worker节点根据用户配置的并发数量进行升级,单个worker节点升级时间约为1分钟。
操作步骤
同时升级控制面和所有节点池
1、登录云容器引擎控制台,在左侧导航栏选择集群进入集群列表页面。
2、在集群列表页面,选择待升级的集群实例,在右侧功能区选择更多 > 升级进入集群升级页面。若页面提示安装cube-system-upgrade-controller和node-problem-detector插件,则点击安装插件按钮安装这两个插件。
3、在集群升级设置每批次的最大并行数,然后单击前置检查,前置检查约需要执行1分钟。
若提示前置检查为正常时,则可以继续进行集群升级操作。
若提示前置检查未通过,可点击查看详情,然后按照页面提示进行修复。修复完成后可再次执行前置检查,确认故障已排查后单击开始升级。
4、升级完成后,您可以在集群列表查看集群版本,确认升级是否成功。
注意1、升级过程中,请勿添加或删除节点。
2、集群升级过程发生错误时,系统将暂停集群升级进程,集群可能处于部分节点已完成升级的中间状态,可通过工单待工程师排除问题后再继续尝试升级。
3、集群升级过程中,请勿修改system-upgrade命名空间下的相关资源。