RKE v1.1.0+优化了升级集群的流程,提供了不宕机升级的功能。本节讲述了如何在使用命令升级集群的时候保证集群内的 pods 可用,实现不宕机升级。

不宕机升级的功能的工作原理是批量升级 worker 节点的同时,保证工作负载在至少一个节点上运行,详情请参考RKE v1.1.0+ 升级工作原理

升级集群现有的 Kubernetes 时,必须是从一个小版本升级到另一个小版本,例如从 v1.16.0 升级到 v1.17.0,或是升级到同一个小版本内的补丁版,例如从 v1.16.0 升级到 v1.16.1。

集群必须满足以下条件:

  1. 集群具有至少 3 个 etcd 节点。
  2. 集群具有至少 2 个 controlplane 节点。
  3. 集群具有至少 2 个 worker 节点。
  1. 应用和 Ingress 部署在至少一个节点上。
  2. The applications must make use of liveness and readiness probes.
  3. 应用必须使用存活探针(liveness probes)和就绪探针(readiness probes)。

请参考,获取使用 node selector 将 pod 分配给节点的操作指导。

配置插件副本的操作指导请参考配置升级策略