API 发起的驱逐
你可以通过直接调用 Eviction API 发起驱逐,也可以通过编程的方式使用 API 服务器的客户端来发起驱逐, 比如 kubectl drain
命令。 此操作创建一个 Eviction
对象,该对象再驱动 API 服务器终止选定的 Pod。
API 发起的驱逐将遵从你的 和 terminationGracePeriodSeconds 配置。
使用 API 创建 Eviction 对象,就像对 Pod 执行策略控制的
你可以使用 来访问 Kubernetes API 并创建 Eviction
对象。 要执行此操作,你应该用 POST 发出要尝试的请求,类似于下面的示例:
policy/v1
版本的 Eviction 在 v1.22 以及更高的版本中可用,之前的发行版本使用 policy/v1beta1
版本。
说明:
在 v1.22 版本废弃以支持 policy/v1
或者,你可以通过使用 curl
或者 来访问 API 以尝试驱逐操作,类似于以下示例:
429 Too Many Requests
:当前不允许驱逐,因为配置了 。 你可以稍后再尝试驱逐。你也可能因为 API 速率限制而看到这种响应。500 Internal Server Error
:不允许驱逐,因为存在配置错误, 例如存在多个 PodDisruptionBudgets 引用同一个 Pod。
如果你想驱逐的 Pod 不属于有 PodDisruptionBudget 的工作负载, API 服务器总是返回 200 OK
并且允许驱逐。
如果 API 服务器允许驱逐,Pod 按照如下方式删除:
- API 服务器中的
Pod
资源会更新上删除时间戳,之后 API 服务器会认为此 资源将被终止。 此Pod
资源还会标记上配置的宽限期。 - 本地运行状态的 Pod 所处的节点上的 kubelet 注意到
Pod
资源被标记为终止,并开始优雅停止本地 Pod。 - 当 kubelet 停止 Pod 时,控制面从 和 EndpointSlice 对象中移除该 Pod。因此,控制器不再将此 Pod 视为有用对象。
- Pod 的宽限期到期后,kubelet 强制终止本地 Pod。
- API 服务器删除
Pod
资源。
在某些情况下,你的应用可能进入中断状态, 在你干预之前,驱逐 API 总是返回 429
或 500
。 例如,如果 ReplicaSet 为你的应用程序创建了 Pod, 但新的 Pod 没有进入 Ready
状态,就会发生这种情况。 在最后一个被驱逐的 Pod 有很长的终止宽限期的情况下,你可能也会注意到这种行为。
如果你注意到驱逐被卡住,请尝试以下解决方案之一:
- 终止或暂停导致问题的自动化操作,重新启动操作之前,请检查被卡住的应用程序。
- 等待一段时间后,直接从集群控制平面删除 Pod,而不是使用 Eviction API。
- 了解如何使用 保护你的应用。
- 了解节点压力引发的驱逐。
- 了解 。