大规模集群的注意事项

    • 每个节点的 Pod 数量不超过 110
    • 节点数不超过 5000
    • 容器总数不超过 300000

    你可以通过添加或删除节点来扩展集群。集群扩缩的方式取决于集群的部署方式。

    为避免遇到云供应商配额问题,在创建具有大规模节点的集群时,请考虑以下事项:

    • 请求增加云资源的配额,例如:
      • 计算实例
      • CPUs
      • 存储卷
      • 使用中的 IP 地址
      • 数据包过滤规则集
      • 网络子网
      • 日志流
    • 由于某些云供应商限制了创建新实例的速度,因此通过分批启动新节点来控制集群扩展操作,并在各批之间有一个暂停。

    对于大型集群,你需要一个具有足够计算能力和其他资源的控制平面。

    通常,你将在每个故障区域运行一个或两个控制平面实例, 先垂直缩放这些实例,然后在到达下降点(垂直)后再水平缩放。

    你应该在每个故障区域至少应运行一个实例,以提供容错能力。 Kubernetes 节点不会自动将流量引向相同故障区域中的控制平面端点。 但是,你的云供应商可能有自己的机制来执行此操作。

    为了提高大规模集群的性能,你可以将事件对象存储在单独的专用 etcd 实例中。

    在创建集群时,你可以(使用自定义工具):

    • 启动并配置额外的 etcd 实例
    • 配置 API 服务器,将它用于存储事件

    有关为大型集群配置和管理 etcd 的详细信息,请参阅 和使用 kubeadm 创建一个高可用 etcd 集群

    插件资源

    Kubernetes 资源限制 有助于最大程度地减少内存泄漏的影响以及 Pod 和容器可能对其他组件的其他方式的影响。 这些资源限制适用于资源, 就像它们适用于应用程序工作负载一样。

    例如,你可以对日志组件设置 CPU 和内存限制

    为避免遇到集群插件资源问题,在创建大规模集群时,请考虑以下事项:

    • 部分垂直扩展插件 —— 总有一个插件副本服务于整个集群或服务于整个故障区域。 对于这些附加组件,请在扩大集群时加大资源请求和资源限制。
    • 许多水平扩展插件 —— 你可以通过运行更多的 Pod 来增加容量——但是在大规模集群下, 可能还需要稍微提高 CPU 或内存限制。 VerticalPodAutoscaler 可以在 recommender 模式下运行, 以提供有关请求和限制的建议数字。

    是一种自定义资源,你可以将其部署到集群中,帮助你管理资源请求和 Pod 的限制。 访问 Vertical Pod Autoscaler 以了解有关 VerticalPodAutoscaler 的更多信息, 以及如何使用它来扩展集群组件(包括对集群至关重要的插件)的信息。

    与许多云供应商集成在一起,帮助你在你的集群中,按照资源需求级别运行正确数量的节点。

    addon resizer 可帮助你在集群规模变化时自动调整插件的大小。

    最后修改 August 27, 2021 at 6:16 PM PST: