使用 kubeadm 创建集群

    kubeadm 工具很棒,如果你需要:

    • 一个尝试 Kubernetes 的简单方法。
    • 一个现有用户可以自动设置集群并测试其应用程序的途径。
    • 其他具有更大范围的生态系统和/或安装工具中的构建模块。

    你可以在各种机器上安装和使用 kubeadm:笔记本电脑, 一组云服务器,Raspberry Pi 等。无论是部署到云还是本地, 你都可以将 kubeadm 集成到预配置系统中,例如 Ansible 或 Terraform。

    要遵循本指南,你需要:

    • 一台或多台运行兼容 deb/rpm 的 Linux 操作系统的计算机;例如:Ubuntu 或 CentOS。
    • 每台机器 2 GB 以上的内存,内存不足时应用会受限制。
    • 用作控制平面节点的计算机上至少有 2 个 CPU。
    • 集群中所有计算机之间具有完全的网络连接。你可以使用公共网络或专用网络。

    你还需要使用可以在新集群中部署特定 Kubernetes 版本对应的 kubeadm

    适用于 kubeadm 以及整个 Kubernetes。 查阅该策略以了解支持哪些版本的 Kubernetes 和 kubeadm。 该页面是为 Kubernetes v1.25 编写的。

    kubeadm 工具的整体功能状态为一般可用性(GA)。一些子功能仍在积极开发中。 随着工具的发展,创建集群的实现可能会略有变化,但总体实现应相当稳定。

    说明: 根据定义,在 kubeadm alpha 下的所有命令均在 alpha 级别上受支持。

    目标

    • 安装单个控制平面的 Kubernetes 集群
    • 在集群上安装 Pod 网络,以便你的 Pod 可以相互连通

    在所有主机上安装 和 kubeadm。 详细说明和其他前提条件,请参见安装 kubeadm

    说明:

    如果你已经安装了kubeadm,执行 apt-get update && apt-get upgradeyum update 以获取 kubeadm 的最新版本。

    升级时,kubelet 每隔几秒钟重新启动一次, 在 crashloop 状态中等待 kubeadm 发布指令。crashloop 状态是正常现象。 初始化控制平面后,kubelet 将正常运行。

    准备所需的容器镜像

    这个步骤是可选的,只适用于你希望 kubeadm initkubeadm join 不去下载存放在 registry.k8s.io 上的默认的容器镜像的情况。

    当你在离线的节点上创建一个集群的时候,Kubeadm 有一些命令可以帮助你预拉取所需的镜像。 阅读离线运行 kubeadm 获取更多的详情。

    Kubeadm 允许你给所需要的镜像指定一个自定义的镜像仓库。 阅读 获取更多的详情。

    初始化控制平面节点

    控制平面节点是运行控制平面组件的机器, 包括 (集群数据库) 和 API Server (命令行工具 与之通信)。

    1. (推荐)如果计划将单个控制平面 kubeadm 集群升级成高可用, 你应该指定 --control-plane-endpoint 为所有控制平面节点设置共享端点。 端点可以是负载均衡器的 DNS 名称或 IP 地址。
    2. 选择一个 Pod 网络插件,并验证是否需要为 kubeadm init 传递参数。 根据你选择的第三方网络插件,你可能需要设置 --pod-network-cidr 的值。 请参阅安装 Pod 网络附加组件

    3. (可选)kubeadm 试图通过使用已知的端点列表来检测容器运行时。 使用不同的容器运行时或在预配置的节点上安装了多个容器运行时,请为 kubeadm init 指定 --cri-socket 参数。 请参阅。

    要初始化控制平面节点,请运行:

    关于 apiserver-advertise-address 和 ControlPlaneEndpoint 的注意事项

    --apiserver-advertise-address 可用于为控制平面节点的 API server 设置广播地址, --control-plane-endpoint 可用于为所有控制平面节点设置共享端点。

    --control-plane-endpoint 允许 IP 地址和可以映射到 IP 地址的 DNS 名称。 请与你的网络管理员联系,以评估有关此类映射的可能解决方案。

    这是一个示例映射:

    1. 192.168.0.102 cluster-endpoint

    其中 192.168.0.102 是此节点的 IP 地址,cluster-endpoint 是映射到该 IP 的自定义 DNS 名称。 这将允许你将 --control-plane-endpoint=cluster-endpoint 传递给 kubeadm init,并将相同的 DNS 名称传递给 kubeadm join。 稍后你可以修改 cluster-endpoint 以指向高可用性方案中的负载均衡器的地址。

    kubeadm 不支持将没有 --control-plane-endpoint 参数的单个控制平面集群转换为高可用性集群。

    更多信息

    有关 kubeadm init 参数的更多信息,请参见 kubeadm 参考指南

    要使用配置文件配置 kubeadm init 命令, 请参见。

    要自定义控制平面组件,包括可选的对控制平面组件和 etcd 服务器的活动探针提供 IPv6 支持, 请参阅自定义参数

    要重新配置一个已经创建的集群,请参见 。

    要再次运行 kubeadm init,你必须首先卸载集群

    如果将具有不同架构的节点加入集群, 请确保已部署的 DaemonSet 对这种体系结构具有容器镜像支持。

    kubeadm init 首先运行一系列预检查以确保机器 准备运行 Kubernetes。这些预检查会显示警告并在错误时退出。然后 kubeadm init 下载并安装集群控制平面组件。这可能会需要几分钟。 完成之后你应该看到:

    1. Your Kubernetes control-plane has initialized successfully!
    2. To start using your cluster, you need to run the following as a regular user:
    3. mkdir -p $HOME/.kube
    4. sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
    5. sudo chown $(id -u):$(id -g) $HOME/.kube/config
    6. You should now deploy a Pod network to the cluster.
    7. Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
    8. /docs/concepts/cluster-administration/addons/
    9. You can now join any number of machines by running the following on each node
    10. as root:
    11. kubeadm join <control-plane-host>:<control-plane-port> --token <token> --discovery-token-ca-cert-hash sha256:<hash>

    要使非 root 用户可以运行 kubectl,请运行以下命令, 它们也是 kubeadm init 输出的一部分:

    1. mkdir -p $HOME/.kube
    2. sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
    3. sudo chown $(id -u):$(id -g) $HOME/.kube/config

    或者,如果你是 root 用户,则可以运行:

    1. export KUBECONFIG=/etc/kubernetes/admin.conf

    警告:

    记录 kubeadm init 输出的 kubeadm join 命令。 你需要此命令。

    令牌用于控制平面节点和加入节点之间的相互身份验证。 这里包含的令牌是密钥。确保它的安全, 因为拥有此令牌的任何人都可以将经过身份验证的节点添加到你的集群中。 可以使用 kubeadm token 命令列出,创建和删除这些令牌。 请参阅 kubeadm 参考指南

    安装 Pod 网络附加组件

    注意:

    本节包含有关网络设置和部署顺序的重要信息。 在继续之前,请仔细阅读所有建议。

    你必须部署一个基于 Pod 网络插件的 容器网络接口 (CNI),以便你的 Pod 可以相互通信。 在安装网络之前,集群 DNS (CoreDNS) 将不会启动。

    • 注意你的 Pod 网络不得与任何主机网络重叠: 如果有重叠,你很可能会遇到问题。 (如果你发现网络插件的首选 Pod 网络与某些主机网络之间存在冲突, 则应考虑使用一个合适的 CIDR 块来代替, 然后在执行 kubeadm init 时使用 --pod-network-cidr 参数并在你的网络插件的 YAML 中替换它)。

    • 默认情况下,kubeadm 将集群设置为使用和强制使用 (基于角色的访问控制)。 确保你的 Pod 网络插件支持 RBAC,以及用于部署它的 manifests 也是如此。

    • 如果要为集群使用 IPv6(双协议栈或仅单协议栈 IPv6 网络), 请确保你的 Pod 网络插件支持 IPv6。 IPv6 支持已在 CNI v0.6.0 版本中添加。

    说明: kubeadm 应该是与 CNI 无关的,对 CNI 驱动进行验证目前不在我们的端到端测试范畴之内。 如果你发现与 CNI 插件相关的问题,应在其各自的问题跟踪器中记录而不是在 kubeadm 或 kubernetes 问题跟踪器中记录。

    一些外部项目为 Kubernetes 提供使用 CNI 的 Pod 网络,其中一些还支持。

    请参阅实现 Kubernetes 网络模型的附加组件列表。

    你可以使用以下命令在控制平面节点或具有 kubeconfig 凭据的节点上安装 Pod 网络附加组件:

    1. kubectl apply -f <add-on.yaml>

    每个集群只能安装一个 Pod 网络。

    安装 Pod 网络后,你可以通过在 kubectl get pods --all-namespaces 输出中检查 CoreDNS Pod 是否 Running 来确认其是否正常运行。 一旦 CoreDNS Pod 启用并运行,你就可以继续加入节点。

    如果你的网络无法正常工作或 CoreDNS 不在“运行中”状态,请查看 kubeadm 的 。

    默认情况下,kubeadm 启用 准入控制器来限制 kubelets 在节点注册时可以应用哪些标签。准入控制器文档描述 kubelet --node-labels 选项允许使用哪些标签。 其中 node-role.kubernetes.io/control-plane 标签就是这样一个受限制的标签, kubeadm 在节点创建后使用特权客户端手动应用此标签。 你可以使用一个有特权的 kubeconfig,比如由 kubeadm 管理的 /etc/kubernetes/admin.conf, 通过执行 kubectl label 来手动完成操作。

    控制平面节点隔离

    默认情况下,出于安全原因,你的集群不会在控制平面节点上调度 Pod。 如果你希望能够在控制平面节点上调度 Pod,例如单机 Kubernetes 集群,请运行:

    1. kubectl taint nodes --all node-role.kubernetes.io/control-plane- node-role.kubernetes.io/master-

    输出看起来像:

    这将从任何拥有 node-role.kubernetes.io/control-plane:NoSchedule 污点的节点(包括控制平面节点)上移除该污点。 这意味着调度程序将能够在任何地方调度 Pod。

    加入节点

    节点是你的工作负载(容器和 Pod 等)运行的地方。要将新节点添加到集群,请对每台计算机执行以下操作:

    • SSH 到机器

    • 成为 root (例如 sudo su -

    • 必要时安装一个运行时

    • 运行 kubeadm init 输出的命令,例如:

      1. kubeadm join --token <token> <control-plane-host>:<control-plane-port> --discovery-token-ca-cert-hash sha256:<hash>

    如果没有令牌,可以通过在控制平面节点上运行以下命令来获取令牌:

    1. kubeadm token list

    输出类似于以下内容:

    1. TOKEN TTL EXPIRES USAGES DESCRIPTION EXTRA GROUPS
    2. 8ewj1p.9r9hcjoqgajrj4gi 23h 2018-06-12T02:51:28Z authentication, The default bootstrap system:
    3. signing token generated by bootstrappers:
    4. 'kubeadm init'. kubeadm:
    5. default-node-token

    默认情况下,令牌会在 24 小时后过期。如果要在当前令牌过期后将节点加入集群, 则可以通过在控制平面节点上运行以下命令来创建新令牌:

    1. kubeadm token create

    输出类似于以下内容:

    1. 5didvk.d09sbcov8ph2amjw

    如果你没有 --discovery-token-ca-cert-hash 的值,则可以通过在控制平面节点上执行以下命令链来获取它:

    1. openssl dgst -sha256 -hex | sed 's/^.* //'

    输出类似于以下内容:

    说明: 要为 <control-plane-host>:<control-plane-port> 指定 IPv6 元组,必须将 IPv6 地址括在方括号中,例如:[2001:db8::101]:2073

    输出应类似于:

    1. [preflight] Running pre-flight checks
    2. ... (log output of join workflow) ...
    3. Node join complete:
    4. * Certificate signing request sent to control-plane and response
    5. received.
    6. * Kubelet informed of new secure connection details.
    7. Run 'kubectl get nodes' on control-plane to see this machine join.

    几秒钟后,当你在控制平面节点上执行 kubectl get nodes,你会注意到该节点出现在输出中。

    (可选)从控制平面节点以外的计算机控制集群

    为了使 kubectl 在其他计算机(例如笔记本电脑)上与你的集群通信, 你需要将管理员 kubeconfig 文件从控制平面节点复制到工作站,如下所示:

    1. scp root@<control-plane-host>:/etc/kubernetes/admin.conf .
    2. kubectl --kubeconfig ./admin.conf get nodes

    说明:

    上面的示例假定为 root 用户启用了 SSH 访问。如果不是这种情况, 你可以使用 scpadmin.conf 文件复制给其他允许访问的用户。

    admin.conf 文件为用户提供了对集群的超级用户特权。 该文件应谨慎使用。对于普通用户,建议生成一个你为其授予特权的唯一证书。 你可以使用 kubeadm alpha kubeconfig user --client-name <CN> 命令执行此操作。 该命令会将 KubeConfig 文件打印到 STDOUT,你应该将其保存到文件并分发给用户。 之后,使用 kubectl create (cluster)rolebinding 授予特权。

    (可选)将 API 服务器代理到本地主机

    如果要从集群外部连接到 API 服务器,则可以使用 kubectl proxy

    1. scp root@<control-plane-host>:/etc/kubernetes/admin.conf .
    2. kubectl --kubeconfig ./admin.conf proxy

    你现在可以在本地访问 API 服务器 http://localhost:8001/api/v1

    清理

    如果你在集群中使用了一次性服务器进行测试,则可以关闭这些服务器,而无需进一步清理。你可以使用 kubectl config delete-cluster 删除对集群的本地引用。

    但是,如果要更干净地取消配置集群, 则应首先清空节点并确保该节点为空, 然后取消配置该节点。

    删除节点

    使用适当的凭证与控制平面节点通信,运行:

    1. kubectl drain <node name> --delete-emptydir-data --force --ignore-daemonsets

    在删除节点之前,请重置 kubeadm 安装的状态:

    1. kubeadm reset

    重置过程不会重置或清除 iptables 规则或 IPVS 表。如果你希望重置 iptables,则必须手动进行:

    1. iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

    如果要重置 IPVS 表,则必须运行以下命令:

    现在删除节点:

    1. kubectl delete node <node name>

    如果你想重新开始,只需运行 kubeadm initkubeadm join 并加上适当的参数。

    你可以在控制平面主机上使用 kubeadm reset 来触发尽力而为的清理。

    有关此子命令及其选项的更多信息,请参见 参考文档。

    • 使用 验证集群是否正常运行。
    • 有关使用 kubeadm 升级集群的详细信息,请参阅升级 kubeadm 集群
    • 在 中了解有关 kubeadm 进阶用法的信息。
    • 了解有关 Kubernetes 概念和 的更多信息。
    • 有关 Pod 网络附加组件的更多列表,请参见集群网络页面。
    • 请参阅以探索其他附加组件, 包括用于 Kubernetes 集群的日志记录、监视、网络策略、可视化和控制的工具。
    • 配置集群如何处理集群事件的日志以及 在 Pod 中运行的应用程序。 有关所涉及内容的概述,请参见日志架构

    反馈

    版本偏差策略

    虽然 kubeadm 允许所管理的组件有一定程度的版本偏差, 但是建议你将 kubeadm 的版本与控制平面组件、kube-proxy 和 kubelet 的版本相匹配。

    kubeadm 中的 Kubernetes 版本偏差

    kubeadm 可以与 Kubernetes 组件一起使用,这些组件的版本与 kubeadm 相同,或者比它大一个版本。 Kubernetes 版本可以通过使用 --kubeadm init--kubernetes-version 标志或使用 --config 时的 字段指定给 kubeadm。 这个选项将控制 kube-apiserver、kube-controller-manager、kube-scheduler 和 kube-proxy 的版本。

    例子:

    • kubeadm 的版本为 1.25。
    • kubernetesVersion 必须为 1.25 或者 1.24。

    kubeadm 中 kubelet 的版本偏差

    与 Kubernetes 版本类似,kubeadm 可以使用与 kubeadm 相同版本的 kubelet, 或者比 kubeadm 老一个版本的 kubelet。

    例子:

    • kubeadm 的版本为 1.25。
    • 主机上的 kubelet 必须为 1.25 或者 1.24。

    kubeadm 支持的 kubeadm 的版本偏差

    kubeadm 命令在现有节点或由 kubeadm 管理的整个集群上的操作有一定限制。

    如果新的节点加入到集群中,用于 kubeadm join 的 kubeadm 二进制文件必须与用 kubeadm init 创建集群或用 kubeadm upgrade 升级同一节点时所用的 kubeadm 版本一致。 类似的规则适用于除了 kubeadm upgrade 以外的其他 kubeadm 命令。

    kubeadm join 的例子:

    • 使用 kubeadm init 创建集群时使用版本为 1.25 的 kubeadm。
    • 添加节点所用的 kubeadm 可执行文件为版本 。

    对于正在升级的节点,所使用的的 kubeadm 必须与管理该节点的 kubeadm 具有相同的 MINOR 版本或比后者新一个 MINOR 版本。

    kubeadm upgrade 的例子:

    • 用于创建或升级节点的 kubeadm 版本为 1.24。
    • 用于升级节点的 kubeadm 版本必须为 1.24 或 1.25。

    要了解更多关于不同 Kubernetes 组件之间的版本偏差,请参见 版本偏差策略

    集群弹性

    此处创建的集群具有单个控制平面节点,运行单个 etcd 数据库。 这意味着如果控制平面节点发生故障,你的集群可能会丢失数据并且可能需要从头开始重新创建。

    解决方法:

    • 使用多个控制平面节点。你可以阅读 选择集群拓扑提供的 高可用性

    kubeadm deb/rpm 软件包和二进制文件是为 amd64、arm (32-bit)、arm64、ppc64le 和 s390x 构建的遵循多平台提案

    从 v1.12 开始还支持用于控制平面和附加组件的多平台容器镜像。

    故障排除

    如果你在使用 kubeadm 时遇到困难, 请查阅我们的故障排除文档