部署 TiDB Binlog

    默认情况下,TiDB Binlog 在 TiDB 集群中处于禁用状态。若要创建一个启用 TiDB Binlog 的 TiDB 集群,或在现有 TiDB 集群中启用 TiDB Binlog,可根据以下步骤进行操作。

    可以修改 TidbCluster CR,添加 Pump 相关配置,示例如下:

    自 v1.1.6 版本起支持透传 TOML 配置给组件:

    1. ...
    2. pump:
    3. baseImage: pingcap/tidb-binlog
    4. version: v5.2.1
    5. replicas: 1
    6. storageClassName: local-storage
    7. requests:
    8. storage: 30Gi
    9. schedulerName: default-scheduler
    10. config: |
    11. addr = "0.0.0.0:8250"
    12. gc = 7
    13. heartbeat-interval = 2

    按照集群实际情况修改 versionreplicasstorageClassNamerequests.storage 等配置。

    值得注意的是,如果需要部署企业版的 Pump,需要将 上述 yaml 中 spec.pump.baseImage 配置为企业版镜像,格式为 pingcap/tidb-binlog-enterprise

    例如:

    1. spec:
    2. pump:
    3. baseImage: pingcap/tidb-binlog-enterprise

    如果在生产环境中开启 TiDB Binlog,建议为 TiDB 与 Pump 组件设置亲和性和反亲和性。如果在内网测试环境中尝试使用开启 TiDB Binlog,可以跳过此步。

    默认情况下,TiDB 和 Pump 的 affinity 亲和性设置为 {}。由于目前 Pump 组件与 TiDB 组件默认并非一一对应,当启用 TiDB Binlog 时,如果 Pump 与 TiDB 组件分开部署并出现网络隔离,而且 TiDB 组件还开启了 ignore-error,则会导致 TiDB 丢失 Binlog。推荐通过亲和性特性将 TiDB 组件与 Pump 部署在同一台 Node 上,同时通过反亲和性特性将 Pump 分散在不同的 Node 上,每台 Node 上至多仅需一个 Pump 实例。

    • spec.tidb.affinity 按照如下设置:

      1. spec:
      2. tidb:
      3. affinity:
      4. podAffinity:
      5. preferredDuringSchedulingIgnoredDuringExecution:
      6. - weight: 100
      7. podAffinityTerm:
      8. labelSelector:
      9. matchExpressions:
      10. - key: "app.kubernetes.io/component"
      11. operator: In
      12. values:
      13. - "pump"
      14. - key: "app.kubernetes.io/managed-by"
      15. operator: In
      16. values:
      17. - "tidb-operator"
      18. - key: "app.kubernetes.io/name"
      19. operator: In
      20. values:
      21. - "tidb-cluster"
      22. - key: "app.kubernetes.io/instance"
      23. operator: In
      24. values:
      25. - ${cluster_name}
      26. topologyKey: kubernetes.io/hostname
    • spec.pump.affinity 按照如下设置:

      1. spec:
      2. pump:
      3. affinity:
      4. podAffinity:
      5. preferredDuringSchedulingIgnoredDuringExecution:
      6. - weight: 100
      7. labelSelector:
      8. matchExpressions:
      9. - key: "app.kubernetes.io/component"
      10. operator: In
      11. values:
      12. - "tidb"
      13. - key: "app.kubernetes.io/managed-by"
      14. operator: In
      15. values:
      16. - "tidb-operator"
      17. - key: "app.kubernetes.io/name"
      18. operator: In
      19. values:
      20. - "tidb-cluster"
      21. - key: "app.kubernetes.io/instance"
      22. operator: In
      23. - ${cluster_name}
      24. topologyKey: kubernetes.io/hostname
      25. podAntiAffinity:
      26. preferredDuringSchedulingIgnoredDuringExecution:
      27. - weight: 100
      28. podAffinityTerm:
      29. labelSelector:
      30. matchExpressions:
      31. - key: "app.kubernetes.io/component"
      32. operator: In
      33. values:
      34. - "pump"
      35. - key: "app.kubernetes.io/managed-by"
      36. operator: In
      37. values:
      38. - "tidb-operator"
      39. - key: "app.kubernetes.io/name"
      40. operator: In
      41. values:
      42. - "tidb-cluster"
      43. - key: "app.kubernetes.io/instance"
      44. operator: In
      45. values:
      46. - ${cluster_name}
      47. topologyKey: kubernetes.io/hostname

    部署 Drainer

    可以通过 tidb-drainer Helm chart 来为 TiDB 集群部署多个 drainer,示例如下:

    1. 确保 PingCAP Helm 库是最新的:

      1. helm repo update
      1. helm search repo tidb-drainer -l
    2. 获取默认的 values.yaml 文件以方便自定义:

      1. helm inspect values pingcap/tidb-drainer --version=${chart_version} > values.yaml
    3. 修改 values.yaml 文件以指定源 TiDB 集群和 drainer 的下游数据库。示例如下:

      1. clusterName: example-tidb
      2. clusterVersion: v5.2.1
      3. baseImage: pingcap/tidb-binlog
      4. storageClassName: local-storage
      5. storage: 10Gi
      6. initialCommitTs: "-1"
      7. config: |
      8. detect-interval = 10
      9. [syncer]
      10. worker-count = 16
      11. txn-batch = 20
      12. disable-dispatch = false
      13. ignore-schemas = "INFORMATION_SCHEMA,PERFORMANCE_SCHEMA,mysql"
      14. safe-mode = false
      15. db-type = "tidb"
      16. [syncer.to]
      17. user = "root"
      18. password = ""
      19. port = 4000

      clusterNameclusterVersion 必须匹配所需的源 TiDB 集群。

      initialCommitTs 为 drainer 没有 checkpoint 时数据同步的起始 commit timestamp。该参数值必须以 string 类型配置,如 "424364429251444742"

      有关完整的配置详细信息,请参阅 。

      例如:

    4. 部署 Drainer:

      1. helm install ${release_name} pingcap/tidb-drainer --namespace=${namespace} --version=${chart_version} -f values.yaml

      如果服务器没有外网,请参考 部署 TiDB 集群 在有外网的机器上将用到的 Docker 镜像下载下来并上传到服务器上。

    如果要为 TiDB 集群及 TiDB Binlog 开启 TLS,请参考 进行配置。

    创建 secret 并启动包含 Pump 的 TiDB 集群后,修改 values.yamltlsCluster.enabled 设置为 true,并配置相应的 certAllowedCN

    1. ...
    2. tlsCluster:
    3. enabled: true
    4. # certAllowedCN:
    5. # - TiDB
    6. ...

    为 Drainer 和下游数据库间开启 TLS

    如果 tidb-drainer 的写入下游设置为 mysql/tidb,并且希望为 drainer 和下游数据库间开启 TLS,可以参考下面步骤进行配置。

    首先我们需要创建一个包含下游数据库 TLS 信息的 secret,创建方式如下:

    1. kubectl create secret generic ${downstream_database_secret_name} --namespace=${namespace} --from-file=tls.crt=client.pem --from-file=tls.key=client-key.pem --from-file=ca.crt=ca.pem

    默认情况下,tidb-drainer 会将 checkpoint 保存到下游数据库中,所以仅需配置 tlsSyncer.tlsClientSecretName 并配置相应的 certAllowedCN 即可。

    1. tlsSyncer:
    2. # certAllowedCN:
    3. # - TiDB

    如果需要将 tidb-drainer 的 checkpoint 保存到其他开启 TLS 的数据库,需要创建一个包含 checkpoint 数据库的 TLS 信息的 secret,创建方式为:

    1. kubectl create secret generic ${checkpoint_tidb_client_secret} --namespace=${namespace} --from-file=tls.crt=client.pem --from-file=tls.key=client-key.pem --from-file=ca.crt=ca.pem

    修改 values.yamltlsSyncer.checkpoint.tlsClientSecretName 设置为 ${checkpoint_tidb_client_secret},并配置相应的 certAllowedCN

    1. ...
    2. tlsSyncer: {}
    3. tlsClientSecretName: ${downstream_database_secret_name}
    4. # certAllowedCN:
    5. # - TiDB
    6. checkpoint:
    7. tlsClientSecretName: ${checkpoint_tidb_client_secret}
    8. # certAllowedCN:
    9. # - TiDB
    10. ...

    如需详细了解如何维护 TiDB Binlog 集群节点状态信息,可以参考 。

    如果需要完整移除 TiDB Binlog 组件,最好是先移除 Pump 节点,再移除 Drainer 节点。

    如果需要移除的 TiDB Binlog 组件开启了 TLS,则需要先将下述文件写入 binlog.yaml,并使用 kubectl apply -f binlog.yaml 启动一个挂载了 TLS 文件和 binlogctl 工具的 Pod。

    1. apiVersion: v1
    2. kind: Pod
    3. metadata:
    4. name: binlogctl
    5. spec:
    6. containers:
    7. - name: binlogctl
    8. image: pingcap/tidb-binlog:${tidb_version}
    9. command: ['/bin/sh']
    10. stdin: true
    11. stdinOnce: true
    12. tty: true
    13. volumeMounts:
    14. - name: binlog-tls
    15. mountPath: /etc/binlog-tls
    16. volumes:
    17. - name: binlog-tls
    18. secret:
    19. secretName: ${cluster_name}-cluster-client-secret

    缩容 Pump 需要先将单个 Pump 节点从集群中下线,然后运行 kubectl edit tc ${cluster_name} -n ${namespace} 命令将 Pump 对应的 replica 数量减 1,并对每个节点重复上述步骤。具体操作步骤如下:

    1. 下线 Pump 节点:

      假设现在有 3 个 Pump 节点,我们需要下线第 3 个 Pump 节点,将 ${ordinal_id} 替换成 2,操作方式如下(${tidb_version} 为当前 TiDB 的版本)。

      如果 Pump 没有开启 TLS,使用下述指令新建 Pod 下线 Pump。

      1. kubectl run offline-pump-${ordinal_id} --image=pingcap/tidb-binlog:${tidb_version} --namespace=${namespace} --restart=OnFailure -- /binlogctl -pd-urls=http://${cluster_name}-pd:2379 -cmd offline-pump -node-id ${cluster_name}-pump-${ordinal_id}:8250

      然后查看 Pump 的日志输出,输出 pump offline, please delete my pod 后即可确认该节点已经成功下线。

      1. kubectl logs -f -n ${namespace} ${release_name}-pump-${ordinal_id}
    2. 删除对应的 Pump Pod:

      运行 kubectl edit tc ${cluster_name} -n ${namespace} 修改文件中 spec.pump.replicas2,然后等待 Pump Pod 自动下线被删除。

    3. (可选项) 强制下线 Pump

      如果在下线 Pump 节点时遇到下线失败的情况,即执行下线操作后仍未看到 Pump pod 输出可以删除 pod 的日志,可以先进行步骤 2 调小 replicas, 等待 Pump Pod 被完全删除后,标注 Pump 状态为 offline。

      没有开启 TLS 时,使用下述指令标注状态为 offline。

      1. kubectl run update-pump-${ordinal_id} --image=pingcap/tidb-binlog:${tidb_version} --namespace=${namespace} --restart=OnFailure -- /binlogctl -pd-urls=http://${cluster_name}-pd:2379 -cmd update-pump -node-id ${cluster_name}-pump-${ordinal_id}:8250 --state offline

      如果开启了 TLS,通过下述指令使用前面开启的 pod 来标注状态为 offline。

      1. kubectl exec binlogctl -n ${namespace} -- /binlogctl -pd-urls=https://${cluster_name}-pd:2379 -cmd update-pump -node-id ${cluster_name}-pump-${ordinal_id}:8250 --state offline -ssl-ca "/etc/binlog-tls/ca.crt" -ssl-cert "/etc/binlog-tls/tls.crt" -ssl-key "/etc/binlog-tls/tls.key"

    完全移除 Pump 节点

    1. 移除 Pump 节点前,必须首先需要执行 kubectl edit tc ${cluster_name} -n ${namespace} 设置其中的 spec.tidb.binlogEnabledfalse,等待 TiDB Pod 完成重启更新后再移除 Pump 节点。如果直接移除 Pump 节点会导致 TiDB 没有可以写入的 Pump 而无法使用。
    2. 参考缩容 Pump 到 0。
    3. kubectl edit tc ${cluster_name} -n ${namespace}spec.pump 部分配置项全部删除。
    4. kubectl delete sts ${cluster_name}-pump -n ${namespace} 删除 Pump StatefulSet 资源。
    5. 通过 kubectl get pvc -n ${namespace} -l app.kubernetes.io/component=pump 查看 Pump 集群使用过的 PVC,随后使用 kubectl delete pvc -l app.kubernetes.io/component=pump -n ${namespace} 指令删除 Pump 的所有 PVC 资源。
    1. 下线 Drainer 节点:

      使用下述指令下线 Drainer 节点,${drainer_node_id} 为需要下线的 Drainer 的 node ID。如果在 Helm 的 values.yaml 中配置了 drainerName 选项,则 ${drainer_node_id}${drainer_name}-0,否则 ${drainer_node_id}${cluster_name}-${release_name}-drainer-0

      如果 Drainer 没有开启 TLS,使用下述指令新建 pod 下线 Drainer。

      1. kubectl run offline-drainer-0 --image=pingcap/tidb-binlog:${tidb_version} --namespace=${namespace} --restart=OnFailure -- /binlogctl -pd-urls=http://${cluster_name}-pd:2379 -cmd offline-drainer -node-id ${drainer_node_id}:8249

      如果 Drainer 开启了 TLS,通过下述指令使用前面开启的 pod 来下线 Drainer。

      1. kubectl exec binlogctl -n ${namespace} -- /binlogctl -pd-urls "https://${cluster_name}-pd:2379" -cmd offline-drainer -node-id ${drainer_node_id}:8249 -ssl-ca "/etc/binlog-tls/ca.crt" -ssl-cert "/etc/binlog-tls/tls.crt" -ssl-key "/etc/binlog-tls/tls.key"

      然后查看 Drainer 的日志输出,输出 drainer offline, please delete my pod 后即可确认该节点已经成功下线。

      1. kubectl logs -f -n ${namespace} ${drainer_node_id}
    2. 删除对应的 Drainer Pod:

      运行 helm uninstall ${release_name} -n ${namespace} 指令即可删除 Drainer Pod。

      如果不再使用 Drainer,使用 kubectl delete pvc data-${drainer_node_id} -n ${namespace} 指令删除该 Drainer 的 PVC 资源。

    3. (可选项) 强制下线 Drainer

      如果在下线 Drainer 节点时遇到下线失败的情况,即执行下线操作后仍未看到 Drainer pod 输出可以删除 pod 的日志,可以先进行步骤 2 删除 Drainer Pod 后,再运行下述指令标注 Drainer 状态为 offline:

        如果开启了 TLS,通过下述指令使用前面开启的 pod 来下线 Drainer。

        1. kubectl exec binlogctl -n ${namespace} -- /binlogctl -pd-urls=https://${cluster_name}-pd:2379 -cmd update-drainer -node-id ${drainer_node_id}:8249 --state offline -ssl-ca "/etc/binlog-tls/ca.crt" -ssl-cert "/etc/binlog-tls/tls.crt" -ssl-key "/etc/binlog-tls/tls.key"