使用 TiDB Lightning 恢复 GCS 上的备份数据

    本文使用的恢复方式基于 TiDB Operator v1.1 及以上的 CustomResourceDefinition (CRD) 实现,底层通过使用 TiDB Lightning TiDB-backend 来恢复数据。

    TiDB Lightning 是一款将全量数据高速导入到 TiDB 集群的工具,可用于从本地盘、Google Cloud Storage (GCS) 或 Amazon S3 云盘读取数据。目前,TiDB Lightning 支持三种后端:、Local-backendTiDB-backend。本文介绍的方法使用 TiDB-backend。关于这三种后端的区别和选择,请参阅 。如果要使用 或者 Local-backend 导入数据,请参阅使用 TiDB Lightning 导入集群数据

    以下示例将存储在 上指定路径上的集群备份数据恢复到 TiDB 集群。

    如果你需要从 GCS 导出备份数据到 TiDB 集群,并对数据恢复有以下要求,可使用本文介绍的恢复方案:

    • 希望以较低资源占用率和较低网络带宽占用进行恢复,并能接受 50 GB/小时的恢复速度
    • 要求导入集群时满足 ACID
    • 要求备份期间 TiDB 集群仍可对外提供服务

    在进行数据恢复前,你需要准备恢复环境,并拥有数据库的相关权限。

    1. 远程存储访问授权。

      参考 GCS 账号授权授权访问 GCS 远程存储。

    2. 创建 restore-demo2-tidb-secret secret,该 secret 存放用来访问 TiDB 集群的 root 账号和密钥:

    所需的数据库权限

    使用 TiDB Lightning 将 GCS 上的备份数据恢复至 TiDB 集群前,确保你拥有备份数据库的以下权限:

    1. 创建 restore custom resource (CR),将指定的备份数据恢复至 TiDB 集群:

      以上示例将存储在 GCS 上指定路径 spec.gcs.path 的备份数据恢复到 TiDB 集群 spec.to.host。关于 GCS 的配置项可以参考 GCS 字段介绍

      更多 Restore CR 字段的详细解释参考 。

    2. 创建好 CR 后可通过以下命令查看恢复的状态:

    注意

    TiDB Operator 会创建一个 PVC,用于数据恢复,备份数据会先从远端存储下载到 PV,然后再进行恢复。如果恢复完成后想要删掉这个 PVC,可以参考删除资源先把恢复 Pod 删掉,然后再把 PVC 删掉。