数据备份

为了有效地减少可能的人为错误，您应该提前仔细的准备备份和数据还原的策略.

不同公司有不同的可用资源和业务需求，因此不存在一个通用的解决方案可以应对各种情况下的ClickHouse备份和恢复。适用于 1GB 数据的方案可能并不适用于几十 PB 数据的情况。有多种具备各自优缺点的可能方法，将在下面对其进行讨论。最好使用几种方法而不是仅仅使用一种方法来弥补它们的各种缺点。。

注

通常摄入到ClickHouse的数据是通过某种持久队列传递的，例如 Apache Kafka. 在这种情况下，可以配置一组额外的订阅服务器，这些订阅服务器将在写入ClickHouse时读取相同的数据流，并将其存储在冷存储中。大多数公司已经有一些默认推荐的冷存储，可能是对象存储或分布式文件系统，如 .

某些本地文件系统提供快照功能（例如, ZFS），但它们可能不是提供实时查询的最佳选择。一个可能的解决方案是使用这种文件系统创建额外的副本，并将它们与用于查询的表分离。任何修改数据的查询都无法访问此类副本上的快照。作为回报，这些副本可能具有特殊的硬件配置，每个服务器附加更多的磁盘，这将是经济高效的。

clickhouse-copier 是一个多功能工具，最初创建它是为了用于重新切分pb大小的表。因为它能够在ClickHouse表和集群之间可靠地复制数据，所以它也可用于备份和还原数据。

ClickHouse允许使用查询以创建表分区的本地副本。这是利用硬链接(hardlink)到文件夹中实现的，所以它通常不会因为旧数据而占用额外的磁盘空间。创建的文件副本不由ClickHouse服务器处理，所以你可以把它们留在那里：你将有一个简单的备份，不需要任何额外的外部系统，但它仍然容易出现硬件问题。出于这个原因，最好将它们远程复制到另一个位置，然后删除本地副本。分布式文件系统和对象存储仍然是一个不错的选择，但是具有足够大容量的正常附加文件服务器也可以工作（在这种情况下，传输将通过网络文件系统或者也许是来进行).

数据可以使用从备份中恢复。

有关与分区操作相关的查询的详细信息，请参阅更改文档.