ZooKeeper and BookKeeper administration
- ZooKeeper 负责各种与配置和协调相关的任务。
ZooKeeper 和 BookKeeper 都是 开源项目。
每个 Pulsar 实例需要两个独立的 ZooKeeper 集群。
- 本地 ZooKeeper负责集群级别的操作,提供集群的配置管理和协调。 每个 Pulsar 集群都需要一个专用的 ZooKeeper 集群。
- 在实例层面运行,为整个系统提供配置管理(从而实现跨集群)。 配置集群可以部署在独立的机器集群,也可以和本地 Zookeeper 集群部署在同一批机器。
ZooKeeper 负责管理与 Pulsar 协调和配置相关的各种基本任务。
To deploy a Pulsar instance, you need to stand up one local ZooKeeper cluster per Pulsar cluster.
首先,将所有 ZooKeeper 服务器添加到 conf/zookeeper.conf 指定的 quorum 配置中。 在配置文件中为每个集群节点添加一个 行,其中 N
是 ZooKeeper 节点的编号。 以下是一个三节点集群的示例:
在每台主机上,您需要在每个节点的 myid
文件中指定节点 ID,默认位置在服务器的 data/zookeeper
目录 (您可以通过 参数更改文件位置)。
例如,在 Zookeeper 服务器zk1.us-west.example.com
上,你可以通过如下方式设置myid
:
$ mkdir -p data/zookeeper
$ echo 1 > data/zookeeper/myid
在服务器zk2.us-west.example.com
上,设置命令是echo 2 > data/zookeeper/myid
,以此类推。
一旦你将每台服务器添加到zookeeper.conf
配置文件,并且每台服务器都有对应的myid
,你就能使用pulsar-daemon命令去启动所有 Zookeeper 服务(如果想在后台运行命令,记得使用 nohup):
$ bin/pulsar-daemon start zookeeper
部署 Configuration Store
The ZooKeeper cluster configured and started up in the section above is a local ZooKeeper cluster that you can use to manage a single Pulsar cluster. 但是,除了本地集群之外,一个完整的 Pulsar 实例还需要 configuration store来处理一些实例级配置和协调任务。
如果是部署一个单集群实例,你不需要另外部署存储配置的 Zookeeper 集群。 但是,如果部署了 实例,则需要为配置任务设置一个单独的 ZooKeeper 集群。
单集群 Pulsar 实例
如果你的 Pulsar 实例只包含一个集群,你可以在同一批机器上部署本地 Zookeeper 集群和配置存储 Zookeeper 集群,此时这两个集群的 TCP 端口信息需要不一样。
要在单个集群实例中部署配置存储的 Zookeeper 集群。步骤跟部署一样,将同一批机器(跟本地集群一样的机器列表)信息添加到配置文件conf/global_zookeeper.conf中,但是必须确保使用不同的端口(Zookeeper 默认使用2181端口)。 以下是一个使用 2184 端口的三节点ZooKeeper 集群的示例:
clientPort=2184
server.1=zk1.us-west.example.com:2185:2186
server.2=zk2.us-west.example.com:2185:2186
server.3=zk3.us-west.example.com:2185:2186
跟之前一样,在 data/global-zoocheper/myid
文件为每个服务器创建 myid
。
多集群 Pulsar 实例
当你部署一个全球性的Pulsar实例时,集群分布在不同的地理区域。配置存储必须是一个高可用和强一致的元数据存储服务,必须能够容忍整个区域的故障和分区。
这里的关键是确保 ZK quorum 节点必须分布在至少 3 个区域,其他区域以观察员身份运行。
强调一下,配置存储集群的服务器的负载预计会非常低,所以你能够和本地的 ZooKeeper quorum 共用同一批机器。
例如,假设 Pulsar 实例由如下集群组成:us-west
, us-east
, us-central
, eu-central
, ap-south
。 并且假设每个集群自己的本地 ZK 服务器的名字格式如下:
zk[1-3].${CLUSTER}.example.com
这个方法保证即使其中一个区域无法连接,数据也可以写入配置存储服务。
所有服务器中的 ZK 配置如下:
此外,ZK 的观察者需要添加如下配置:
peerType=observer
启动服务
配置存储服务配置完成后,你可以通过来启动集群。
$ bin/pulsar-daemon start configuration-store
Zookeeper 配置项说明
在 Pulsar 的安装目录中有两个独立的 ZooKeeper 配置文件:一是使用conf/zookeeper.conf
配置文件,二是配置存储集群使用的conf/global-zookeeper.conf
配置文件。
本地 ZooKeeper
The conf/zookeeper.conf file handles the configuration for local ZooKeeper. 下表是可用的配置项列表:
Configuration Store
配置存储服务集群使用的配置文件是conf/global-zookeeper.conf。 下表是可用的配置项列表:
Pulsar 使用 BookKeeper 来存储所有的持久化消息。 BookKeeper 是一个分布式的 系统。它保证了独立消息日志读取的一致性,称为 ledger。 Individual BookKeeper servers are also called bookies.
Bookie 机器将消息数据存储在硬盘上。 为了确保最佳性能,需要确保 bookie 有合适的硬件配置。 以下是 Bookie 机器相关的两个关键的硬件指标:
- 硬盘 I/O 的读/写能力。
- 存储容量
默认情况下,在向 Pulsar Broker 返回确认消息之前,写入 bookie 的消息条目总是同步到硬盘。 To ensure low write latency, BookKeeper is designed to use multiple devices:
- A journal to ensure durability. 对于连续的写入来说,bookie 机器的fsync操作至关重要。 通常情况下,使用容量小并且读写快速的设备就足够了,也可以是带有RAID控制器和电池支持写入缓存的。 这两种方案 fsync 延时大约为0.4ms。
- A ledger storage device stores data. 写入操作是在后台运行的,所以写入的 I/O 性能不是一个大问题。 大部分的读取操作是连续的。backlog 只有在没有消费者的情况下,才会被删除。 要存储大量的数据,典型的配置是多块 HDD 硬盘和 一个RAID 控制器构建硬盘阵列。
Configure BookKeeper
你能够通过配置文件去配置 BookKeeper bookies。 配置bookie时,需要确保zkServers参数设置的是 Pulsar 集群的本地 Zookeeper 的地址的。
至少需要修改conf/bookkeeper.conf
文件的如下配置:
# Change to point to journal disk mount point
journalDirectory=data/bookkeeper/journal
# Point to ledger storage disk mount point
ledgerDirectories=data/bookkeeper/ledgers
# Point to local ZK quorum
zkServers=zk1.example.com:2181,zk2.example.com:2181,zk3.example.com:2181
#It is recommended to set this parameter. Otherwise, BookKeeper can't start normally in certain environments (for example, Huawei Cloud).
如果需要更改 BookKeeper 使用的 ZooKeeper 中的根路径,需要使用zkLedgersRootPath=/MY-PREFIX/ledgers
,而不是zkServers=localhost:2181/MY-PREFIX
。
部署 Bookkeeper
BookKeeper provides persistent message storage for Pulsar. 每个 Pulsar Broker 都有属于自己的 bookie。 The BookKeeper cluster shares a local ZooKeeper quorum with the Pulsar cluster.
你可以在前台或者后台启动 bookie。
可以使用命令行工具在前台启动 bookie。
$ bin/bookkeeper bookie
To start a bookie in the background, use the pulsar-daemon CLI tool:
$ bin/bookkeeper shell bookiesanity
使用这个命令的时候,底层的机制是在本地的 bookie 创建新的 ledger ,往里面写一些新的条目,然后读取它,最后删除这个ledger。
下线 bookie
下线 bookie 之前,你必须检查你的环境并满足以下要求:
Ensure the state of your cluster supports decommissioning the target bookie. Check if
EnsembleSize >= Write Quorum >= Ack Quorum
istrue
with one less bookie.确保目标 bookie 在命令列出的 bookie 列表中,
确保没有其他的程序正在运行(比如升级)。
And then you can decommission bookies safely. To decommission bookies, complete the following steps.
Log in to the bookie node, check if there are underreplicated ledgers. The decommission command force to replicate the underreplicated ledgers.
$ bin/bookkeeper shell listunderreplicated
Stop the bookie by killing the bookie process. Make sure that no liveness/readiness probes setup for the bookies to spin them back up if you deploy it in a Kubernetes environment.
运行下线命令。
- 如果你已经登录到了目标节点,则不需要指定参数
-bookieid
。 - 如果你希望从其他 bookie 节点执行目标 bookie 节点下线命令,需要在
-bookieid
参数中指定目标 bookie ID:$ bin/bookkeeper shell decommissionbookie
或$ bin/bookkeeper shell decommissionbookie -bookieid <target bookieid>
- 如果你已经登录到了目标节点,则不需要指定参数
- Validate that no ledgers are on the decommissioned bookie.
$ bin/bookkeeper shell listledgers -bookieid <target bookieid>
你可以通过运行一下命令检查下线的 bookie 是否还在 bookie 列表中:
./bookkeeper shell listbookies -rw -h
./bookkeeper shell listbookies -ro -h
In Pulsar, you can set persistence policies at the namespace level, which determines how BookKeeper handles persistent storage of messages. Policies determine four things:
- 每个 ledger entry 的等待 ack 数 (保证数据保存成功)
- 主题使用的的 bookie 数量。
- 每个ledger entry 的写入次数。
- 标记删除操作的限流率。
设置持久化策略
You can set persistence policies for BookKeeper at the level.
Pulsar-admin
Use the subcommand and specify a namespace as well as any policies that you want to apply. The available flags are:
标记 | 说明 | 默认值 |
---|---|---|
-a , —bookkeeper-ack-quorum | 每个 ledger entry 的等待 ack 数 (保证数据保存成功) | 0 |
-e , —bookkeeper-ensemble | 主题在命名空间中使用的bookie数量 | 0 |
-w , —bookkeeper-write-quorum | 每个 ledger entry 的写入次数 | 0 |
-r , —ml-mark-delete-max-rate | 标记删除操作的限流频率(0表示不限制) | 0 |
如下所示:
$ pulsar-admin namespaces set-persistence my-tenant/my-ns \
--bookkeeper-ack-quorum 3 \
--bookkeeper-ensemble 2
REST API
POST /admin/v2/namespaces/:tenant/:namespace/persistence
Java
int bkEnsemble = 2;
int bkQuorum = 3;
int bkAckQuorum = 2;
double markDeleteRate = 0.7;
PersistencePolicies policies =
new PersistencePolicies(ensemble, quorum, ackQuorum, markDeleteRate);
You can see which persistence policy currently applies to a namespace.
Pulsar-admin
Use the subcommand and specify the namespace.
如下所示:
REST API
Java
This diagram illustrates the role of ZooKeeper and BookKeeper in a Pulsar cluster:
Each Pulsar cluster consists of one or more message brokers. Each broker relies on an ensemble of bookies.