HAProxy 在 TiDB 中的最佳实践

    本文介绍 HAProxy 在 TiDB 中的最佳配置和使用方法。HAProxy 提供 TCP 协议下的负载均衡能力,TiDB 客户端通过连接 HAProxy 提供的浮动 IP 即可对数据进行操作,实现 TiDB Server 层的负载均衡。

    HAProxy 是由 C 语言编写的自由开放源码的软件,为基于 TCP 和 HTTP 协议的应用程序提供高可用性、负载均衡和代理服务。因为 HAProxy 能够快速、高效使用 CPU 和内存,所以目前使用非常广泛,许多知名网站诸如 GitHub、Bitbucket、Stack Overflow、Reddit、Tumblr、Twitter 和 Tuenti 以及亚马逊网络服务系统都在使用 HAProxy。

    HAProxy 由 Linux 内核的核心贡献者 Willy Tarreau 于 2000 年编写,他现在仍然负责该项目的维护,并在开源社区免费提供版本迭代。本文示例使用 HAProxy 。推荐使用最新稳定版的 HAProxy,详情见已发布的 HAProxy 版本

    • :HAProxy 提供优雅关闭服务和无缝切换的高可用功能;
    • 负载均衡:L4 (TCP) 和 L7 (HTTP) 两种负载均衡模式,至少 9 类均衡算法,比如 roundrobin,leastconn,random 等;
    • :对 HAProxy 配置的 HTTP 或者 TCP 模式状态进行检查;
    • 会话保持:在应用程序没有提供会话保持功能的情况下,HAProxy 可以提供该项功能;
    • :支持 HTTPS 通信和解析;
    • 监控与统计:通过 web 页面可以实时监控服务状态以及具体的流量信息。

    在部署 HAProxy 之前,需准备好以下环境。

    根据官方文档,对 HAProxy 的服务器硬件配置有以下建议,也可以根据负载均衡环境进行推算,在此基础上提高服务器配置。

    依赖软件

    操作系统

    依赖包

    • epel-release
    • gcc
    • systemd-devel

    执行如下命令安装依赖包:

    HAProxy 配置 Database 负载均衡场景操作简单,以下部署操作具有普遍性,不具有特殊性,建议根据实际场景,个性化配置相关的配置文件

    1. 下载 HAProxy 2.5.0 的源码包:

      1. 解压源码包:

        1. unzip v2.5.0.zip
      2. 从源码编译 HAProxy 应用:

      3. 重新配置 profile 文件:

        1. echo 'export PATH=/app/haproxy/bin:$PATH' >> /etc/profile
        1. which haproxy

      HAProxy 命令介绍

      执行如下命令查看命令行参数及基本用法:

      更多有关 HAProxy 命令参数的信息,可参阅 Management Guide of HAProxy 和 。

      配置 HAProxy

      yum 安装过程中会生成配置模版,你也可以根据实际场景自定义配置如下配置项。

      1. global # 全局配置。
      2. log 127.0.0.1 local2 # 定义全局的 syslog 服务器,最多可以定义两个。
      3. chroot /var/lib/haproxy # 更改当前目录并为启动进程设置超级用户权限,从而提高安全性。
      4. pidfile /var/run/haproxy.pid # 将 HAProxy 进程的 PID 写入 pidfile。
      5. maxconn 256 # 每个 HAProxy 线程可接受的最大并发连接数。
      6. nbthread 48 # 最大线程数。线程数的上限与 CPU 数量相同。
      7. user haproxy # 同 UID 参数。
      8. group haproxy # 同 GID 参数,建议使用专用用户组。
      9. daemon # 让 HAProxy 以守护进程的方式工作于后台,等同于命令行参数“-D”的功能。当然,也可以在命令行中用“-db”参数将其禁用。
      10. stats socket /var/lib/haproxy/stats # 统计信息保存位置。
      11. defaults # 默认配置。
      12. log global # 日志继承全局配置段的设置。
      13. retries 2 # 向上游服务器尝试连接的最大次数,超过此值便认为后端服务器不可用。
      14. timeout connect 2s # HAProxy 与后端服务器连接超时时间。如果在同一个局域网内,可设置成较短的时间。
      15. listen admin_stats # frontend 和 backend 的组合体,此监控组的名称可按需进行自定义。
      16. bind 0.0.0.0:8080 # 监听端口。
      17. mode http # 监控运行的模式,此处为 `http` 模式。
      18. option httplog # 开始启用记录 HTTP 请求的日志功能。
      19. maxconn 10 # 最大并发连接数。
      20. stats refresh 30s # 每隔 30 秒自动刷新监控页面。
      21. stats uri /haproxy # 监控页面的 URL。
      22. stats realm HAProxy # 监控页面的提示信息。
      23. stats auth admin:pingcap123 # 监控页面的用户和密码,可设置多个用户名。
      24. stats hide-version # 隐藏监控页面上的 HAProxy 版本信息。
      25. stats admin if TRUE # 手工启用或禁用后端服务器(HAProxy 1.4.9 及之后版本开始支持)。
      26. listen tidb-cluster # 配置 database 负载均衡。
      27. bind 0.0.0.0:3390 # 浮动 IP 和 监听端口。
      28. mode tcp # HAProxy 要使用第 4 层的传输层。
      29. balance leastconn # 连接数最少的服务器优先接收连接。`leastconn` 建议用于长会话服务,例如 LDAP、SQL、TSE 等,而不是短会话协议,如 HTTP。该算法是动态的,对于启动慢的服务器,服务器权重会在运行中作调整。
      30. server tidb-1 10.9.18.229:4000 check inter 2000 rise 2 fall 3 # 检测 4000 端口,检测频率为每 2000 毫秒一次。如果 2 次检测为成功,则认为服务器可用;如果 3 次检测为失败,则认为服务器不可用。
      31. server tidb-2 10.9.39.208:4000 check inter 2000 rise 2 fall 3
      32. server tidb-3 10.9.64.166:4000 check inter 2000 rise 2 fall 3

      要启动 HAProxy,执行 haproxy 命令。默认读取 /etc/haproxy/haproxy.cfg(推荐)。

      1. haproxy -f /etc/haproxy/haproxy.cfg

      停止 HAProxy

      要停止 HAProxy,使用 kill -9 命令。

      1. 执行如下命令: