什么是bvar?

是多线程环境下的计数器类库,方便记录和查看用户程序中的各类数值,它利用了thread local存储减少了cache bouncing,相比UbMonitor(百度内的老计数器库)几乎不会给程序增加性能开销,也快于竞争频繁的原子操作。brpc集成了bvar,/vars可查看所有曝光的bvar,可查阅某个bvar,在brpc中的使用方法请查看vars。brpc大量使用了bvar提供统计数值,当你需要在多线程环境中计数并展现时,应该第一时间想到bvar。但bvar不能代替所有的计数器,它的本质是把写时的竞争转移到了读:读得合并所有写过的线程中的数据,而不可避免地变慢了。当你读写都很频繁或得基于最新值做一些逻辑判断时,你不应该用bvar。

为了理解bvar的原理,你得先阅读,其中提到的计数器例子便是bvar。当很多线程都在累加一个计数器时,每个线程只累加私有的变量而不参与全局竞争,在读取时累加所有线程的私有变量。虽然读比之前慢多了,但由于这类计数器的读多为低频的记录和展现,慢点无所谓。而写就快多了,极小的开销使得用户可以无顾虑地使用bvar监控系统,这便是我们设计bvar的目的。

下图是bvar和原子变量,静态UbMonitor,动态UbMonitor在被多个线程同时使用时的开销。可以看到bvar的耗时基本和线程数无关,一直保持在极低的水平(~20纳秒)。而动态UbMonitor在24核时每次累加的耗时达7微秒,这意味着使用300次bvar的开销才抵得上使用一次动态UbMonitor变量。

监控bvar

其中:

  • bvar定期把被监控的项目打入$PWD/monitor/目录下的文件(用log指代)。此处的log和普通的log的不同点在于是bvar导出是覆盖式的,而不是添加式的。
  • 监控系统(用noah指代)收集导出的文件,汇总至全局并生成曲线。建议APP做到如下监控要求:

  • Latency: 系统对外的每个RPC接口的latency(平均和分位值),系统依赖的每个后台的每个RPC接口的latency
  • QPS: 系统对外的每个RPC接口的QPS信息,系统依赖的每个后台的每个RPC接口的QPS信息增加C++ bvar的方法请看快速介绍. bvar默认统计了进程、系统的一些变量,以process, system等开头,比如:

打开bvar的以导出所有的bvar到文件,格式就入上文一样,每行是一对"名字:值"。打开dump功能后应检查monitor/下是否有数据,比如:

监控系统会把定期把单机导出数据汇总到一起,并按需查询。这里以百度内的noah为例,bvar定义的变量会出现在noah的指标项中,用户可勾选并查看历史曲线。

bvar导出到其它监控系统格式