INSPECTION_SUMMARY
在部分场景下,用户只需要关注特定链路或模块的监控汇总。例如当前 Coprocessor 配置的线程池为 8,如果 Coprocessor 的 CPU 使用率达到了 750%,就可以确定存在风险,或者可能提前成为瓶颈。但是部分监控会因为用户的 workload 不同而差异较大,所以难以定义确定的阈值。排查这部分场景的问题也非常重要,所以 TiDB 提供了 inspection_summary
来进行链路汇总。
诊断汇总表 information_schema.inspection_summary
的表结构如下:
RULE
:汇总规则。由于规则在持续添加,最新的规则列表可以通过select * from inspection_rules where type='summary'
查询。METRICS_NAME
:监控表的名字。COMMENT
:对应监控的解释。
诊断结果表和诊断监控汇总表都可以通过 hint
的方式指定诊断的时间范围,例如 select /*+ time_range('2020-03-07 12:00:00','2020-03-07 13:00:00') */* from inspection_summary
是对 2020-03-07 12:00:00 - 2020-03-07 13:00:00 时间段的监控汇总。和监控汇总表一样,inspection_summary
系统表也可以通过对比两个不同时间段的数据,快速发现差异较大的监控项。
以下为一个例子,对比以下两个时间段,读系统链路的监控项:
(2020-01-16 16:10:54.933, 2020-01-16 16:20:54.933)