答案是肯定的,为了达到上面提到的目标,PingCAP 把一些常见问题的现象、原因、解决办法以及涉及到的版本归纳总结到一张思维导图中,我们叫做 diagnose-map。用户可以参考导图来快速定位和解决自己遇到的问题。其中包括了 7 大系列的几十中常见问题,并且还在逐步补充中。

    TiDB 集群问题导图是一个思维导图,汇集了各个模块常见的一些问题。 该导图中把各个模块的问题进行了分类,比如把引起 TiKV OOM 问题的一些潜在原因以及解决方案放在一起,把导致 PD 选举问题的一些潜在原因和解决办法放在一起等等。另外也把两种常见的现象,服务不可用和 latency 明显增高作为两个单独的分支,用户可以从这两个分支出发寻找潜在的问题。举个例子,比如客户端收到 region is unavailable 错误,1.1.1 解释了导致该错误的原理是怎样的,然后列举了 4 种可能导致该问题的原因,用户可以根据自己集群的现象对号入座,按照流程来分析和解决自己遇到的问题。

    由于 TiDB 一直在快速迭代中,该导图不可能把所有可能的问题都提前列出来,只能是一点点完善,如果在该导图中找不到答案的问题可以搜索官方文档或者在 askTUG 上发帖子询问。