监控

    KubeSphere 监控引擎由 Prometheus 提供支持。出于调试目的,您可能希望通过 NodePort 访问内置的 Prometheus 服务,请运行以下命令将服务类型更改为 :

    备注

    若要访问 Prometheus 控制台,您可能需要根据您的环境开放相关端口并配置端口转发规则。

    Node Exporter 引起的主机端口 9100 冲突

    如果有进程占用主机端口 9100,kubespher-monitoring-system 下的 Node Exporter 会崩溃。若要解决冲突,您需要终止进程或将 Node Exporter 换到另一个可用端口。

    如果您已自行部署 Prometheus Operator,请确保在安装 KubeSphere 之前将 Prometheus Operator 删除。否则,可能会出现冲突,即 KubeSphere 内置的 Prometheus Operator 选择重复的 ServiceMonitor 对象。

    如何更改监控数据保留期限

    运行以下命令编辑最大保留期限。导航到 retention 字段,并设置所需保留期限(默认为 7d)。

      首先,请确保标志 --bind-address 设置为 (默认),而不是 127.0.0.1。Prometheus 可能需要从其他主机访问这些组件。

      其次,请检查 kube-schedulerkube-controller-manager 的端点对象是否存在。如果缺失,请通过创建服务和选择目标 Pod 手动创建。

      近几分钟没有监控数据

      请检查您的网络插件,并确保您的主机和 Pod 网络 CIDR 之间没有 IPPool 重叠。强烈建议您使用 KubeKey 安装 Kubernetes。

      中文读者可以参考 KubeSphere 开发者社区的了解更多信息。

      Prometheus 产生错误日志:打开存储失败、没有此文件或目录

      如果 kubesphere-monitoring-system 中的 Prometheus Pod 崩溃并产生以下错误日志,您的 Prometheus 数据可能已经损坏,需要手动删除才能恢复。

      执行进入 Prometheus Pod(如果可能),并删除目录 /prometheus/01EM0016F8FB33J63RNHFMHK3