监控
- 如何访问 KubeSphere Prometheus 控制台
- 与现有的 Prometheus Operator 相冲突
- 近几分钟没有监控数据
- Prometheus 产生错误日志:打开存储失败、没有此文件或目录
KubeSphere 监控引擎由 Prometheus 提供支持。出于调试目的,您可能希望通过 NodePort 访问内置的 Prometheus 服务,请运行以下命令将服务类型更改为 :
备注
若要访问 Prometheus 控制台,您可能需要根据您的环境开放相关端口并配置端口转发规则。
Node Exporter 引起的主机端口 9100 冲突
如果有进程占用主机端口 9100,kubespher-monitoring-system
下的 Node Exporter 会崩溃。若要解决冲突,您需要终止进程或将 Node Exporter 换到另一个可用端口。
如果您已自行部署 Prometheus Operator,请确保在安装 KubeSphere 之前将 Prometheus Operator 删除。否则,可能会出现冲突,即 KubeSphere 内置的 Prometheus Operator 选择重复的 ServiceMonitor 对象。
如何更改监控数据保留期限
运行以下命令编辑最大保留期限。导航到 retention
字段,并设置所需保留期限(默认为 7d
)。
首先,请确保标志 --bind-address
设置为 (默认),而不是 127.0.0.1
。Prometheus 可能需要从其他主机访问这些组件。
其次,请检查 kube-scheduler
和 kube-controller-manager
的端点对象是否存在。如果缺失,请通过创建服务和选择目标 Pod 手动创建。
近几分钟没有监控数据
请检查您的网络插件,并确保您的主机和 Pod 网络 CIDR 之间没有 IPPool 重叠。强烈建议您使用 KubeKey 安装 Kubernetes。
中文读者可以参考 KubeSphere 开发者社区的了解更多信息。
Prometheus 产生错误日志:打开存储失败、没有此文件或目录
如果 kubesphere-monitoring-system
中的 Prometheus Pod 崩溃并产生以下错误日志,您的 Prometheus 数据可能已经损坏,需要手动删除才能恢复。
执行进入 Prometheus Pod(如果可能),并删除目录 /prometheus/01EM0016F8FB33J63RNHFMHK3
: