定位存在资源浪费的工作负载

    通过 Erda 的多云管理平台,可快速找出浪费资源的”元凶”,对集群资源分配进行合理优化。

    请进入 多云管理平台 > 资源管理 > 集群管理 > 选择集群 > 节点列表 操作。

    对于 闲置率 的定义为已分配资源中未使用的比例。

    以分析 CPU 资源为例,选择 CPU 分析。点击 闲置率 栏降序排序,可发现闲置率最高的节点已分配 76.4% 的 CPU 资源,但实际 CPU 使用率仅为 6.5%。

    点击对应节点的 查看 Pods

    进入 Pods 列表后,可先筛选 运行中 状态的 Pod,进行资源分配的分析。

    ::: tip 提示

    通常仅有 运行中容器创建中 等状态的 Pod 才会真正占用资源,任务类 Pod 在任务完成后即进入 完成 状态,此时 Pod 所占用资源已被释放。

    :::

    点击 CPU 请求值 一栏。由于 Pod 处于运行中状态,因此 CPU 请求值已由 K8s 应允,即这部分资源已分配至该 Pod。如下图所示,分配较多资源的 Pod CPU 水位普遍较低,说明此处存在资源浪费的情况。

    定位存在资源浪费的工作负载 - 图3

    点击对应 Pod 的名称。

    进入 Pod 详情查看历史资源使用情况,可发现 Pod CPU 全天的使用率都较低,由此判断确实存在资源浪费的情况。

    定位存在资源浪费的工作负载 - 图5

    点击 Pod 详情中的工作负载。

    定位存在资源浪费的工作负载 - 图7