管理系统资源

    在开始前:

    • 确保主机上运行了libvirtd守护进程。
    • 用virsh list —all命令确认虚拟机已经被定义。

    概述

    虚拟化环境下,同一主机上的多个虚拟机竞争使用物理CPU。为了防止某些虚拟机占用过多的物理CPU资源,影响相同主机上其他虚拟机的性能,需要平衡虚拟机vCPU的调度,避免物理CPU的过度竞争。

    CPU份额表示一个虚拟机竞争物理CPU计算资源的能力大小总和。用户通过调整cpu_shares值能够设置虚拟机抢占物理CPU资源的能力。cpu_shares值无单位,是一个相对值。虚拟机获得的CPU计算资源,是与其他虚拟机的CPU份额,按相对比例,瓜分物理CPU除预留外可用计算资源。通过调整CPU份额来保证虚拟机CPU计算资源服务质量。

    操作步骤

    通过修改分配给虚拟机的运行时间的cpu_shares值,来平衡vCPU之间的调度。

    • 查看虚拟机的当前CPU份额:

    • 在线修改:修改处于running状态的虚拟机的当前CPU份额,使用带—live参数的virsh schedinfo命令:

      比如将正在运行的虚拟机openEulerVM的CPU份额从1024改为2048:

      1. $ virsh schedinfo openEulerVM --live cpu_shares=2048
      2. Scheduler : posix
      3. cpu_shares : 2048
      4. vcpu_period : 100000
      5. vcpu_quota : -1
      6. emulator_period: 100000
      7. emulator_quota : -1
      8. global_period : 100000
      9. global_quota : -1
      10. iothread_period: 100000
      11. iothread_quota : -1

      对cpu_shares值的修改立即生效,虚拟机openEulerVM能得到的运行时间将是原来的2倍。但是这一修改将在虚拟机关机并重新启动后失效。

    • 持久化修改:在libvirt内部配置中修改虚拟机的CPU份额,使用带—config参数的virsh schedinfo命令:

      1. $ virsh schedinfo <VMInstance> --config cpu_shares=<number>

      比如将虚拟机openEulerVM的CPU份额从1024改为2048:

      1. $ virsh schedinfo openEulerVM --config cpu_shares=2048
      2. Scheduler : posix
      3. cpu_shares : 2048
      4. vcpu_period : 0
      5. vcpu_quota : 0
      6. emulator_period: 0
      7. emulator_quota : 0
      8. global_period : 0
      9. global_quota : 0
      10. iothread_period: 0
      11. iothread_quota : 0

      对cpu_shares值的修改不会立即生效,在虚拟机openEulerVM下一次启动后才生效,并持久生效。虚拟机openEulerVM能得到的运行时间将是原来的2倍。

    绑定QEMU进程至物理CPU

    概述

    QEMU主进程绑定特性是将QEMU主进程绑定到特定的物理CPU范围内,从而保证了运行不同业务的虚拟机不会干扰到邻位虚拟机。例如在一个典型的云计算场景中,一台物理机上会运行多台虚拟机,而每台虚拟机的业务不同,造成了不同程度的资源占用,为了避免存储IO密集的虚拟机对邻位虚拟机的干扰,需要将不同虚拟机处理IO的存储进程完全隔离,由于QEMU主进程是处理前后端的主要服务进程,故需要实现隔离。

    操作步骤

    通过virsh emulatorpin命令可以绑定QEMU主进程到物理CPU。

    • 查看QEMU进程当前绑定的物理CPU范围:

      1. $ virsh emulatorpin openEulerVM
      2. emulator: CPU Affinity
      3. ----------------------------------
      4. *: 0-63

      这说明虚拟机openEulerVM对应的QEMU主进程可以在主机的所有物理CPU上调度。

    • 在线绑定:修改处于running状态的虚拟机对应的QEMU进程的绑定关系,使用带—live参数的vcpu emulatorpin命令:

      1. $ virsh emulatorpin openEulerVM --live 2-3
      2. $ virsh emulatorpin openEulerVM
      3. emulator: CPU Affinity
      4. ----------------------------------
      5. *: 2-3

      以上命令把虚拟机openEulerVM对应的QEMU进程绑定到物理CPU2、3上,即限制了QEMU进程只在这两个物理CPU上调度。这一绑定关系的调整立即生效,但在虚拟机关机并重新启动后失效。

    • 持久化绑定:在libvirt内部配置中修改虚拟机对应的QEMU进程的绑定关系,使用带—config参数的virsh emulatorpin命令:

      1. $ virsh emulatorpin openEulerVM --config 0-3,^1
      2. $ virsh emulatorpin openEulerVM --config
      3. emulator: CPU Affinity
      4. ----------------------------------

      以上命令把虚拟机openEulerVM对应的QEMU进程绑定到物理CPU0、2、3上,即限制了QEMU进程只在这三个物理CPU上调度。这一绑定关系的调整不会立即生效,在虚拟机下一次启动后才生效,并持久生效

    概述

    操作步骤

    通过virsh vcpupin命令可以调整vCPU和物理CPU的绑定关系。

    • 查看虚拟机的当前vCPU绑定信息:

      这说明虚拟机openEulerVM的所有vCPU可以在主机的所有物理CPU上调度。

    • 在线调整:修改处于running状态的虚拟机的当前vCPU绑定关系,使用带—live参数的vcpu vcpupin命令:

      1. $ virsh vcpupin openEulerVM --live 0 2-3
      2. $ virsh vcpupin openEulerVM
      3. VCPU CPU Affinity
      4. ----------------------
      5. 0 2-3
      6. 2 0-63
      7. 3 0-63

      以上命令把虚拟机openEulerVM的vCPU0绑定到PCPU2、3上,即限制了vCPU0只在这两个物理CPU上调度。这一绑定关系的调整立即生效,但在虚拟机关机并重新启动后失效。

    • 持久化调整:在libvirt内部配置中修改虚拟机的vCPU绑定关系,使用带—config参数的virsh vcpupin命令:

      1. $ virsh vcpupin openEulerVM --config 0 0-3,^1
      2. $ virsh vcpupin openEulerVM --config
      3. VCPU CPU Affinity
      4. ----------------------
      5. 0 0,2-3
      6. 1 0-63
      7. 2 0-63
      8. 3 0-63

      以上命令把虚拟机openEulerVM的vCPU0绑定到物理CPU0、2、3上,即限制了vCPU0只在这三个物理CPU上调度。这一绑定关系的调整不会立即生效,在虚拟机下一次启动后才生效,并持久生效

    CPU热插

    概述

    在线增加(热插)虚拟机CPU是指在虚拟机处于运行状态下,为虚拟机热插CPU而不影响虚拟机正常运行的方案。当虚拟机内部业务压力不断增大,会出现所有CPU均处于较高负载的情形。为了不影响虚拟机内的正常业务运行,可以使用CPU热插功能(在不关闭虚拟机情况下增加虚拟机的CPU数目),提升虚拟机的计算能力。

    约束限制

    • 如果处理器为AArch64架构,创建虚拟机时指定的虚拟机芯片组类型(machine)需为virt-4.1或virt更高版本。如果处理器为x86_64架构,创建虚拟机时指定的虚拟机芯片组类型(machine)需为pc-i440fx-1.5或pc更高版本。
    • 在配置Guest NUMA的场景中,必须把属于同一个socket的vcpu配置在同一vNode中,否则热插CPU后可能导致虚拟机softlockup,进而可能导致虚拟机panic。
    • 虚拟机在迁移、休眠唤醒、快照过程中均不支持CPU热插。
    • 虚拟机CPU热插是否自动上线取决于虚拟机操作系统自身逻辑,虚拟化层不保证热插CPU自动上线。
    • CPU热插同时受限于Hypervisor和GuestOS支持的最大CPU数目。
    • 虚拟机启动、关闭、重启过程中可能出现热插CPU失效的情况,但再次重启会生效。
    • 热插虚拟机CPU的时候,如果新增CPU数目不是虚拟机CPU拓扑配置项中Cores的整数倍,可能会导致虚拟机内部看到的CPU拓扑是混乱的,建议每次新增的CPU数目为Cores的整数倍。
    • 若需要热插CPU在线生效且在虚拟机重启后仍有效,virsh setvcpus接口中需要同时传入—config和—live选项, 将热插CPU动作持久化。

    操作步骤

    一、配置虚拟机XML

    1. 使用CPU热插功能,需要在创建虚拟机时配置虚拟机当前的CPU数目、虚拟机所支持的最大CPU数目,以及虚拟机芯片组类型(对于AArch64架构,需为virt-4.1及以上版本。对于x86_64架构,需为pc-i440fx-1.5及以上版本)。这里以AArch64架构虚拟机为例,配置模板如下:

      1. <domain type='kvm'>
      2. ...
      3. <vcpu placement='static' current='m'>n</vcpu>
      4. <os>
      5. <type arch='aarch64' machine='virt-4.1'>hvm</type>
      6. </os>
      7. ...
      8. <domain>

      例如,配一个虚拟机当前CPU数目为4,最大支持的热插CPU上限为64的XML配置为:

      1. <domain type='kvm'>
      2. ……
      3. <vcpu placement='static' current='4'>64</vcpu>
      4. <os>
      5. <type arch='aarch64' machine='virt-4.1'>hvm</type>
      6. </os>
      7. ……

    二、热插并上线CPU

    1. 如果热插CPU后需要自动上线热插的CPU,可以使用root权限在虚拟机内部创建udev rules文件/etc/udev/rules.d/99-hotplug-cpu.rules,并在其中定义udev规则,内容参考如下:

      1. # automatically online hot-plugged cpu
      2. ACTION=="add", SUBSYSTEM=="cpu", ATTR{online}="1"

      说明: 如果没有使用udev rules自动上线热插CPU,可以在热插CPU后,使用root权限,参考如下命令手动上线:

      1. for i in `grep -l 0 /sys/devices/system/cpu/cpu*/online`
      2. do
      3. echo 1 > $i
      4. done
    2. 利用virsh工具进行虚拟机CPU热插操作。例如给虚拟机openEulerVM热插CPU到6,且在线生效的参考命令如下:

      1. virsh setvcpus openEulerVM 6 --live

    传统的多核运算使用SMP(Symmetric Multi-Processor)模式:将多个处理器与一个集中的存储器和I/O总线相连。所有处理器只能访问同一个物理存储器,因此SMP系统也被称为一致存储器访问(UMA)系统。一致性指无论在什么时候,处理器只能为内存的每个数据保持或共享唯一一个数值。很显然,SMP的缺点是可伸缩性有限,因为在存储器和I/O接口达到饱和的时候,增加处理器并不能获得更高的性能。

    NUMA(Non Uniform Memory Access Architecture) 模式是一种分布式存储器访问方式,处理器可以同时访问不同的存储器地址,大幅度提高并行性。 NUMA模式下,处理器被划分成多个“节点”(NODE), 每个节点分配一块本地存储器空间。所有节点中的处理器都可以访问全部的物理存储器,但是访问本节点内的存储器所需要的时间,比访问某些远程节点内的存储器所花的时间要少得多。

    配置Host-NUMA

    操作步骤

    • 查看host的NUMA拓扑结构:

      1. $ numactl -H
      2. available: 4 nodes (0-3)
      3. node 0 cpus: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
      4. node 0 size: 31571 MB
      5. node 0 free: 17095 MB
      6. node 1 cpus: 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
      7. node 1 size: 32190 MB
      8. node 1 free: 28057 MB
      9. node 2 cpus: 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
      10. node 2 size: 32190 MB
      11. node 2 free: 10562 MB
      12. node 3 free: 272 MB
      13. node distances:
      14. node 0 1 2 3
      15. 0: 10 15 20 20
      16. 1: 15 10 20 20
      17. 2: 20 20 10 15
      18. 3: 20 20 15 10
    • 在虚拟机XML配置文件中添加numatune字段,创建并启动虚拟机。例如使用主机上的NUMA node 0给虚拟机分配内存,配置参数如下:

      1. <numatune>
      2. <memory mode="strict" nodeset="0"/>
      3. </numatune>

      假设虚拟机的vCPU也绑定在NODE0的物理CPU上,就可以避免由于vCPU访问远端内存带来的性能下降。

      管理系统资源 - 图4 说明:

      • 分配给虚拟机的内存不要超过该NUMA节点剩余的可用内存,否则可能导致虚拟机启动失败。
      • 建议虚拟机内存和vCPU都绑定在同一NUMA节点,避免vCPU访问远端内存造成性能下降。例如将上例中vCPU也绑定在NUMA node 0上。

    虚拟机中运行的很多业务软件都针对NUMA架构进行了性能优化,尤其是对于大规格虚拟机,这种优化的作用更明显。openEuler提供了Guest NUMA特性,在虚拟机内部呈现出NUMA拓扑结构。用户可以通过识别这个结构,对业务软件的性能进行优化,从而保证业务更好的运行。

    配置Guest NUMA时可以指定vNode的内存在HOST上的分配位置,实现内存的分块绑定,同时配合vCPU绑定,使vNode上的vCPU和内存在同一个物理NUMA node上。

    操作步骤

    在虚拟机的XML配置文件中,配置了Guest NUMA后,就可以在虚拟机内部查看NUMA拓扑结构。项是Guest NUMA的必配项。

    1. <cputune>
    2. <vcpupin vcpu='0' cpuset='0-3'/>
    3. <vcpupin vcpu='1' cpuset='0-3'/>
    4. <vcpupin vcpu='2' cpuset='16-19'/>
    5. <vcpupin vcpu='3' cpuset='16-19'/>
    6. </cputune>
    7. <numatune>
    8. <memnode cellid="0" mode="strict" nodeset="0"/>
    9. <memnode cellid="1" mode="strict" nodeset="1"/>
    10. </numatune>
    11. [...]
    12. <cpu>
    13. <numa>
    14. <cell id='0' cpus='0-1' memory='2097152'/>
    15. <cell id='1' cpus='2-3' memory='2097152'/>
    16. </numa>
    17. </cpu>

    内存热插

    概述

    在虚拟化场景下,虚拟机的内存、CPU、外部设备都是软件模拟呈现的,因此可以在虚拟化底层为虚拟机提供内存在线调整的能力。当前openEuler版本支持在线给虚拟机添加内存,当虚拟机出现物理内存不足又无法关闭虚拟机的时候,可以使用此特性增加虚拟机的物理内存资源。

    约束限制

    • 创建虚拟机的时候,AArch64平台上指定的主板类型(machine)需为virt-4.1或更高virt以上,x86平台上指定的主板类型需要为pc-i440fx-1.5以上版本。
    • 内存热插特性依赖于Guest NUMA,虚拟机必须配置Guest NUMA,否则无法完成内存热插流程。
    • 热插内存时候必须指定新增内存所属的Gust NUMA node编号,否则内存热插失败。
    • 虚拟机内核必须支持内存热插能力,否则虚拟机无法识别新增内存或者无法上线内存。
    • 配置使用大页的虚拟机,热插内存的容量必须是系统hugepagesz的整数倍,否则会导致热插失败。
    • 热插内存的大小必须为Guest物理内存块大小block_size_bytes的整数倍,否则无法正常上线。在Guest内部执行lsmem可以获取block_size_bytes大小。
    • 配置n个virtio-net网卡后,最大可热插次数取值为min{max_slot, 64 - n},因为要给网卡预留slot。
    • vhost-user设备和内存热插特性互斥。配置了vhost-user设备的虚拟机不支持内存热插;内存热插后,不支持虚拟机热插vhost-user设备。
    • 如果虚拟机操作系统为Linux系列,请确保初始内存大于等于4GB。
    • 如果虚拟机操作系统为Windows类型,第一次热插内存必须指定到Guest NUMA node0上,否则热插内存无法被虚拟机识别。
    • 在直通场景下,由于需要预先分配内存,因此启动和热插内存都比普通虚拟机要慢(尤其是大规格虚拟机),属于正常现象。
    • 建议虚拟机可用内存与热插内存的比例至少为1:32,即热插32G内存虚拟机至少需要有1G可用内存,如果低于该比例可能会导致虚拟机卡死。
    • 热插内存是否自动上线取决于虚拟机操作系统自身逻辑,可以手动上线或者配置udev规则自动上线。

    操作步骤

    一、配置虚拟机XML

    1. 使用内存热插功能,需要在创建虚拟机时配置可热插内存的最大范围、预留槽位号,并配置Guest NUMA拓扑结构。

      例如,为虚拟机配置32GiB初始内存,预留256个槽位号,最大支持1TiB内存上限,2个NUMA node的配置为:

      1. <domain type='kvm'>
      2. <memory unit='GiB'>32</memory>
      3. <maxMemory slots='256' unit='GiB'>1024</maxMemory>
      4. <cpu mode='host-passthrough' check='none'>
      5. <topology sockets='2' cores='2' threads='1'/>
      6. <numa>
      7. <cell id='0' cpus='0-1' memory='16' unit='GiB'/>
      8. <cell id='1' cpus='2-3' memory='16' unit='GiB'/>
      9. </numa>
      10. </cpu>
      11. ....

    说明: 其中: maxMemory字段中slots号表示预留的内存插槽,最大取值为256。 maxMemory表示虚拟机支持的最大物理内存上限。 Guest NUMA配置请参见“配置Guest NUMA”相关章节。

    二、热插并上线内存

    1. 如果热插内存后需要自动上线热插的内存,可以使用root权限在虚拟机内部创建udev rules文件/etc/udev/rules.d/99-hotplug-memory.rules,并在其中定义udev规则,内容参考如下:

      1. # automatically online hot-plugged memory
      2. ACTION=="add", SUBSYSTEM=="memory", ATTR{state}="online"
    2. 根据需要热插的内存大小和虚拟机Guest NUMA Node创建内存描述xml文件。

      例如,热插1GiB内存到NUMA node0上:

      1. <memory model='dimm'>
      2. <target>
      3. <size unit='MiB'>1024</size>
      4. <node>0</node>
      5. </target>
    3. 使用virsh attach-device命令为虚拟机热插内存。其中openEulerVM为虚拟机名称,memory.xml为热插内存的描述文件,—live表示热插内存在线生效,也可以使用—config 将热插内存持久化到虚拟机xml文件中。

      1. # virsh attach-device openEulerVM memory.xml --live