概述
IPMI是计算机系统的远程“关闭”或“带外”管理的标准接口。它可以独立于操作系统直接从所谓的“带外”管理卡监视硬件状态,还可以完全启动机器。
Zabbix IPMI监控仅适用于支持IPMI的设备(HP iLO, DELL DRAC, IBM RSA, Sun SSP, 等等).
也可以参考IPMI检查的已知问题。
配置
主机配置
主机必须配置为处理IPMI检查。必须添加IPMI接口,必须定义相应的IP和端口号,并且必须定义IPMI认证参数。
更多细节请查看。
服务器配置
默认情况下,Zabbix服务器未配置为启动任何IPMI轮询,因此任何添加的IPMI监控项将无法正常工作。要更改此选项,请以root身份打开Zabbix服务器配置文件(),并查找以下行:
取消注释,并设置poller计数为3,如下:
监控项配置
配置主机级别的时:
对于主机接口,选择IPMI IP和端口
选择'IPMI agent'作为类型
指定IPMI传感器(例如在Dell Poweredge上的 'FAN MOD 1A RPM' )
在主机中输入唯一的监控项key(例如,ipmi.fan.rpm)
超时和会话终止
IPMI消息超时和重试计数在OpenIPMI库中定义。由于目前OpenIPMI的设计,无论在接口还是监控项级别都不能在Zabbix中使这些值进行配置。
关于IPMI离散传感器的注意事项
要在主机上找到传感器启动Zabbix服务器,启用DebugLevel=4。等待几分钟,并在Zabbix服务器日志文件中查找传感器发现记录:
要解码IPMI传感器类型和状态,请在(在撰写本文时,最新的文件是http://www.intel.com/content/dam/www/public/us/en/documents/product-briefs/second-gen-interface-spec-v2.pdf)获取IPMI 2.0规范的副本
开始的第一个参数是“reading_type”。从规范中使用“表42-1,事件/读取类型代码范围”来解码“reading_type”代码。我们示例中的大多数传感器都有“reading_type:0x1”,这意味着是“threshold”传感器。 “表42-3,传感器类型代码”表示:“类型:0x1”表示温度传感器;“类型:0x2” - 电压传感器;“类型:0x4” - 风扇等阈值传感器有时称为“模拟”传感器,因为它们测量连续参数,如温度,电压,每分钟转数。
另一个例子 - 一个带有“read_type:0x3”的传感器。“表42-1,事件/读取类型代码范围”表示读取类型代码02h-0Ch表示“通用离散”传感器。离散传感器具有多达15个可能的状态(换句话说-最多15个有意义的位)。例如,对于具有“type:0x7”的传感器“CATERR”,“表42-3,传感器类型代码”表示此类型“处理器”,各个位的含义是:00h(最低有效位)- IERR ;01h - 散热等。
在我们的示例中有几个传感器具有“reading_type:0x6f”。对于这些传感器,“表42-1,事件/读取类型代码范围”建议使用“表42-3,传感器类型代码”来解码位的含义。 例如,传感器“Power Unit Stat”的类型为“0x9”,表示“Power Unit”。 Offset 00h表示“PowerOff / Power Down”。 换句话说,如果最低有效位为1,则服务器断电。为了测试这个位,可以使用band与掩码1的功能。触发表达式可能就像{www.zabbix.com:Power Unit Stat.band(#1,1)} = 1警告服务器关机。
关于OpenIPMI-2.0.16,2.0.17,2.0.18和2.0.19中离散传感器名称的注释
OpenIPMI-2.0.16,2.0.17和2.0.18中的离散传感器的名称通常在附近附加一个额外的“0”(或其它数字或字母)。例如,当ipmitool和OpenIPMI-2.0.19将传感器名称显示为“PhysicalSecurity”或“CATERR”时,在OpenIPMI-2.0.16,2.0.17和2.0.18中,名称分别为“PhysicalSecurity0”或“CATERR0”。
当使用OpenIPMI-2.0.16,2.0.17和2.0.18配置IPMI项目时,请在IPMI代理监控项的IPMI传感器字段中使用以“0”结尾的名称。当你的Zabbix服务器升级到使用OpenIPMI-2.0.19(或更高版本)的新Linux发行版时,具有这些IPMI离散传感器的监控项将变为“不支持”。 你必须更改其IPMI传感器名称(最后删除“0”),并等待一段时间才能再次转为“Enabled”。
关于阈值和离散传感器同时可用的注意事项
连接终止注意事项
如果不执行IPMI检查(由于任何原因:所有主机IPMI监控项禁用/不支持、主机已禁用/已删除、主机维护等),IPMI连接将从Zabbix服务器或代理服务器终止3到4小时,具体时间取决于Zabbix服务器/代理服务器何时启动。