跳到主要内容

事件日志

通过“事件日志”选项卡,用户可查看 SEL(系统事件日志)。

SEL(系统事件日志)记录机柜级信息/警告/紧急事件,以便用户能够了解机柜中发生的情况。最多可记录 4090 个事件条目。

默认情况下,事件按照从最早到最近的发生顺序排序,最新条目位于最后一页。单击日期/时间可以使事件按照从最近到最早的顺序重新排序。

目前,在日志已满的情况下无法写入新事件。手动清除日志后才能记录最新事件。
图 1. 事件日志
Event Log
  • 刷新:SEL 永远不会自动刷新。日志已满时,单击刷新获取最新条目。
  • 保存日志:SEL 数据将另存为 .csv 文件并导出。
  • 清除日志:SEL 数据将被清除。
  • 严重性:SEL 数据条目将根据严重性按顺序列出。
    • :表示事件为参考类型

    • :表示事件为警告类型

    • :表示事件为紧急类型紧急事件会点亮“错误”LED。

以下是所有可能事件的列表:

表 1. 可能事件的列表

消息字符串

消息描述

Severity

生效

失效

PS% 12V OC 故障

PSU 过流

Critical

PSU 故障

指示灯:

点亮

NA

PS% 12V OV 故障

PSU 12V 过压

Critical

PSU 故障

指示灯:

点亮

NA

PS% 12V UV 故障

PSU 12V 欠压

Critical

PSU 故障

指示灯:

点亮

NA

PS% 12V AUX OC 故障

PSU 12V AUX 过流

Critical

PSU 交流电源正常

指示灯:

熄灭

NA

PS% 12V AUX OV 故障

PSU 12V AUX 过压

Critical

PSU 交流电源正常

指示灯:

熄灭

NA

PS% 12V AUX UV 故障

PSU 12V AUX 欠压

Critical

PSU 交流电源正常

指示灯:

熄灭

NA

PS% IIN OC 故障

PSU IIN 过流

Critical

PSU 直流电源正常

指示灯:

熄灭

NA

PS% VIN OV 故障

PSU VIN 过压

Critical

PSU 故障

指示灯:

点亮

NA

PS% VIN UV 故障

PSU VIN 欠压

Critical

PSU 故障

指示灯:

点亮

NA

PS% 12V OC 警告

PSU 12V 过流

警告

NA

NA

PS% IIN OC 警告

PSU IIN 过流

警告

不适用

不适用

PS% VIN OV 警告

PSU VIN 过压

警告

不适用

不适用

PS% VIN UV 警告

PSU VIN 欠压

警告

不适用

不适用

PS% 热故障

PSU 热故障

Critical

PSU 故障

指示灯:

点亮

NA

PS% 风扇故障

PSU 风扇故障

Critical

PSU 故障

指示灯:

点亮

NA

PS% 热警告

PSU 热警告

警告

NA

NA

PS% 超额配置故障

由于调速生效超过 3 秒而导致电源模块关闭

Critical

PSU 故障

指示灯:

点亮

NA

PS% iShare 警告

PSU 电流分享警告

警告

NA

NA

PS% EPOW 生效

PSU 交流电源丢失

Critical

PSU 交流电源正常

指示灯:

熄灭

PSU 交流电源正常

指示灯:

点亮

PS% VIN UV 电源不足故障

PSU VIN 欠压电源不足

Critical

PSU 故障

指示灯:

点亮

NA

PS% 交流电源低压线路

此 PSU 已接入低于 170V 的交流电源电压

参考

无 LED

无 LED

PS% 内部 OC 故障

任何 PSU 内部故障导致的过流状况

Critical

PSU 故障

指示灯:

点亮

NA

PS% 间歇性故障

发生任何未定义的 PSU 内部故障,并且 PSU 可能会关闭或仍然尝试运行

Critical

PSU 故障

指示灯:

点亮

NA

PS% 不受支持

在安装了不支持的 PSU 时生效

Critical

错误 LED:

点亮

错误 LED:

熄灭

PS 类型不匹配

PSU 类型不匹配时生效

警告

无 LED

无 LED

FAN% 不存在

风扇模块不存在

Critical

错误 LED:

点亮

风扇故障 LED:

点亮

错误 LED:

熄灭

风扇故障 LED:

熄灭

风扇转速计 %%:风扇

传感器,故障事件已生效,读取值:

%RPM(阈值:

1472RPM)

当风扇转速计传感器读数

小于阈值 RPM 时

Critical

错误 LED:

点亮

风扇故障 LED:

点亮

错误 LED:

熄灭

风扇故障 LED:

熄灭

风扇 FFS

系统风扇处于全速状态

警告

无 LED

无 LED

PSU FFS

PSU 风扇处于全速状态

警告

无 LED

无 LED

NODE%_PRESENT

节点已安装在指示的插槽中

参考

无 LED

无 LED

NODE%_DC_OFF

节点已关闭(DC-Off)

参考

无 LED

无 LED

NODE%_RESEAT

用户执行模拟插拔,整个节点已关闭再打开交流电源 * 不允许尝试插拔已打开电源的节点,SMM 将阻止该请求

参考

无 LED

无 LED

NODE%_RESET

用户执行重置,节点上的 BMC 已重置

参考

无 LED

无 LED

NODE%_1ST_NOPERM

BMC 无法获取电源权限以打开节点电源

警告

无 LED

无 LED

NODE%_2ND_NOPERM

客户端操作系统无法获取电源权限以打开电源

警告

无 LED

无 LED

NODE%_CAP_LOW

恢复的上限值低于当前的上限边界

Critical

错误 LED:

点亮

无 LED

NODE%_CAP_FAIL

无法将上限值设置为 XCC

Critical

错误 LED:

点亮

无 LED

NODE%_XCC_FAULT

打开电源后,所示节点的 BMC 没有响应

Critical

错误 LED:

点亮

无 LED

NODE%_NO_COMM

所示节点的 BMC 无响应超过 1 分钟,已增强系统风扇,以避免节点发生潜在过热状况

警告

无 LED

无 LED

NODE%_FS_NORESP

由于操作系统运行时间,所示节点的 BMC 无响应超过 5 分钟,并且没有采取任何进一步操作

Critical

错误 LED:

点亮

无 LED

NODE%_RESEAT_SMM

所示节点的 BMC 无响应超过 7 分钟,并进入故障安全操作的第二阶段 * 故障安全任务不插拔已打开电源的节点。

警告

无 LED

无 LED

NODE%_FS_NOPERM

所示节点的 BMC 无响应超过 14 分钟,并进入故障安全操作的最后阶段,功率预算将被回收并且电源权限将被拒绝

Critical

错误 LED:

点亮

无 LED

NODE%_PMIN_2_BIG

对于 XCC 发送到 SMM 的功率上限边界 PMax 和 PMin,PMin 大于 PMax

Critical

错误 LED:

点亮

无 LED

机柜无权限

如果发生不存在风扇的问题,则会拒绝整个机箱的电源权限。

警告

无 LED

无 LED

ENCL_CAP_LOW

恢复的机柜上限值低于当前的上限边界

Critical

错误 LED:

点亮

无 LED

ENCL_CAP_FAIL

无法设置机柜上限值

Critical

错误 LED:

点亮

无 LED

ENCL_PMAX_2_BIG

所有节点的 PMax 汇总结果已超过总电源功率

Critical

错误 LED:

点亮

无 LED

ENCL_PMIN_2_BIG

所有节点的 PMin 汇总结果已超过总电源功率

Critical

错误 LED:

点亮

无 LED

HI_PCI_NOACSTIC

由于安装了 GPU 节点或在节点上安装了大功率或高发热的 PCIe 卡,因此已禁用噪音模式 1 - 4。

参考

无 LED

无 LED

NODE%_HI_PCI

此节点中安装了大功率或高发热的 PCIe 卡。不能应用机柜噪音模式以使该节点保持足够的散热气流

参考

无 LED

无 LED

机柜右 PIOR 3.3V 检测

如果 3.3V Aux PWRGD 处于低位,则 SMM 会检测到平移台电源故障

Critical

错误 LED:

点亮

错误 LED:

熄灭

机柜左 PIOR 3.3V 检测

如果 3.3V Aux PWRGD 处于低位,则 SMM 会检测到平移台电源故障

Critical

错误 LED:

点亮

错误 LED:

熄灭

机柜右 PIOR 故障

平移台右 PIOR 不存在或发生故障

Critical

错误 LED:

点亮

错误 LED:

熄灭

机柜左 PIOR 故障

平移台左 PIOR 不存在或发生故障

Critical

错误 LED:

点亮

错误 LED:

熄灭

机柜事件日志禁用:“事件日志记录已禁用”传感器,“日志区域已重置/清除”

已生效

已清除 SMM SEL

参考

无 LED

无 LED

机柜事件日志禁用:“事件日志记录已禁用”传感器,SEL 达到 75% 的状态已生效

当 SEL 容量至少为 75% 时,SMM 会发出警告

警告(75%)

无 LED

无 LED

机柜事件日志禁用:“事件日志记录已禁用”传感器,SEL 已满的状态已生效

SEL 达到 100% 满容时,SMM 会发出错误。

紧急(已满)

无 LED

无 LED

SMM 12V 检测

当 12 伏电源导轨上测得的电压低于临界阈值下限(10.816 伏)或者高于临界阈值上限(13.248 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

SMM 5V 检测

当 5 伏电源导轨上测得的电压低于临界阈值下限(4.563 伏)或者高于临界阈值上限(5.589 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

SMM 3.3V 检测

当 3.3 伏电源导轨上测得的电压低于临界阈值下限(2.975 伏)或者高于临界阈值上限(3.623 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

SMM 2.5V 检测

当 2.5 伏电源导轨上测得的电压低于临界阈值下限(2.36 伏)或者高于临界阈值上限(2.62 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

SMM 1.2V 检测

当 1.2 伏电源导轨上测得的电压低于临界阈值下限(1.12 伏)或者高于临界阈值上限(1.28 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

SMM 1.15V 检测

当 1.2 伏电源导轨上测得的电压低于临界阈值下限(1.078 伏)或者高于临界阈值上限(1.21 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

VBAT 检测

当纽扣电池上测得的输出电压低于临界阈值下限(1.795 伏)时

Critical

错误 LED:

点亮

错误 LED:

熄灭

PIOR R 故障

右 PIOR 卡不存在或发生故障

Critical

错误 LED:

点亮

NA

PIOR L 故障

左 PIOR 卡不存在或发生故障

Critical

错误 LED:

点亮

NA

EIOM 不存在

EIOM 卡不存在

参考

无 LED

无 LED

P BOOT 故障

主存储体引导故障

警告

错误 LED:

熄灭

错误 LED:

熄灭