事件日志
通过“事件日志”选项卡,用户可查看 SEL(系统事件日志)。
SEL(系统事件日志)记录机柜级信息/警告/紧急事件,以便用户能够了解机柜中发生的情况。最多可记录 4090 个事件条目。
默认情况下,事件按照从最早到最近的发生顺序排序,最新条目位于最后一页。单击日期/时间可以使事件按照从最近到最早的顺序重新排序。
![Event Log](event_log_002.png)
- 刷新:SEL 永远不会自动刷新。日志已满时,单击刷新获取最新条目。
- 保存日志:SEL 数据将另存为 .csv 文件并导出。
- 清除日志:SEL 数据将被清除。
- 严重性:SEL 数据条目将根据严重性按顺序列出。
:表示事件为参考类型
:表示事件为警告类型
:表示事件为紧急类型紧急事件会点亮“错误”LED。
以下是所有可能事件的列表:
消息字符串 | 消息描述 | Severity | 生效 | 失效 |
PS% 12V OC 故障 | PSU 过流 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 12V OV 故障 | PSU 12V 过压 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 12V UV 故障 | PSU 12V 欠压 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 12V AUX OC 故障 | PSU 12V AUX 过流 | Critical | PSU 交流电源正常 指示灯: 熄灭 | NA |
PS% 12V AUX OV 故障 | PSU 12V AUX 过压 | Critical | PSU 交流电源正常 指示灯: 熄灭 | NA |
PS% 12V AUX UV 故障 | PSU 12V AUX 欠压 | Critical | PSU 交流电源正常 指示灯: 熄灭 | NA |
PS% IIN OC 故障 | PSU IIN 过流 | Critical | PSU 直流电源正常 指示灯: 熄灭 | NA |
PS% VIN OV 故障 | PSU VIN 过压 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% VIN UV 故障 | PSU VIN 欠压 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 12V OC 警告 | PSU 12V 过流 | 警告 | NA | NA |
PS% IIN OC 警告 | PSU IIN 过流 | 警告 | 不适用 | 不适用 |
PS% VIN OV 警告 | PSU VIN 过压 | 警告 | 不适用 | 不适用 |
PS% VIN UV 警告 | PSU VIN 欠压 | 警告 | 不适用 | 不适用 |
PS% 热故障 | PSU 热故障 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 风扇故障 | PSU 风扇故障 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 热警告 | PSU 热警告 | 警告 | NA | NA |
PS% 超额配置故障 | 由于调速生效超过 3 秒而导致电源模块关闭 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% iShare 警告 | PSU 电流分享警告 | 警告 | NA | NA |
PS% EPOW 生效 | PSU 交流电源丢失 | Critical | PSU 交流电源正常 指示灯: 熄灭 | PSU 交流电源正常 指示灯: 点亮 |
PS% VIN UV 电源不足故障 | PSU VIN 欠压电源不足 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 交流电源低压线路 | 此 PSU 已接入低于 170V 的交流电源电压 | 参考 | 无 LED | 无 LED |
PS% 内部 OC 故障 | 任何 PSU 内部故障导致的过流状况 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 间歇性故障 | 发生任何未定义的 PSU 内部故障,并且 PSU 可能会关闭或仍然尝试运行 | Critical | PSU 故障 指示灯: 点亮 | NA |
PS% 不受支持 | 在安装了不支持的 PSU 时生效 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
PS 类型不匹配 | PSU 类型不匹配时生效 | 警告 | 无 LED | 无 LED |
FAN% 不存在 | 风扇模块不存在 | Critical | 错误 LED: 点亮 风扇故障 LED: 点亮 | 错误 LED: 熄灭 风扇故障 LED: 熄灭 |
风扇转速计 %%:风扇 传感器,故障事件已生效,读取值: %RPM(阈值: 1472RPM) | 当风扇转速计传感器读数 小于阈值 RPM 时 | Critical | 错误 LED: 点亮 风扇故障 LED: 点亮 | 错误 LED: 熄灭 风扇故障 LED: 熄灭 |
风扇 FFS | 系统风扇处于全速状态 | 警告 | 无 LED | 无 LED |
PSU FFS | PSU 风扇处于全速状态 | 警告 | 无 LED | 无 LED |
NODE%_PRESENT | 节点已安装在指示的插槽中 | 参考 | 无 LED | 无 LED |
NODE%_DC_OFF | 节点已关闭(DC-Off) | 参考 | 无 LED | 无 LED |
NODE%_RESEAT | 用户执行模拟插拔,整个节点已关闭再打开交流电源 * 不允许尝试插拔已打开电源的节点,SMM 将阻止该请求 | 参考 | 无 LED | 无 LED |
NODE%_RESET | 用户执行重置,节点上的 BMC 已重置 | 参考 | 无 LED | 无 LED |
NODE%_1ST_NOPERM | BMC 无法获取电源权限以打开节点电源 | 警告 | 无 LED | 无 LED |
NODE%_2ND_NOPERM | 客户端操作系统无法获取电源权限以打开电源 | 警告 | 无 LED | 无 LED |
NODE%_CAP_LOW | 恢复的上限值低于当前的上限边界 | Critical | 错误 LED: 点亮 | 无 LED |
NODE%_CAP_FAIL | 无法将上限值设置为 XCC | Critical | 错误 LED: 点亮 | 无 LED |
NODE%_XCC_FAULT | 打开电源后,所示节点的 BMC 没有响应 | Critical | 错误 LED: 点亮 | 无 LED |
NODE%_NO_COMM | 所示节点的 BMC 无响应超过 1 分钟,已增强系统风扇,以避免节点发生潜在过热状况 | 警告 | 无 LED | 无 LED |
NODE%_FS_NORESP | 由于操作系统运行时间,所示节点的 BMC 无响应超过 5 分钟,并且没有采取任何进一步操作 | Critical | 错误 LED: 点亮 | 无 LED |
NODE%_RESEAT_SMM | 所示节点的 BMC 无响应超过 7 分钟,并进入故障安全操作的第二阶段 * 故障安全任务不插拔已打开电源的节点。 | 警告 | 无 LED | 无 LED |
NODE%_FS_NOPERM | 所示节点的 BMC 无响应超过 14 分钟,并进入故障安全操作的最后阶段,功率预算将被回收并且电源权限将被拒绝 | Critical | 错误 LED: 点亮 | 无 LED |
NODE%_PMIN_2_BIG | 对于 XCC 发送到 SMM 的功率上限边界 PMax 和 PMin,PMin 大于 PMax | Critical | 错误 LED: 点亮 | 无 LED |
机柜无权限 | 如果发生不存在风扇的问题,则会拒绝整个机箱的电源权限。 | 警告 | 无 LED | 无 LED |
ENCL_CAP_LOW | 恢复的机柜上限值低于当前的上限边界 | Critical | 错误 LED: 点亮 | 无 LED |
ENCL_CAP_FAIL | 无法设置机柜上限值 | Critical | 错误 LED: 点亮 | 无 LED |
ENCL_PMAX_2_BIG | 所有节点的 PMax 汇总结果已超过总电源功率 | Critical | 错误 LED: 点亮 | 无 LED |
ENCL_PMIN_2_BIG | 所有节点的 PMin 汇总结果已超过总电源功率 | Critical | 错误 LED: 点亮 | 无 LED |
HI_PCI_NOACSTIC | 由于安装了 GPU 节点或在节点上安装了大功率或高发热的 PCIe 卡,因此已禁用噪音模式 1 - 4。 | 参考 | 无 LED | 无 LED |
NODE%_HI_PCI | 此节点中安装了大功率或高发热的 PCIe 卡。不能应用机柜噪音模式以使该节点保持足够的散热气流 | 参考 | 无 LED | 无 LED |
机柜右 PIOR 3.3V 检测 | 如果 3.3V Aux PWRGD 处于低位,则 SMM 会检测到平移台电源故障 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
机柜左 PIOR 3.3V 检测 | 如果 3.3V Aux PWRGD 处于低位,则 SMM 会检测到平移台电源故障 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
机柜右 PIOR 故障 | 平移台右 PIOR 不存在或发生故障 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
机柜左 PIOR 故障 | 平移台左 PIOR 不存在或发生故障 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
机柜事件日志禁用:“事件日志记录已禁用”传感器,“日志区域已重置/清除” 已生效 | 已清除 SMM SEL | 参考 | 无 LED | 无 LED |
机柜事件日志禁用:“事件日志记录已禁用”传感器,SEL 达到 75% 的状态已生效 | 当 SEL 容量至少为 75% 时,SMM 会发出警告 | 警告(75%) | 无 LED | 无 LED |
机柜事件日志禁用:“事件日志记录已禁用”传感器,SEL 已满的状态已生效 | SEL 达到 100% 满容时,SMM 会发出错误。 | 紧急(已满) | 无 LED | 无 LED |
SMM 12V 检测 | 当 12 伏电源导轨上测得的电压低于临界阈值下限(10.816 伏)或者高于临界阈值上限(13.248 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
SMM 5V 检测 | 当 5 伏电源导轨上测得的电压低于临界阈值下限(4.563 伏)或者高于临界阈值上限(5.589 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
SMM 3.3V 检测 | 当 3.3 伏电源导轨上测得的电压低于临界阈值下限(2.975 伏)或者高于临界阈值上限(3.623 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
SMM 2.5V 检测 | 当 2.5 伏电源导轨上测得的电压低于临界阈值下限(2.36 伏)或者高于临界阈值上限(2.62 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
SMM 1.2V 检测 | 当 1.2 伏电源导轨上测得的电压低于临界阈值下限(1.12 伏)或者高于临界阈值上限(1.28 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
SMM 1.15V 检测 | 当 1.2 伏电源导轨上测得的电压低于临界阈值下限(1.078 伏)或者高于临界阈值上限(1.21 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
VBAT 检测 | 当纽扣电池上测得的输出电压低于临界阈值下限(1.795 伏)时 | Critical | 错误 LED: 点亮 | 错误 LED: 熄灭 |
PIOR R 故障 | 右 PIOR 卡不存在或发生故障 | Critical | 错误 LED: 点亮 | NA |
PIOR L 故障 | 左 PIOR 卡不存在或发生故障 | Critical | 错误 LED: 点亮 | NA |
EIOM 不存在 | EIOM 卡不存在 | 参考 | 无 LED | 无 LED |
P BOOT 故障 | 主存储体引导故障 | 警告 | 错误 LED: 熄灭 | 错误 LED: 熄灭 |