跳到主要内容

确定组件故障

有时确定问题起因的唯一方式是开始卸下组件,直到问题解决。使用以下过程帮助您确定问题的根本原因。

问题

BladeCenter S 系统出现问题,但您无法确定问题出自哪个组件。
在开始尝试确定某个特定组件是否有问题之前,应先查看高级管理模块,并尝试解决任何已发现的问题。
要查看事件日志:

研究

执行以下步骤以确定问题出自哪个特定组件:
  1. 关闭所有刀片服务器,并将它们与 BladeCenter S 机箱中面板脱开。打开释放手柄,刀片服务器会从托架中滑出大约一英寸。
  2. 确保电源模块托架 1 中装有一个正常工作的电源,并脱开电源 2、3 和 4(将它们拉出大约一英寸)。
  3. 从中面板上脱开以下组件:
    1. 打开所有 I/O 模块上的释放手柄。
      要点
      拆离 I/O 模块将会中断其与任何(与该 I/O 模块相连的)外部设备的通信。请确保在拆离 I/O 模块之前已关闭所有外部设备的电源。
    2. 打开存储器模块上的释放手柄。
      请确保在卸下存储器模块之前所有驱动器活动都已停止(硬盘驱动器上的绿色指示灯不闪烁)。
    如果从 BladeCenter S 机箱前部拔出或卸下所有设备(介质托盘、刀片服务器和存储器模块),电源模块将被禁用。
  4. 验证电源模块 1 的交流指示灯和直流指示灯是否点亮。如果未点亮,请参阅对电源问题进行故障诊断
  5. 验证高级管理模块是否正常工作。如果不工作,请参阅对高级管理模块问题进行故障诊断
    1. 登录高级管理模块并检查“系统状态”页面中是否有任何问题。
    2. 验证电源是否显示在高级管理模块“电源管理”页面中。
    3. 检查事件日志中是否存在新错误消息,并解决发现的所有错误。由于已从 BladeCenter S 机箱卸下组件,因此可以忽略与非冗余模块相关的消息。
  6. 插入电源 2 并验证交流指示灯和直流指示灯是否点亮。
  7. 登录高级管理模块,并验证电源是否显示在高级管理模块“电源管理”页面中。如果显示,请卸下电源 1。
  8. 如果仍然无法获得可正常工作的最小配置,请与 IBM® 支持人员联系。
  9. 通过重新连接并启动刀片服务器,启用刀片服务器。选择不需要存储器模块引导的刀片服务器。
    1. 将刀片服务器安装在刀片服务器托架 1 中。为它开启电源,然后使用本地 KVM 连接确保它完成 POST 并启动操作系统。
      • 如果刀片服务器启动时未看到任何视频显示,请参阅对监视器或视频问题进行 故障诊断
      • 如果刀片服务器发生故障,并带有 POST 错误消息或检查代码,请参阅该刀片服务器的文档。
      • 如果刀片服务器启动,但键盘或鼠标无法工作,请尝试使用其他刀片服务器。
        • 如果键盘或鼠标仅对于一台刀片服务器无法工作,可能是该刀片服务器有问题。
        • 如果键盘或鼠标对于多台刀片服务器都无法工作,可能是高级管理模块有问题。请验证高级管理模块的固件级别,并在必要时更换高级管理模块
    2. 启动刀片服务器板载诊断程序(在 POST 期间按 F2 键并运行诊断程序)。如果返回任何错误,请参阅对刀片服务器问题进行故障诊断
      有关板载诊断程序和对刀片服务器进行故障诊断的更多信息,请参阅刀片服务器文档中提供的刀片服务器故障诊断过程。
  10. 将以太网交换机模块安装在 I/O 模块托架 1 中,并将它连接到网络。检查高级管理模块系统状态,确保它完成 POST,而且高级管理模块“系统状态”页面或事件日志中未显示任何错误。
  11. 现在,您应该具有一个正常工作的 BladeCenter S 系统,包含高级管理模块、一台刀片服务器、一个 I/O 模块,一个电源、介质托盘和风扇模块。开始将组件逐个装回到 BladeCenter S 机箱中,直到您再次看到故障症状。从电源开始,下来是其他 I/O 模块,然后是刀片服务器。
  12. 如果重新安装某个模块或刀片服务器后故障症状重新出现,请与 IBM 支持人员进行联系,获取更多解决方案步骤。