跳到主要内容

多台刀片服务器显示看守程序超时消息

看守程序超时消息显示在高级管理模块事件日志中。如果您看到 BladeCenter S 机箱中的多台刀片服务器显示这些消息,请使用以下过程。

问题

高级管理模块事件日志显示有关 BladeCenter S 机箱中多台刀片服务器的看守程序超时消息。

研究

执行以下步骤解决问题:
  1. 查找高级管理模块的固件更新。查看固件更改历史记录中是否存在与看守程序超时错误相关的信息,必要时更新固件。

    通过转至软件和设备驱动程序 - IBM BladeCenter 并选择 BladeCenter S,可以找到相应的固件。

  2. 搜索 IBM Support 页面,以查找高级管理模块的固件更新。查看固件更改历史记录中是否存在与看守程序超时错误相关的信息,必要时更新固件。
  3. 确保服务处理器(集成系统管理处理器和 BMC 控制器)代码级别为最新或至少未缺少关键修订。
  4. 验证刀片服务器是否正常运行。如果它们可以响应,问题可能是假错情况。
    1. 验证刀片服务器上是否安装了 IBM 服务器自动重启(ASR)驱动程序。
    2. 更新刀片服务器上的服务处理器固件。
    3. 更新高级管理模块的固件。
    4. 更换高级管理模块
  5. 如果所有刀片服务器都没有响应,并且运行的操作系统级别相同,应用程序相似,请再次启动多台刀片服务器并访问每台刀片服务器的操作系统日志。
    • 确定刀片服务器没有响应是否由常见软件驱动程序或模块问题导致。
    • 验证磁盘驱动程序和通信驱动程序是否最新。
  6. 尽管比较少见,到刀片服务器的 RS-485 通信信道具有的噪音可能会占用服务处理器。检查事件日志,以便查看是否所有刀片服务器都发生多个服务处理器通信错误。如果是,请参阅针对刀片服务器显示的服务处理器通信(SP COMM)错误获取更多故障诊断过程。