跳到主要内容

诊断问题

联系 IBM 或经过批准的保修服务提供商之前,请按所示顺序执行以下过程以诊断服务器的问题:

  1. 使服务器恢复发生问题之前所处的状态。
    如果发生问题之前更改了任何硬件、软件或固件,如有可能,请撤销这些更改。这可能包括以下任意项:
    • 硬件组件
    • 设备驱动程序和固件
    • 系统软件
    • UEFI 固件
    • 系统输入电源或网络连接
  2. 查看 light path 诊断程序 LED 和事件日志。
    服务器可方便地诊断硬件和软件问题。
    • light path 诊断程序 LED:有关 light path 诊断程序 LED 的信息,请参阅Light path 诊断程序 LED
    • 事件日志:有关通知事件和诊断的信息,请参阅事件日志
    • 软件或操作系统错误代码:有关特定错误代码的信息,请参阅软件或操作系统随附的文档。有关文档,请访问制造商的网站。
  3. 运行 LXCE OneCLI 并收集系统数据。

    运行 LXCE OneCLI 以收集有关硬件、固件、软件和操作系统的信息。在联系 IBM 或经过批准的保修服务提供商时准备好这些信息。有关运行 OneCLI 的说明,请参阅《LXCE OneCLI 用户指南》。

    要下载最新版本的 OneCLI 代码和《LXCE OneCLI 用户指南》,请访问 https://support.lenovo.com/us/en/documents/LNVO-DSA

  4. 检查是否有代码更新,如有,则应用代码更新。
    更新的 uEFI 固件、设备固件或设备驱动程序中可能提供了针对许多问题的修订或变通方法。要显示服务器的可用更新的列表,请访问 Fix Central 网站
    注意
    安装错误的固件或设备驱动程序更新可能导致服务器故障。在安装固件或设备驱动程序更新之前,请阅读所下载的更新随附的任何自述文件和变更历史记录文件。这些文件中包含有关此更新和安装更新过程的重要信息,包括从旧固件或设备驱动程序版本更新至最新版本的任何特殊过程。
    重要
    某些集群解决方案需要特定的代码级别或协调的代码更新。如果该设备是集群解决方案的一部分,请在更新代码前先验证集群解决方案是否支持最新级别的代码。
    1. 安装 UpdateXpress 系统更新。

      可安装打包为 UpdateXpress System Pack 或 UpdateXpress CD 映像的代码更新。UpdateXpress System Pack 包含一个经过集成测试的捆绑包,其中含有适用于您的服务器的固件和设备驱动程序在线更新。此外,您可以使用 Lenovo XClarity Essentials Bootable Media Creator 来创建可用于应用固件更新和运行 Preboot 诊断的可引导介质。有关 UpdateXpress System Pack 的更多信息,请参阅 https://datacentersupport.lenovo.com更新固件。有关 Bootable Media Creator 的详细信息,请参阅适用于 Lenovo x86 服务器的 Bootable Media Creator(BoMC) 网站

      如果任何重要更新所列出的发布日期比 UpdateXpress System Pack 或 UpdateXpress 映像发布日期晚,请务必单独安装该更新(请参阅 b)。

    2. 安装手动系统更新。
      1. 确定现有代码级别。

        《OneCLI 清单报告》中,单击固件/VPD 以查看系统固件级别,或单击软件以查看操作系统级别。

      2. 下载并安装未处于最新级别的代码的更新。

        要显示服务器的可用更新的列表,请访问 Fix Central 网站

        单击某个更新时,将显示一个信息页面,其中列出该更新修复的问题。检查此列表中是否有您的特定问题;但是,即使其中未列出您的问题,安装该更新也有可能解决该问题。

  5. 检查配置是否不正确,如有,则纠正配置。

    如果服务器配置不正确,那么系统功能在启用时可能无法工作;如果对服务器配置进行了错误的更改,那么已启用的系统功能可能会停止工作。

    1. 确保支持所有已安装的硬件和软件。

      要确认服务器支持所安装的操作系统、可选设备和软件级别,请参阅 Lenovo ServerProven 网站。如果不支持任何硬件或软件组件,请卸载它以确定是否它导致问题。在联系 IBM 或经过批准的保修服务提供商请求支持之前,必须卸下不支持的硬件。

    2. 确保正确安装并配置了服务器、操作系统和软件。

      许多配置问题是由电源线或信号线缆松动或适配器安装不正确导致的。通过关闭服务器、接回线缆、装回适配器,然后重新开启服务器,或许可以解决问题。有关执行检验过程的信息,请参阅关于检验过程。有关配置服务器的信息,请参阅配置信息和说明

  6. 请参阅控制器和管理软件文档。

    如果问题与特定功能(例如,RAID 硬盘在 RAID 阵列中标记为脱机)有关,请参阅相关控制器和管理或控制软件的文档,以验证控制器配置是否正确。

    许多设备(如 RAID 和网络适配器)均有问题确定信息。

    有关操作系统、软件或设备的问题,请访问 Lenovo 支持门户

  7. 检查是否有故障诊断步骤和保留提示。
    故障诊断步骤和保留提示记载已知的问题和建议的解决方案。要搜索故障诊断步骤和保留提示,请访问 Lenovo 支持门户
  8. 使用故障诊断表。

    要查找具有可识别症状的问题的解决方案,请参阅根据症状进行故障诊断

    一个问题可能会导致多种症状。执行适用于最明显症状的故障诊断步骤。如果该过程未诊断出问题,如有可能,请使用适用于其他症状的过程。

    如果问题仍然存在,请联系 IBM 或经认可的保修服务提供商,他们可帮助您从其他方面确定问题或者可能会更换硬件。要提出在线服务请求,请访问 服务请求和 PMR 网站请准备好提供有关任何错误代码的信息和已收集的数据。