跳到主要内容

诊断问题

联系 IBM 或经过 Lenovo 批准的保修服务提供商之前,请按所示顺序执行以下步骤以诊断服务器的问题。

  1. 使服务器恢复发生问题之前所处的状态。
    如果发生问题之前更改了任何硬件、软件或固件,如有可能,请撤销这些更改。此操作可能涉及任何以下各项:
    • 硬件组件
    • 设备驱动程序和固件
    • 系统软件
    • UEFI 固件
    • 系统输入电源或网络连接
  2. 查看 Light Path 诊断程序 LED、事件日志和错误代码。
    以下各项可帮助您轻松诊断硬件和软件问题:
    • Light path 诊断程序 LED(请参阅Light path 诊断程序
    • 事件日志(请参阅事件日志
    • 软件或操作系统错误代码(请参阅制造商网站上的文档或提示)
  3. 运行 LXCE OneCLI 并收集系统数据。

    运行 LXCE OneCLI 以收集有关硬件、固件、软件和操作系统的信息。在联系 IBM 或经过批准的保修服务提供商时准备好这些信息。有关如何运行 OneCLI 的说明,请参阅《LXCE OneCLI 用户指南》。

    要下载最新版本的 OneCLI 代码和《LXCE OneCLI 用户指南》,请访问 https://support.lenovo.com/us/en/documents/LNVO-DSA

  4. 检查是否有代码更新,如有,则应用代码更新。
    更新的 uEFI 固件、设备固件或设备驱动程序中可能提供了针对许多问题的修订或变通方法。要显示服务器可用更新的列表,请访问https://datacentersupport.lenovo.com
    注意
    安装错误的固件或设备驱动程序更新可能导致服务器故障。在安装固件或设备驱动程序更新之前,请阅读所下载的更新随附的任何自述文件和变更历史记录文件。这些文件中包含有关此更新和安装更新过程的重要信息,包括从旧固件或设备驱动程序版本更新至最新版本的任何特殊过程。
    重要
    某些集群解决方案需要特定的代码级别或协调的代码更新。如果该设备是集群解决方案的一部分,请在更新代码前先验证集群解决方案是否支持最新级别的代码。
    1. 安装 UpdateXpress 系统更新。

      可安装打包为 UpdateXpress System Pack 或 UpdateXpress CD 映像的代码更新。UpdateXpress System Pack 包含一个经过集成测试的捆绑包,其中含有适用于您的服务器的固件和设备驱动程序在线更新。此外,您可以使用 Lenovo XClarity Essentials Bootable Media Creator 来创建可用于应用固件更新和运行 Preboot 诊断的可引导介质。有关 UpdateXpress System Pack 的详细信息,请访问:https://datacentersupport.lenovo.com

      有关 Bootable Media Creator 程序的详细信息,请访问: 适用于 Lenovo x86 服务器的 Bootable Media Creator(BoMC) Web 站点

      务必单独安装任何列出的发布日期比 UpdateXpress System Pack 或 UpdateXpress 映像发布日期晚的重要更新。请参阅以下两个用于手动安装系统更新的步骤。

    2. 安装手动系统更新。
      1. 确定现有代码级别。

        《OneCLI 清单报告》中,单击固件/VPD 以查看系统固件级别,或单击软件以查看操作系统级别。

      2. 下载并安装任何未处于最新级别的代码的更新。

        要显示服务器可用更新的列表,请访问:https://datacentersupport.lenovo.com

        单击某个更新时,将显示一个信息页面,其中列出该更新修复的问题。检查此列表中是否有您的特定问题;但是,即使其中未列出您的问题,安装该更新也有可能解决该问题。

  5. 检查配置是否不正确,如有,则纠正配置。

    如果服务器配置不正确,那么系统功能在启用时可能无法工作;如果对服务器配置进行了错误的更改,那么已启用的系统功能可能会停止工作。

    1. 确保支持所有已安装的硬件和软件。

      要确认服务器支持所安装的操作系统、可选设备和软件级别,请访问 Lenovo ServerProven 网站。如果不支持任何硬件或软件组件,请卸下该硬件或卸载该软件以确定是否该硬件或软件导致问题。在联系 IBM 或经过批准的保修服务提供商请求支持之前,必须卸下不支持的硬件。

    2. 确保正确安装并配置了服务器、操作系统和软件。

      许多配置问题都是电源线或信号线缆松动或适配器安装不当所致。通过关闭服务器、接回线缆、装回适配器,然后重新开启服务器,或许可以解决问题。有关执行检验过程的信息,请参阅执行检验过程之前的预防措施。有关配置服务器的信息,请参阅配置信息

  6. 参考控制器和管理软件文档。

    如果问题与特定功能(例如,RAID 硬盘在 RAID 阵列中标记为脱机)有关,请参阅相关控制器和管理或控制软件的文档,以验证控制器配置是否正确。

    许多设备(如 RAID 和以太网控制器)均提供用于确定问题的信息。

    有关操作系统或 IBM 软件或设备的问题,请访问 Lenovo 支持门户

  7. 检查是否有故障排除过程和 retain 提示。

    故障排除过程和 retain 提示记载已知的问题和建议的解决方案。要搜索故障排除过程和 retain 提示,请访问 Lenovo 支持门户

  8. 使用故障诊断表。

    要查找具有可识别症状的问题的解决方案,请参阅根据症状进行故障诊断

    一个问题可能会导致多种症状。执行适用于最明显症状的故障诊断步骤。如果该过程未解决问题,如有可能,请使用适用于其他症状的过程。

    如果问题仍然存在,请联系 IBM 或经认可的保修服务提供商,他们可帮助您从其他方面确定问题或者可能会更换硬件。要提出在线服务请求,请访问 服务请求和 PMR 网站请准备好提供有关任何错误代码的信息和已收集的数据。