跳到主要内容

可察觉的问题

按以下信息解决可察觉的问题。

服务器在 UEFI 引导过程中挂起

如果系统在 UEFI 引导过程中挂起且屏幕上显示 UEFI: DXE INIT 的消息,请确保 Option ROM 未设置为传统。您可以通过使用 Lenovo XClarity Essentials OneCLI 运行以下命令,远程查看 Option ROM 的当前设置:

onecli config show EnableDisableAdapterOptionROMSupport --bmc xcc_userid:xcc_password@xcc_ipaddress

要在 Legacy Option ROM 设置下恢复引导过程中挂起的系统,请参阅以下技术提示:

Option ROM 设置配置为“传统”时,ThinkSystem 服务器在 UEFI 引导期间挂起且显示“UEFI:DXE INIT”

如果必须使用 Legacy Option ROM,请勿在“设备和 I/O 端口”菜单上将插槽 Option ROM 设置为传统。而是将插槽 Option ROM 设置为自动(默认设置),然后将系统引导模式设置为传统模式。Legacy Option ROM 将在系统引导之前很快被调用。

服务器在启动时立即显示 POST 事件查看器

完成以下步骤,直至解决该问题。

  1. 纠正系统 LED 和诊断显示屏指示的任何错误。

  2. 确保服务器支持所有处理器,且这些处理器在速度和高速缓存大小上匹配。

    可从系统设置中查看处理器详细信息。

    要确定服务器是否支持处理器,请参阅 Lenovo ServerProven 网站

  3. (仅限经过培训的技术人员)确保处理器 1 已正确安装到位。

  4. (仅限经过培训的技术人员)卸下处理器 2,然后重新启动服务器。

  5. 按所示顺序逐个更换以下组件(每更换一个组件后都要重新启动服务器):

    1. (仅限经过培训的技术人员)处理器

    2. (仅限经过培训的技术人员)主板

服务器无响应(POST 完毕且操作系统正在运行)

完成以下步骤,直至解决该问题。

  • 如果您在服务器所在位置,则完成以下步骤:

    1. 如果使用 KVM 连接,请确保该连接正常运行。否则,确保键盘和鼠标正常运行。

    2. 如有可能,请登录到服务器并确认所有应用程序均在运行(无应用程序挂起)。

    3. 重新启动服务器。

    4. 如果问题仍然存在,请确保已正确安装并配置任何新软件。

    5. 与软件购买处或软件提供商取得联系。

  • 如果从远程位置访问服务器,请完成以下步骤:

    1. 确保所有应用程序均在运行(没有应用程序挂起)。

    2. 尝试从系统注销,然后重新登录。

    3. 通过从命令行中 ping 服务器或对其运行 trace route,验证网络访问。

      1. 如果在 ping 测试期间无法获得响应,请尝试 ping 机箱中的其他服务器以确定这是连接问题还是服务器问题。

      2. 运行 traceroute 以确定连接在何处中断。尝试解决 VPN 或连接中断处的连接问题。

    4. 通过管理界面远程重新启动服务器。

    5. 如果问题仍然存在,请确认已正确安装并配置任何新软件。

    6. 与软件购买处或软件提供商取得联系。

服务器无响应(POST 失败并且无法启动系统设置)

配置更改(如添加设备或适配器固件更新)和固件或应用程序代码问题可能导致服务器 POST(开机自检)失败。

如果发生这种情况,则服务器将按以下任一方式进行响应:

  • 服务器自动重新启动并重新尝试 POST。

  • 服务器挂起,必须由您手动重新启动服务器以使服务器重新尝试 POST。

(自动或手动)连续尝试指定次数之后,服务器将恢复为默认 UEFI 配置并启动系统设置,以使您可对配置作出必要的纠正并重新启动服务器。如果服务器无法使用默认配置成功完成 POST,则处理器板或系统 I/O 板可能有问题。执行以下操作:

  1. 卸下所有新添加的设备并将系统恢复为默认硬件配置。

  2. 尝试重新启动系统并检查是否可以成功引导到系统设置程序。

    • 如果不能,请执行以下操作:

      1. 更换处理器板。

      2. 更换系统 I/O 板。

    • 如果可以,请尝试将可疑设备移至另一个被测系统(SUT)。

      • 如果 SUT 系统可以正常工作,则表示问题可能是由处理器板或系统 I/O 板引起的。

      • 如果 SUT 系统无法正常工作,则表示可疑设备可能存在问题。

  3. 如果所有可疑部件均已被隔离但问题仍然存在,请以最低配置运行受影响的系统,以便进一步细化问题隔离,然后再逐步加回其他配置。

在事件日志中显示电压平板故障

完成以下步骤,直至解决该问题。

  1. 将系统恢复至最低配置。请参阅规格以了解所需的处理器和 DIMM 的最少数量。

  2. 重新启动系统。

    • 如果系统重新启动,请逐个添加先前卸下的部件并且每次都重新启动系统,直至发生错误。更换发生错误的相应部件。

    • 如果系统未重新启动,应首先怀疑是处理器板的问题,然后是系统 I/O 板。

异味

完成以下步骤,直至解决该问题。

  1. 异味可能来自新安装的设备。

  2. 如果问题仍然存在,请与 Lenovo 支持机构联系。

服务器温度似乎在升高

完成以下步骤,直至解决该问题。

多个服务器或机箱:

  1. 确保室温在指定范围内(请参阅规格)。

  2. 确保风扇已正确安装到位。

  3. 将 UEFI 和 XCC 更新到最新版本。

  4. 确保服务器中的填充件已正确安装(请参阅硬件更换过程了解详细的安装过程)。

  5. 使用 IPMI 命令将风扇速度逐渐提高到最高风扇速度,以查看是否可以解决问题。

    IPMI raw 命令只能由经过培训的技术人员使用,并且每个系统都有其自己特定的 IPMI raw 命令。

  6. 检查管理处理器事件日志中是否有温度升高事件。如果没有任何事件,则服务器在正常运行温度范围内运行。请注意,您可能会遇到一些温度变化。

安装新适配器后无法进入“传统”模式

请完成以下过程来解决该问题。

  1. 转至 UEFI 设置 > 设备和 I/O 端口 > 设置 Option ROM 执行顺序

  2. 将安装了操作系统的 RAID 适配器移动到列表顶部。

  3. 选择保存

  4. 重新启动系统并自动引导到操作系统。

部件开裂或机箱开裂

请与 Lenovo 支持机构联系。