跳到主要内容

GPU OAM 功率上限设置(仅限经过培训的技术人员)

请参阅以下章节了解有关 GPU OAM 功率上限的更多信息。此过程仅适用于经过培训的技术人员。

GPU OAM 功率上限工具

可以通过 XCC IPMI 命令设置 GPU OAM 功率上限。请参阅以下几节以了解 IPMI 命令。

XCC 和 AMC 固件版本

确保 XCC 和 AMC 固件版本符合要求。可以在 XCC Web GUI 中查看 XCC 和 AMC 固件版本。

XCC 和 AMC 固件版本要求:
  • XCC 固件版本必须为 USX318B 或更高版本。要更新 XCC 固件,请参阅 Lenovo XClarity Controller 门户页面

  • AMC 固件版本必须为 6.2.0.0 或更高版本。可以通过 XCC Web GUI 更新 AMC 固件。

更换主板后设置 GPU OAM 功率上限

更换主板后,请确保配置 GPU OAM 功率上限。

读取 GPU OAM 功率上限值

使用 IPMI 命令读取 GPU OAM 功率上限值。请参阅以下内容以了解更多详细信息。

步骤:

  1. 使用以下命令行读取用户定义的 GPU OAM 功率上限值:
    ipmitool raw 0x3a 0xce 9 3 2
    返回值如下:
    ipmitool raw 0x3a 0xce 9 3 2 
    0[x] [y][z]

    其中 [x]、[y] 和 [z] 分别代表三位十六进制数的第一位,第二位和第三位。将十六进制数转换为十进制数,这个十进制数就是功率上限值。

    例如,下面的返回值显示 GPU 功率上限值为 580 W(由十六进制数 244 转换而来)。
    ipmitool raw 0x3a 0xce 9 3 2 
    02 44

    记下功率上限值。

    如果返回的值为fail,请继续执行步骤 2。

  2. (如果在步骤 1 中成功读取了功率上限值,请跳过步骤 2。)

    使用以下命令行读取默认的 GPU OAM 功率上限值:
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
    返回值如下:
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02 
    0[x] [y][z]

    其中 [x]、[y] 和 [z] 分别代表三位十六进制数的第一位,第二位和第三位。将十六进制数转换为十进制数,这个十进制数就是功率上限值。

    例如,下面的返回值显示 GPU 功率上限值为 580 W(由十六进制数 244 转换而来)。
    ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02 
    02 44

    记下功率上限值。

使用 IPMI 命令配置 GPU OAM 功率上限

  • 功率上限值范围在 300 W 到 600 W 之间。XCC 将拒绝超出此范围的值。

  • 所有四个 GPU 的功率上限瓦数值均相同。

步骤:

  1. 将功率上限瓦数值从十进制数转换为十六进制数。

    以 580 W 为例,十进制数 580 转换为十六进制数为:244

  2. 使用以下命令行设置功率上限:
    ipmitool raw 0x3a 0xce 9 3 0x01 0x0[x] 0x[y][z]

    其中 [x]、[y] 和 [z] 分别代表转换后的十六进制数的第一位、第二位和第三位。

    例如,将 GPU 功率上限设置为 580 W 的命令行如下:
    ipmitool raw 0x3a 0xce 9 3 0x01 0x02 0x44
  3. 经过 30 到 50 秒后,使用以下命令读取功率上限值:
    ipmitool raw 0x3a 0xce 9 3 2
    返回值为:
    ipmitool raw 0x3a 0xce 9 3 2 
    0[x] [y][z]
    其中 [x]、[y] 和 [z] 应分别匹配转换后的十六进制数的第一位、第二位和第三位。例如,如果具有如下返回值,则说明 GPU 功率上限成功设置为 580 W。
    ipmitool raw 0x3a 0xce 9 3 2 
    02 44
  4. 如果响应功率上限值不正确,请关闭再打开系统的直流电源,然后重复步骤 2 来验证该值。如果问题仍然存在,请关闭再打开交流电源或执行模拟插拔,然后再次验证。