GPU OAM 功率上限设置(仅限经过培训的技术人员)
请参阅以下章节了解有关 GPU OAM 功率上限的更多信息。此过程仅适用于经过培训的技术人员。
GPU OAM 功率上限工具
可以通过 XCC IPMI 命令设置 GPU OAM 功率上限。请参阅以下几节以了解 IPMI 命令。
确保 XCC 和 AMC 固件版本符合要求。可以在 XCC Web GUI 中查看 XCC 和 AMC 固件版本。
XCC 固件版本必须为 USX318B 或更高版本。要更新 XCC 固件,请参阅 Lenovo XClarity Controller 门户页面。
AMC 固件版本必须为 6.2.0.0 或更高版本。可以通过 XCC Web GUI 更新 AMC 固件。
更换主板后设置 GPU OAM 功率上限
要沿用与被替换 GPU 相同的功率上限值,请执行以下操作:
关闭服务器电源之前,读取 GPU OAM 功率上限值。请参阅读取 GPU OAM 功率上限值。
打开服务器电源后,配置 GPU OAM 功率上限值。请参阅使用 IPMI 命令配置 GPU OAM 功率上限。
要设置新的功率上限值,请转到使用 IPMI 命令配置 GPU OAM 功率上限。
读取 GPU OAM 功率上限值
使用 IPMI 命令读取 GPU OAM 功率上限值。请参阅以下内容以了解更多详细信息。
步骤:
- 使用以下命令行读取用户定义的 GPU OAM 功率上限值:
ipmitool raw 0x3a 0xce 9 3 2
返回值如下:ipmitool raw 0x3a 0xce 9 3 2
0[x] [y][z]其中 [x]、[y] 和 [z] 分别代表三位十六进制数的第一位,第二位和第三位。将十六进制数转换为十进制数,这个十进制数就是功率上限值。
例如,下面的返回值显示 GPU 功率上限值为 580 W(由十六进制数 244 转换而来)。ipmitool raw 0x3a 0xce 9 3 2
02 44记下功率上限值。
如果返回的值为
fail
,请继续执行步骤 2。 (如果在步骤 1 中成功读取了功率上限值,请跳过步骤 2。)
使用以下命令行读取默认的 GPU OAM 功率上限值:ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
返回值如下:ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
0[x] [y][z]其中 [x]、[y] 和 [z] 分别代表三位十六进制数的第一位,第二位和第三位。将十六进制数转换为十进制数,这个十进制数就是功率上限值。
例如,下面的返回值显示 GPU 功率上限值为 580 W(由十六进制数 244 转换而来)。ipmitool raw 0x3a 0x0b 0xf2 0x0 0x10 0x02
02 44记下功率上限值。
使用 IPMI 命令配置 GPU OAM 功率上限
功率上限值范围在 300 W 到 600 W 之间。XCC 将拒绝超出此范围的值。
所有四个 GPU 的功率上限瓦数值均相同。
步骤:
将功率上限瓦数值从十进制数转换为十六进制数。
以 580 W 为例,十进制数 580 转换为十六进制数为:244
- 使用以下命令行设置功率上限:
ipmitool raw 0x3a 0xce 9 3 0x01 0x0[x] 0x[y][z]
其中 [x]、[y] 和 [z] 分别代表转换后的十六进制数的第一位、第二位和第三位。
例如,将 GPU 功率上限设置为 580 W 的命令行如下:ipmitool raw 0x3a 0xce 9 3 0x01 0x02 0x44
- 经过 30 到 50 秒后,使用以下命令读取功率上限值:
ipmitool raw 0x3a 0xce 9 3 2
返回值为:ipmitool raw 0x3a 0xce 9 3 2
0[x] [y][z]其中 [x]、[y] 和 [z] 应分别匹配转换后的十六进制数的第一位、第二位和第三位。例如,如果具有如下返回值,则说明 GPU 功率上限成功设置为 580 W。ipmitool raw 0x3a 0xce 9 3 2
02 44 如果响应功率上限值不正确,请关闭再打开系统的直流电源,然后重复步骤 2 来验证该值。如果问题仍然存在,请关闭再打开交流电源或执行模拟插拔,然后再次验证。