Saltar al contenido principal

Extracción del complejo de GPU H100/H200

Siga las instrucciones que aparecen en esta sección para extraer el complejo de GPU H100/H200. El procedimiento debe ser realizado por un técnico capacitado.

Acerca de esta tarea

S036




18 - 32 kg (39 - 70 lb)32 - 55 kg (70 - 121 lb)
PRECAUCIÓN
Utilice métodos seguros cuando lo levante.
Atención
  • Lea Directrices de instalación y Lista de comprobación de inspección de seguridad para asegurarse de que trabaja con seguridad.
  • Apague el servidor y los dispositivos periféricos y desconecte los cables de alimentación y todos los cables externos. Consulte Apagado del servidor.
  • Para realizar este procedimiento se requieren dos personas y un dispositivo de elevación en el sitio que soporte hasta 181 kg (400 lb). Si todavía no tiene un dispositivo de elevación disponible, Lenovo ofrece el Genie Lift GL-8 material lift que se puede comprar en Data Center Solution Configurator. Asegúrese de incluir el freno de liberación con el pie y la plataforma de carga al pedir el Genie Lift GL-8 material lift.
Nota
Asegúrese de que tiene a mano las herramientas requeridas que aparecen a continuación para sustituir correctamente el componente:
  • Destornillador de cabeza Torx T10
  • Destornillador de cabeza Torx T15
  • Destornillador de cabeza Phillips n.° 1
  • Destornillador de cabeza Phillips n.° 2
  • Destornillador plano
  • Toallita de limpieza con alcohol
  • 2 kits de PCM H100/H200
  • 2 kits de almohadillas de masilla de bucle de agua H100/H200 de SR780a V3
  • Kit de servicio de bucle de agua H100/H200 de SR780a V3
  • Kit de dispositivo de mantenimiento de la GPU H100/H200
  • Kit de PCM del NVSwitch H100/H200
  • Kit de almohadillas de masilla del NVSwitch H100/H200
  • Kit de asas de la placa base de la GPU H100/H200
  • Broca de extensión Torx T25 de 150 mm (para asas de placa base de GPU)
El kit de servicio de bucle de agua H100/H200 y el kit de dispositivo de mantenimiento son reutilizables y obligatorios cuando se realiza el mantenimiento de GPU y módulos de la placa de frío de la GPU. Se recomienda mantenerlos en la instalación en la que opera el servidor en caso de que se necesiten sustituciones en el futuro.
Nota
Asegúrese de que tiene a mano las herramientas requeridas que aparecen a continuación para sustituir correctamente el componente:
  • Destornillador con regulación de par que se puede establecer en 0,6 newton-metros, 5,3 pulgadas-libras
La siguiente ilustración muestra la numeración de la GPU y la numeración de ranura correspondiente en XCC.
Figura 1. Numeración de la GPU
GPU numbering
Zócalo de GPU físicoNumeración de ranuras en XCCNúmero lógico en nvidia-smi

GPU 1

Ranura 21

1

GPU 2

Ranura 24

2

GPU 3

Ranura 22

0

GPU 4

Ranura 23

3

GPU 5

Ranura 17

5

GPU 6

Ranura 20

6

GPU 7

Ranura 18

4

GPU 8

Ranura 19

7

Procedimiento

  1. Prepárese para esta tarea.
    1. Quite la cubierta superior frontal. Consulte Extracción de la cubierta superior frontal.
    2. Quite la cubierta superior posterior. Consulte Extracción de la cubierta superior posterior.
    3. Quite el compartimiento del ventilador. Consulte Extracción del compartimiento del ventilador (solamente para técnicos capacitados).
    4. Quite el complejo de CPU. Consulte Extracción del complejo de CPU.
    5. Quite el complejo de alimentación. Consulte Extracción del complejo de alimentación.
    6. Desconecte los cables de la Placa base de GPU.
    7. Si es necesario, desconecte y quite los cables que pasan por el complejo de GPU. Antes de desconectar los cables, haga una lista de cada uno de ellos y tome nota de los conectores a los que están conectados los cables. Consulte Disposición interna de los cables.
    8. Quite el módulo de la placa de frío de la GPU posterior. Consulte Extracción del módulo de la placa de frío de la GPU H100/H200 posterior.
    9. Quite el módulo de la placa de frío de la GPU frontal. Consulte Extracción del módulo de la placa de frío de la GPU H100/H200 frontal.
    10. Quite el módulo de la placa de frío del NVSwitch o el módulo de la placa de frío del NVSwitch y el retemporizador. Consulte Extracción del módulo de la placa de frío del NVSwitch H100/H200.
  2. Desenganche la lanzadera del conmutador PCIe del chasis.
    1. Presione los dos pestillos de liberación azules.
    2. Gire las dos palancas de liberación hasta que estén perpendiculares a la lanzadera del conmutador PCIe.
    3. Tire de la lanzadera del conmutador PCIe hacia delante hasta que se detenga.
      Importante
      Empuje las dos palancas de liberación hacia atrás hasta que se bloqueen en su lugar después de extraer la lanzadera del conmutador PCIe para evitar daños.
      Figura 2. Extracción de la lanzadera del conmutador PCIe en la posición de detención
      PCIe switch shuttle removal to stop position
  3. Suelte los dos tornillos M3 para quitar el soporte protector del conector de la GPU.
    Figura 3. Extracción del soporte protector del conector de la GPU
    Removing the GPU connector protective bracket
  4. Suelte los diecisiete tornillos de fijación Torx T15 de la placa base de la GPU.
    Nota
    Afloje o apriete los tornillos con un destornillador de par con el par correspondiente. Como referencia, el par necesario para que los tornillos se suelten o aprieten completamente es de 0,6±0,024 newton-metros, 5,3±0,212 pulgada-libras.
    Figura 4. Extracción de tornillos
    Screw removal
  5. Quite el complejo de GPU.
    1. Presione el botón que se encuentra al costado del asa.
    2. Ajuste el asa para hacer espacio para el destornillador.
      Figura 5. Ajuste del asa
      Adjusting the handle
    3. Alinee las asas con los orificios de tornillos y bájelas hacia la placa base de la GPU; luego, apriete los cinco tornillos M3 (5 x M3, 0,5 newton-metros, 4,3 pulgada-libras) para fijar las asas a la placa base de la GPU.
      Figura 6. Instalación de las asas
      Installing the handles
    4. Sujete las dos asas (1) y levante el complejo de GPU para quitarlo del chasis.
    Atención
    Asegúrese de que dos personas estén a ambos lados del complejo de GPU y levántenlo sujetando las dos asas.
    Figura 7. Extracción del complejo de GPU
    Removing the GPU complex
    Nota
    Mantenga las asas conectadas al complejo de GPU en caso de que esta se vaya a enviar a un procedimiento de RMA.

Después de finalizar

  1. Instale una unidad de sustitución. Consulte Instalación del complejo de GPU H100/H200.
  2. Si se le indica que devuelva el componente o dispositivo opcional, siga todas las instrucciones del embalaje y utilice los materiales de embalaje para el envío que se le suministraron.