Pular para o conteúdo principal

Instalar uma GPU H100/H200 e um módulo de dissipador de calor

Siga as instruções nesta seção para instalar um módulo de dissipador de calor e GPU H100/H200. O procedimento deve ser executado por um técnico treinado.

Sobre esta tarefa

Atenção
  • Leia Diretrizes de instalação e Lista de verificação de inspeção de segurança para garantir que esteja trabalhando de forma segura.
  • Encoste a embalagem antiestática que contém o componente em qualquer superfície metálica não pintada no servidor; em seguida, remova-o da embalagem e coloque-o em uma superfície antiestática.
  • Duas pessoas e um dispositivo de elevação no local que podem suportar até 400 lb (181 kg) são necessários para executar esse procedimento. Se você ainda não tiver um dispositivo de içamento disponível, a Lenovo oferece o Genie Lift GL-8 material lift que pode ser adquirido em Data Center Solution Configurator. Inclua o freio e a plataforma de carga ao pedir o Genie Lift GL-8 material lift.
  • Inspecione os conectores e os soquetes na GPU e na Placa-base da GPU. Não use a GPU nem a Placa-base da GPU se os conectores estiverem danificados ou ausentes, ou se houver detritos nos soquetes. Substitua a GPU ou a Placa-base da GPU antes de continuar o procedimento de instalação.
  • A GPU e o dissipador de calor compõem uma peça. Não remova o dissipador de calor da GPU.
  • A tabela a seguir mostra as informações de mapeamento sobre os soquetes de GPU físicos, a numeração de slots no XCC e os IDs dos módulos no nvidia-smi.


    Soquete de GPU físicoNumeração de slot no XCCID do módulo no nvidia-smi
    SXM 1Slot 211
    SXM 2Slot 242
    SXM 3Slot 223
    SXM 4Slot 234
    SXM 5Slot 175
    SXM 6Slot 206
    SXM 7Slot 187
    SXM 8Slot 198
Nota
Certifique-se de ter as ferramentas necessárias listadas abaixo disponíveis para substituir adequadamente o componente:
  • Chave de fenda de torque que pode ser definida como 0,1 a 0,62 Newton-metro, 0,9 a 5,5 polegadas-libras
  • Torx T15 bit estendido (200 mm de comprimento)
  • Gabarito H100/H200
Download de firmware e driver: talvez seja necessário atualizar o firmware ou o driver depois de substituir um componente.

Procedimento

  1. (Opcional) Conclua as etapas a seguir para a nova GPU e o módulo de dissipador de calor.
    • Remova as tampas do conector na parte inferior.


    • Anexe a etiqueta do número de peça da FRU.
      1. Remova a película protetora da tampa plástica.
      2. Cole a etiqueta do número de peça da FRU na tampa plástica.


    • Remova a tampa plástica do dissipador de calor.


  2. Segure o Módulo de GPU e dissipador de calor com as duas mãos; em seguida, alinhe o Módulo de GPU e dissipador de calor com os dois orifícios-guia na Placa-base da GPU e coloque-o com cuidado na Placa-base da GPU.
    Figura 1. Instalação do Módulo de GPU e dissipador de calor
    Módulo de GPU e dissipador de calor installation
  3. Alinhe o gabarito com o dissipador de calor de GPU e instale-o cuidadosamente no dissipador de calor de GPU.
    Figura 2. Instalação do gabarito
    Jig installation
  4. Insira a chave de fenda de torque nos orifícios designados no dispositivo e aperte os quatro parafusos Torx T15 na sequência mostrada na ilustração abaixo ( > > > ).
    Nota
    Primeiro, ajuste a chave de fenda de torque para 0,1 - 0,12 newton-metro, 0,9 - 1,1 libras-polegadas para apertar os parafusos por algumas rodadas. Em seguida, ajuste a chave de fenda de torque para 0,58 - 0,62 newton-metro, 5 - 5,5 libras-polegadas para apertar totalmente os parafusos.
    Figura 3. Sequência de aperto dos parafusos
    Screw tightening sequence
  5. Remova o gabarito do dissipador de calor da GPU.
    Figura 4. Remoção do gabarito
    Jig removal
  6. Coloque a tampa plástica sobre o Módulo de GPU e dissipador de calor até que esteja bem encaixada.
    Figura 5. Instalação da tampa plástica
    Plastic cover installation

Depois de concluir

  1. (Somente o Módulo de GPU e dissipador de calor 2, 4, 5 e 7) Reinstale o duto de ar da GPU. Consulte Instalar um duto de ar da GPU H100/H200.
  2. Reinstale o complexo de energia. Consulte Instalar o complexo de energia.
  3. Reinstale o Alternador de GPU 8U. Consulte Instalar o alternador de GPU 8U.
  4. Reinstale todas as unidades hot-swap de 2,5 polegadas ou preenchimentos do compartimento de unidade (se houver) nos compartimentos de unidade. Consulte Instalar uma unidade hot-swap de 2,5 polegadas
  5. Reinstale todos os ventiladores frontais. Consulte Instalar um ventilador hot-swap (frontal e traseiro).
  6. Reinstale todas as unidades de fonte de alimentação. Consulte Instalar uma unidade de fonte de alimentação hot-swap.
  7. Conclua a substituição de peças. Consulte Concluir a substituição de peças.