Pular para o conteúdo principal

Instalar a placa-base da GPU H100/H200

Siga as instruções nesta seção para instalar a placa-base da GPU H100/H200. O procedimento deve ser executado por um técnico treinado.

Sobre esta tarefa

Atenção
  • Leia Diretrizes de instalação e Lista de verificação de inspeção de segurança para garantir que esteja trabalhando de forma segura.
  • Encoste a embalagem antiestática que contém o componente em qualquer superfície metálica não pintada no servidor; em seguida, remova-o da embalagem e coloque-o em uma superfície antiestática.
  • Inspecione os conectores e soquetes na GPU e na placa-base da GPU. Não use a GPU nem a placa base da GPU se seus conectores estiverem danificados ou ausentes, ou se houver detritos nos soquetes. Substitua a GPU ou a placa-base da GPU antes de continuar o procedimento de instalação.
Nota
Certifique-se de ter as ferramentas necessárias listadas abaixo disponíveis para substituir adequadamente o componente:
  • Chave de fenda de cabeça Torx T10
  • Chave de fenda de cabeça Torx T15
  • Chave de fenda de cabeça Phillips nº 1
  • Chave de fenda de cabeça Phillips nº 2
  • Chave de fenda de cabeça plana
  • Pano de limpeza com álcool
  • 2 x Kit PCM H100/H200
  • 2 x Kit de protetor putty com sistema hidráulico do SR780a V3 H100/H200
  • Kit de serviço com sistema hidráulico do SR780a V3 H100/H200
  • Kit de ferramentas de serviço da GPU H100/H200
  • Kit PCM NVSwitch H100/H200
  • Kit de protetor putty do NVSwitch H100/H200
  • Kit de alça de placa-base de GPU H100/H200
  • Bit de extensão Torx T25 de 150 mm (para alças de placa-base de GPU)
O kit de serviço com sistema hidráulico do H100/H200 e o kit de ferramentas são reutilizáveis e obrigatórios durante a manutenção de GPUs e módulos de placa fria da GPU. É recomendável mantê-los na instalação onde o servidor opera para futuras necessidades de substituição.
Nota
Certifique-se de ter as ferramentas necessárias listadas abaixo disponíveis para substituir adequadamente o componente:
  • Chave de fenda de torque que pode ser definida como 0,6 Newton-metro, 5,3 polegadas-libras
Download de firmware e driver: talvez seja necessário atualizar o firmware ou o driver depois de substituir um componente.
A ilustração a seguir mostra a numeração da GPU e a numeração de slots correspondente no XCC.
Figura 1. Numeração da GPU
GPU numbering
Soquete de GPU físicoNumeração de slot no XCCNúmero lógico em nvidia-smi

GPU 1

Slot 21

1

GPU 2

Slot 24

2

GPU 3

Slot 22

0

GPU 4

Slot 23

3

GPU 5

Slot 17

5

GPU 6

Slot 20

6

GPU 7

Slot 18

4

GPU 8

Slot 19

7

Procedimento

  1. (Opcional) Remova a nova placa-base da GPU da embalagem.
    1. Estenda as duas alças nos dois lados da placa-base da GPU.
    2. Segure as duas alças e remova a placa-base da GPU da embalagem.
    Figura 2. Removendo a placa-base da GPU da embalagem
    Removing the GPU baseboard from the package box
  2. Instale as GPUs na placa-base da GPU.
    1. Coloque com cuidado a placa-base da GPU em uma superfície antiestática plana.
    2. Coloque com cuidado a GPU na placa-base da GPU.
    3. Siga a sequência mostrada na ilustração abaixo para apertar os quatro parafusos Torx T15 para fixar a GPU na placa-base.
      Nota
      Primeiro, ajuste a chave de fenda de torque para 0,1 - 0,12 newton-metro, 0,9 - 1,1 libras-polegadas para apertar os parafusos por algumas rodadas. Em seguida, ajuste a chave de fenda de torque para 0,58 - 0,62 newton-metro, 5 - 5,5 libras-polegadas para apertar totalmente os parafusos.
      Figura 3. Instalando a GPU
      Installing the GPU
    4. Repita para instalar todas as GPUs.
  3. Instale o complexo da GPU.
    1. Segure as alças (1) nos dois lados da placa-base da GPU na orientação correta, conforme ilustrado; em seguida, alinhe o complexo da GPU com os 17 suportes na placa do adaptador do complexo da GPU e coloque-o cuidadosamente na placa do adaptador.
      Atenção
      Duas pessoas devem estar em cada lado do complexo da GPU e levantá-lo segurando as duas alças.
      Figura 4. Instalação do complexo da GPU
      GPU complex installation
    2. Pressione o botão na lateral da alça.
    3. Ajuste a alça para criar espaço para chave de fenda.
      Figura 5. Ajustando a alça
      Adjusting the handle
    4. Solte os cinco parafusos M3 que prendem as alças no complexo da GPU; em seguida, remova as alças do complexo da GPU.
      Figura 6. Removendo as alças
      Removing handles
  4. Siga a sequência mostrada na ilustração abaixo para apertar os 17 parafusos prisioneiros Torx T15 para fixar o complexo da GPU.
    Importante
    Não aperte demais os parafusos para evitar danos.
    Nota
    Solte ou aperte os parafusos com uma chave de fenda de torque ajustada para o torque adequado. Para referência, o torque necessário para que os parafusos fiquem totalmente soltos ou presos é de 0,6±0,024 Newton-metro, de 5,3±0,212 libras-polegada.
    Figura 7. Instalação do parafuso
    Screw installation
  5. Alinhe o suporte de proteção do conector de GPU com os orifícios de parafuso correspondentes; em seguida, aperte os dois parafusos M3 (PH2, 2 x M3, 0,5 newton-metro, 4,3 libras-polegadas) para prender o suporte de proteção do conector de GPU no chassi.
    Figura 8. Instalando o suporte de proteção do conector de GPU
    Installing GPU connector protective bracket
  6. Instale o alternador do comutador PCIe.
    1. Pressione as duas travas de liberação azuis.
    2. Pressione as duas travas de bloqueio nos dois lados do alternador do comutador PCIe.
    3. Empurre o alternador do comutador PCIe no chassi até que ele pare.
    4. Gire as duas alavancas de liberação até que se travem no lugar.
      Figura 9. Instalação do alternador do comutador PCIe
      PCIe switch shuttle installation

Depois de concluir

  1. Reinstale o módulo de placa fria do NVSwitch. Consulte Instalar o módulo de placa fria do NVSwitch H100/H200.
  2. Reinstale o módulo de placa fria da GPU H100/H200 frontal. Consulte Instale o módulo de placa fria da GPU H100/H200 frontal.
  3. Reinstale o módulo de placa fria da GPU H100/H200 traseira. Consulte Instale o módulo de placa fria da GPU H100/H200 traseira.
  4. Reconecte os cabos na Placa-base da GPU. Consulte Roteamento de cabos da placa-base da GPU para obter mais informações.
  5. Reconecte todos os cabos que foram desconectados. Consulte Roteamento de cabos internos.
  6. Reinstale o complexo de energia. Consulte Instalar o complexo de energia.
  7. Reinstale o complexo da CPU. Consulte Instalar o complexo da CPU.
  8. Reinstale o compartimento do ventilador. Consulte Instalar o compartimento do ventilador (apenas técnico treinado).
  9. Reinstale a tampa superior traseira. Consulte Instalar a tampa superior traseira.
  10. Reinstale a tampa superior frontal. Consulte Instalar a tampa superior frontal.
  11. Conclua a substituição de peças. Consulte Concluir a substituição de peças.