Pular para o conteúdo principal

Remover a placa-base da GPU H100/H200

Siga as instruções nesta seção para remover a placa-base da GPU H100/H200. O procedimento deve ser executado por um técnico treinado.

Sobre esta tarefa

Atenção
  • Leia Diretrizes de instalação e Lista de verificação de inspeção de segurança para garantir que esteja trabalhando de forma segura.
  • Desligue o servidor e os dispositivos periféricos e desconecte os cabos de alimentação e todos os cabos externos. Consulte Desligar o servidor.
  • Se o servidor estiver instalado em um rack, remova o servidor do rack. Consulte Remover o servidor do rack.
  • Duas pessoas e um dispositivo de elevação no local que podem suportar até 400 lb (181 kg) são necessários para executar esse procedimento. Se você ainda não tiver um dispositivo de içamento disponível, a Lenovo oferece o Genie Lift GL-8 material lift que pode ser adquirido em Data Center Solution Configurator. Inclua o freio e a plataforma de carga ao pedir o Genie Lift GL-8 material lift.
Nota
Certifique-se de ter as ferramentas necessárias listadas abaixo disponíveis para substituir adequadamente o componente:
  • Chave de fenda de cabeça Torx T10
  • Chave de fenda de cabeça Torx T15
  • Chave de fenda de cabeça Phillips nº 1
  • Chave de fenda de cabeça Phillips nº 2
  • Chave de fenda de cabeça plana
  • Pano de limpeza com álcool
  • 2 x Kit PCM H100/H200
  • 2 x Kit de protetor putty com sistema hidráulico do SR780a V3 H100/H200
  • Kit de serviço com sistema hidráulico do SR780a V3 H100/H200
  • Kit de ferramentas de serviço da GPU H100/H200
  • Kit PCM NVSwitch H100/H200
  • Kit de protetor putty do NVSwitch H100/H200
  • Kit de alça de placa-base de GPU H100/H200
  • Bit de extensão Torx T25 de 150 mm (para alças de placa-base de GPU)
O kit de serviço com sistema hidráulico do H100/H200 e o kit de ferramentas são reutilizáveis e obrigatórios durante a manutenção de GPUs e módulos de placa fria da GPU. É recomendável mantê-los na instalação onde o servidor opera para futuras necessidades de substituição.
Nota
Certifique-se de ter as ferramentas necessárias listadas abaixo disponíveis para substituir adequadamente o componente:
  • Chave de fenda de torque que pode ser definida como 0,6 Newton-metro, 5,3 polegadas-libras
A ilustração a seguir mostra a numeração da GPU e a numeração de slots correspondente no XCC.
Figura 1. Numeração da GPU
GPU numbering
Soquete de GPU físicoNumeração de slot no XCCNúmero lógico em nvidia-smi

GPU 1

Slot 21

1

GPU 2

Slot 24

2

GPU 3

Slot 22

0

GPU 4

Slot 23

3

GPU 5

Slot 17

5

GPU 6

Slot 20

6

GPU 7

Slot 18

4

GPU 8

Slot 19

7

Procedimento

  1. Faça as preparações para essa tarefa.
    1. Remova a tampa superior frontal. Consulte Remover a tampa superior frontal.
    2. Remova a tampa superior traseira. Consulte Remover a tampa superior traseira.
    3. Remova o compartimento do ventilador. Consulte Remover a gaiola do ventilador (apenas técnico treinado).
    4. Remova o complexo da CPU. Consulte Remover o complexo da CPU.
    5. Remova o complexo de energia. Consulte Remover o complexo de energia.
    6. Desconecte os cabos da Placa-base da GPU.
    7. Desconecte e remova os cabos direcionados pelo complexo da GPU, se necessário. Antes de desconectar os cabos, faça uma lista de cada cabo e registre os conectores aos quais o cabo está conectado. Consulte Roteamento de cabos internos.
    8. Remova o módulo de placa fria da GPU traseira. Consulte Remover o módulo de placa fria da GPU H100/H200 traseira.
    9. Remova o módulo de placa fria da GPU frontal. Consulte Remover o módulo de placa fria da GPU H100/H200 frontal.
    10. Remova o módulo de placa fria do NVSwitch ou o módulo de placa fria do NVSwitch e da placa temporizadora. Consulte Remover o módulo de placa fria do NVSwitch H100/H200.
  2. Desencaixe o alternador do comutador PCIe do chassi.
    1. Pressione as duas travas de liberação azuis.
    2. Gire as duas alavancas de liberação até que estejam perpendiculares ao alternador do comutador PCIe.
    3. Puxe o alternador do comutador PCIe para frente até que ele pare.
      Importante
      Empurre as duas alavancas de liberação para trás até que elas travem no lugar depois de remover o alternador do comutador PCIe para evitar danos.
      Figura 2. Remoção do alternador do comutador PCIe para a posição de parada
      PCIe switch shuttle removal to stop position
  3. Solte os dois parafusos M3 para remover o suporte de proteção do conector da GPU.
    Figura 3. Removendo o suporte de proteção do conector da GPU
    Removing the GPU connector protective bracket
  4. Solte os 17 parafusos prisioneiros Torx T15 na placa-base da GPU.
    Nota
    Solte ou aperte os parafusos com uma chave de fenda de torque ajustada para o torque adequado. Para referência, o torque necessário para que os parafusos fiquem totalmente soltos ou presos é de 0,6±0,024 Newton-metro, de 5,3±0,212 libras-polegada.
    Figura 4. Remoção do parafuso
    Screw removal
  5. Remova o complexo da GPU.
    1. Pressione o botão na lateral da alça.
    2. Ajuste a alça para criar espaço para chave de fenda.
      Figura 5. Ajustando a alça
      Adjusting the handle
    3. Alinhe as alças com os orifícios dos parafusos e abaixe-as na placa-base da GPU; em seguida, aperte os cinco parafusos M3 (5 x M3, 0,5 newton-metro, 4,3 polegadas-libras) para prender as alças na placa-base da GPU.
      Figura 6. Instalando as alças
      Installing the handles
    4. Segure as duas alças (1) e levante o complexo da GPU para fora do chassi.
    Atenção
    Duas pessoas devem estar em cada lado do complexo da GPU e levantá-lo segurando as duas alças.
    Figura 7. Removendo o complexo da GPU
    Removing the GPU complex
    Nota
    Mantenha as alças conectadas ao complexo da GPU se ele for enviado para o procedimento de RMA.
  6. Remova as alças se necessário. Coloque com cuidado o complexo da GPU em uma superfície antiestática plana; em seguida, solte os cinco parafusos M3 que prendem as alças na placa-base. Levante as alças para removê-las da placa-base.
    Nota
    Mantenha as alças conectadas à placa base da GPU se ela for enviada para o procedimento de RMA.
    Figura 8. Removendo as alças
    Removing handles
  7. Remova as GPUs da placa-base da GPU.
    1. Coloque com cuidado o complexo da GPU em uma superfície antiestática plana.
    2. Solte os quatro parafusos Torx T15 na sequência mostrada na ilustração abaixo.
      Nota
      Solte os parafusos com uma chave de fenda de torque ajustada para o torque adequado. Para referência, o torque necessário para que os parafusos fiquem totalmente soltos é de 0,6 newton-metro, 5,3 polegada-libras.
    3. Remova com cuidado a GPU da placa-base da GPU.
      Figura 9. Removendo a GPU
      Removing the GPU
    4. Repita para remover todas as GPUs.

Depois de concluir

  1. Instale uma unidade de substituição. Consulte Instalar a placa-base da GPU H100/H200.
  2. Se você receber instruções para retornar o componente ou o dispositivo opcional, siga todas as instruções do pacote e use os materiais do pacote para remessa que foram fornecidos.