Zum Hauptinhalt springen

H100/H200 GPU‑ und Kühlkörpermodul installieren

Führen Sie die Anweisungen in diesem Abschnitt aus, um ein H100/H200 GPU‑ und Kühlkörpermodul zu installieren. Der Vorgang muss von einem qualifizierten Kundendiensttechniker ausgeführt werden.

Zu dieser Aufgabe

Achtung
  • Lesen Sie Installationsrichtlinien und Sicherheitsprüfungscheckliste, um sicherzustellen, dass Sie sicher arbeiten.
  • Berühren Sie mit der antistatischen Schutzhülle, in der sich die Komponente befindet, eine unlackierte Metalloberfläche am Server. Entnehmen Sie die Komponente anschließend aus der Schutzhülle und legen Sie sie auf eine antistatische Oberfläche.
  • Für dieses Verfahren sind zwei Personen und eine Hebevorrichtung vor Ort erforderlich, die bis zu 181 kg (400 lb) unterstützt. Wenn Ihnen noch keine Hebevorrichtung zur Verfügung steht, bietet Lenovo den Genie Lift GL-8 material lift an, der mit dem Data Center Solution Configurator Zusätzlich zum Genie Lift GL-8 material lift sollten Sie unbedingt auch die fußbetätigte Haltebremse und die Ladeplattform bestellen.
  • Stellen Sie sicher, dass Sie die Anschlüsse und Sockel der GPU und des GPU-Baseboard überprüfen. Verwenden Sie die GPU oder das GPU-Baseboard nicht, wenn die Anschlüsse beschädigt sind oder fehlen oder wenn sich Verunreinigungen in den Sockeln befinden. Ersetzen Sie die GPU oder das GPU-Baseboard durch eine neue Komponente, bevor Sie mit der Installation fortfahren.
  • GPU und Kühlkörper sind eine Komponente. Sie dürfen den Kühlkörper nicht von der GPU entfernen.
  • Die folgende Tabelle zeigt Informationen zur Zuordnung der physischen GPU-Sockel, die Steckplatznummerierung in XCC und die Modul-IDs in nvidia-smi.


    Physischer GPU-SockelSteckplatznummerierung in XCCModul-ID in nvidia-smi
    SXM 1Steckplatz 211
    SXM 2Steckplatz 242
    SXM 3Steckplatz 223
    SXM 4Steckplatz 234
    SXM 5Steckplatz 175
    SXM 6Steckplatz 206
    SXM 7Steckplatz 187
    SXM 8Steckplatz 198
Anmerkung
Stellen Sie sicher, dass Sie die unten aufgeführten Werkzeuge bereithalten, um die Komponente ordnungsgemäß auszutauschen:
  • Drehmomentschraubendreher, der auf 0,1–0,62 Newtonmeter bzw. 0,9–5,5 Poundforce Inch eingestellt werden kann
  • Verlängerter T15 Torx-Bit (200 mm lang)
  • H100/H200 Vorrichtung
Firmware‑ und Treiberdownload: Möglicherweise müssen Sie nach dem Austausch einer Komponente die Firmware oder Treiber aktualisieren.

Vorgehensweise

  1. (Optional) Führen Sie die folgenden Schritte für das neue GPU- und Kühlkörpermodul aus.
    • Entfernen Sie die Anschlussabdeckungen an der Unterseite.


    • Bringen Sie das FRU-Teilenummeretikett an.
      1. Entfernen Sie die Schutzfolie von der Kunststoffabdeckung.
      2. Bringen Sie das FRU-Teilenummeretikett an der Kunststoffabdeckung an.


    • Entfernen Sie die Kunststoffabdeckung vom Kühlkörper.


  2. Greifen Sie das GPU‑ und Kühlkörpermodul mit beiden Händen. Richten Sie das GPU‑ und Kühlkörpermodul dann an den zwei Führungslöchern auf dem GPU-Baseboard aus und setzen Sie es vorsichtig auf das GPU-Baseboard.
    Abbildung 1. GPU‑ und Kühlkörpermodul installieren
    GPU‑ und Kühlkörpermodul installation
  3. Richten Sie die Vorrichtung am GPU-Kühlkörper aus und installieren Sie sie vorsichtig am GPU-Kühlkörper.
    Abbildung 2. Vorrichtung installieren
    Jig installation
  4. Setzen Sie den Drehmomentschraubendreher in die vorgesehenen Löcher an der Vorrichtung ein und ziehen Sie die vier T15 Torx-Schrauben in der Reihenfolge an, wie in der folgenden Abbildung gezeigt ( > > > ).
    Anmerkung
    Stellen Sie zuerst den Drehmomentschraubendreher auf 0,1–0,12 Newtonmeter bzw. 0,9–1,1 Poundforce Inch, um die Schrauben ein paar Runden lang festzuziehen. Stellen Sie dann den Drehmomentschraubendreher auf 0,58–0,62 Newtonmeter bzw. 5–5,5 Poundforce Inch, um die Schrauben vollständig anzuziehen.
    Abbildung 3. Reihenfolge beim Anziehen der Schrauben
    Screw tightening sequence
  5. Entfernen Sie die Vorrichtung vom GPU-Kühlkörper.
    Abbildung 4. Vorrichtung entfernen
    Jig removal
  6. Setzen Sie die Kunststoffabdeckung auf das GPU‑ und Kühlkörpermodul, bis sie ordnungsgemäß sitzt.
    Abbildung 5. Installation der Kunststoffabdeckung
    Plastic cover installation

Nach dieser Aufgabe

  1. (nur GPU‑ und Kühlkörpermodul 2, 4, 5 und 7) Installieren Sie den GPU-Luftkanal erneut. Siehe H100/H200 GPU-Luftkanal installieren.
  2. Installieren Sie den Stromversorgungskomplex erneut. Siehe Stromversorgungskomplex installieren.
  3. Installieren Sie das 8U-GPU-Shuttle erneut. Siehe 8U-GPU-Shuttle installieren.
  4. Installieren Sie alle 2,5‑Zoll-Hot-Swap-Laufwerke oder Abdeckblenden der Laufwerkpositionen (sofern vorhanden) erneut in den Laufwerkpositionen. Siehe 2,5-Zoll-Hot-Swap-Laufwerk installieren
  5. Installieren Sie alle vorderen Lüfter erneut. Siehe Hot-Swap-Lüfter installieren (Vorderseite und Rückseite).
  6. Installieren Sie alle Netzteileinheiten erneut. Siehe Hot-Swap-Netzteileinheit installieren.
  7. Schließen Sie den Austausch der Komponenten ab. Informationen dazu finden Sie im Abschnitt Austausch von Komponenten abschließen.