Zum Hauptinhalt springen

H100/H200 GPU‑ und Kühlkörpermodul entfernen

Führen Sie die Anweisungen in diesem Abschnitt aus, um ein H100/H200 GPU‑ und Kühlkörpermodul zu entfernen. Der Vorgang muss von einem qualifizierten Kundendiensttechniker ausgeführt werden.

Zu dieser Aufgabe

Achtung
  • Lesen Sie Installationsrichtlinien und Sicherheitsprüfungscheckliste, um sicherzustellen, dass Sie sicher arbeiten.
  • Schalten Sie den Server und die Peripheriegeräte aus und trennen Sie alle Netzkabel und externen Kabel. Siehe Server ausschalten.
  • Für dieses Verfahren sind zwei Personen und eine Hebevorrichtung vor Ort erforderlich, die bis zu 181 kg (400 lb) unterstützt. Wenn Ihnen noch keine Hebevorrichtung zur Verfügung steht, bietet Lenovo den Genie Lift GL-8 material lift an, der mit dem Data Center Solution Configurator Zusätzlich zum Genie Lift GL-8 material lift sollten Sie unbedingt auch die fußbetätigte Haltebremse und die Ladeplattform bestellen.
  • Stellen Sie sicher, dass Sie die Anschlüsse und Sockel der GPU und des GPU-Baseboard überprüfen. Verwenden Sie die GPU oder das GPU-Baseboard nicht, wenn die Anschlüsse beschädigt sind oder fehlen oder wenn sich Verunreinigungen in den Sockeln befinden. Ersetzen Sie die GPU oder das GPU-Baseboard durch eine neue Komponente, bevor Sie mit der Installation fortfahren.
  • GPU und Kühlkörper sind eine Komponente. Sie dürfen den Kühlkörper nicht von der GPU entfernen.
  • Die folgende Tabelle zeigt Informationen zur Zuordnung der physischen GPU-Sockel, die Steckplatznummerierung in XCC und die Modul-IDs in nvidia-smi.


    Physischer GPU-SockelSteckplatznummerierung in XCCModul-ID in nvidia-smi
    SXM 1Steckplatz 211
    SXM 2Steckplatz 242
    SXM 3Steckplatz 223
    SXM 4Steckplatz 234
    SXM 5Steckplatz 175
    SXM 6Steckplatz 206
    SXM 7Steckplatz 187
    SXM 8Steckplatz 198
Anmerkung
Stellen Sie sicher, dass Sie die unten aufgeführten Werkzeuge bereithalten, um die Komponente ordnungsgemäß auszutauschen:
  • Drehmomentschraubendreher, der auf 0,6 Newtonmeter bzw. 5,3 Poundforce Inch eingestellt werden kann
  • Verlängerter T15 Torx-Bit (200 mm lang)
  • H100/H200 Vorrichtung

Vorgehensweise

  1. Bereiten Sie diese Aufgabe vor.
    1. Entfernen Sie alle Netzteileinheiten. Siehe Hot-Swap-Netzteileinheit entfernen.
    2. Entfernen Sie alle vorderen Lüfter. Siehe Hot-Swap-Lüfter entfernen (Vorderseite und Rückseite).
    3. Entfernen Sie alle 2,5‑Zoll-Hot-Swap-Laufwerke und Abdeckblenden der Laufwerkpositionen (sofern vorhanden) aus den Laufwerkpositionen. Siehe 2,5-Zoll-Hot-Swap-Laufwerk entfernen.
    4. Ziehen Sie das 8U-GPU-Shuttle aus dem Gehäuse heraus und legen Sie es auf die Ladeplattform. Siehe 8U-GPU-Shuttle entfernen.
    5. Entfernen Sie den Stromversorgungskomplex. Siehe Stromversorgungskomplex entfernen.
    6. (nur GPU‑ und Kühlkörpermodul 2, 4, 5 und 7) Entfernen Sie den GPU-Luftkanal. Siehe H100/H200 GPU-Luftkanal entfernen.
  2. Entfernen Sie die Kunststoffabdeckung vom GPU‑ und Kühlkörpermodul.
    Abbildung 1. Entfernen der Kunststoffabdeckung
    Plastic cover removal
  3. Richten Sie die Vorrichtung am GPU-Kühlkörper aus und installieren Sie sie vorsichtig am GPU-Kühlkörper.
    Abbildung 2. Vorrichtung installieren
    Jig installation
  4. Setzen Sie den Drehmomentschraubendreher in die vorgesehenen Löcher an der Vorrichtung ein und lösen Sie die vier T15 Torx-Schrauben in der Reihenfolge, wie in der folgenden Abbildung gezeigt ( > > > ).
    Anmerkung
    Lösen Sie die Schrauben mit einem Drehmomentschraubendreher, der auf das richtige Drehmoment eingestellt ist. Das Drehmoment zum vollständigen Lösen der Schrauben beträgt 0,6 Newtonmeter bzw. 5,3 Poundforce Inch.
    Abbildung 3. Entfernen der Schrauben
    Screw removal
  5. Entfernen Sie die Vorrichtung vom GPU-Kühlkörper.
    Abbildung 4. Vorrichtung entfernen
    Jig removal
  6. Heben Sie mit beiden Händen das GPU- und Kühlkörpermodul vom GPU-Baseboard ab.
    Abbildung 5. GPU- und Kühlkörpermodul entfernen
    GPU and heat sink module removal

Nach dieser Aufgabe

Wenn Sie angewiesen werden, die Komponente oder die Zusatzeinrichtung einzusenden, befolgen Sie die Verpackungsanweisungen und verwenden Sie ggf. das mitgelieferte Verpackungsmaterial für den Transport.