Zum Hauptinhalt springen

H100/H200 GPU-Baseboard installieren

Führen Sie die Anweisungen in diesem Abschnitt aus, um das H100/H200 GPU-Baseboard zu installieren. Der Vorgang muss von einem qualifizierten Kundendiensttechniker ausgeführt werden.

Zu dieser Aufgabe

Achtung
  • Lesen Sie Installationsrichtlinien und Sicherheitsprüfungscheckliste, um sicherzustellen, dass Sie sicher arbeiten.
  • Berühren Sie mit der antistatischen Schutzhülle, in der sich die Komponente befindet, eine unlackierte Metalloberfläche am Server. Entnehmen Sie die Komponente anschließend aus der Schutzhülle und legen Sie sie auf eine antistatische Oberfläche.
  • Überprüfen Sie unbedingt die Anschlüsse und Sockel der GPU und des GPU-Baseboards. Verwenden Sie die GPU oder das GPU-Baseboard nicht, wenn Anschlüsse beschädigt sind oder fehlen oder wenn sich Fremdkörper in den Sockeln befinden. Ersetzen Sie die GPU oder das GPU-Baseboard durch ein(e) neue(s), bevor Sie mit der Installation fortfahren.
Anmerkung
Stellen Sie sicher, dass Sie die unten aufgeführten Werkzeuge bereithalten, um die Komponente ordnungsgemäß auszutauschen:
  • T10-Torx-Schraubendreher
  • T15-Torx-Schraubendreher
  • PH1-Kreuzschlitzschraubendreher
  • PH2-Kreuzschlitzschraubendreher
  • Schlitzschraubendreher
  • Alkoholhaltiges Reinigungstuch
  • 2 x H100/H200 PCM-Satz
  • 2 x SR780a V3 H100/H200 Wasserkreislauf-Putty-Pad-Satz
  • SR780a V3 H100/H200 Wasserkreislauf-Service-Satz
  • H100/H200 GPU-Befestigungssatz
  • H100/H200 NVSwitch PCM-Satz
  • H100/H200 NVSwitch Putty-Pad-Satz
  • H100/H200 GPU-Baseboard-Griff-Satz
  • T25-Torx-Verlängerungsbit, 150 mm (für Griffe des GPU-Baseboards)
Der H100/H200-Wasserkreislauf-Service-Satz und der Befestigungssatz sind wiederverwendbar und für die Wartung von GPUs und GPU-Kühlplattenmodulen obligatorisch. Es wird empfohlen, sie in der Einrichtung aufzubewahren, in der der Server betrieben wird, um sie bei Bedarf ersetzen zu können.
Anmerkung
Stellen Sie sicher, dass Sie die unten aufgeführten Werkzeuge bereithalten, um die Komponente ordnungsgemäß auszutauschen:
  • Drehmomentschraubendreher, der auf 0,6 Newtonmeter bzw. 5,3 Poundforce Inch eingestellt werden kann
Firmware‑ und Treiberdownload: Möglicherweise müssen Sie nach dem Austausch einer Komponente die Firmware oder Treiber aktualisieren.
In der folgenden Abbildung sind die GPU-Nummerierung und die entsprechende Steckplatznummerierung in XCC dargestellt.
Abbildung 1. GPU-Nummerierung
GPU numbering
Physischer GPU-SockelSteckplatznummerierung in XCCLogische Nummer in nvidia-smi

GPU 1

Steckplatz 21

1

GPU 2

Steckplatz 24

2

GPU 3

Steckplatz 22

0

GPU 4

Steckplatz 23

3

GPU 5

Steckplatz 17

5

GPU 6

Steckplatz 20

6

GPU 7

Steckplatz 18

4

GPU 8

Steckplatz 19

7

Vorgehensweise

  1. (Optional) Nehmen Sie das neue GPU-Baseboard aus der Verpackung.
    1. Ziehen Sie die beiden Griffe auf beiden Seiten des GPU-Baseboards aus.
    2. Halten Sie die beiden Griffe fest und nehmen Sie das GPU-Baseboard aus der Verpackung.
    Abbildung 2. Entfernen des GPU-Baseboards aus der Verpackung
    Removing the GPU baseboard from the package box
  2. Installieren Sie die GPUs auf dem GPU-Baseboard.
    1. Legen Sie das GPU-Baseboard vorsichtig auf einer ebenen, antistatischen Oberfläche ab.
    2. Legen Sie die GPU vorsichtig auf dem GPU-Baseboard ab.
    3. Befolgen Sie die in der folgenden Abbildung gezeigte Reihenfolge, um die vier T15-Torx-Schrauben anzuziehen und die GPU am GPU-Baseboard zu befestigen.
      Anmerkung
      Stellen Sie zuerst den Drehmomentschraubendreher auf 0,1–0,12 Newtonmeter bzw. 0,9–1,1 Poundforce Inch, um die Schrauben ein paar Runden lang festzuziehen. Stellen Sie dann den Drehmomentschraubendreher auf 0,58–0,62 Newtonmeter bzw. 5–5,5 Poundforce Inch, um die Schrauben vollständig anzuziehen.
      Abbildung 3. Installieren der GPU
      Installing the GPU
    4. Wiederholen Sie diesen Vorgang, um alle GPUs zu installieren.
  3. Installieren Sie den GPU-Komplex.
    1. Halten Sie die Griffe (1) an beiden Seiten des GPU-Baseboards wie dargestellt in der richtigen Ausrichtung. Richten Sie dann den GPU-Komplex an den siebzehn Abstandshaltern auf der GPU-Komplex-Adapterplatte aus und setzen Sie ihn vorsichtig auf die Adapterplatte.
      Achtung
      Stellen Sie sicher, dass auf beiden Seiten des GPU-Komplexes zwei Personen stehen, und heben Sie ihn an, indem Sie die beiden Griffe festhalten.
      Abbildung 4. Installation des GPU-Komplexes
      GPU complex installation
    2. Drücken Sie auf den Knopf an der Seite des Griffs.
    3. Passen Sie den Griff so an, dass Platz für den Schraubendreher geschaffen wird.
      Abbildung 5. Einstellen des Griffs
      Adjusting the handle
    4. Lösen Sie die fünf M3-Schrauben, mit denen die Griffe am GPU-Komplex befestigt sind. Entfernen Sie dann die Griffe aus dem GPU-Komplex.
      Abbildung 6. Entfernen von Griffen
      Removing handles
  4. Befolgen Sie die in der folgenden Abbildung angezeigte Reihenfolge, um die siebzehn unverlierbaren T15-Torx-Schrauben anzuziehen und den GPU-Komplex zu befestigen.
    Wichtig
    Überdrehen Sie die Schrauben nicht, um eine Beschädigung zu vermeiden.
    Anmerkung
    Lösen oder befestigen Sie die Schrauben mit einem Drehmomentschraubendreher und dem richtigen Drehmoment. Das Drehmoment zum vollständigen Lösen oder Anziehen der Schrauben beträgt 0,6 ± 0,024 Newtonmeter bzw. 5,3 ± 0,212 Poundforce Inch.
    Abbildung 7. Anbringen der Schraube
    Screw installation
  5. Richten Sie die Schutzhalterung des GPU-Anschlusses an den entsprechenden Schraubenlöchern aus. Ziehen Sie dann die beiden M3-Schrauben (PH2, 2 x M3, 0,5 Newtonmeter bzw. 4,3 Poundforce Inch) an, um die Schutzhalterung des GPU-Anschlusses am Gehäuse zu befestigen.
    Abbildung 8. Installieren der Schutzhalterung des GPU-Anschlusses
    Installing GPU connector protective bracket
  6. Installieren Sie das PCIe-Switch-Shuttle.
    1. Drücken Sie auf die zwei blauen Entriegelungshebel.
    2. Drücken Sie die beiden Verriegelungshebel auf beiden Seiten des PCIe-Switch-Shuttles.
    3. Schieben Sie das PCIe-Switch-Shuttle bis zum Anschlag in das Gehäuse.
    4. Drehen Sie die zwei Lösehebel, bis sie einrasten.
      Abbildung 9. Installation des PCIe-Switch-Shuttles
      PCIe switch shuttle installation

Nach dieser Aufgabe

  1. Installieren Sie das NVSwitch-Kühlplattenmodul erneut. Siehe H100/H200 NVSwitch-Kühlplattenmodul installieren.
  2. Installieren Sie das vordere H100/H200 GPU-Kühlplattenmodul erneut. Siehe Vorderes H100/H200 GPU-Kühlplattenmodul installieren.
  3. Installieren Sie das hintere H100/H200 GPU-Kühlplattenmodul erneut. Siehe Hinteres H100/H200 GPU-Kühlplattenmodul installieren.
  4. Schließen Sie die Kabel wieder an das GPU-Baseboard an. Siehe Kabelführung für GPU-Baseboard.
  5. Schließen Sie alle vorher abgezogenen Kabel wieder an. Siehe Interne Kabelführung.
  6. Installieren Sie den Stromversorgungskomplex erneut. Siehe Stromversorgungskomplex installieren.
  7. Installieren Sie den CPU-Komplex erneut. Siehe CPU-Komplex installieren.
  8. Bauen Sie den Lüfterrahmen wieder ein. Siehe Lüfterrahmen installieren (nur qualifizierte Techniker).
  9. Bringen Sie die hintere obere Abdeckung wieder an. Siehe Hintere obere Abdeckung installieren.
  10. Bringen Sie die vordere obere Abdeckung wieder an. Siehe Vordere obere Abdeckung installieren.
  11. Schließen Sie den Austausch der Komponenten ab. Informationen dazu finden Sie im Abschnitt Austausch von Komponenten abschließen.