Zum Hauptinhalt springen

Vorderes B200 GPU-Kühlplattenmodul entfernen

Führen Sie die Anweisungen in diesem Abschnitt aus, um das vordere B200 GPU-Kühlplattenmodul zu entfernen. Der Vorgang muss von einem qualifizierten Kundendiensttechniker ausgeführt werden.

Zu dieser Aufgabe

Achtung
  • Lesen Sie Installationsrichtlinien und Sicherheitsprüfungscheckliste, um sicherzustellen, dass Sie sicher arbeiten.
  • Schalten Sie den Server und die Peripheriegeräte aus und trennen Sie alle Netzkabel und externen Kabel. Siehe Server ausschalten.
  • Wenn der Server in einem Rack installiert ist, schieben Sie ihn aus den Laufschienen des Racks heraus, um Zugriff zur oberen Abdeckung zu erhalten oder das Gehäuse aus dem Rack zu schieben. Siehe Server aus dem Rack entfernen.
  • Für dieses Verfahren sind zwei Personen und eine Hebevorrichtung vor Ort erforderlich, die bis zu 181 kg (400 lb) unterstützt. Wenn Ihnen noch keine Hebevorrichtung zur Verfügung steht, bietet Lenovo den Genie Lift GL-8 material lift an, der mit dem Data Center Solution Configurator Zusätzlich zum Genie Lift GL-8 material lift sollten Sie unbedingt auch die fußbetätigte Haltebremse und die Ladeplattform bestellen.
  • Falls Sie keinen Drehmomentschraubendreher besitzen, wird auf Anfrage einer zur Verfügung gestellt.
Anmerkung
Stellen Sie sicher, dass Sie die unten aufgeführten Werkzeuge bereithalten, um die Komponente ordnungsgemäß auszutauschen:
  • T15-Torx-Schraubendreher
  • T15-Torx-Verlängerungsbit, 200 mm
  • PH1-Kreuzschlitzschraubendreher
  • PH2-Kreuzschlitzschraubendreher
  • Alkoholhaltiges Reinigungstuch
  • B200 PCM
  • B200 SXM6 PAD-1
  • B200 SXM6 PAD-2
  • B200 Vorderer und hinterer GPU-Transporthalterungssatz
  • B200 GPU-Service-Satz
Der Satz B200 (GPU und Retimer, NVSwitch) (Service- und Transporthalterung) ist wiederverwendbar und obligatorisch für die Wartung von GPUs und GPU-Kühlplattenmodulen. Es wird empfohlen, sie in der Einrichtung aufzubewahren, in der der Server betrieben wird, um sie bei Bedarf ersetzen zu können.
Wichtig
Richtlinien zum Austauschen von Putty-Pads/Phasenwechselmaterialien (PCM)
  • Reinigen Sie vor dem Austausch des Putty-Pads/PCM die Hardwareoberfläche vorsichtig mit einem alkoholhaltigen Reinigungstuch.
  • Halten Sie das Putty-Pad/PCM vorsichtig fest, um eine Verformung zu vermeiden. Stellen Sie sicher, dass keine Schraubenlöcher oder Öffnungen durch das Putty-Pad/PCM verdeckt werden.
  • Verwenden Sie kein abgelaufenes Putty-Pad/PCM. Überprüfen Sie das Verfallsdatum auf der Verpackung des Putty-Pads/PCM. Wenn die Putty-Pads/PCM abgelaufen sind, kaufen Sie neue, um sie ordnungsgemäß zu ersetzen.
In der folgenden Abbildung sind die B200 GPU-Nummerierung und die entsprechende Steckplatznummerierung in XCC dargestellt.
Abbildung 1. B200 GPU-Nummerierung
B200 GPU numbering
Physischer GPU-SockelSteckplatznummerierung in XCCLogische Nummer in nvidia-smi

GPU 1

Steckplatz 21

4

GPU 2

Steckplatz 24

7

GPU 3

Steckplatz 22

5

GPU 4

Steckplatz 23

6

GPU 5

Steckplatz 17

0

GPU 6

Steckplatz 20

3

GPU 7

Steckplatz 18

1

GPU 8

Steckplatz 19

2

Die folgende Abbildung zeigt die Komponenten für das vordere B200 GPU-Kühlplattenmodul.
Abbildung 2. Identifikation der Komponenten des vorderen B200 GPU-Kühlplattenmoduls
Front B200 GPU cold plate module components identification
Tabelle 1. Komponenten des vorderen B200 GPU-Kühlplattenmoduls
1 Leitung2 Schlauchbinder
3 Flüssigkeitserkennungssensormodul4 Transporthalterung
5 GPU-Kühlplatte6 Etikett der GPU-Steckplatznummer
7 Drehmomentetikett für GPU-Kühlplattenschrauben 

Vorgehensweise

  1. Bereiten Sie diese Aufgabe vor.
    1. Entfernen Sie die vordere obere Abdeckung. Siehe Vordere obere Abdeckung entfernen.
    2. Entfernen Sie die hintere obere Abdeckung. Siehe Hintere obere Abdeckung entfernen.
    3. Entfernen Sie den Lüfterrahmen. Siehe Lüfterrahmen entfernen (nur qualifizierte Techniker).
    4. Entfernen Sie den CPU-Komplex. Siehe CPU-Komplex entfernen.
    5. Entfernen Sie den Stromversorgungskomplex. Siehe Stromversorgungskomplex entfernen.
    6. Ziehen Sie die Kabel ab und entfernen Sie sie bei Bedarf aus dem GPU-Komplex. Bevor Sie die Kabel abziehen, erstellen Sie eine Liste der einzelnen Kabel und notieren Sie, an welchen Anschlüssen die Kabel angeschlossen sind. Siehe Interne Kabelführung.
  2. Die folgende Abbildung zeigt die Position der Schlauchhalterung.
    Abbildung 3. Position der Schlauchhalterung
    Hose holder location
  3. Entfernen Sie die Halterung des hinteren Lüfterrahmens.
    1. Lösen Sie die acht M3-Schrauben, mit denen die Halterung des hinteren Lüfterrahmens am Gehäuse befestigt ist.
    2. Lösen Sie die vier M3-Schrauben, mit denen die Halterung für den hinteren Lüfterrahmen am Lüfterrahmen befestigt ist.
    3. Fassen Sie die Halterung des hinteren Lüfterrahmens, um sie aus dem Lüfterrahmen zu heben.
    Abbildung 4. Entfernen der Halterung des hinteren Lüfterrahmens
    Removing the hose cover
  4. Wenn das hintere B200 GPU-Kühlplattenmodul bereits im Gehäuse installiert ist, fahren Sie mit Schritt 5 bis 7 fort, um die Leitung der hinteren Kühlplatte neu zu positionieren und so Platz für den Austausch des vorderen Kühlplattenmoduls zu schaffen. Überspringen Sie die Schritte 5 bis 7, wenn das hintere Kühlplattenmodul noch nicht installiert ist.
  5. Positionieren Sie die hintere B200 GPU-Kühlplattenleitung so, dass Platz für die vordere B200 GPU geschaffen wird. Installieren Sie die zwei Servicehalterungen an den hinteren GPU-Kühlplatten.
    1. Richten Sie die Führungsstifte an der Servicehalterung an den Führungslöchern auf der GPU-Kühlplatte aus. Senken Sie sie dann auf die Kühlplatte ab.
    2. Ziehen Sie die beiden unverlierbaren Schrauben (PH1, 2 x M3, 0,5 Newtonmeter bzw. 4,3 Poundforce Inch) an, um die Servicehalterung an der hinteren GPU-Kühlplatte zu installieren. Wiederholen Sie den Vorgang, um eine weitere Servicehalterung zu installieren.
      Abbildung 5. Installieren der Servicehalterungen an den hinteren GPU-Kühlplatten
      Installing the shipping brackets to the rear GPU cold plates
      Anmerkung
      Achten Sie darauf, das Kabel des Flüssigkeitserkennungssensormodul beim Installieren der Halterung nicht einzuklemmen.

  6. Lösen Sie die vier M3-Schrauben (W7-W8), mit denen die Leitung des hinteren B200 GPU-Kühlplattenmoduls am Gehäuse befestigt ist.
    Abbildung 6. Entfernen der Leitung des hinteren B200 GPU-Kühlplattenmoduls
    Removing the rear B200 GPU cold plate module manifold
  7. Positionieren Sie die Leitung des hinteren B200 GPU-Kühlplattenmoduls neu.
    1. Drehen Sie die Leitung des hinteren B200 GPU-Kühlplattenmoduls wie dargestellt um. Richten Sie die Führungsstifte auf der Leitung an den Führungsnuten der Transporthalterungen aus und setzen sie die Führungsstifte in die Nuten ein. Installieren Sie dann die Leitung wie dargestellt an den Servicehalterungen.
    2. Stellen Sie sicher, dass die Führungsstifte an der Leitung sicher in die Führungsnuten der Transporthalterungen eingerastet sind.
      Abbildung 7. Neupositionierung der Leitung des hinteren GPU-Kühlplattenmoduls
      Repositioning the rear B200 GPU cold plate module manifold
  8. Lösen Sie die Schrauben in der folgenden Schraubenreihenfolge um 360 Grad: (siehe Etikett der Kühlplatte). Lösen Sie dann die sechzehn T15-Torx-Schrauben mit einem Drehmomentschraubendreher und dem richtigen Drehmoment vollständig.
    Anmerkung
    • Lösen Sie die Schrauben mit einem Drehmomentschraubendreher und dem richtigen Drehmoment. Das Drehmoment zum vollständigen Lösen oder Anziehen der Schrauben beträgt 5,3 ± 0,212 Poundforce Inch bzw. 0,6 ± 0,024 Newtonmeter.
    • Stellen Sie sicher, dass die unverlierbaren Schrauben vollständig gelöst sind, bevor Sie das Kühlplattenmodul entfernen.
    • Befolgen Sie die Schraubenreihenfolge, um ein Kippen der Kühlplatte zu verhindern.
    Abbildung 8. Entfernen der GPU-Kühlplatten
    Removing the GPU cold plates
    Anmerkung
    • Verwenden Sie die TIM-Trennschraube, falls erforderlich, um die Kühlplatte von der GPU zu trennen. Stellen Sie sicher, dass alle Schrauben der Kühlplatte vollständig gelöst sind, bevor Sie die TIM-Trennschraube anziehen.

      • Öffnen Sie den Deckel der TIM-Trennschraube.

      • Ziehen Sie die TIM-Trennschraube an, um die Kühlplatte von der GPU zu trennen.

    • Bringen Sie die TIM-Trennschraube nach Gebrauch wieder in ihre ursprüngliche Position zurück.

      • Lösen Sie die TIM-Trennschraube, um sie wieder in ihre ursprüngliche Position zu bringen.

      • Schließen Sie den Deckel. Wenn der Deckel nicht geschlossen werden kann, muss die TIM-Trennschraube weiter gelöst werden.

  9. Installieren Sie die Transporthalterungen.
    1. Entfernen Sie die Querstrebe, bevor Sie die Transporthalterungen installieren. Lösen Sie die vier unverlierbaren Schrauben, um die Querstrebe zu entfernen.
      Abbildung 9. Entfernen der Querstrebe
      Removing crossbar
    2. Richten Sie die Führungsstifte der Transporthalterungen an den Führungslöchern der Leitung und Kühlplatten aus. Senken Sie dann die Transporthalterungen auf das vordere B200 GPU-Kühlplattenmodul ab.
    3. Ziehen Sie die zehn unverlierbaren Schrauben (PH1, 10 x M3, 0,5 Newtonmeter bzw. 4,3 Poundforce Inch) an, um die Transporthalterung am vorderen B200 GPU-Kühlplattenmodul zu befestigen. Wiederholen Sie den Vorgang, um die andere Transporthalterung zu installieren.
      Abbildung 10. Installieren der Transporthalterungen
      Installing the shipping brackets
      Anmerkung
      Achten Sie darauf, das Kabel des Flüssigkeitserkennungssensormodul beim Installieren der Halterung nicht einzuklemmen.

    4. Installieren Sie die Querstrebe erneut. Richten Sie die Querstrebe an den Transporthalterungen aus. Ziehen Sie dann die vier unverlierbaren Schrauben an, um die Querstrebe an den Transporthalterungen zu installieren.
      Abbildung 11. Installieren der Querstrebe
      Installing the crossbar
  10. Lösen Sie die vier M3-Schrauben (W5-W6), mit denen die Leitung des vorderen B200 GPU-Kühlplattenmoduls am Gehäuse befestigt ist.
    Abbildung 12. Entfernen der Leitung des vorderen B200 GPU-Kühlplattenmoduls
    Removing the front B200 GPU cold plate module manifold
  11. Entfernen Sie das vordere B200 GPU-Kühlplattenmodul.
    1. Lösen Sie die Schläuche von den Schlauchbindern, mit denen sie an den Schlauchführungen befestigt sind.
    2. Befestigen Sie die Schläuche mit den Schlauchbindern an den Transporthalterungen.
    3. Befestigen Sie das Kabel des Flüssigkeitserkennungssensor mit der Kabelklemme an der Leitung.
    4. Halten Sie die Transporthalterungen und heben Sie das vordere B200 GPU-Kühlplattenmodul aus dem Gehäuse.
      Abbildung 13. Entfernen des vorderen B200 GPU-Kühlplattenmoduls
      Removing the front B200 GPU cold plate module
      Anmerkung
      Wenn die Schrauben der Kühlplatte nicht vollständig gelöst sind, verwenden Sie den T15-Torx-Schraubendreher, um alle Schrauben der Kühlplatte vollständig zu lösen. Bringen Sie den T15-Torx-Verlängerungsbit (200 mm) an, um bei Bedarf die Schrauben der Kühlplatte zu erreichen.
  12. Entfernen Sie PCM und Putty-Pads umgehend mit alkoholhaltigen Reinigungstüchern von den GPUs. Gehen Sie dabei sehr vorsichtig vor, um Beschädigungen an der GPU zu vermeiden.
    Achtung
    • Es wird empfohlen, das PCM zu entfernen, solange es in einem flüssigen Zustand ist.

    • Die elektrischen Komponenten rund um den Die (Chip) der GPUs sind äußerst empfindlich. Vermeiden Sie beim Entfernen des PCM und Reinigen des Die (Chip) der GPU, die elektrischen Komponenten zu berühren, um Schäden zu vermeiden.

    Abbildung 14. Entfernen von PCM und Putty-Pads von den GPUs
    Cleaning PCM and putty pads off from the GPUs
  13. Wischen Sie mit alkoholhaltigen Reinigungstüchern alle Reste des Putty-Pads und des PCM von der GPU-Kühlplatte ab.
    Anmerkung
    Bewahren Sie die Transporthalterung am Kühlplattenmodul auf, falls sie später wieder installiert werden soll.
    Abbildung 15. Entfernen von PCM und Putty-Pads von den Kühlplatten
    Wiping PCM and putty pads off from the cold plates

Nach dieser Aufgabe

  1. Installieren Sie eine Austauscheinheit. Siehe Vorderes B200 GPU-Kühlplattenmodul installieren.
  2. Wenn Sie angewiesen werden, die Komponente oder die Zusatzeinrichtung einzusenden, befolgen Sie die Verpackungsanweisungen und verwenden Sie ggf. das mitgelieferte Verpackungsmaterial für den Transport.