Installazione di un modulo del dissipatore di calore e GPU H100/H200
Seguire le istruzioni riportate in questa sezione per installare il modulo del dissipatore di calore e GPU H100/H200. La procedura deve essere eseguita da un tecnico qualificato.
Informazioni su questa attività
Attenzione
- Leggere Linee guida per l'installazione ed Elenco di controllo per la sicurezza per assicurarsi di operare in sicurezza.
- Mettere in contatto l'involucro antistatico contenente il componente con qualsiasi superficie metallica non verniciata del server, quindi rimuoverlo dall'involucro e posizionarlo su una superficie antistatica.
- Per eseguire questa procedura sono necessarie due persone e un dispositivo di sollevamento in grado di supportare fino a 400 libbre (181 kg). Se non si dispone già di un dispositivo di sollevamento, Lenovo offre la Genie Lift GL-8 material lift che può essere acquistata in Data Center Solution Configurator. Assicurarsi di includere il freno a pedale e la piattaforma di carico al momento dell'ordine Genie Lift GL-8 material lift.
- Assicurarsi di controllare i connettori e i socket sulla GPU e la Scheda di base GPU. Non utilizzare la GPU o la Scheda di base GPU se i relativi connettori sono danneggiati o mancanti o in caso di presenza di detriti nei socket. Sostituire la GPU o la Scheda di base GPU con una nuova prima di continuare la procedura di installazione.
- GPU e dissipatore di calore sono un unico componente. Non rimuovere il dissipatore di calore dalla GPU.
- La tabella seguente mostra le informazioni di associazione sui socket fisici delle GPU, la numerazione degli slot in XCC e gli ID dei moduli in nvidia-smi.
Socket fisico della GPU Numerazione degli slot in XCC ID modulo in nvidia-smi SXM 1 Slot 21 1 SXM 2 Slot 24 2 SXM 3 Slot 22 3 SXM 4 Slot 23 4 SXM 5 Slot 17 5 SXM 6 Slot 20 6 SXM 7 Slot 18 7 SXM 8 Slot 19 8
Nota
Assicurarsi di disporre degli strumenti necessari elencati di seguito per sostituire correttamente il componente:
- Cacciavite dinamometrico che può essere impostato su 0,1-0,62 newton-metri, 0,9-5,5 pollici-libbre
- Punta Torx T15 estesa (lunga 200 mm)
- Dima H100/H200
Download di firmware e driver: potrebbe essere necessario aggiornare il firmware o il driver dopo la sostituzione di un componente.
Visitare il sito Sito Web per il download di driver e software per ThinkSystem SR685a V3 per visualizzare gli aggiornamenti più recenti di firmware e driver per il server in uso.
Per ulteriori informazioni sugli strumenti di aggiornamento del firmware, vedere Aggiornamento del firmware.
Procedura
Dopo aver terminato
- Reinstallare il condotto dell'aria GPU (solo Modulo del dissipatore di calore e GPU 2, 4, 5 e 7). Vedere Installazione di un condotto dell'aria GPU H100/H200.
- Reinstallare il complesso di alimentazione. Vedere Installazione del complesso di alimentazione.
- Reinstallare lo shuttle GPU 8U. Vedere Installazione dello shuttle della GPU 8U.
- Reinstallare tutte le unità hot-swap da 2,5 pollici nei vani delle unità, compresi gli eventuali elementi di riempimento di questi ultimi. Vedere Installazione di un'unità hot-swap da 2,5 pollici
- Reinstallare tutte le ventole anteriori. Vedere Installazione di una ventola hot-swap (anteriore e posteriore).
- Reinstallare tutte le unità di alimentazione. Vedere Installazione di un'unità di alimentazione hot-swap.
- Completare le operazioni di sostituzione dei componenti. Vedere Completamento delle operazioni di sostituzione dei componenti.
Envoyer des commentaires