H100/H200 GPU 복합체 설치
이 섹션의 지침에 따라 H100/H200 GPU 복합체를 설치하십시오. 이 절차는 숙련된 기술자가 수행해야 합니다.
이 작업 정보
S036
![]() | ![]() |
| 18~32kg(39~70lb) | 32~55kg(70~121lb) |
경고
제품을 들 때에는 안전 수칙을 따르십시오.
주의
주
구성 요소를 올바르게 교체하려면 아래 나열된 필수 도구를 갖춰야 합니다.
- Torx T10 드라이버
- Torx T15 드라이버
- Phillips #1 헤드 드라이버
- Phillips #2 드라이버
- 일자 드라이버
- 알코올 청소 패드
- 2 x H100/H200 PCM 키트
- SR780a V3 H100/H200 워터 루프 퍼티 패드 키트 2개
- SR780a V3 H100/H200 워터 루프 서비스 키트
- H100/H200 GPU 서비스 고정 키트
- H100/H200 NVSwitch PCM 키트
- H100/H200 NVSwitch 퍼티 패드 키트
- H100/H200 GPU 베이스보드 핸들 키트
- Torx T25 150mm 확장 비트(GPU 베이스보드 핸들용)
주
구성 요소를 올바르게 교체하려면 아래 나열된 필수 도구를 갖춰야 합니다.
- 0.6뉴턴 미터(5.3인치 파운드)로 설정할 수 있는 토크 드라이버
펌웨어 및 드라이버 다운로드: 구성 요소를 교체한 후 펌웨어 또는 드라이버를 업데이트해야 할 수 있습니다.
서버의 최신 펌웨어 및 드라이버 업데이트를 확인하려면 드라이버 및 소프트웨어 다운로드 웹사이트(ThinkSystem SR780a V3용)로 이동하십시오.
펌웨어 업데이트 도구에 대한 자세한 정보를 보려면 펌웨어 업데이트로 이동하십시오.
다음 그림에서는 XCC의 GPU 번호 및 해당 슬롯 번호를 보여줍니다.
그림 1. GPU 번호


| 물리적 GPU 소켓 | XCC의 슬롯 번호 | nvidia-smi의 논리 번호 |
|---|---|---|
GPU 1 | 슬롯 21 | 1 |
GPU 2 | 슬롯 24 | 2 |
GPU 3 | 슬롯 22 | 0 |
GPU 4 | 슬롯 23 | 3 |
GPU 5 | 슬롯 17 | 5 |
GPU 6 | 슬롯 20 | 6 |
GPU 7 | 슬롯 18 | 4 |
GPU 8 | 슬롯 19 | 7 |
절차
완료한 후
- NVSwitch 냉각판 모듈을 다시 설치하십시오. H100/H200 NVSwitch 냉각판 모듈 설치의 내용을 참조하십시오.
- 앞면 H100/H200 GPU 냉각판 모듈을 다시 설치하십시오. 앞면 H100/H200 GPU 냉각판 모듈 설치의 내용을 참조하십시오.
- 뒷면 H100/H200 GPU 냉각판 모듈을 다시 설치하십시오. 뒷면 H100/H200 GPU 냉각판 모듈 설치의 내용을 참조하십시오.
- 케이블을 GPU 베이스보드에 다시 연결하십시오. 자세한 정보는 GPU 베이스보드 케이블 배선의 내용을 참조하십시오.
- 분리한 케이블을 모두 다시 연결하십시오. 내장 케이블 배선의 내용을 참조하십시오.
- 전원 복합체를 다시 설치하십시오. 전원 복합체 설치의 내용을 참조하십시오.
- CPU 복합체를 다시 설치합니다. CPU 복합체 설치의 내용을 참조하십시오.
- 팬 케이지를 다시 설치하십시오. 팬 케이지 설치(숙련된 기술자 전용)의 내용을 참조하십시오.
- 뒷면 윗면 덮개를 다시 설치하십시오. 뒷면 윗면 덮개 설치의 내용을 참조하십시오.
- 앞면 윗면 덮개를 다시 설치하십시오. 앞면 윗면 덮개 설치의 내용을 참조하십시오.
- 부품 교체를 완료하십시오. 부품 교체 완료의 내용을 참조하십시오.
피드백 보내기


GPU 베이스보드의 양쪽에 있는 핸들 2개를 확장합니다.
핸들 2개를 잡고 패키지 상자에서 GPU 복합체를 제거합니다.

핸들을 조정하여 드라이버 사용 공간을 만듭니다.
GPU 복합체에 핸들을 고정하는 M3 나사 5개를 푸십시오. 그런 다음 GPU 복합체에서 핸들을 제거합니다.


