본문으로 건너뛰기

H100/H200 GPU 및 방열판 모듈 설치

이 섹션의 지침에 따라 H100/H200 GPU 및 방열판 모듈을 설치하십시오. 이 절차는 숙련된 기술자가 수행해야 합니다.

이 작업 정보

주의
  • 설치 지침안전 점검 목록의 내용을 읽고 안전하게 작업하십시오.
  • 구성 요소가 들어 있는 정전기 방지 포장재를 서버의 도포되지 않은 금속 표면에 접촉시킨 다음 포장재에서 꺼내고 정전기 방지 표면에 놓으십시오.
  • 현장에 최대 181kg(400lbs)을 지탱할 수 있는 리프팅 장치 1대와 작업자 2명이 있어야 이 절차를 수행할 수 있습니다. 아직 사용할 수 있는 리프팅 장치가 준비되지 않은 경우 Lenovo에서 Genie Lift GL-8 material lift를 제공하며, Data Center Solution Configurator에서 구입 가능합니다. Genie Lift GL-8 material lift를 주문할 때 풋 릴리스 브레이크와 로드 플랫폼이 포함되어 있는지 확인하십시오.
  • GPU 및 GPU 베이스보드에 있는 커넥터와 소켓을 검사하십시오. GPU 또는 GPU 베이스보드의 커넥터가 손상되었거나 누락된 경우, 혹은 소켓에 이물질이 있는 경우에는 사용하지 마십시오. 설치 절차를 계속 진행하기 전에 GPU 또는 GPU 베이스보드를 새것으로 교체합니다.
  • GPU와 방열판은 하나의 부품입니다. GPU에서 방열판을 제거하지 마십시오.
  • 다음 표는 nvidia-smi의 실제 GPU 소켓, XCC의 슬롯 번호 및 모듈 ID에 대한 매핑 정보를 보여줍니다.


    물리적 GPU 소켓XCC의 슬롯 번호nvidia-smi의 모듈 ID
    SXM 1슬롯 211
    SXM 2슬롯 242
    SXM 3슬롯 223
    SXM 4슬롯 234
    SXM 5슬롯 175
    SXM 6슬롯 206
    SXM 7슬롯 187
    SXM 8슬롯 198
구성 요소를 올바르게 교체하려면 아래 나열된 필수 도구를 갖춰야 합니다.
  • 0.1-0.62뉴턴 미터(0.9-5.5인치 파운드)로 설정할 수 있는 토크 드라이버
  • Torx T15 확장 비트(길이 200mm)
  • H100/H200 지그
펌웨어 및 드라이버 다운로드: 구성 요소를 교체한 후 펌웨어 또는 드라이버를 업데이트해야 할 수 있습니다.

절차

  1. (선택 사항) 새 GPU 및 방열판 모듈에 대해 다음 단계를 완료하십시오.
    • 하단의 커넥터 덮개를 제거합니다.


    • FRU 부품 번호 레이블을 부착합니다.
      1. 플라스틱 덮개에서 보호 필름을 제거합니다.
      2. FRU 부품 번호 레이블을 플라스틱 덮개에 부착합니다.


    • 방열판에서 플라스틱 덮개를 제거합니다.


  2. 양손으로 GPU 및 방열판 모듈을 잡은 다음 GPU 및 방열판 모듈GPU 베이스보드에 있는 가이드 구멍 2개에 맞추고 GPU 베이스보드에 조심스럽게 놓습니다.
    그림 1. GPU 및 방열판 모듈 설치
    GPU 및 방열판 모듈 installation
  3. 지그를 GPU 방열판에 맞추고 GPU 방열판에 조심스럽게 설치하십시오.
    그림 2. 지그 설치
    Jig installation
  4. 토크 드라이버를 지그의 지정된 구멍에 삽입하고 아래 그림에 표시된 순서( > > > )대로 Torx T15 나사 4개를 조입니다.
    먼저 토크 드라이버를 0.1~0.12뉴턴 미터(0.9~1.1인치 파운드)로 설정하여 나사를 몇 바퀴 조입니다. 그런 다음 토크 드라이버를 0.58~0.62뉴턴 미터(5~5.5인치 파운드)로 설정하여 나사를 완전히 조입니다.
    그림 3. 나사 조이는 순서
    Screw tightening sequence
  5. GPU 방열판에서 지그를 제거하십시오.
    그림 4. 지그 제거
    Jig removal
  6. GPU 및 방열판 모듈에 플라스틱 덮개를 놓고 단단히 고정합니다.
    그림 5. 플라스틱 덮개 설치
    Plastic cover installation

완료한 후

  1. (GPU 및 방열판 모듈 2, 4, 5, 7만 해당) GPU 통풍관을 다시 설치합니다. H100/H200 GPU 통풍관 설치의 내용을 참조하십시오.
  2. 전원 복합체를 다시 설치하십시오. 전원 복합체 설치의 내용을 참조하십시오.
  3. 8U GPU 셔틀을 다시 설치하십시오. 8U GPU 셔틀 설치의 내용을 참조하십시오.
  4. 모든 2.5인치 핫 스왑 드라이브 또는 드라이브 베이 필러(해당하는 경우)를 드라이브 베이에 다시 설치하십시오. 2.5인치 핫 스왑 드라이브 설치
  5. 앞면 팬을 모두 다시 설치합니다. 핫 스왑 팬 설치(앞면 및 뒷면)의 내용을 참조하십시오.
  6. 전원 공급 장치를 모두 다시 설치하십시오. 핫 스왑 전원 공급 장치 유닛 설치의 내용을 참조하십시오.
  7. 부품 교체를 완료하십시오. 부품 교체 완료의 내용을 참조하십시오.