跳至主要内容

漏水問題(GPU 水迴路)

使用此資訊解決漏水相關問題。

如果觀察到機箱外部有水,請確保已斷開電源供應器。如果在機箱外部未觀察到水,但懷疑機箱中存在漏水,請完成以下步驟以確定漏水源。GPU 和 CPU 水迴路配備了洩漏感應器,可協助偵測任何漏水情況。
兩個洩漏感應都可能無法偵測到小洩漏,因此可能需要目視確認。

可疑的洩漏症狀

由於洩漏問題,可能會出現以下情況:
  • 處理器過溫錯誤由系統錯誤「!」指示。伺服器前方的 LED 持續亮起

  • 當沒有洩漏時,洩漏感應器上的綠色 LED 將保持常亮,若偵測到洩漏,則會以 1 Hz 的頻率閃爍。請注意,GPU 洩漏感應器 LED 僅在系統連接到交流 (AC) 電源時可見,而 CPU 洩漏感應器 LED 無需完全拆卸伺服器即可查看

  • 伺服器意外關閉

    • 如果偵測到洩漏,系統將直流 (DC) 電源關閉並阻斷電源許可。在洩漏問題解決之前,它不會再次通電。

    • 感應器盒「洩漏繩」一側的纜線損壞或受壓可能導致系統關機。

  • 如果洩漏感應器出現安裝錯誤,系統將繼續運作,因為此錯誤與任何實際洩漏無關。此問題的兩個主要原因是:

    • 洩漏感應器盒「電源」側的纜線損壞,位於感應器盒和主機板連頭之間。

    • 纜線接頭已拔出。

  • Lenovo XClarity Controller 事件可能會報告以下事件:
    • FQXSPUN0019M:感應器 [SensorElementName] 的狀態已從較不嚴重轉變成嚴重。此事件表示可能偵測到洩漏。

    • FQXSPUN0038J:感應器 [SensorElementName] 指出安裝錯誤。

  • 如果「洩漏偵測」或「感應器安裝錯誤」仍然存在,則需要更換受影響的水迴路

請依次完成以下步驟,直到可以找出潛在洩漏的原因:
  1. 檢查 Lenovo XClarity Controller 訊息以查看是否報告了任何洩漏警告。有關詳細資訊,請參閱XClarity Controller 事件

  2. 從機架卸下伺服器,並將其放置在穩定的工作檯面上。請參閱從機架卸下伺服器

  3. 根據訊息定位所指示的 GPU 水迴路。

  4. 使用手電筒目視檢查洩漏感應器、滴水盤是否有任何水分。

  5. 檢查水迴路是否有任何水分。

  6. 如果您在上述步驟中發現問題,請更換一個或多個水迴路(請參閱更換 GPU 水迴路(僅限經過培訓的維修技術人員))。
    在將水冷板模組重新安裝到機箱中之前,使用手電筒目視檢查機箱底部非常重要。
  7. 更換 GPU 水迴路後,執行交流電 (AC) 循環,並檢查事件是否已解除。

  8. 如果無法識別問題,請執行交流電 (AC) 循環,並檢查問題是否仍然存在。請聯繫產品工程師以獲得進一步的協助。