跳至主要内容

可靠性、可用性及可維修性

可靠性、可用性和可維修性 (RAS) 是設計電腦的三個重要特性。RAS 特性有助於確保儲存在伺服器中資料的完整性,也確保可因應您的需求來提供伺服器可用性,而且易於診斷和更正問題。

伺服器具有以下 RAS 特性:
  • 3 年零件及人工有限保固 (機器 類型 5464)
  • 24 小時支援中心
  • 自動錯誤重試和回復
  • 在不可遮罩式岔斷 (NMI) 時自動重新啟動
  • 電源發生故障後自動重新啟動
  • 受「Integrated Management Module 2.1 (IMM2.1)」控制的備用基本輸入/輸出系統切換
  • 針對風扇、電源、溫度、電壓和電源供應器備援的內建監視
  • 大部分接頭上的纜線顯示偵測
  • Chipkill 記憶體保護
  • 用於 x4 DRAM 技術的 DIMM 的單一裝置資料更正 (SDDC)(僅適用於 16 GB DIMM)。在最多兩個 DRAM DIMM 發生硬體故障後,仍確保單一 x4 DRAM DIMM 上的資料可供使用。每排保留一個 x4 DRAM DIMM 為空的裝置。
  • ServeRAID 及乙太網路配接卡的診斷支援
  • 錯誤碼和訊息
  • 錯誤校正碼 (ECC) L3 快取和系統記憶體
  • 全陣列記憶體鏡映 (Full Array Memory Mirroring, FAMM) 備用功能
  • 具有速度感應功能的熱抽換散熱風扇
  • 熱抽換硬碟
  • 熱抽換電源供應器
  • 資訊和 light path 診斷 LED 面板
  • Integrated Management Module 2.1 (IMM2.1)
  • DIMM、微處理器、硬碟、固態硬碟、電源供應器和風扇的 light path 診斷 LED
  • 記憶體鏡映和記憶體備用支援
  • 記憶體錯誤校正碼和同位檢查測試
  • 記憶體縮減(非鏡映記憶體)。在記憶體控制器偵測到無法更正的非鏡映錯誤,且記憶體控制器無法以正常運作方式回復之後,IMM2.1 會在伺服器重新啟動後記載無法更正的錯誤並通知 POST。POST 會以邏輯方式將發生無法更正的錯誤之記憶體排除在外,並以其餘已安裝的記憶體重新啟動伺服器。
  • 功能表驅動的安裝、系統配置和獨立磁碟的備用陣列 (RAID) 配置程式
  • 微處理器內建自我測試 (BIST)、內部錯誤信號監視、內部過熱保護信號監視、配置檢查,以及透過 Light Path 診斷進行微處理器和電壓調節器模組故障識別
  • 不可遮罩式岔斷 (NMI) 按鈕
  • 對 PCIe 匯流排進行同位元檢查
  • 電源管理:符合進階配置和電源介面 (ACPI) 標準
  • 開機自我測試 (POST)
  • 主動式平台警示(包括「故障預警分析」(Predictive Failure Analysis) 和「自我監視分析與報告技術」警示)︰微處理器、電壓調節器、記憶體、內部儲存體(SAS/SATA 硬碟和固態硬碟、NVMe 固態硬碟、M.2 儲存、快閃儲存配接卡)、風扇、電源供應器、RAID 控制器,以及伺服器環境溫度和子元件溫度。
  • 支援失效接手的備援乙太網路功能
  • 備用熱抽換電源供應器及備用熱抽換風扇
  • 備用網路介面卡 (NIC) 支援
  • 遠端系統問題判斷支援
  • ROM 型診斷
  • ROM 總和檢查
  • 對記憶體、主機板上的 VPD、電源供應器和硬碟或固態硬碟背板、微處理器和記憶體擴充匣以及乙太網路配接卡進行「序列存在偵測 (SPD)」
  • Unified Extensible Firmware Interface (UEFI) 會在發生過多可修正錯誤或多位元錯誤時,隔離單一 DIMM
  • 固態硬碟
  • 用於系統管理功能和監視的備用電壓
  • 透過遠端起始程式載入 (RIPL) 或動態主機配置通訊協定/開機通訊協定 (DHCP/BOOTP),從 LAN 啟動(開機)
  • 從配置功能表進行系統自動配置
  • 系統錯誤記載(POST 及 IMM2.1
  • 透過內部積體電路 (I2C) 通訊協定匯流排進行系統管理監視
  • 無法更正的錯誤 (UE) 偵測
  • 可在本端或透過 LAN 升級的 POST、Unified Extensible Firmware Interface (UEFI)、診斷程式、IMM2.1 韌體及唯讀記憶體 (ROM) 常駐程式碼
  • 微處理器、主機板、電源供應器和 SAS/SATA(熱抽換硬碟或固態硬碟)背板的重要產品資料 (VPD)
  • Wake on LAN 功能