跳到主要内容

可靠性、可用性和可维护性功能

计算节点设计中三个最重要的功能是可靠性、可用性和可维护性(RAS)。这些 RAS 特性有助于确保计算节点中存储的数据的完整性、需要计算节点时它的可用性以及诊断和更正问题时可实现的便利性。

计算节点具有以下 RAS 功能:

  • 高级配置和电源接口(ACPI)
  • 服务器自动重新启动(ASR)
  • 使用 DSA Preboot 的内置诊断
  • 针对温度、电压、硬盘的内置监控
  • 每周 7 天,每天 24 小时的客户支持中心1
  • 客户升级驻留在闪存 ROM 中的代码和诊断
  • 客户可升级的 UEFI 代码和诊断
  • 受 ECC 保护的 DDR4 DIMM
  • 二级高速缓存上的 ECC 保护
  • 错误代码和消息
  • Integrated Management Module II(IMM2),它与 Chassis Management Module 通信以实现远程系统管理
  • Light path 诊断程序
  • 内存奇偶校验测试
  • 开机自检(POST)过程中的微处理器内建自测(BIST)
  • 访问微处理器序列号
  • 检测处理器是否存在
  • 驻留在 ROM 中的诊断
  • 系统错误日志记录
  • 重要产品数据(VPD)存储在内存中
  • Wake on LAN(WOL)功能(装有具有 WOL 功能的可选 I/O 适配器时)
  • PCI 唤醒(PME)功能
1 是否提供服务因国家/地区而异。响应时间因来电号码和性质而异。