跳到主要内容

可靠性、可用性和可维护性

计算机设计中有三个重要特性,即可靠性、可用性和可维护性(RAS)。RAS 功能有助于确保存储在服务器中数据的完整性、当需要服务器时它的可用性以及诊断和纠正问题的简便性。

您的服务器具有以下 RAS 功能:
  • 3 年部件和 3 年人工有限保修(机器类型 5463
  • 24 小时支持中心
  • 自动错误重试和恢复
  • 当发生不可屏蔽中断(NMI)时自动重新启动
  • 电源发生故障后自动重新启动
  • 在 Integrated Management Module (IMM) 控制下切换备份基本输入/输出系统
  • 针对风扇、电源模块、温度、电压和电源模块冗余的内置监控
  • 大多数接口上的线缆感知检测
  • Chipkill 内存保护
  • 用于 x4 DRAM 技术 DIMM 的双设备数据更正(DDDC)(仅对 16 GB DIMM 可用)。确保在最多两个 DRAM DIMM 发生硬件故障后,单个 x4 DRAM DIMM 上的数据可用。每列中保留一个 x4 DRAM DIMM 作为空间设备。
  • 支持诊断 ServeRAID 和以太网适配器
  • 错误代码和消息
  • 纠错码(ECC)三级高速缓存和系统内存
  • 全阵列内存镜像(FAMM)冗余
  • 具有速度感应功能的热插拔散热风扇
  • 热插拔硬盘
  • Integrated Management Module (IMM)
  • 支持内存镜像和内存备用
  • 内存纠错码和奇偶校验测试
  • 内存缩小(非镜像内存)。如果在内存控制器检测到不可纠正的非镜像错误后重新启动了服务器,而且内存控制器无法进行操作恢复,那么 IMM 会记录这一不可纠正的错误并通知 POST。POST 从逻辑上映射掉发生不可纠正错误的内存,然后服务器用其余已安装的内存重新启动。
  • 菜单式设置、系统配置和独立磁盘冗余阵列(RAID)配置程序
  • 微处理器内置自检(BIST)、内部错误信号监控、内部热脱扣信号监控、配置检查以及通过 light path 诊断程序进行的微处理器和电压调节器模块故障识别
  • 不可屏蔽中断(NMI)按钮
  • 小型计算机系统接口(SCSI)总线和 PCI-E 及 PCI 总线的奇偶校验
  • 电源管理:符合“高级配置和电源接口”(ACPI)
  • 开机自检(POST)
  • 主动平台警报(包括故障预警分析和自监控、分析和报告技术警报):微处理器、稳压器、内存、内部存储(SAS/SATA 硬盘和固态硬盘、M.2 存储、闪存存储适配器)、风扇、电源模块、RAID 控制器以及服务器环境温度和子组件温度
  • 支持故障转移的冗余以太网功能
  • 冗余的热插拔电源模块和冗余的热插拔风扇
  • 支持冗余网络接口卡(NIC)
  • 暂时关闭系统错误 LED 的提醒按钮
  • 支持远程确定系统问题
  • 基于 ROM 的诊断
  • ROM 校验和
  • 对内存、主板上的 VPD、电源模块、硬盘或固态硬盘背板、微处理器和内存扩展托盘以及以太网卡的“串行感知检测”(SPD)
  • UEFI 可隔离可纠正的错误或多位错误过多的单个 DIMM
  • 固态驱动器
  • 用于系统管理功能部件和监控的备用电压
  • 通过远程初始程序加载(RIPL)或动态主机配置协议/引导协议(DHCP/BOOTP),从 LAN 启动(引导)
  • 通过配置菜单进行系统自动配置
  • 系统错误日志记录(POST 和 IMM)
  • 通过内部集成电路(IC)协议总线进行系统管理监控
  • 检测不可纠正错误(UE)
  • 可本地升级或通过 LAN 升级驻留在 POST、UEFI、诊断、IMM 固件和只读存储器(ROM)中的代码
  • 关于微处理器、主板、电源模块和 SAS/SATA(热插拔硬盘或固态硬盘)背板的重要产品数据(VPD)
  • Wake on LAN 功能