可靠性、可用性和可维护性
本主题概述服务器的可靠性、可用性和可维护性(RAS)特性。
计算机设计中有三个重要特性,即可靠性、可用性和可维护性(RAS)。RAS 功能有助于确保存储在服务器中数据的完整性、当需要服务器时它的可用性以及诊断和纠正问题的简便性。
您的服务器具有以下 RAS 功能:
- 3 年部件和 3 年人工有限保修
- 24 小时支持中心
- 自动错误重试和恢复
- 当发生不可屏蔽中断(NMI)时自动重新启动
- 电源发生故障后自动重新启动
- 在 Integrated Management Module(IMM)的控制下切换备用基本输入/输出系统
- 内置监控风扇、电源、温度、电压和电源模块冗余的功能
- 大多数接口上的线缆感知检测
- Chipkill 内存保护
- Corrected Machine Check Interrupt(CMCI)
- 针对 x4 DRAM 技术 DIMM 的单设备数据校正(SDDC)(仅在 16 GB DIMM 上可用)。确保在最多两个 DRAM DIMM 发生硬件故障后,单个 x4 DRAM DIMM 上的数据可用。每列中保留一个 x4 DRAM DIMM 作为空间设备。
- 支持诊断 ServeRAID 和以太网适配器
- DRAM 单设备数据校正(SDDC)
- 动态内存迁移
- 增强的 DRAM 单设备数据校正(SDDC+1)
- 增强的 DRAM 双设备数据校正(SDDC+1)
- 错误代码和消息
- 纠错码(ECC)三级高速缓存和系统内存
- 识别发生故障的 DIMM
- 全阵列内存镜像(FAMM)冗余
- 具有速度感应功能的热插拔散热风扇
- 热插拔硬盘
- 热插拔和冗余电源模块
- 集成基板管理控制器(BMC)子系统
- Integrated Management Module(IMM)
- LCD 系统信息显示面板
- DIMM、微处理器、PCIe 适配器、硬盘、固态硬盘、电源模块、风扇、PCIe 模块和 I/O 模块的 light path LED
- 内存地址奇偶校验保护
- 内存需求清除和巡视清除
- 内存纠错码和奇偶校验测试
- 内存缩减(非镜像内存)。服务器重新启动后,如果内存控制器检测到不可纠正的非镜像错误,并且内存控制器无法恢复正常运行,则 IMM 记录该不可纠正的错误并通知 POST。POST 从逻辑上映射掉发生不可纠正的错误的内存,然后服务器用其余已安装的内存重新启动。
- 支持内存镜像和内存列备用
- 内存过热调速
- 菜单式设置、系统配置和独立磁盘冗余阵列(RAID)配置程序
- 微处理器内置自检(BIST)、监控内部错误信号、监控内部热断路信号、检查配置以及通过 light path 诊断程序识别微处理器和稳压器模块故障
- 不可屏蔽中断(NMI)按钮
- 操作系统内存联机(容量变更)
- 对 PCIe 总线进行奇偶校验
- 支持 PCIe 热添加和热卸下
- PCIe 热插拔(仅限微处理器 2 和 3)
- 电源管理:符合高级配置和电源接口(ACPI)
- 开机自检(POST)
- 故障预警分析(PFA)可对内存、SAS/SATA 硬盘或固态硬盘和风扇发出警报。
- 支持故障转移的冗余以太网功能
- 冗余的热插拔电源模块和冗余的热插拔风扇
- 支持冗余网络接口卡(NIC)
- 暂时关闭系统错误 LED 的提醒按钮
- 支持远程确定系统问题
- 基于 ROM 的诊断,并可升级基于闪存 ROM 的代码和诊断
- ROM 校验和
- 可对内存、主板上的 VPD、电源模块和硬盘或固态硬盘底板、微处理器和内存扩展托盘以及以太网适配器执行串行存在检测(SPD)
- UEFI 可隔离可纠正的错误或多位错误过多的单个 DIMM
- SMI 时钟故障转移
- SMI 通道故障转移
- SMI 数据包重传
- 固态硬盘
- 用于系统管理功能和监控的待机电压
- 通过远程初始程序加载(RIPL)或动态主机配置协议/引导协议(DHCP/BOOTP),从 LAN 启动(引导)
- 通过配置菜单进行系统自动配置
- 系统错误日志记录(UEFI/POST 和 IMM)
- 通过集成电路间(I2C)协议总线进行系统管理监控
- 温度和风扇监控
- 检测不可纠正错误(UE)
- 可本地升级或通过 LAN 升级驻留在 POST、UEFI、诊断、IMM 固件和只读存储器(ROM)中的代码
- 微处理器和内存扩展模块、PCIe 扩展模块、基本 I/O 模块、存储和 I/O 模块、电源模块和 SAS/SATA(热插拔硬盘或固态硬盘)底板上的重要产品数据(VPD)
- Wake on LAN 功能
提供反馈