Confiabilidade, Disponibilidade e Capacidade de Manutenção

Três recursos importantes de design do computador são confiabilidade, disponibilidade e capacidade de manutenção (RAS). Os recursos RAS ajudam a assegurar a integridade dos dados que são armazenados no servidor, a disponibilidade do servidor quando você precisa dele e a facilidade com a qual é possível diagnosticar e corrigir problemas.

O servidor tem os seguintes recursos RAS:

Garantia limitada de 3 anos em componentes e de 3 anos em mão de obra (máquina Tipo 5464)
Centro de suporte 24 horas
Recuperação de erro e nova tentativa automáticas
Reinício automático em NMI (nonmaskable interrupt)
Reinicialização automática após uma falha de energia
Sistema BIOS de backup alternando sob o controle do Integrated Management Module 2.1 (IMM2.1)
Monitoramento integrado para ventilador, energia, temperatura, voltagem e redundância da fonte de alimentação
Detecção de presença de cabo na maioria dos conectores
Proteção de memória Chipkill
Correção de dados de dispositivo único (SDDC) para tecnologia DIMMs x4 DRAM (disponível apenas em DIMMs de 16 GB). Assegure-se de que os dados estejam disponíveis em um único DIMM DRAM x4 depois de uma falha grave de até dois DIMMs DRAM. Um DIMM DRAM x4 em cada posição é reservado como um dispositivo de espaço.
Suporte de diagnóstico para adaptadores ServeRAID e Ethernet
Códigos e mensagens de erro
ECC (Error Correcting Code) cache L3 e memória do sistema
Redundância Matriz Integral de Espelhamento de Memória (FAMM)
Ventiladores de resfriamento hot swap com capacidade de sensor de velocidade
Unidades de disco rígido hot swap
Fontes de alimentação hot swap
Painéis de LED de informações e sistema de diagnósticos por light path
Integrated Management Module 2.1 (IMM2.1)
Os LEDs do sistema de diagnósticos por light path para DIMMs, microprocessadores, unidades de disco rígido, unidades de estado sólido, fontes de alimentação e ventiladores
Espelhamento de memória e suporte de memória sobressalente
Código de correção de erro de memória e teste de paridade
Diminuição de memória (memória não espelhada). Após uma reinicialização do servidor após o controlador de memória detectar um erro incorrigível não espelhado e o controlador de memória não puder se recuperar operacionalmente, o IMM2.1 registra o erro incorrigível e informa o POST. O POST mapeia logicamente a memória com o erro incorrigível e o servidor é reiniciado com a memória restante instalada.
Configuração orientada a menu, configuração do sistema e programas de configuração Redundant Array of Independent Disks (RAID)
BIST (Autoteste Integrado) no microprocessador, monitoramento de sinal de erro interno, monitoramento de sinal de trip térmico interno, verificação da configuração e identificação da falha no módulo regulador de voltagem e microprocessador através do diagnóstico de Light Path
botão de interrupção não mascarável (NMI)
Verificação de paridade nos barramentos PCIe
Gerenciamento de energia: em conformidade com a ACPI (Advanced Configuration and Power Interface)
Autoteste inicial (POST)
Alertas proativos da plataforma (incluindo análise de falhas preditivas e automonitoramento, alertas de tecnologia de relatório e análise): microprocessadores, reguladores de voltagem, memória, armazenamento interno (unidades de disco rígido SAS/SATA e unidades de estado sólido, unidades de estado sólido NVMe, armazenamento M.2, adaptadores flash de armazenamento), ventiladores, fontes de alimentação, controladores RAID temperaturas de subcomponentes e ambiente do servidor
Recursos Ethernet redundantes com suporte a failover
Fontes de alimentação hot swap redundantes e ventiladores redundantes hot swap
Suporte à placa da interface de rede redundante (NIC)
Suporte de determinação de problema do sistema remoto
Diagnósticos baseados em ROM
Somas de verificação de ROM
Detecção de Presença Serial (SPD) na memória, VPD na placa-mãe, fonte de alimentação e unidade de disco rígido ou os painéis traseiros da unidade de estado sólido, o microprocessador e bandeja de expansão de memória e adaptadores Ethernet
Isolamento Single-DIMM de erro corrigível excessivo ou erro multi-bit pela UEFI (Interface Firmware Extensível Unificada)
Unidades de estado sólido
Voltagem standby para recursos de gerenciamento de sistemas e monitoramento
Inicialização na LAN por meio do carregamento inicial de programas remoto (RIPL) ou do protocolo de configuração de host dinâmico/protocolo de inicialização (DHCP/BOOTP)
Auto-configuração do sistema a partir do menu de configuração
Log de erro no sistema (POST e IMM2.1)
Monitoramento de gerenciamento de sistemas por meio do barramento do protocolo Inter-Integrated Circuit (I2C)
Detecção de erro irrecuperável (UE)
POST atualizável, Interface Firmware Extensível Unificada (UEFI), diagnósticos, firmware de IMM2.1 e código residente de memória de leitura (ROM), localmente ou sobre a LAN
Dados vitais do produto (VPD) nos microprocessadores, placa-mãe, fontes de alimentação e SAS/SATA (unidade de disco rígido hot swap ou unidade de estado sólido) painel traseiro
Recurso Wake on LAN

Enviar feedback