Pular para o conteúdo principal

Confiabilidade, Disponibilidade e Capacidade de Manutenção

Três recursos importantes de design do computador são confiabilidade, disponibilidade e capacidade de manutenção (RAS). Os recursos RAS ajudam a assegurar a integridade dos dados que são armazenados no servidor, a disponibilidade do servidor quando você precisa dele e a facilidade com a qual é possível diagnosticar e corrigir problemas.

O servidor tem os seguintes recursos RAS:
  • Garantia limitada de 3 anos em componentes e de 3 anos em mão de obra (máquina Tipo 5464)
  • Centro de suporte 24 horas
  • Recuperação de erro e nova tentativa automáticas
  • Reinício automático em NMI (nonmaskable interrupt)
  • Reinicialização automática após uma falha de energia
  • Sistema BIOS de backup alternando sob o controle do Integrated Management Module 2.1 (IMM2.1)
  • Monitoramento integrado para ventilador, energia, temperatura, voltagem e redundância da fonte de alimentação
  • Detecção de presença de cabo na maioria dos conectores
  • Proteção de memória Chipkill
  • Correção de dados de dispositivo único (SDDC) para tecnologia DIMMs x4 DRAM (disponível apenas em DIMMs de 16 GB). Assegure-se de que os dados estejam disponíveis em um único DIMM DRAM x4 depois de uma falha grave de até dois DIMMs DRAM. Um DIMM DRAM x4 em cada posição é reservado como um dispositivo de espaço.
  • Suporte de diagnóstico para adaptadores ServeRAID e Ethernet
  • Códigos e mensagens de erro
  • ECC (Error Correcting Code) cache L3 e memória do sistema
  • Redundância Matriz Integral de Espelhamento de Memória (FAMM)
  • Ventiladores de resfriamento hot swap com capacidade de sensor de velocidade
  • Unidades de disco rígido hot swap
  • Fontes de alimentação hot swap
  • Painéis de LED de informações e sistema de diagnósticos por light path
  • Integrated Management Module 2.1 (IMM2.1)
  • Os LEDs do sistema de diagnósticos por light path para DIMMs, microprocessadores, unidades de disco rígido, unidades de estado sólido, fontes de alimentação e ventiladores
  • Espelhamento de memória e suporte de memória sobressalente
  • Código de correção de erro de memória e teste de paridade
  • Diminuição de memória (memória não espelhada). Após uma reinicialização do servidor após o controlador de memória detectar um erro incorrigível não espelhado e o controlador de memória não puder se recuperar operacionalmente, o IMM2.1 registra o erro incorrigível e informa o POST. O POST mapeia logicamente a memória com o erro incorrigível e o servidor é reiniciado com a memória restante instalada.
  • Configuração orientada a menu, configuração do sistema e programas de configuração Redundant Array of Independent Disks (RAID)
  • BIST (Autoteste Integrado) no microprocessador, monitoramento de sinal de erro interno, monitoramento de sinal de trip térmico interno, verificação da configuração e identificação da falha no módulo regulador de voltagem e microprocessador através do diagnóstico de Light Path
  • botão de interrupção não mascarável (NMI)
  • Verificação de paridade nos barramentos PCIe
  • Gerenciamento de energia: em conformidade com a ACPI (Advanced Configuration and Power Interface)
  • Autoteste inicial (POST)
  • Alertas proativos da plataforma (incluindo análise de falhas preditivas e automonitoramento, alertas de tecnologia de relatório e análise): microprocessadores, reguladores de voltagem, memória, armazenamento interno (unidades de disco rígido SAS/SATA e unidades de estado sólido, unidades de estado sólido NVMe, armazenamento M.2, adaptadores flash de armazenamento), ventiladores, fontes de alimentação, controladores RAID temperaturas de subcomponentes e ambiente do servidor
  • Recursos Ethernet redundantes com suporte a failover
  • Fontes de alimentação hot swap redundantes e ventiladores redundantes hot swap
  • Suporte à placa da interface de rede redundante (NIC)
  • Suporte de determinação de problema do sistema remoto
  • Diagnósticos baseados em ROM
  • Somas de verificação de ROM
  • Detecção de Presença Serial (SPD) na memória, VPD na placa-mãe, fonte de alimentação e unidade de disco rígido ou os painéis traseiros da unidade de estado sólido, o microprocessador e bandeja de expansão de memória e adaptadores Ethernet
  • Isolamento Single-DIMM de erro corrigível excessivo ou erro multi-bit pela UEFI (Interface Firmware Extensível Unificada)
  • Unidades de estado sólido
  • Voltagem standby para recursos de gerenciamento de sistemas e monitoramento
  • Inicialização na LAN por meio do carregamento inicial de programas remoto (RIPL) ou do protocolo de configuração de host dinâmico/protocolo de inicialização (DHCP/BOOTP)
  • Auto-configuração do sistema a partir do menu de configuração
  • Log de erro no sistema (POST e IMM2.1)
  • Monitoramento de gerenciamento de sistemas por meio do barramento do protocolo Inter-Integrated Circuit (I2C)
  • Detecção de erro irrecuperável (UE)
  • POST atualizável, Interface Firmware Extensível Unificada (UEFI), diagnósticos, firmware de IMM2.1 e código residente de memória de leitura (ROM), localmente ou sobre a LAN
  • Dados vitais do produto (VPD) nos microprocessadores, placa-mãe, fontes de alimentação e SAS/SATA (unidade de disco rígido hot swap ou unidade de estado sólido) painel traseiro
  • Recurso Wake on LAN