Pular para o conteúdo principal

Confiabilidade, Disponibilidade e Capacidade de Manutenção

Três recursos importantes de design do computador são confiabilidade, disponibilidade e capacidade de manutenção (RAS). Os recursos RAS ajudam a assegurar a integridade dos dados que são armazenados no servidor, a disponibilidade do servidor quando você precisa dele e a facilidade com a qual é possível diagnosticar e corrigir problemas.

O servidor tem os seguintes recursos RAS:
  • Garantia limitada para peças e mão de obra por três anos (Tipo de Máquina 5463)
  • Centro de suporte 24 horas
  • Recuperação de erro e nova tentativa automáticas
  • Reinício automático em NMI (nonmaskable interrupt)
  • Reinicialização automática após uma falha de energia
  • Backup do sistema BIOS básico que alterna sob o controle do Integrated Management Module (IMM)
  • Monitoramento integrado para ventilador, energia, temperatura, voltagem e redundância da fonte de alimentação
  • Detecção de presença de cabo na maioria dos conectores
  • Proteção de memória Chipkill
  • DDDC (Double-Device Data Correction) para DIMMs de tecnologia DRAM x4 (disponível apenas em DIMMs de 16 GB). Assegure-se de que os dados estejam disponíveis em um único DIMM DRAM x4 depois de uma falha grave de até dois DIMMs DRAM. Um DIMM DRAM x4 em cada posição é reservado como um dispositivo de espaço.
  • Suporte de diagnóstico para adaptadores ServeRAID e Ethernet
  • Códigos e mensagens de erro
  • ECC (Error Correcting Code) cache L3 e memória do sistema
  • Redundância Matriz Integral de Espelhamento de Memória (FAMM)
  • Ventiladores de resfriamento hot swap com capacidade de sensor de velocidade
  • Unidades de disco rígido hot swap
  • IMM (Integrated Management Module)
  • Espelhamento de memória e suporte de memória sobressalente
  • Código de correção de erro de memória e teste de paridade
  • Diminuição de memória (memória não espelhada). Depois de uma reinicialização do servidor, se o controlador de memória tiver detectado um erro incorrigível não espelhado e não puder se recuperar operacionalmente, o IMM registrará o erro incorrigível e informará o POST. O POST mapeia logicamente a memória com o erro incorrigível e o servidor é reiniciado com a memória restante instalada.
  • Configuração orientada a menu, configuração do sistema e programas de configuração Redundant Array of Independent Disks (RAID)
  • BIST (Autoteste Integrado) no microprocessador, monitoramento de sinal de erro interno, monitoramento de sinal de trip térmico interno, verificação da configuração e identificação da falha no módulo regulador de voltagem e microprocessador através do diagnóstico de Light Path
  • Botão de interrupção não mascarável (NMI)
  • Verificação de paridade no barramento Small Computer System Interface (SCSI) e barramentos PCI-E e PCI
  • Gerenciamento de energia: conformidade com ACPI (Advanced Configuration and Power Interface)
  • Autoteste inicial (POST)
  • Alertas proativos da plataforma (incluindo análise de falhas preditivas e automonitoramento, alertas de tecnologia de relatório e análise): microprocessadores, reguladores de voltagem, memória, armazenamento interno (unidades de disco rígido SAS/SATA e unidades de estado sólido, armazenamento M.2, adaptadores flash de armazenamento), ventiladores, fontes de alimentação, controladores RAID e temperaturas de subcomponentes e ambiente do servidor
  • Recursos Ethernet redundantes com suporte a failover
  • Fontes de alimentação hot swap redundantes e ventiladores redundantes hot swap
  • Suporte à placa da interface de rede redundante (NIC)
  • Botão Lembrete para desligar temporariamente o LED de erro no sistema
  • Suporte de determinação de problema do sistema remoto
  • Diagnósticos baseados em ROM
  • Somas de verificação de ROM
  • Serial Presence Detection (SPD) na memória, VPD na placa-mãe, fonte de alimentação, painéis traseiros da unidade de disco rígido ou da unidade de estado sólido, microprocessador, bandeja de expansão de memória e placas Ethernet.
  • Isolamento Single-DIMM de erro corrigível excessivo ou erro multi-bit pela UEFI (Interface Firmware Extensível Unificada)
  • Unidades de estado sólido
  • Voltagem em espera para recursos de gerenciamento de sistemas e monitoramento
  • Inicialização na LAN por meio do carregamento inicial de programas remoto (RIPL) ou do protocolo de configuração de host dinâmico/protocolo de inicialização (DHCP/BOOTP)
  • Auto-configuração do sistema a partir do menu de configuração
  • Criação de log de erro do sistema (POST e IMM)
  • Monitoramento de gerenciamento de sistemas por meio do barramento de protocolo IC (Inter-Integrated Circuit)
  • Detecção de erro irrecuperável (UE)
  • POST atualizável, UEFI (Unified Extensible Firmware Interface), diagnósticos, firmware de IMM e código residente de ROM, localmente ou sobre a LAN
  • Dados vitais do produto (VPD) nos microprocessadores, placa-mãe, fontes de alimentação e SAS/SATA (unidade de disco rígido hot swap ou unidade de estado sólido) painel traseiro
  • Recurso Wake on LAN