Pular para o conteúdo principal

Confiabilidade, disponibilidade e capacidade de manutenção

Três recursos importantes de design do computador são confiabilidade, disponibilidade e capacidade de manutenção (RAS). Os recursos RAS ajudam a assegurar a integridade dos dados que são armazenados no servidor, a disponibilidade do servidor quando você precisa dele e a facilidade com a qual é possível diagnosticar e corrigir problemas.

O servidor tem os seguintes recursos RAS:
  • Garantia limitada de 3 anos em componentes e de 3 anos em mão de obra (máquina Tipo 3633)
  • Garantia limitada de 1 anos em componentes e de 1 anos em mão de obra (máquina Tipo 3943)
  • Sistema BIOS de backup alternando sob o controle do Integrated Management Module 2.1 (IMM2.1)
  • Centro de suporte 24 horas
  • Serviço Call Home
  • Primeira captura de dados de falha (FFDC) para determinar a causa raiz da falha
  • Manipulação de erro estendida (EEH) para o complexo host e root PCIe, link PCIe e falhas do adaptador PCIe
  • Detecção de erro da fonte de alimentação

  • Detecção de falha de VRD

  • Manipulação de falha de E/S

  • Detecção de erro interno de microprocessador

  • Trip térmico interno do microprocessador

  • Cache L2 de código de correção de erro (ECC) e memória do sistema
  • Fontes de alimentação hot swap redundantes
  • Unidades de disco rígido hot swap
  • Recursos avançados de memória:
    • Detecção de erro de memória de bit único

    • Correção de hardware com erro de memória de bit único

    • Detecção de vários erros de memória de bit único

  • Limitação de microprocessador
  • Limitação térmica de memória
  • Alertas PFA (Predictive Failure Analysis)
  • Integrated Management Module (IMM)

  • monitoramento de gerenciamento de sistemas por meio do barramento de protocolo IC (Inter-Integrated Circuit)
  • Voltagem em espera para recursos de gerenciamento de sistemas e monitoramento
  • Gerenciado por energia e em conformidade com ACPI (Advanced Configuration and Power Interface)
  • Autoteste inicial (POST)
  • Criação de log de erro do sistema (POST e IMM)
  • Códigos e mensagens de erro
  • Painéis de LED de informações e sistema de diagnósticos por light path

  • Iniciativa SPD e TruDDR4 de memória

  • Suporte de failover do NIC

  • Reinício automático em NMI (nonmaskable interrupt)

  • Despejo forçado de O/S (botão NMI)
  • Inicialização do dispositivo USB

  • Reinicialização do sistema remoto

  • Recuperação de erro e nova tentativa automáticas

  • Recuperação de excesso de temperatura

  • Botão Restaurar as configurações padrão do CMOS

  • Identificadores exclusivos de dados vitais do produto (VPD) no servidor blade e nos principais componentes eletrônicos com informações armazenadas na memória não volátil para visualização remota

  • Monitores e alertas de temperatura ambiente

  • Monitores e alertas de temperatura da memória

  • Monitores e alertas de temperatura do processador

  • POST atualizável, UEFI, diagnóstico, firmware IMM e código residente ROM (Read-Only Memory), localmente ou sobre a LAN

  • Diagnóstico pré-inicialização integrado

  • Diagnóstico Ethernet

  • Diagnóstico RAID

  • Guia de instalação e serviço