Aller au contenu principal

Fiabilité, disponibilité et facilité de maintenance

Les trois fonctions importantes dans la conception d'un ordinateur sont la fiabilité, la disponibilité et la facilité de maintenance. On parle de fonctions de RAS (Reliability, Availability, Serviceability). Les fonctions de RAS vous permettent d'assurer l'intégrité des données stockées sur le serveur, la disponibilité du serveur dès que vous en avez besoin et la facilité de diagnostic et de correction des problèmes.

Le serveur offre les fonctions de RAS suivantes :
  • Garantie de trois ans sur les pièces et de trois ans sur la main-d'œuvre (Type de machine 5463)
  • Centre de support 24h/24
  • Relance et récupération automatique après erreur
  • Redémarrage automatique après une interruption non masquable (NMI)
  • Redémarrage automatique après une coupure d'alimentation
  • Commutation du système BIOS de sauvegarde sous le contrôle d'integrated management module (IMM)
  • Surveillance intégrée des ventilateurs, de l'alimentation, de la température, de la tension et de l'alimentation de secours
  • Détection de câble sur la plupart des connecteurs
  • Protection de mémoire Chipkill
  • Correction de données sur deux unités (DDDC) pour des barrettes DIMM à technologie DRAM x4 (disponible uniquement sur des barrettes DIMM 16 Go). Garantit que les données sont disponibles sur une barrette DIMM à DRAM x4 après une grave défaillance sur deux barrettes DIMM à DRAM maximum. Une barrette DIMM à DRAM x4 de chaque rangée est réservée sous forme d'unité d'espace.
  • Diagnostic pour les adaptateurs ServeRAID et Ethernet
  • Messages et codes d'erreur
  • Code correcteur d'erreur (ECC) pour la mémoire système et cache du bloc L3
  • Redondance de mise en miroir de mémoire pour toute la grappe (FAMM)
  • Ventilateurs de refroidissement à remplacement à chaud avec détection du débit
  • Unités de disque dur remplaçables à chaud
  • Integrated Management Module (IMM)
  • Prise en charge de la mise en miroir de mémoire et de la tolérance mémoire
  • Code correcteur d'erreurs de mémoire et test de parité
  • Réduction de la mémoire (mémoire non mise en miroir). Après un redémarrage du serveur, lorsque le contrôleur de mémoire a détecté une erreur irrémédiable non mise en miroir et que le contrôleur de mémoire ne peut pas récupérer de manière opérationnelle, le module IMM consigne l'erreur irrémédiable et informe l'autotest à la mise sous tension. Celui-ci parcourt la mémoire avec l'erreur irrémédiable, puis le serveur redémarre avec la mémoire installée restante.
  • Programmes de configuration système et RAID (Redundant Array of Independent Disks) pilotés par menus
  • Autotest intégré du microprocesseur (BIST), surveillance de signal d'erreur interne, surveillance de signal de sécurité thermique interne, contrôle de configuration, et identification de problème de module de régulation de tension et du microprocesseur via light path diagnostics
  • Bouton d'interruption non masquable (NMI)
  • Contrôle de parité sur le bus SCSI et les bus PCI-E et PCI
  • Gestion de l'alimentation : compatible ACPI (Advanced Configuration and Power Interface)
  • Autotest à la mise sous tension (POST)
  • Alertes de plateforme proactives (y compris analyse des pannes prévisibles et alertes d'analyse de surveillance automatique et de technologie de génération de rapports (SMART)) : microprocesseurs, régulateurs de tension, mémoire, stockage interne (unités de disque dur SAS/SATA et unités SSD, stockage M.2, adaptateurs de stockage flash), ventilateurs, alimentations, contrôleurs RAID, et températures ambiantes du serveur et des sous-composants
  • Fonctions Ethernet de secours avec support de basculement
  • Blocs d'alimentation redondants remplaçables à chaud et ventilateurs redondants remplaçables à chaud
  • Prise en charge d'un carte d'interface réseau redondante
  • Bouton REMIND permettant de mettre temporairement hors tension le voyant d'erreur système
  • Identification des problèmes système à distance
  • Diagnostic basé sur la ROM
  • Vérification par total de contrôle de la mémoire morte
  • Fonction SPD (Serial Presence Detection) sur la mémoire, données techniques essentielles sur la carte mère, bloc d'alimentation et fonds de panier des unités de disque dur ou SSD, microprocesseur et tiroir d'extension de la mémoire, et cartes Ethernet
  • Isolement de barrette DIMM unique pour les erreurs corrigibles en excès ou les erreurs multibits de l'UEFI
  • Unités SSD
  • Tension de secours pour la surveillance et les fonctions de gestion de système
  • Démarrage (amorçage) à partir du réseau local via RIPL (Remote Initial Program Load) ou DHCP/BOOTP (Dynamic Host Configuration Protocol/Boot Protocol)
  • Configuration automatique du système depuis le menu de configuration
  • Consignation des erreurs système (autotest à la mise sous tension et IMM)
  • Surveillance de la gestion de système via le bus de protocole Inter-Integrated Circuit
  • Détection d'erreur irrémédiable (UE)
  • Possibilité de mettre à niveau l'autotest à la mise sous tension, l'UEFI, les programmes de diagnostic, le microprogramme de module IMM, le code résident de mémoire morte, en local ou sur un réseau local
  • Données techniques essentielles sur les microprocesseurs, la carte mère, les blocs d'alimentation et le fond de panier SAS/SATA (unité SSD ou unité de disque dur remplaçable à chaud)
  • Fonction Wake on LAN