Aller au contenu principal

Fiabilité, disponibilité et facilité de maintenance

Les trois fonctions importantes dans la conception d'un ordinateur sont la fiabilité, la disponibilité et la facilité de maintenance. On parle de fonctions de RAS (Reliability, Availability, Serviceability). Les fonctions de RAS vous permettent d'assurer l'intégrité des données stockées sur le serveur, la disponibilité du serveur dès que vous en avez besoin et la facilité de diagnostic et de correction des problèmes.

Le serveur offre les fonctions de RAS suivantes :
  • Garantie main d'œuvre et composants limitée à 3 ans (Machine Type 5464)
  • Centre de support 24/24
  • Relance et récupération automatique après erreur
  • Redémarrage automatique après une interruption non masquable (NMI)
  • Redémarrage automatique après une coupure d'alimentation
  • Commutation du système BIOS sous contrôle du Integrated Management Module 2.1 (IMM2.1)
  • Surveillance intégrée des ventilateurs, de l'alimentation, de la température, de la tension et de l'alimentation de secours
  • Détection de câble sur la plupart des connecteurs
  • Protection de mémoire Chipkill
  • Correction de données sur une unité (SDDC) pour des barrettes DIMM à technologie DRAM x4 (disponible uniquement sur des barrettes DIMM 16 Go). Garantit que les données sont disponibles sur une barrette DIMM à DRAM x4 après une grave défaillance sur deux barrettes DIMM à DRAM maximum. Une barrette DIMM à DRAM x4 de chaque rangée est réservée sous forme d'unité d'espace.
  • Diagnostic pour les adaptateurs ServeRAID et Ethernet
  • Messages et codes d'erreur
  • Code correcteur d'erreur (ECC) pour la mémoire système et cache du bloc L3
  • Redondance de mise en miroir de mémoire pour toute la grappe (FAMM)
  • Ventilateurs de refroidissement à remplacement à chaud avec détection du débit
  • Unités de disque dur remplaçables à chaud
  • Blocs d'alimentation remplaçables à chaud
  • Panneau d'information et panneau Light Path Diagnostics
  • Integrated Management Module 2.1 (IMM2.1)
  • Voyants Light Path diagnostics pour les barrettes DIMM, les microprocesseurs, les unités de disque dur, les unités SSD, le bloc d'alimentation et les ventilateurs
  • Prise en charge de la mise en miroir de mémoire et de la tolérance mémoire
  • Code correcteur d'erreurs de mémoire et test de parité
  • Réduction de la mémoire (mémoire non mise en miroir). Après un redémarrage de serveur après que le contrôleur de mémoire ait détecté une erreur irrémédiable non mise en miroir et l'impossibilité pour le contrôleur de mémoire de procéder à la restauration de manière opérationnelle, le module IMM2.1 consigne l'erreur irrémédiable et informe le POST. Celui-ci parcourt la mémoire avec l'erreur irrémédiable, puis le serveur redémarre avec la mémoire installée restante.
  • Programmes de configuration système et RAID (Redundant Array of Independent Disks) pilotés par menus
  • Autotest intégré du microprocesseur (BIST), surveillance de signal d'erreur interne, surveillance de signal de sécurité thermique interne, contrôle de configuration, et identification de problème de module de régulation de tension et du microprocesseur via light path diagnostics
  • Bouton d'interruption non masquable (NMI)
  • Contrôle de parité sur les bus PCIe
  • Gestion de l'alimentation : compatible ACPI (Advanced Configuration et Power Interface)
  • Autotest à la mise sous tension (POST)
  • Alertes de plateforme proactives (y compris analyse des pannes prévisibles et alertes d'analyse de surveillance automatique et de technologie de génération de rapports (SMART)) : microprocesseurs, régulateurs de tension, mémoire, stockage interne (unités de disque dur SAS/SATA et unités SSD, unités SSD NVMe, stockage M.2, adaptateurs de stockage flash), ventilateurs, alimentations, contrôleurs RAID, et températures ambiantes du serveur et des sous-composants
  • Fonctions Ethernet de secours avec support de basculement
  • Blocs d'alimentation redondants remplaçables à chaud et ventilateurs redondants remplaçables à chaud
  • Prise en charge d'un carte d'interface réseau redondante
  • Identification des problèmes système à distance
  • Diagnostic basé sur la ROM
  • Vérification par total de contrôle de la mémoire morte
  • SPD (Serial Presence Detection) sur mémoire, données techniques essentielles sur la carte mère, le bloc d'alimentation et le fonds de panier de l'unité de disque dur ou de l'unité SSD, microprocesseur et bac d'extension mémoire ainsi que les adaptateurs Ethernet
  • Isolement de barrette DIMM unique pour les erreurs corrigibles en excès ou les erreurs multibits de l'UEFI
  • Unités SSD
  • Tension de secours pour la surveillance et les fonctions de gestion de système
  • Démarrage (amorçage) à partir du réseau local via RIPL (Remote Initial Program Load) ou DHCP/BOOTP (Dynamic Host Configuration Protocol/Boot Protocol)
  • Configuration automatique du système depuis le menu de configuration
  • Journalisation d'erreur système (POST et IMM2.1)
  • Surveillance de la gestion de système à l'aide du bus I2C (Inter-Integrated Circuit)
  • Détection d'erreur irrémédiable (UE)
  • Possibilité de mettre à niveau l'autotest à la mise sous tension, Unified Extensible Firmware Interface (UEFI), diagnostics, microprogramme IMM2.1 et code résident de mémoire morte (ROM) en local ou sur le LAN
  • Données techniques essentielles sur les microprocesseurs, la carte mère, les blocs d'alimentation et le fond de panier SAS/SATA (unité SSD ou unité de disque dur remplaçable à chaud)
  • Fonction Wake on LAN