Zum Hauptinhalt springen

Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit

Drei wichtige Merkmale beim Konzipieren einer Computerarchitektur sind Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit. Diese werden auch als RAS (Reliability, Availability, Serviceability) bezeichnet. Die RAS-Funktionen helfen beim Sicherstellen der Integrität der auf dem Server gespeicherten Daten, der Verfügbarkeit des Servers und der einfachen Fehlerdiagnose und ‑behebung.

Der Server verfügt über die folgenden RAS-Funktionen:
  • Drei Jahre beschränkte Garantie auf Teile und Serviceleistungen (Maschine Typ 5464)
  • Unterstützung durch Support Center rund um die Uhr
  • Automatische Fehlerwiederholung und -behebung
  • Automatischer Neustart bei nicht maskierbaren Interrupts (NMI)
  • Automatischer Wiederanlauf nach Stromausfall
  • Vom Integrated Management Module 2.1 (IMM2.1) gesteuerte Umschaltung auf Sicherungs-BIOS (Basic Input/Output System)
  • Eingebaute Überwachung für Lüfter, Netzstrom, Temperatur, Spannung und Netzteilredundanz
  • Verkabelungserkennung für die meisten Anschlüsse
  • Chipkill-Speicherschutz
  • SDDC (Singe Device Data Correction) für DIMMs mit x4-DRAM-Technologie (nur verfügbar bei DIMMs mit 16 GB). Stellt sicher, dass Daten auf einem einzelnen x4-DRAM-DIMM verfügbar sind, nachdem ein permanenter Fehler an bis zu zwei DRAM-DIMMs aufgetreten ist. Ein x4-DRAM-DIMM jeder Speicherbank ist als Speicherbereichseinheit reserviert.
  • Diagnoseunterstützung für ServeRAID- und Ethernet-Adapter
  • Fehlercodes und -nachrichten
  • Fehlerkorrekturcode (ECC), L3-Cache und Systemspeicher
  • FAMM-Redundanz (Full Array Memory Mirroring)
  • Hot-Swap-Lüfter mit Geschwindigkeitssensor
  • Hot-Swap-Festplattenlaufwerke
  • Hot-Swap-Netzteile
  • LED-Informationsanzeige und LED-Diagnoseanzeige der Funktion „Light Path Diagnostics“
  • Integrated Management Module 2.1 (IMM2.1)
  • „Light Path Diagnostics“-Anzeigen für DIMMs, Mikroprozessoren, Festplattenlaufwerke, Solid-State-Laufwerke, Netzteile und Lüfter
  • Unterstützung für Speicherspiegelung und Ersatzspeicherfunktion
  • Speicherfehlerkorrekturcode und Paritätstest
  • Speicher-Downsizing (nicht gespiegelter Speicher). Nach einem Neustart des Servers, nachdem der Speichercontroller einen nicht gespiegelten, nicht behebbaren Fehler erkannt hat und der Speichercontroller seinen Betrieb nicht wieder aufnehmen kann, protokolliert das IMM2.1 den nicht behebbaren Fehler und informiert POST, den Selbsttest beim Einschalten. POST hebt die logische Zuordnung des Speichers mit dem nicht behebbaren Fehler auf und der Server wird mit dem verbleibenden installierten Speicher erneut gestartet.
  • Menügeführte Installations-, Systemkonfigurations- und RAID-Konfigurationsprogramme (Redundant Array of Independent Disks)
  • Mikroprozessor-BIST (integrierter Selbsttest), interne Fehlersignalüberwachung, interne Wärmeauslösersignalüberwachung, Konfigurationsüberprüfung und Störungserkennung für das Mikroprozessor- und Spannungsreglermodul mithilfe der Funktion „Light Path Diagnostics“
  • Schalter für nicht maskierbare Interrupts (NMI)
  • Paritätsprüfung in Bezug auf die PCIe-Busse
  • Stromverbrauchssteuerung: Konformität mit ACPI (Advanced Configuration und Power Interface)
  • Selbsttest beim Einschalten (Power-On Self-Test, POST)
  • Proactive Platform Alerts (einschließlich Predictive Failure Analysis und Self-Monitoring, Analysis and Reporting Technology-Alerts): Mikroprozessoren, Spannungsregler, Hauptspeicher, interne Storage-Einheiten (SAS/SATA-Festplattenlaufwerke und -SSDs, NVMe-SSDs, M.2-Storage, Flash-Storage-Adapter), Lüfter, Netzteile, RAID-Controller und Temperatur von Server und Subkomponenten.
  • Ethernet-Redundanz für Failoverunterstützung
  • Redundante Hot-Swap-Netzteile und redundante Hot-Swap-Lüfter
  • Unterstützung für redundante Netzschnittstellenkarte (Network Interface Card, NIC)
  • Unterstützung für Systemfehlerbestimmung über Fernzugriff
  • ROM-basierte Diagnosen
  • ROM-Kontrollsummen
  • SPD (Serial Presence Detection) für Speicher, elementare Produktdaten auf Systemplatine, Netzteil und Rückwandplatinen für Festplattenlaufwerke oder Solid-State-Laufwerke, Erweiterungseinbaurahmen für Mikroprozessoren und Hauptspeicher und Ethernet-Adapter
  • Isolation einzelner DIMMs mit hoher Fehleranzahl oder Multi-Bit-Fehlern durch die UEFI (Unified Extensible Firmware Interface)
  • Solid-State-Laufwerke
  • Spannung im Bereitschaftsmodus für Systemmanagementfunktionen und Überwachung
  • Systemstart (Booten) über ein LAN durch einleitendes Programmladen (Remote Initial Program Load, RIPL) über Fernzugriff oder mithilfe von DHCP/BOOTP (Dynamic Host Configuration Protocol/Boot Protocol)
  • Automatische Systemkonfiguration über das Konfigurationsmenü
  • Systemfehlerprotokollierung (POST und IMM2.1)
  • Systemmanagementüberwachung über den Inter-Integrated-Circuit-Protokollbus (I2C)
  • Erkennung nicht behebbarer Fehler
  • POST, UEFI (Unified Extensible Firmware Interface), Diagnoseprogramme, IMM2.1-Firmware und residenter ROM-Code (Read-Only-Memory), lokal oder über LAN aktualisierbar
  • Elementare Produktdaten (VPD – Vital Product Data) auf Mikroprozessoren, Systemplatine, Netzteilen und auf der SAS/SATA-Rückwandplatine (Hot-Swap-Festplattenlaufwerk oder Solid-State-Laufwerk)
  • Funktion „Wake on LAN“