Zum Hauptinhalt springen

Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit

Drei wichtige Merkmale beim Konzipieren einer Computerarchitektur sind Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit. Diese werden auch als RAS (Reliability, Availability, Serviceability) bezeichnet. Die RAS-Funktionen helfen beim Sicherstellen der Integrität der auf dem Server gespeicherten Daten, der Verfügbarkeit des Servers und der einfachen Fehlerdiagnose und ‑behebung.

Der Server verfügt über die folgenden RAS-Funktionen:
  • Begrenzter Herstellerservice von 3 Jahren für Teile und 3 Jahren für Serviceleistungen (Maschinentyp 8871)
  • Unterstützung durch Support Center rund um die Uhr
  • Automatische Fehlerwiederholung und -behebung
  • Automatischer Neustart bei nicht maskierbaren Interrupts (NMI)
  • Automatischer Wiederanlauf nach Stromausfall
  • Vom Integrated Management Module (IMM) gesteuerte Umschaltung auf Sicherungs-BIOS (Basic Input/Output System)
  • Eingebaute Überwachung für Lüfter, Netzstrom, Temperatur, Spannung und Netzteilredundanz
  • Verkabelungserkennung für die meisten Anschlüsse
  • Chipkill-Speicherschutz
  • DDDC (Double Device Data Correction) für DIMMs mit x4-DRAM-Technologie. Stellt sicher, dass Daten auf einem einzelnen x4-DRAM-DIMM verfügbar sind, nachdem ein permanenter Fehler an bis zu zwei DRAM-DIMMs aufgetreten ist. Ein x4-DRAM-DIMM jeder Speicherbank ist als Speicherbereichseinheit reserviert.
  • Diagnoseunterstützung für ServeRAID- und Ethernet-Adapter
  • Fehlercodes und -nachrichten
  • Fehlerkorrekturcode (ECC), L3-Cache und Systemspeicher
  • FAMM-Redundanz (Full Array Memory Mirroring)
  • Hot-Swap-Lüfter mit Geschwindigkeitssensor
  • Hot-Swap-Festplattenlaufwerke
  • LCD-Systeminformationsanzeige (bei einigen Modellen verfügbar) und Bedienerinformationsanzeige
  • Integrated Management Module (IMM)
  • LCD-Systeminformationsanzeige für Speicher-DIMMs (bei einigen Modellen verfügbar), Mikroprozessoren, Festplattenlaufwerke, Solid-State-Laufwerke, Netzteile und Lüfter
  • Unterstützung für Speicherspiegelung und Ersatzspeicherfunktion
  • Speicherfehlerkorrekturcode und Paritätstest
  • Verringerung der Speicherkapazität (nicht gespiegelter Speicher). Nach einem Neustart des Servers, nachdem der Speichercontroller einen nicht gespiegelten, nicht behebbaren Fehler erkannt hat und der Speichercontroller seinen Betrieb nicht wiederaufnehmen kann, protokolliert das IMM den nicht behebbaren Fehler und informiert POST, den Selbsttest beim Einschalten. POST hebt die logische Zuordnung des Speichers mit dem nicht behebbaren Fehler auf und der Server wird mit dem verbleibenden installierten Speicher erneut gestartet.
  • Menügeführte Installations-, Systemkonfigurations- und RAID-Konfigurationsprogramme (Redundant Array of Independent Disks)
  • Mikroprozessor-BIST (integrierter Selbsttest), interne Fehlersignalüberwachung, interne Wärmeauslösersignalüberwachung, Konfigurationsüberprüfung und Störungserkennung für das Mikroprozessor- und Spannungsreglermodul mithilfe der LCD-Systeminformationsanzeige (wenn verfügbar).
  • Schalter für nicht maskierbare Interrupts (NMI)
  • Paritätsprüfung auf dem SCSI-Bus (Small Computer System Interface) und auf den PCI-E- und PCI-Bussen
  • Stromverbrauchssteuerung: Konformität mit ACPI (Advanced Configuration and Power Interface)
  • Selbsttest beim Einschalten (Power-On Self-Test, POST)
  • Proactive Platform Alerts (einschließlich Predictive Failure Analysis und Self-Monitoring, Analysis and Reporting Technology-Alerts): Mikroprozessoren, Spannungsregler, Hauptspeicher, interne Storage-Einheiten (SAS/SATA-Festplattenlaufwerke und -SSDs, NVMe-SSDs, M.2-Storage, Flash-Storage-Adapter), Lüfter, Netzteile, RAID-Controller und Temperatur von Server und Subkomponenten.
  • Ethernet-Redundanz für Failoverunterstützung
  • Redundante Hot-Swap-Netzteile und redundante Hot-Swap-Lüfter
  • Unterstützung für redundante Netzschnittstellenkarte (Network Interface Card, NIC)
  • Knopf „Remind“ zum vorübergehenden Ausschalten der Systemfehleranzeige
  • Unterstützung für Systemfehlerbestimmung über Fernzugriff
  • ROM-basierte Diagnosen
  • ROM-Kontrollsummen
  • SPD (Serial Presence Detection) für Speicher, elementare Produktdaten auf der Systemplatine, Netzteil, Rückwandplatinen für Festplattenlaufwerke oder Solid-State-Laufwerke, Mikroprozessor und Speichererweiterungseinbaurahmen sowie für Ethernet-Karten
  • Isolation einzelner DIMMs mit hoher Fehleranzahl oder Multi-Bit-Fehlern durch die UEFI (Unified Extensible Firmware Interface)
  • Solid-State-Laufwerke
  • Spannung im Bereitschaftsmodus für Systemmanagementfunktionen und Überwachung
  • Systemstart (Booten) über ein LAN durch einleitendes Programmladen (Remote Initial Program Load, RIPL) über Fernzugriff oder mithilfe von DHCP/BOOTP (Dynamic Host Configuration Protocol/Boot Protocol)
  • Automatische Systemkonfiguration über das Konfigurationsmenü
  • Systemfehlerprotokollierung (POST und IMM)
  • Systemmanagementüberwachung über den Inter-Integrated-Circuit-Protokollbus (IC)
  • Erkennung nicht behebbarer Fehler
  • POST, UEFI (Unified Extensible Firmware Interface), Diagnoseprogramme, IMM-Firmware und residenter ROM-Code (Read-Only-Memory), lokal oder über LAN aktualisierbar
  • Elementare Produktdaten (VPD – Vital Product Data) auf Mikroprozessoren, Systemplatine, Netzteilen und auf der SAS/SATA-Rückwandplatine (Hot-Swap-Festplattenlaufwerk oder Solid-State-Laufwerk)
  • Funktion „Wake on LAN“