Cluster-Fehlercodes
Das System meldet einen Fehler oder einen Status, der durch das Generieren eines Fehlercodes, der auf der Seite „Meldungen“ aufgeführt ist, von Interesse sein könnte. Anhand dieser Codes können Sie ermitteln, welche Komponente des Systems die Warnmeldung erfahren hat und warum die Warnmeldung generiert wurde.
In der folgenden Liste werden die verschiedenen Arten von Codes beschrieben:
-
AuthentifizierungServiceFault
Der Authentifizierungsdienst auf einem oder mehreren Clusterknoten funktioniert nicht wie erwartet.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
VerfügbarVirtualNetworkIPAdresseLow
Die Anzahl der virtuellen Netzwerkadressen im Block der IP-Adressen ist gering.
Um diesen Fehler zu beheben, fügen Sie dem Block der virtuellen Netzwerkadressen weitere IP-Adressen hinzu.
-
* BlockClusterFull*
Es ist nicht ausreichend freier Block-Speicherplatz zur Unterstützung eines Single-Node-Verlusts vorhanden. Weitere Informationen zu Cluster-Auslastungsstufen finden Sie in der GetClusterFullThreshold API-Methode. Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Stage3Low (Warnung): Benutzerdefinierter Schwellenwert wurde überschritten. Passen Sie Cluster-Volleinstellungen an oder fügen Sie weitere Nodes hinzu.
-
Stage4Critical (Fehler): Es gibt nicht genügend Speicherplatz zur Wiederherstellung nach einem Ausfall eines 1 Node. Das Erstellen von Volumes, Snapshots und Klonen ist nicht zulässig.
-
Stage5CompletelyConsumed (kritisch)1; es sind keine Schreibzugriffe oder neue iSCSI-Verbindungen zulässig. Aktuelle iSCSI-Verbindungen werden beibehalten. Schreibzugriffe scheitern, bis mehr Kapazität dem Cluster hinzugefügt wird.
Löschen oder löschen Sie Volumes, um diesen Fehler zu beheben, oder fügen Sie dem Storage-Cluster einen weiteren Storage-Node hinzu.
-
-
BlocksDegradiert
Blockdaten werden aufgrund eines Ausfalls nicht mehr vollständig repliziert.
Schweregrad
Beschreibung
Warnung
Auf nur zwei vollständige Kopien der Blockdaten kann zugegriffen werden.
Fehler
Auf nur eine vollständige Kopie der Blockdaten kann zugegriffen werden.
Kritisch
Auf vollständige Kopien der Blockdaten kann nicht zugegriffen werden.
Hinweis: der Warnstatus kann nur auf einem Triple Helix System auftreten.
Um diesen Fehler zu beheben, stellen Sie alle Offline Nodes oder Block-Services wieder her oder wenden Sie sich an den NetApp Support, um Unterstützung zu erhalten.
-
BlockServiceTooFull
Ein Block-Service benötigt zu viel Speicherplatz.
Um diesen Fehler zu beheben, fügen Sie mehr bereitgestellte Kapazität hinzu.
-
BlockServiceUnHealthy
Ein Blockdienst wurde als fehlerhaft erkannt:
-
Schweregrad = Warnung: Es werden keine Maßnahmen ergriffen. Dieser Warnzeitraum läuft in cTimeUntilBSIsKilledMSec=330000 Millisekunden ab.
-
Schweregrad = Fehler: Das System setzt Daten automatisch zurück und repliziert seine Daten auf andere gesunde Laufwerke.
-
Schweregrad = kritisch: Es gibt fehlerhafte Blockdienste auf mehreren Knoten, die größer oder gleich der Replikationszahl sind (2 für Doppelhelix). Die Daten sind nicht verfügbar, und die bin-Synchronisierung wird nicht beendet.
Prüfen Sie auf Probleme mit der Netzwerkverbindung und Hardwarefehler. Es gibt weitere Fehler, wenn bestimmte Hardwarekomponenten ausgefallen sind. Der Fehler wird gelöscht, wenn der Blockservice aufgerufen wird oder wenn der Dienst deaktiviert wurde.
-
-
BmcSelfTestFailed
Der Baseboard Management Controller (BMC) hat einen Selbsttest nicht bestanden.
Wenden Sie sich an den NetApp Support, wenn Sie Hilfe benötigen.
Bei einem Upgrade auf Element 12.5 oder höher wird der
BmcSelfTestFailed
Fehler nicht für einen Node generiert, der bereits eine ausgefallene BMC hat, oder wenn die BMC eines Node während des Upgrades ausfällt. Die BMCs, die die Selbsttests während des Upgrades nicht durchführen, geben einen Warnfehler ausBmcSelfTestFailed
, nachdem das gesamte Cluster das Upgrade abgeschlossen hat. -
ClockSkewExceedsFaultThreshold
Zeitverzerrung zwischen dem Cluster-Master und dem Node, der ein Token enthält, übersteigt den empfohlenen Schwellenwert. Storage Cluster kann die Zeitverzerrung zwischen den Nodes nicht automatisch korrigieren.
Um diesen Fehler zu beheben, verwenden Sie NTP-Server, die intern zu Ihrem Netzwerk sind, anstatt die Installationsstandards. Wenn Sie einen internen NTP-Server verwenden, wenden Sie sich an den NetApp Support.
-
* ClusterCannotSync*
Es ist ein nicht genügend Speicherplatz vorhanden, und Daten auf den Offline-Blockspeicherlaufwerken können nicht mit Laufwerken synchronisiert werden, die noch aktiv sind.
Um diesen Fehler zu beheben, fügen Sie mehr Speicher hinzu.
-
* ClusterFull*
Es ist kein freier Speicherplatz im Storage-Cluster mehr verfügbar.
Um diesen Fehler zu beheben, fügen Sie mehr Speicher hinzu.
-
ClusterIOPSAreüberProvistiert
Cluster-IOPS werden überprovisioniert. Die Summe aller minimalen QoS-IOPS ist größer als die erwarteten IOPS des Clusters. Eine minimale QoS kann nicht für alle Volumes gleichzeitig aufrechterhalten werden.
Senken Sie zur Behebung dieses Problems die Mindesteinstellungen für QoS-IOPS für Volumes.
-
CpuThermalEventThreshold
Die Anzahl der thermischen CPU-Ereignisse auf einer oder mehreren CPUs überschreitet den konfigurierten Schwellenwert.
Wenn innerhalb von zehn Minuten keine neuen thermischen CPU-Ereignisse erkannt werden, löst sich die Warnung.
-
AbleDriveSecurityFailed
Das Cluster ist nicht für das Aktivieren der Laufwerksicherheit konfiguriert (Verschlüsselung im Ruhezustand), aber mindestens ein Laufwerk ist die Laufwerksicherheit aktiviert, was bedeutet, dass die Laufwerksicherheit auf diesen Laufwerken deaktiviert ist. Dieser Fehler wird mit dem Schweregrad „
Warnung
“ protokolliert.Um diesen Fehler zu beheben, überprüfen Sie die Fehlerdetails aus dem Grund, warum die Laufwerksicherheit nicht deaktiviert werden konnte. Mögliche Gründe sind:
-
Der Verschlüsselungsschlüssel konnte nicht erworben werden. Untersuchen Sie das Problem mit dem Zugriff auf den Schlüssel oder den externen Schlüsselserver.
-
Der Vorgang zum Deaktivieren des Laufwerks ist fehlgeschlagen. Stellen Sie fest, ob der falsche Schlüssel möglicherweise erfasst wurde.
Wenn keiner dieser Gründe den Fehler Gründe hat, muss das Laufwerk möglicherweise ausgetauscht werden.
Sie können versuchen, ein Laufwerk wiederherzustellen, das die Sicherheit nicht erfolgreich deaktiviert, selbst wenn der richtige Authentifizierungsschlüssel angegeben ist. Entfernen Sie die Laufwerke aus dem System, indem Sie sie auf verfügbar verschieben, löschen Sie sie sicher auf dem Laufwerk, und verschieben Sie sie wieder in aktiv.
-
-
DisconnectedClusterpaar
Ein Cluster-Paar ist getrennt oder falsch konfiguriert.
Überprüfen Sie die Netzwerkverbindung zwischen den Clustern.
-
Verbindung abschaltenRemoteNode
Ein Remote-Knoten ist entweder getrennt oder falsch konfiguriert.
Überprüfen Sie die Netzwerkverbindung zwischen den Nodes.
-
DemconnectedSnapMirrorEndpoint
Ein Remote-SnapMirror-Endpunkt wird getrennt oder falsch konfiguriert.
Überprüfen Sie die Netzwerkverbindung zwischen dem Cluster und dem Remote-SnapMirrorEndpoint.
-
Auffahrt verfügbar
Ein oder mehrere Laufwerke sind im Cluster verfügbar. Im Allgemeinen sollten alle Cluster alle Laufwerke hinzugefügt werden und keine im Status „verfügbar“. Sollte dieser Fehler unerwartet auftreten, wenden Sie sich an den NetApp Support.
Um diesen Fehler zu beheben, fügen Sie alle verfügbaren Laufwerke zum Speicher-Cluster hinzu.
-
* Auffahrt nicht möglich*
Das Cluster gibt diesen Fehler zurück, wenn ein oder mehrere Laufwerke ausgefallen sind und einer der folgenden Bedingungen anzeigt:
-
Der Laufwerksmanager kann nicht auf das Laufwerk zugreifen.
-
Der Slice- oder Block-Service ist zu oft ausgefallen, vermutlich aufgrund von Lese- oder Schreibfehlern des Laufwerks und kann nicht neu gestartet werden.
-
Das Laufwerk fehlt.
-
Der Master-Service für den Node ist nicht verfügbar (alle Laufwerke im Node gelten als fehlend/ausgefallen).
-
Das Laufwerk ist gesperrt und der Authentifizierungsschlüssel für das Laufwerk kann nicht erworben werden.
-
Das Laufwerk ist gesperrt, und der Entsperrvorgang schlägt fehl.
So lösen Sie dieses Problem:
-
Überprüfen Sie die Netzwerkverbindung für den Node.
-
Ersetzen Sie das Laufwerk.
-
Stellen Sie sicher, dass der Authentifizierungsschlüssel verfügbar ist.
-
-
DriveHealthFault
Die SMART-Integritätsprüfung auf einem Laufwerk ist fehlgeschlagen, sodass die Funktionen des Laufwerks verringert werden. Es gibt einen kritischen Schweregrad für diesen Fehler:
-
Laufwerk mit serieller Verbindung: <Seriennummer> in Steckplatz: <Node-Steckplatz><Laufwerksfach> hat die INTELLIGENTE allgemeine Integritätsprüfung nicht bestanden.
Um diesen Fehler zu beheben, ersetzen Sie das Laufwerk.
-
-
DriveWearFault
Die Restlebensdauer eines Laufwerks ist unter die Schwellenwerte gesunken, funktioniert aber immer noch.Es gibt zwei mögliche Schweregrade für diesen Fehler: Kritisch und Warnung:
-
Laufwerk mit serieller Verbindung: <Seriennummer> im Steckplatz: <Node-Steckplatz><Laufwerk-Steckplatz> verfügt über einen kritischen Verschleiß.
-
Laufwerk mit serieller Verbindung: <Seriennummer> im Steckplatz: <Node-Steckplatz><Laufwerksfach> verfügt über geringe Verschleißreserven.
Um diesen Fehler zu beheben, tauschen Sie das Laufwerk bald aus.
-
-
* DuplicateClusterMasterCandidates*
Es wurden mehr als ein Master-Kandidat für Speichercluster erkannt.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
EnableDriveSecurityFailed
Das Cluster ist so konfiguriert, dass es Laufwerkssicherheit (Verschlüsselung im Ruhezustand) benötigt, die Laufwerkssicherheit konnte jedoch auf mindestens einem Laufwerk nicht aktiviert werden. Dieser Fehler wird mit dem Schweregrad „
Warnung
“ protokolliert.Um diesen Fehler zu beheben, überprüfen Sie die Fehlerdetails aus dem Grund, warum die Laufwerksicherheit nicht aktiviert werden konnte. Mögliche Gründe sind:
-
Der Verschlüsselungsschlüssel konnte nicht erworben werden. Untersuchen Sie das Problem mit dem Zugriff auf den Schlüssel oder den externen Schlüsselserver.
-
Der Vorgang zum Aktivieren ist auf dem Laufwerk fehlgeschlagen. Stellen Sie fest, ob der falsche Schlüssel möglicherweise erfasst wurde. Wenn keiner dieser Gründe den Fehler Gründe hat, muss das Laufwerk möglicherweise ausgetauscht werden.
Sie können versuchen, ein Laufwerk wiederherzustellen, das die Sicherheit nicht erfolgreich aktiviert, selbst wenn der richtige Authentifizierungsschlüssel angegeben ist. Entfernen Sie die Laufwerke aus dem System, indem Sie sie auf verfügbar verschieben, löschen Sie sie sicher auf dem Laufwerk, und verschieben Sie sie wieder in aktiv.
-
-
EnsembleDegraded
Die Netzwerk-Konnektivität oder -Stromversorgung wurde auf einen oder mehrere der Ensemble-Knoten verloren.
Um diesen Fehler zu beheben, stellen Sie die Netzwerkverbindung oder den Netzstrom wieder her.
-
Ausnahme
Ein Fehler wurde gemeldet, der sich nicht auf einen Routinefehler ausstellt. Diese Fehler werden nicht automatisch aus der Fehlerwarteschlange gelöscht.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
AusfallenSpaceTooFull
Ein Blockservice reagiert nicht auf Datenschreibanfragen. Dadurch verfügt der Slice Service über keinen freien Speicherplatz zum Speichern ausgefallener Schreibvorgänge.
Um diesen Fehler zu beheben, stellen Sie die Funktion zur Wiederherstellung von Blockdiensten wieder her, damit Schreibvorgänge normal fortgesetzt werden und der fehlerhafte Speicherplatz aus dem Schichtdienst entfernt werden kann.
-
FanSensor
Ein Lüftersensor ist ausgefallen oder fehlt.
Um diesen Fehler zu beheben, ersetzen Sie eine fehlerhafte Hardware.
-
Fiber ChannelAccessDegraded
Ein Fibre Channel-Node reagiert nicht auf andere Nodes im Storage-Cluster über einen bestimmten Zeitraum. In diesem Status gilt der Node als nicht ansprechbar und generiert einen Cluster-Fehler.
Überprüfen Sie die Netzwerkverbindung.
-
FaserChannelAccessUnverfügbar
Alle Fibre-Channel-Nodes reagieren nicht mehr. Die Node-IDs werden angezeigt.
Überprüfen Sie die Netzwerkverbindung.
-
FiberChannelActiveIxL
Die Anzahl der iXL-Nexus nähert sich dem unterstützten Limit von 8000 aktiven Sitzungen pro Fibre-Channel-Node.
-
Best Practice-Grenze ist 5500.
-
Warngrenze ist 7500.
-
Die maximale Obergrenze (nicht erzwungen) beträgt 8192.
Um diesen Fehler zu beheben, reduzieren Sie die Anzahl der iXL Nexus unter dem Best Practice Limit von 5500.
-
-
Fiber ChannelConfig
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
An einem PCI-Steckplatz befindet sich ein unerwarteter Fibre Channel-Port.
-
Es gibt ein unerwartetes Fibre Channel HBA-Modell.
-
Ein Problem mit der Firmware eines Fibre Channel HBA ist aufgetreten.
-
Ein Fibre-Channel-Port ist nicht online.
-
Bei der Konfiguration von Fibre Channel Passthrough müssen hartnäckige Probleme aufgetreten sein.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
FiberChannelIOPS
Die IOPS-Gesamtzahl nähert sich dem IOPS-Limit für Fibre Channel Nodes im Cluster. Die Grenzen sind:
-
FC0025: 50.000 IOPS bei 4-KB-Blockgröße pro Fibre Channel Node.
-
FCN001: Grenzwert von 625.000 OPS bei einer Blockgröße von 4 KB pro Fibre Channel Node.
Um diesen Fehler zu beheben, verteilen Sie die Last auf alle verfügbaren Fibre Channel Nodes.
-
-
FiberChannelStaticIxL
Die Anzahl der iXL-Nexus nähert sich dem unterstützten Limit von 16000 statischen Sitzungen pro Fibre-Channel-Node.
-
Best Practice-Grenze ist 11000.
-
Warngrenze ist 15000.
-
Die maximale Obergrenze (erzwungen) ist 16384.
Um diesen Fehler zu beheben, reduzieren Sie die Anzahl der iXL Nexus unter dem Best Practice Limit von 11000.
-
-
DateiSystemkapazitätNiedrig
Auf einem der Dateisysteme ist nicht genügend Platz vorhanden.
Um diesen Fehler zu beheben, fügen Sie dem Dateisystem mehr Kapazität hinzu.
-
FileSystemIsReadOnly
Ein Dateisystem ist in einen schreibgeschützten Modus umgestiegen.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
FipsDrivesMismatch
Ein Laufwerk ohne FIPS wurde physisch in einen FIPS-fähigen Storage-Node eingesetzt oder ein FIPS-Laufwerk wurde physisch in einen Storage-Node außerhalb von FIPS eingesetzt. Pro Node wird ein einziger Fehler generiert und alle betroffenen Laufwerke aufgelistet.
Um diesen Fehler zu beheben, entfernen oder ersetzen Sie das nicht übereinstimmende Laufwerk oder die betreffenden Laufwerke.
-
FipsDriveOutOfCompliance
Das System hat erkannt, dass die Verschlüsselung im Ruhezustand nach Aktivierung der FIPS-Festplattenfunktion deaktiviert wurde. Dieser Fehler wird auch generiert, wenn die FIPS-Laufwerksfunktion aktiviert ist und ein Laufwerk oder ein Node außerhalb von FIPS im Storage-Cluster vorhanden ist.
Um diesen Fehler zu beheben, aktivieren Sie die Verschlüsselung im Ruhezustand oder entfernen Sie die nicht-FIPS-Hardware aus dem Storage-Cluster.
-
FipsSelfTestFailure
Das FIPS-Subsystem hat während des Self-Tests einen Ausfall erkannt.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
HardwareConfigMismatch
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Die Konfiguration stimmt nicht mit der Knotendefinition überein.
-
Für diesen Node-Typ gibt es eine falsche Laufwerksgröße.
-
Es wurde ein nicht unterstütztes Laufwerk erkannt. Ein möglicher Grund ist, dass die installierte Element-Version dieses Laufwerk nicht erkennt. Es wird empfohlen, die Element Software auf diesem Node zu aktualisieren.
-
Es stimmt nicht überein, dass die Laufwerk-Firmware nicht stimmt.
-
Der Status für die Laufwerksverschlüsselung stimmt nicht mit dem Node überein.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
IdPCertificateExpiration
Das SSL-Zertifikat des Dienstanbieters des Clusters zur Verwendung mit einem Drittanbieter-Identitätsanbieter (IdP) nähert sich dem Ablaufdatum oder ist bereits abgelaufen. Dieser Fehler nutzt die folgenden Schweregrade auf der Grundlage der Dringlichkeit:
Schweregrad
Beschreibung
Warnung
Das Zertifikat läuft innerhalb von 30 Tagen ab.
Fehler
Das Zertifikat läuft innerhalb von 7 Tagen ab.
Kritisch
Das Zertifikat läuft innerhalb von 3 Tagen ab oder ist bereits abgelaufen.
Um diesen Fehler zu beheben, aktualisieren Sie das SSL-Zertifikat, bevor es abläuft. Verwenden Sie die UpdateIdpConfiguration API-Methode mit
refreshCertificateExpirationTime=true
, um das aktualisierte SSL-Zertifikat bereitzustellen. -
Inkonsistenz BondModes
Die Bond-Modi auf dem VLAN-Gerät fehlen. Dieser Fehler zeigt den erwarteten Bond-Modus und den derzeit verwendeten Bond-Modus an.
-
Inkonsistent Mtus
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Bond1G-Diskrepanz: Inkonsistente MTUs wurden an Bond1G-Schnittstellen erkannt.
-
Bond10G-Diskrepanz: Inkonsistente MTUs wurden an Bond10G-Schnittstellen erkannt.
Dieser Fehler zeigt den betreffenden Node oder die betreffenden Knoten zusammen mit dem zugehörigen MTU-Wert an.
-
-
UnstimmigeDie Routenregeln
Die Routingregeln für diese Schnittstelle sind inkonsistent.
-
Inkonsistent SubnetMasken
Die Netzwerkmaske auf dem VLAN-Gerät stimmt nicht mit der intern aufgezeichneten Netzwerkmaske für das VLAN überein. Dieser Fehler zeigt die erwartete Netzwerkmaske und die aktuell verwendete Netzwerkmaske an.
-
IncorrectBondPortCount
Die Anzahl der Bond-Ports ist falsch.
-
InvalidConfiguredFiberChannelNodeCount
Eine der beiden erwarteten Fibre-Channel-Node-Verbindungen ist beeinträchtigt. Dieser Fehler wird angezeigt, wenn nur ein Fibre-Channel-Knoten verbunden ist.
Um diesen Fehler zu beheben, überprüfen Sie die Cluster-Netzwerkkonnektivität und die Netzwerkverkabelung und überprüfen Sie, ob Services ausgefallen sind. Falls keine Netzwerk- oder Serviceprobleme auftreten, wenden Sie sich an den NetApp Support, um einen Fibre Channel-Node zu ersetzen.
-
IrqBalanceFailed
Beim Versuch, Interrupts auszugleichen, ist eine Ausnahme aufgetreten.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
KmZertifizierungFault
-
Das Zertifikat der Root Certification Authority (CA) nähert sich dem Ablaufdatum.
Um diesen Fehler zu beheben, erwerben Sie ein neues Zertifikat von der Root CA mit Ablaufdatum mindestens 30 Tage aus und verwenden Sie ModifyKeyServerkmip, um das aktualisierte Root CA-Zertifikat bereitzustellen.
-
Das Clientzertifikat nähert sich dem Ablaufdatum.
Um diesen Fehler zu beheben, erstellen Sie einen neuen CSR mit GetClientCertificateSigningRequest, lassen Sie ihn unterzeichnen, um sicherzustellen, dass das neue Ablaufdatum mindestens 30 Tage beträgt, und verwenden Sie ModifyKeyServerkmip, um das auslaufende KMIP-Clientzertifikat durch das neue Zertifikat zu ersetzen.
-
Das Zertifikat der Root Certification Authority (CA) ist abgelaufen.
Um diesen Fehler zu beheben, erwerben Sie ein neues Zertifikat von der Root CA mit Ablaufdatum mindestens 30 Tage aus und verwenden Sie ModifyKeyServerkmip, um das aktualisierte Root CA-Zertifikat bereitzustellen.
-
Client-Zertifikat ist abgelaufen.
Um diesen Fehler zu beheben, erstellen Sie einen neuen CSR mit GetClientCertificateSigningRequest, lassen Sie ihn unterzeichnen, um sicherzustellen, dass das neue Ablaufdatum mindestens 30 Tage beträgt, und verwenden Sie ModifyKeyServerkmip, um das abgelaufene KMIP-Clientzertifikat durch das neue Zertifikat zu ersetzen.
-
Fehler bei der Root Certification Authority (CA)-Zertifizierung.
Um diesen Fehler zu beheben, überprüfen Sie, ob das richtige Zertifikat bereitgestellt wurde und, falls erforderlich, das Zertifikat von der Stammzertifizierungsstelle erneut erwerben. Verwenden Sie ModifyKeyServerkmip, um das richtige KMIP-Client-Zertifikat zu installieren.
-
Fehler beim Client-Zertifikat.
Um diesen Fehler zu beheben, überprüfen Sie, ob das korrekte KMIP-Client-Zertifikat installiert ist. Die Root-CA des Client-Zertifikats sollte auf dem EKS installiert werden. Verwenden Sie ModifyKeyServerkmip, um das richtige KMIP-Client-Zertifikat zu installieren.
-
-
KmipServerFault
-
Verbindungsfehler
Um diesen Fehler zu beheben, überprüfen Sie, ob der externe Schlüsselserver aktiv ist und über das Netzwerk erreichbar ist. Verwenden Sie TestKeyServerKimp und TestKeyProviderKmip, um Ihre Verbindung zu testen.
-
Authentifizierungsfehler
Um diesen Fehler zu beheben, überprüfen Sie, ob die richtige Root-CA- und KMIP-Client-Zertifikate verwendet werden und ob der private Schlüssel und das KMIP-Client-Zertifikat übereinstimmen.
-
Serverfehler
Um diesen Fehler zu beheben, überprüfen Sie die Details auf den Fehler. Möglicherweise ist aufgrund des zurückgegebenen Fehlers eine Fehlerbehebung auf dem externen Schlüsselserver erforderlich.
-
-
* MemoryEccThreshold*
Es wurden eine große Anzahl von korrigierbaren oder nicht korrigierbaren ECC-Fehlern erkannt. Dieser Fehler nutzt die folgenden Schweregrade auf der Grundlage der Dringlichkeit:
Ereignis
Schweregrad
Beschreibung
Ein einzelnes DIMM cErrorCount erreicht cDimmCorrectableErrWarnThreshold.
Warnung
Korrigierbare ECC-Speicherfehler über dem Schwellenwert auf DIMM: <Prozessor> <DIMM Slot>
Ein einzelnes DIMM cErrorCount bleibt über cDimmCorrectableErrWarnThreshold bis cErrorFaultTimer für das DIMM abläuft.
Fehler
Korrektur von ECC-Speicherfehlern über dem Schwellenwert auf DIMM: <Processor> <DIMM>
Ein Speicher-Controller meldet cErrorCount über cMemCtlrCorrectableErrWarnThreshold und cMemCtlrCorrectableErrWarnDauer wird angegeben.
Warnung
Korrigierbare ECC-Speicherfehler oberhalb des Schwellenwerts für Speicher-Controller: <Prozessor> <Speicher-Controller>
Ein Speicher-Controller meldet cErrorCount über cMemCtlrCorrectableErrWarnThreshold bis cErrorFaultTimer für den Speicher-Controller abläuft.
Fehler
Korrektur von ECC-Speicherfehlern über dem Schwellenwert auf DIMM: <Processor> <DIMM>
Ein einzelnes DIMM meldet einen uErrorCount über Null, aber kleiner als cDimmUncorrectTableErrFaultThreshold.
Warnung
Nicht korrigierbarer ECC-Speicherfehler auf DIMM: <Prozessor> <DIMM Slot> erkannt
Ein einzelnes DIMM meldet einen uErrorCount von mindestens cDimmUncorrectTableErrFaultThreshold.
Fehler
Nicht korrigierbarer ECC-Speicherfehler auf DIMM: <Prozessor> <DIMM Slot> erkannt
Ein Speicher-Controller meldet einen uErrorCount über Null, aber kleiner als cMemCtlrUncorregictErrFaultThreshold.
Warnung
Nicht korrigierbarer ECC-Speicherfehler auf Speichercontroller: <Prozessor> <Speichercontroller> erkannt
Ein Speicher-Controller meldet einen uErrorCount von mindestens cMemCtlrUncorregictErrFaultThreshold.
Fehler
Nicht korrigierbarer ECC-Speicherfehler auf Speichercontroller: <Prozessor> <Speichercontroller> erkannt
Um diesen Fehler zu beheben, wenden Sie sich an den NetApp Support.
-
SpeichernUserageThreshold
Die Speicherauslastung ist über dem Normalwert. Dieser Fehler nutzt die folgenden Schweregrade auf der Grundlage der Dringlichkeit:
Weitere Informationen zum Fehlertyp finden Sie in der Überschrift Details im Fehlerfehler. Schweregrad
Beschreibung
Warnung
Der Systemspeicher ist schwach.
Fehler
Der Systemspeicher ist sehr gering.
Kritisch
Der Systemspeicher wird vollständig verbraucht.
Um diesen Fehler zu beheben, wenden Sie sich an den NetApp Support.
-
* MetadataClusterFull*
Es ist nicht ausreichend freier Speicherplatz für Metadaten vorhanden, um einen Ausfall eines einzelnen Nodes zu unterstützen. Weitere Informationen zu Cluster-Auslastungsstufen finden Sie in der GetClusterFullThreshold API-Methode. Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Stage3Low (Warnung): Benutzerdefinierter Schwellenwert wurde überschritten. Passen Sie Cluster-Volleinstellungen an oder fügen Sie weitere Nodes hinzu.
-
Stage4Critical (Fehler): Es gibt nicht genügend Speicherplatz zur Wiederherstellung nach einem Ausfall eines 1 Node. Das Erstellen von Volumes, Snapshots und Klonen ist nicht zulässig.
-
Stage5CompletelyConsumed (kritisch)1; es sind keine Schreibzugriffe oder neue iSCSI-Verbindungen zulässig. Aktuelle iSCSI-Verbindungen werden beibehalten. Schreibzugriffe scheitern, bis mehr Kapazität dem Cluster hinzugefügt wird. Löschen oder Löschen von Daten oder Hinzufügen weiterer Nodes
Löschen oder löschen Sie Volumes, um diesen Fehler zu beheben, oder fügen Sie dem Storage-Cluster einen weiteren Storage-Node hinzu.
-
-
MtuCheckFailure
Ein Netzwerkgerät ist nicht für die richtige MTU-Größe konfiguriert.
Um diesen Fehler zu beheben, stellen Sie sicher, dass alle Netzwerkschnittstellen und Switch-Ports für Jumbo Frames konfiguriert sind (MTUs mit einer Größe von bis zu 9000 Byte).
-
NetworkConfig
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Eine erwartete Schnittstelle ist nicht vorhanden.
-
Es ist eine doppelte Schnittstelle vorhanden.
-
Eine konfigurierte Schnittstelle ist ausgefallen.
-
Ein Netzwerkneustart ist erforderlich.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
NoVerfügbarVirtualNetzwerkIPAddresses
Im Block der IP-Adressen sind keine virtuellen Netzwerkadressen verfügbar.
-
VirtualNetworkID # TAG(###) hat keine Speicher-IP-Adressen. Dem Cluster können keine weiteren Nodes hinzugefügt werden.
Um diesen Fehler zu beheben, fügen Sie dem Block der virtuellen Netzwerkadressen weitere IP-Adressen hinzu.
-
-
NodeHardwareFault (Netzwerkschnittstelle <Name> ist ausgefallen oder das Kabel ist nicht angeschlossen)
Eine Netzwerkschnittstelle ist entweder ausgefallen oder das Kabel ist nicht angeschlossen.
Um diesen Fehler zu beheben, überprüfen Sie die Netzwerkverbindung für den Knoten oder Knoten.
-
NodeHardwareFault (Laufwerksverschlüsselungsstatus entspricht dem Verschlüsselungsstatus des Node für das Laufwerk in Steckplatz <Node-Steckplatz><Laufwerkseinschub>)
Ein Laufwerk entspricht nicht den Verschlüsselungsfunktionen des in installierten Storage-Nodes.
-
NodeHardwareFault (Falscher <Laufwerkstyp> Laufwerksgröße <tatsächliche Größe> für das Laufwerk in Steckplatz <Node-Steckplatz><Laufwerkseinschub> für diesen Node-Typ - erwartete <erwartete Größe>)
Ein Storage-Node enthält ein Laufwerk, das die falsche Größe für diesen Node hat.
-
NodeHardwareFault (nicht unterstütztes Laufwerk in Steckplatz <Node Slot><Drive Slot> gefunden; Laufwerksstatistiken und Integritätsinformationen sind nicht verfügbar)
Ein Storage-Node enthält ein Laufwerk, das nicht unterstützt wird.
-
NodeHardwareFault (das Laufwerk in Slot <Node Slot><Drive Slot> sollte die Firmware-Version <erwartete Version> verwenden, wird aber nicht unterstützte Version <tatsächliche Version> verwenden)
Ein Speicherknoten enthält ein Laufwerk, auf dem eine nicht unterstützte Firmware-Version ausgeführt wird.
-
NoteWartungs-Modus
Ein Node wurde im Wartungsmodus versetzt. Dieser Fehler nutzt die folgenden Schweregrade auf der Grundlage der Dringlichkeit:
Schweregrad
Beschreibung
Warnung
Gibt an, dass sich der Node noch im Wartungsmodus befindet.
Fehler
Zeigt an, dass der Wartungsmodus nicht deaktiviert wurde, wahrscheinlich aufgrund von fehlgeschlagenen oder aktiven Standardys.
Um diesen Fehler zu beheben, deaktivieren Sie den Wartungsmodus nach Abschluss der Wartung. Wenn der Fehler auf der Fehlerebene weiterhin besteht, wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
NodeOffline
Element Software kann nicht mit dem angegebenen Node kommunizieren. Überprüfen Sie die Netzwerkverbindung.
-
NotusingLACPBondMode
LACP Bonding-Modus ist nicht konfiguriert.
Um diesen Fehler zu beheben, verwenden Sie LACP Bonding bei der Implementierung von Storage-Nodes. Es kann zu Performance-Problemen kommen, wenn LACP nicht aktiviert und ordnungsgemäß konfiguriert ist.
-
NtpServerUnerreichbar
Das Storage-Cluster kann nicht mit dem angegebenen NTP-Server oder den angegebenen Servern kommunizieren.
Um diesen Fehler zu beheben, überprüfen Sie die Konfiguration für den NTP-Server, das Netzwerk und die Firewall.
-
NtpTimeNotInSync
Der Unterschied zwischen der Storage-Cluster-Zeit und der angegebenen NTP-Serverzeit ist zu groß. Der Speichercluster kann die Differenz nicht automatisch korrigieren.
Um diesen Fehler zu beheben, verwenden Sie NTP-Server, die intern zu Ihrem Netzwerk sind, anstatt die Installationsstandards. Wenn Sie interne NTP-Server verwenden und das Problem weiterhin besteht, wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
NvramDeviceStatus
Ein NVRAM-Gerät weist einen Fehler auf, ist ausgefallen oder ist ausgefallen. Dieser Fehler weist folgende Schweregrade auf:
Schweregrad
Beschreibung
Warnung
Die Hardware hat eine Warnung erkannt. Dieser Zustand kann vorübergehend sein, z. B. eine Temperaturwarnung.
-
NvmLifetimeFehler
-
NvmLifetimeStatus
-
EnergiengySourceLifetimeStatus
-
EnergiengySourceTemperatureStatus
-
WarningThresholdExceped
Fehler
Die Hardware hat einen Fehler oder kritischen Status erkannt. Der Cluster-Master versucht, das Slice-Laufwerk aus dem Betrieb zu entfernen (dies erzeugt ein Ereignis zum Entfernen des Laufwerks). Wenn sekundäre Schichtdienste nicht verfügbar sind, wird das Laufwerk nicht entfernt. Zusätzlich zu den Warnungsebenen-Fehlern zurückgegebene Fehler:
-
Der Mount-Punkt für NVRAM-Gerät ist nicht vorhanden.
-
Die NVRAM-Gerätepartition ist nicht vorhanden.
-
Die NVRAM-Gerätepartition ist vorhanden, aber nicht angehängt.
Kritisch
Die Hardware hat einen Fehler oder kritischen Status erkannt. Der Cluster-Master versucht, das Slice-Laufwerk aus dem Betrieb zu entfernen (dies erzeugt ein Ereignis zum Entfernen des Laufwerks). Wenn sekundäre Schichtdienste nicht verfügbar sind, wird das Laufwerk nicht entfernt.
-
Persistenz verloren
-
ArmStatusSaveNArmed
-
CsaveStatusfehler
Ersetzen Sie alle fehlerhaften Hardware im Node. Falls das Problem dadurch nicht behoben werden kann, wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
PowerSupplyError
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Es ist kein Netzteil vorhanden.
-
Ein Netzteil ist fehlgeschlagen.
-
Ein Netzteileingang fehlt oder außerhalb des zulässigen Bereichs liegt.
Um diesen Fehler zu beheben, überprüfen Sie, ob alle Knoten mit redundanter Stromversorgung versorgt werden. Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
ProvisionedSpaceTooFull
Die insgesamt bereitgestellte Kapazität des Clusters ist zu voll.
Um diesen Fehler zu beheben, fügen Sie mehr bereitgestellten Speicherplatz hinzu oder löschen und löschen Sie Volumes.
-
EntferntRepAsyncDelayExceeded
Die konfigurierte asynchrone Verzögerung der Replikation wurde überschritten. Überprüfen Sie die Netzwerkverbindung zwischen Clustern.
-
EntfernteRepClusterFull
Die Remote-Replikation der Volumes wurde angehalten, da der Ziel-Storage-Cluster zu voll ist.
Um diesen Fehler zu beheben, geben Sie Speicherplatz auf dem Ziel-Storage-Cluster frei.
-
EntfernteRepSnapshotClusterFull
Die Remote-Replizierung der Snapshots wurde durch die Volumes unterbrochen, weil der Ziel-Storage-Cluster zu voll ist.
Um diesen Fehler zu beheben, geben Sie Speicherplatz auf dem Ziel-Storage-Cluster frei.
-
EntferntRepSnapshotsExceedLimit
Die Volumes haben die Remote-Replizierung von Snapshots angehalten, da das Ziel-Storage-Cluster-Volume seine Snapshot-Grenze überschritten hat.
Um diesen Fehler zu beheben, erhöhen Sie die Snapshot-Grenze auf dem Ziel-Speicher-Cluster.
-
Fehler beim PlaneActionError
Mindestens eine der geplanten Aktivitäten wurde ausgeführt, ist aber fehlgeschlagen.
Der Fehler wird gelöscht, wenn die geplante Aktivität erneut ausgeführt wird und erfolgreich ist, wenn die geplante Aktivität gelöscht wird oder wenn die Aktivität angehalten und fortgesetzt wird.
-
SensorReadingFailed
Ein Sensor konnte nicht mit dem Baseboard Management Controller (BMC) kommunizieren.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
ServiceNotRunning
Ein erforderlicher Dienst wird nicht ausgeführt.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
SliceServiceTooFull
Einem Schichtdienst ist zu wenig provisionierte Kapazität zugewiesen.
Um diesen Fehler zu beheben, fügen Sie mehr bereitgestellte Kapazität hinzu.
-
SchliceServiceUngesund
Das System hat erkannt, dass ein Schichtdienst ungesund ist und ihn automatisch stillsetzt.
-
Schweregrad = Warnung: Es werden keine Maßnahmen ergriffen. Dieser Warnzeitraum läuft in 6 Minuten ab.
-
Schweregrad = Fehler: Das System setzt Daten automatisch zurück und repliziert seine Daten auf andere gesunde Laufwerke.
Prüfen Sie auf Probleme mit der Netzwerkverbindung und Hardwarefehler. Es gibt weitere Fehler, wenn bestimmte Hardwarekomponenten ausgefallen sind. Der Fehler wird gelöscht, wenn der Schichtdienst verfügbar ist oder wenn der Dienst deaktiviert wurde.
-
-
Sshenenabled
Der SSH-Service ist auf einem oder mehreren Nodes im Storage-Cluster aktiviert.
Um diesen Fehler zu beheben, deaktivieren Sie den SSH-Service auf dem entsprechenden Node oder Nodes oder wenden Sie sich an den NetApp Support, um Unterstützung zu erhalten.
-
SslCertificateExpiration
Das mit diesem Knoten verknüpfte SSL-Zertifikat nähert sich dem Ablaufdatum oder ist abgelaufen. Dieser Fehler nutzt die folgenden Schweregrade auf der Grundlage der Dringlichkeit:
Schweregrad
Beschreibung
Warnung
Das Zertifikat läuft innerhalb von 30 Tagen ab.
Fehler
Das Zertifikat läuft innerhalb von 7 Tagen ab.
Kritisch
Das Zertifikat läuft innerhalb von 3 Tagen ab oder ist bereits abgelaufen.
Um diesen Fehler zu beheben, erneuern Sie das SSL-Zertifikat. Wenden Sie sich bei Bedarf an den NetApp Support, um Hilfe zu erhalten.
-
* Stranddecacity*
Ein einzelner Node verursacht mehr als die Hälfte der Storage-Cluster-Kapazität.
Um die Datenredundanz aufrechtzuerhalten, reduziert das System die Kapazität des größten Node, sodass einige seiner Blockkapazitäten ungenutzt (nicht verwendet) sind.
Fügen Sie zur Behebung dieses Fehlers weitere Laufwerke zu vorhandenen Speicher-Nodes hinzu oder fügen Sie dem Cluster Storage-Nodes hinzu.
-
TempSensor
Ein Temperatursensor meldet höhere Temperaturen als normale Temperaturen. Dieser Fehler kann in Verbindung mit PowerSupplyError oder FanSensor Fehlern ausgelöst werden.
Um diesen Fehler zu beheben, prüfen Sie, ob Luftstrombehinderungen in der Nähe des Storage-Clusters vorhanden sind. Wenden Sie sich bei Bedarf an den NetApp Support, um Hilfe zu erhalten.
-
Upgrade
Ein Upgrade läuft seit mehr als 24 Stunden.
Setzen Sie das Upgrade fort, oder wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
UnresponsiveService
Ein Dienst reagiert nicht mehr.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
VirtualNetworkConfig
Dieser Cluster-Fehler gibt eine der folgenden Bedingungen an:
-
Eine Schnittstelle ist nicht vorhanden.
-
Ein falscher Namespace auf einer Schnittstelle.
-
Eine falsche Netzmaske ist vorhanden.
-
Eine falsche IP-Adresse ist vorhanden.
-
Eine Schnittstelle ist nicht verfügbar und wird nicht ausgeführt.
-
Es gibt eine überflüssige Schnittstelle auf einem Knoten.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.
-
-
VolumesDegradiert
Die Replikation und Synchronisierung der sekundären Volumes ist nicht abgeschlossen. Die Meldung wird gelöscht, wenn die Synchronisierung abgeschlossen ist.
-
VolumesOffline
Ein oder mehrere Volumes im Storage-Cluster sind offline. Der Fehler volumeDegraded ist ebenfalls vorhanden.
Wenden Sie sich an den NetApp Support, um Hilfe zu erhalten.