Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Systemmonitore

10/14/2025 Beitragende

PDFs

Data Infrastructure Insights umfasst eine Reihe systemdefinierter Monitore für Metriken und Protokolle. Die verfügbaren Systemmonitore hängen von den auf Ihrem Mandanten vorhandenen Datensammlern ab. Aus diesem Grund können sich die in Data Infrastructure Insights verfügbaren Monitore ändern, wenn Datensammler hinzugefügt oder ihre Konfigurationen geändert werden.

Viele Systemmonitore befinden sich standardmäßig im Status Pausiert. Sie können einen Systemmonitor aktivieren, indem Sie die Option Fortsetzen für den Monitor auswählen. Stellen Sie sicher, dass „Erweiterte Zählerdatenerfassung“ und „ONTAP EMS-Protokollerfassung aktivieren“ im Datensammler aktiviert sind. Diese Optionen finden Sie im ONTAP Data Collector unter Erweiterte Konfiguration: Aktivieren der erweiterten Zähler- und EMS-Protokollsammlung für ONTAP

Aktivieren der erweiterten Zähler- und EMS-Protokollsammlung für ONTAP

Inhaltsverzeichnis:[]

Monitorbeschreibungen

Systemdefinierte Monitore bestehen aus vordefinierten Metriken und Bedingungen sowie Standardbeschreibungen und Korrekturmaßnahmen, die nicht geändert werden können. Sie können die Benachrichtigungsempfängerliste für systemdefinierte Monitore ändern. Um die Kennzahlen, Bedingungen, Beschreibungen und Korrekturmaßnahmen anzuzeigen oder die Empfängerliste zu ändern, öffnen Sie eine systemdefinierte Monitorgruppe und klicken Sie in der Liste auf den Monitornamen.

Systemdefinierte Monitorgruppen können nicht geändert oder entfernt werden.

Die folgenden systemdefinierten Monitore sind in den angegebenen Gruppen verfügbar.

* ONTAP -Infrastruktur* umfasst Monitore für infrastrukturbezogene Probleme in ONTAP Clustern.
* ONTAP Workload-Beispiele* umfassen Monitore für Workload-bezogene Probleme.
Monitore in beiden Gruppen befinden sich standardmäßig im Status „Angehalten“.

Nachfolgend sind die Systemmonitore aufgeführt, die derzeit in Data Infrastructure Insights enthalten sind:

Metrische Monitore

Monitorname

Schwere

Monitorbeschreibung

Korrekturmaßnahme

Hohe Auslastung der Fiber Channel-Ports

KRITISCH

Fiber Channel Protocol-Ports werden zum Empfangen und Übertragen des SAN-Verkehrs zwischen dem Kundenhostsystem und den ONTAP LUNs verwendet. Eine hohe Portauslastung führt zu einem Engpass und beeinträchtigt letztendlich die Leistung sensibler Fiber Channel Protocol-Workloads. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen zum Ausgleich des Netzwerkverkehrs ergriffen werden sollten. … Eine kritische Meldung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen zum Ausgleich des Netzwerkverkehrs ergriffen werden sollten, um die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Verschieben Sie Workloads auf einen anderen FCP-Port mit geringerer Auslastung. 2. Beschränken Sie den Datenverkehr bestimmter LUNs auf unbedingt erforderliche Aufgaben, entweder über QoS-Richtlinien in ONTAP oder über die Konfiguration auf Hostseite, um die Auslastung der FCP-Ports zu verringern. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Maßnahmen: 1. Konfigurieren Sie mehrere FCP-Ports zur Abwicklung des Datenverkehrs, sodass die Portauslastung auf mehrere Ports verteilt wird. 2. Verschieben Sie Workloads auf einen anderen FCP-Port mit geringerer Auslastung. 3. Beschränken Sie den Datenverkehr bestimmter LUNs auf unbedingt erforderliche Aufgaben, entweder über QoS-Richtlinien in ONTAP oder über die Konfiguration auf Hostseite, um die Auslastung der FCP-Ports zu verringern.

Lun-Latenz hoch

KRITISCH

LUNs sind Objekte, die den E/A-Verkehr bedienen, der häufig von leistungsempfindlichen Anwendungen wie Datenbanken verursacht wird. Hohe LUN-Latenzen bedeuten, dass die Anwendungen selbst darunter leiden und ihre Aufgaben nicht erfüllen können. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen ergriffen werden sollten, um die LUN auf den entsprechenden Knoten oder das entsprechende Aggregat zu verschieben. … Eine kritische Meldung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um die Dienstkontinuität sicherzustellen. Die erwarteten Latenzen basieren auf dem Medientyp: SSD bis zu 1–2 Millisekunden, SAS bis zu 8–10 Millisekunden und SATA HDD 17–20 Millisekunden

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Maßnahmen in Betracht ziehen, um Dienstunterbrechungen zu minimieren: Wenn mit der LUN oder ihrem Volume eine QoS-Richtlinie verknüpft ist, bewerten Sie deren Schwellenwerte und überprüfen Sie, ob diese zu einer Drosselung der LUN-Arbeitslast führen. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Maßnahmen: 1. Wenn das Aggregat ebenfalls eine hohe Auslastung aufweist, verschieben Sie die LUN in ein anderes Aggregat. 2. Wenn der Knoten ebenfalls stark ausgelastet ist, verschieben Sie das Volume auf einen anderen Knoten oder reduzieren Sie die Gesamtarbeitslast des Knotens. 3. Wenn der LUN oder ihrem Volume eine QoS-Richtlinie zugeordnet ist, bewerten Sie deren Schwellenwerte und überprüfen Sie, ob diese zu einer Drosselung der LUN-Arbeitslast führen.

Hohe Netzwerk-Port-Auslastung

KRITISCH

Netzwerkports werden zum Empfangen und Übertragen des NFS-, CIFS- und iSCSI-Protokollverkehrs zwischen den Hostsystemen des Kunden und den ONTAP -Volumes verwendet. Wenn die Portauslastung hoch ist, wird dies zu einem Engpass und beeinträchtigt letztendlich die Leistung von NFS-, CIFS- und iSCSI-Workloads. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen zum Ausgleich des Netzwerkverkehrs ergriffen werden sollten. … Eine kritische Meldung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um den Netzwerkverkehr auszugleichen und so die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Beschränken Sie den Datenverkehr bestimmter Volumes auf die unbedingt erforderlichen Aufgaben, entweder über QoS-Richtlinien in ONTAP oder über eine hostseitige Analyse, um die Auslastung der Netzwerkports zu verringern. 2. Konfigurieren Sie ein oder mehrere Volumes so, dass sie einen anderen, weniger ausgelasteten Netzwerkport verwenden. … Wenn der Warnschwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen in Betracht ziehen: 1. Konfigurieren Sie mehrere Netzwerkports zur Abwicklung des Datenverkehrs, sodass die Portauslastung auf mehrere Ports verteilt wird. 2. Konfigurieren Sie ein oder mehrere Volumes so, dass sie einen anderen, weniger ausgelasteten Netzwerkport verwenden.

NVMe-Namespace-Latenz hoch

KRITISCH

NVMe-Namespaces sind Objekte, die den E/A-Verkehr bedienen, der von leistungsempfindlichen Anwendungen wie Datenbanken gesteuert wird. Eine hohe Latenz der NVMe-Namespaces bedeutet, dass die Anwendungen selbst darunter leiden und ihre Aufgaben nicht erfüllen können. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen ergriffen werden sollten, um die LUN auf den entsprechenden Knoten oder das entsprechende Aggregat zu verschieben. … Eine kritische Meldung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen in Betracht ziehen, um Dienstunterbrechungen zu minimieren: Wenn dem NVMe-Namespace oder seinem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, falls diese zu einer Drosselung der NVMe-Namespace-Workload führen. … Wenn der Warnschwellenwert überschritten wird, sollten Sie die folgenden Maßnahmen in Erwägung ziehen: 1. Wenn das Aggregat ebenfalls eine hohe Auslastung aufweist, verschieben Sie die LUN in ein anderes Aggregat. 2. Wenn der Knoten ebenfalls stark ausgelastet ist, verschieben Sie das Volume auf einen anderen Knoten oder reduzieren Sie die Gesamtarbeitslast des Knotens. 3. Wenn dem NVMe-Namespace oder seinem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie die Grenzwerte, falls diese zu einer Drosselung der NVMe-Namespace-Workload führen.

QTree-Kapazität voll

KRITISCH

Ein Qtree ist ein logisch definiertes Dateisystem, das als spezielles Unterverzeichnis des Stammverzeichnisses innerhalb eines Volumes existieren kann. Jeder Qtree verfügt über ein Standardspeicherkontingent oder ein durch eine Kontingentrichtlinie definiertes Kontingent, um die im Baum gespeicherte Datenmenge innerhalb der Volumekapazität zu begrenzen. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen zur Vergrößerung des Speicherplatzes ergriffen werden sollten. … Eine kritische Meldung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um Speicherplatz freizugeben und die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie den Platz des Qtree, um dem Wachstum gerecht zu werden. 2. Löschen Sie nicht benötigte Daten, um Speicherplatz freizugeben. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Erhöhen Sie den Platz des Qtree, um dem Wachstum gerecht zu werden. 2. Löschen Sie nicht benötigte Daten, um Speicherplatz freizugeben.

QTree-Kapazitätsgrenze

KRITISCH

Ein Qtree ist ein logisch definiertes Dateisystem, das als spezielles Unterverzeichnis des Stammverzeichnisses innerhalb eines Volumes existieren kann. Jeder Qtree verfügt über ein in KBytes gemessenes Speicherplatzkontingent, das zum Speichern von Daten verwendet wird, um das Wachstum des Benutzerdatenvolumens zu kontrollieren und seine Gesamtkapazität nicht zu überschreiten. … Ein Qtree verwaltet ein weiches Speicherkapazitätskontingent, das den Benutzer proaktiv warnt, bevor das Gesamtkapazitätskontingentlimit im Qtree erreicht wird und keine Daten mehr gespeichert werden können. Durch die Überwachung der in einem Qtree gespeicherten Datenmenge wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie das Baumflächenkontingent, um dem Wachstum Rechnung zu tragen 2. Weisen Sie den Benutzer an, unerwünschte Daten im Baum zu löschen, um Speicherplatz freizugeben

QTree-Kapazitäts-Softlimit

WARNING (Warnung)

Ein Qtree ist ein logisch definiertes Dateisystem, das als spezielles Unterverzeichnis des Stammverzeichnisses innerhalb eines Volumes existieren kann. Jeder Qtree verfügt über ein in KBytes gemessenes Speicherplatzkontingent, das er zum Speichern von Daten verwenden kann, um das Wachstum des Benutzerdatenvolumens zu kontrollieren und seine Gesamtkapazität nicht zu überschreiten. … Ein Qtree verwaltet ein weiches Speicherkapazitätskontingent, das den Benutzer proaktiv warnt, bevor das Gesamtkapazitätskontingentlimit im Qtree erreicht wird und keine Daten mehr gespeichert werden können. Durch die Überwachung der in einem Qtree gespeicherten Datenmenge wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn der Warnschwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen in Betracht ziehen: 1. Erhöhen Sie das Baumplatzkontingent, um dem Wachstum Rechnung zu tragen. 2. Weisen Sie den Benutzer an, nicht benötigte Daten im Baum zu löschen, um Speicherplatz freizugeben.

QTree-Dateien – hartes Limit

KRITISCH

Ein Qtree ist ein logisch definiertes Dateisystem, das als spezielles Unterverzeichnis des Stammverzeichnisses innerhalb eines Volumes existieren kann. Jeder Qtree verfügt über ein Kontingent für die Anzahl der Dateien, die er enthalten kann, um eine verwaltbare Dateisystemgröße innerhalb des Datenträgers aufrechtzuerhalten. … Ein Qtree verwaltet ein festes Dateianzahlkontingent, über dem neue Dateien im Baum abgelehnt werden. Durch die Überwachung der Anzahl der Dateien innerhalb eines Qtree wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie das Dateianzahlkontingent für den Qtree. 2. Löschen Sie unerwünschte Dateien aus dem Qtree-Dateisystem.

QTree-Dateien Soft Limit

WARNING (Warnung)

Ein Qtree ist ein logisch definiertes Dateisystem, das als spezielles Unterverzeichnis des Stammverzeichnisses innerhalb eines Volumes existieren kann. Jeder Qtree verfügt über ein Kontingent für die Anzahl der Dateien, die er enthalten kann, um eine verwaltbare Dateisystemgröße innerhalb des Datenträgers aufrechtzuerhalten. … Ein Qtree verwaltet ein weiches Dateianzahlkontingent, um den Benutzer proaktiv zu warnen, bevor das Dateilimit im Qtree erreicht wird und keine weiteren Dateien mehr gespeichert werden können. Durch die Überwachung der Anzahl der Dateien innerhalb eines Qtree wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Erhöhen Sie das Dateianzahlkontingent für den Qtree. 2. Löschen Sie unerwünschte Dateien aus dem Qtree-Dateisystem.

Snapshot-Reservespeicherplatz voll

KRITISCH

Die Speicherkapazität eines Datenträgers ist zum Speichern von Anwendungs- und Kundendaten erforderlich. Ein Teil dieses Speicherplatzes, der sogenannte reservierte Snapshot-Speicherplatz, wird zum Speichern von Snapshots verwendet, die einen lokalen Schutz der Daten ermöglichen. Je mehr neue und aktualisierte Daten im ONTAP Volume gespeichert werden, desto mehr Snapshot-Kapazität wird verwendet und desto weniger Snapshot-Speicherkapazität steht für zukünftige neue oder aktualisierte Daten zur Verfügung. Wenn die Snapshot-Datenkapazität innerhalb eines Volumes den gesamten Snapshot-Reservespeicherplatz erreicht, kann dies dazu führen, dass der Kunde keine neuen Snapshot-Daten speichern kann und der Schutzgrad der Daten im Volume verringert wird. Durch die Überwachung der Snapshot-Kapazität des verwendeten Volumes wird die Kontinuität der Datendienste sichergestellt.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Konfigurieren Sie Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist. 2. Löschen Sie einige ältere, nicht mehr benötigte Snapshots, um Speicherplatz freizugeben. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Erhöhen Sie den Snapshot-Reservespeicherplatz innerhalb des Volumes, um dem Wachstum Rechnung zu tragen. 2. Konfigurieren Sie Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist.

Speicherkapazitätsgrenze

KRITISCH

Wenn sich ein Speicherpool (Aggregat) füllt, verlangsamen sich die E/A-Vorgänge und werden schließlich gestoppt, was zu einem Speicherausfall führt. Eine Warnmeldung weist darauf hin, dass bald eine geplante Aktion durchgeführt werden sollte, um den minimalen freien Speicherplatz wiederherzustellen. Eine kritische Warnung weist darauf hin, dass eine Dienstunterbrechung unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um Speicherplatz freizugeben und die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofort die folgenden Maßnahmen in Betracht ziehen, um die Dienstunterbrechung zu minimieren: 1. Löschen Sie Snapshots auf nicht kritischen Volumes. 2. Löschen Sie Volumes oder LUNs, die keine wesentlichen Arbeitslasten darstellen und die möglicherweise aus externen Speicherkopien wiederhergestellt werden können.……Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Verschieben Sie ein oder mehrere Volumes an einen anderen Speicherort. 2. Fügen Sie mehr Speicherkapazität hinzu. 3. Ändern Sie die Einstellungen für die Speichereffizienz oder verschieben Sie inaktive Daten in den Cloud-Speicher.

Speicherleistungsgrenze

KRITISCH

Wenn ein Speichersystem seine Leistungsgrenze erreicht, verlangsamen sich die Vorgänge, die Latenz steigt und es kann zu Ausfällen bei Arbeitslasten und Anwendungen kommen. ONTAP wertet die Speicherpoolauslastung für Workloads aus und schätzt, wie viel Prozent der Leistung verbraucht wurden. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen zur Reduzierung der Speicherpoolauslastung ergriffen werden sollten, um sicherzustellen, dass genügend Speicherpoolleistung übrig bleibt, um Workloadspitzen zu bewältigen. … Eine kritische Meldung weist darauf hin, dass ein Leistungsabfall unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um die Speicherpoolauslastung zu reduzieren und so die Servicekontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Unterbrechen Sie geplante Aufgaben wie Snapshots oder SnapMirror -Replikation. 2. Leerlauf, nicht unbedingt erforderliche Arbeitslasten. … Wenn der Warnschwellenwert überschritten wird, ergreifen Sie sofort die folgenden Maßnahmen: 1. Verschieben Sie eine oder mehrere Workloads an einen anderen Speicherort. 2. Fügen Sie weitere Speicherknoten (AFF) oder Festplattenregale (FAS) hinzu und verteilen Sie die Arbeitslasten neu 3. Ändern Sie die Arbeitslasteigenschaften (Blockgröße, Anwendungs-Caching).

Hartes Limit für die Benutzerkontingentkapazität

KRITISCH

ONTAP erkennt die Benutzer von Unix- oder Windows-Systemen, die über die Rechte zum Zugriff auf Volumes, Dateien oder Verzeichnisse innerhalb eines Volumes verfügen. Daher ermöglicht ONTAP den Kunden, die Speicherkapazität für ihre Benutzer oder Benutzergruppen ihrer Linux- oder Windows-Systeme zu konfigurieren. Das Benutzer- oder Gruppenrichtlinienkontingent begrenzt den Speicherplatz, den der Benutzer für seine eigenen Daten nutzen kann. … Eine harte Begrenzung dieses Kontingents ermöglicht die Benachrichtigung des Benutzers, wenn die innerhalb des Volumes genutzte Kapazität kurz vor dem Erreichen des Gesamtkapazitätskontingents liegt. Durch die Überwachung der innerhalb eines Benutzer- oder Gruppenkontingents gespeicherten Datenmenge wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie den Speicherplatz des Benutzer- oder Gruppenkontingents, um dem Wachstum Rechnung zu tragen. 2. Weisen Sie den Benutzer oder die Gruppe an, nicht benötigte Daten zu löschen, um Speicherplatz freizugeben.

Soft-Limit für Benutzerkontingentkapazität

WARNING (Warnung)

ONTAP erkennt die Benutzer von Unix- oder Windows-Systemen, die über die Rechte zum Zugriff auf Volumes, Dateien oder Verzeichnisse innerhalb eines Volumes verfügen. Daher ermöglicht ONTAP den Kunden, die Speicherkapazität für ihre Benutzer oder Benutzergruppen ihrer Linux- oder Windows-Systeme zu konfigurieren. Das Benutzer- oder Gruppenrichtlinienkontingent begrenzt den Speicherplatz, den der Benutzer für seine eigenen Daten nutzen kann. … Eine weiche Begrenzung dieses Kontingents ermöglicht eine proaktive Benachrichtigung des Benutzers, wenn die innerhalb des Volumes genutzte Kapazität das Gesamtkapazitätskontingent erreicht. Durch die Überwachung der innerhalb eines Benutzer- oder Gruppenkontingents gespeicherten Datenmenge wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Erhöhen Sie den Speicherplatz des Benutzer- oder Gruppenkontingents, um dem Wachstum Rechnung zu tragen. 2. Löschen Sie nicht benötigte Daten, um Speicherplatz freizugeben.

Volumenkapazität Voll

KRITISCH

Die Speicherkapazität eines Datenträgers ist zum Speichern von Anwendungs- und Kundendaten erforderlich. Je mehr Daten im ONTAP -Volume gespeichert werden, desto geringer ist die Speicherverfügbarkeit für zukünftige Daten. Wenn die Datenspeicherkapazität innerhalb eines Volumes die Gesamtspeicherkapazität erreicht, kann dies dazu führen, dass der Kunde aufgrund fehlender Speicherkapazität keine Daten speichern kann. Durch die Überwachung der genutzten Speicherkapazität wird die Kontinuität der Datendienste gewährleistet.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie den Speicherplatz des Volumens, um dem Wachstum gerecht zu werden. 2. Löschen Sie nicht benötigte Daten, um Speicherplatz freizugeben. 3. Wenn Snapshot-Kopien mehr Speicherplatz belegen als die Snapshot-Reserve, löschen Sie alte Snapshots oder aktivieren Sie die automatische Löschung von Volume-Snapshots. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden sofortigen Maßnahmen: 1. Erhöhen Sie den Platz im Volumen, um dem Wachstum gerecht zu werden 2. Wenn Snapshot-Kopien mehr Speicherplatz belegen als die Snapshot-Reserve, löschen Sie alte Snapshots oder aktivieren Sie die automatische Löschung von Volume-Snapshots.……

Volume-Inodes-Limit

KRITISCH

Volumes, die Dateien speichern, verwenden Indexknoten (Inode) zum Speichern von Dateimetadaten. Wenn ein Volume seine Inode-Zuweisung erschöpft, können keine weiteren Dateien hinzugefügt werden. … Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen ergriffen werden sollten, um die Anzahl der verfügbaren Inodes zu erhöhen. … Eine kritische Meldung weist darauf hin, dass die Erschöpfung des Dateilimits unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um Inodes freizugeben und so die Dienstkontinuität sicherzustellen.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie den Inodes-Wert für das Volume. Wenn der Inodes-Wert bereits den Maximalwert erreicht hat, teilen Sie das Volume in zwei oder mehr Volumes auf, da das Dateisystem über die maximale Größe hinausgewachsen ist. 2. Verwenden Sie FlexGroup , da es bei der Unterbringung großer Dateisysteme hilft. … Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Erhöhen Sie den Inodes-Wert für das Volume. Wenn der Inodes-Wert bereits das Maximum erreicht hat, teilen Sie das Volume in zwei oder mehr Volumes auf, da das Dateisystem über die maximale Größe hinausgewachsen ist. 2. Verwenden Sie FlexGroup , da es bei der Unterbringung großer Dateisysteme hilft

Lautstärkelatenz hoch

KRITISCH

Volumes sind Objekte, die den E/A-Verkehr bedienen, der häufig von leistungsempfindlichen Anwendungen wie DevOps-Anwendungen, Home-Verzeichnissen und Datenbanken gesteuert wird. Hohe Volumenlatenzen können dazu führen, dass die Anwendungen selbst darunter leiden und ihre Aufgaben nicht erfüllen können. Die Überwachung der Volume-Latenzen ist entscheidend, um eine konsistente Anwendungsleistung aufrechtzuerhalten. Je nach Medientyp sind folgende Latenzen zu erwarten: SSD bis zu 1–2 Millisekunden, SAS bis zu 8–10 Millisekunden und SATA-HDD 17–20 Millisekunden.

Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen ergreifen, um die Dienstunterbrechung zu minimieren: Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, falls diese zu einer Drosselung der Volume-Arbeitslast führen. … Wenn der Warnschwellenwert überschritten wird, sollten Sie die folgenden Sofortmaßnahmen in Betracht ziehen: 1. Wenn das Aggregat ebenfalls eine hohe Auslastung aufweist, verschieben Sie das Volume auf ein anderes Aggregat. 2. Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, um zu prüfen, ob diese zu einer Drosselung der Volume-Arbeitslast führen. 3. Wenn der Knoten ebenfalls stark ausgelastet ist, verschieben Sie das Volume auf einen anderen Knoten oder reduzieren Sie die Gesamtarbeitslast des Knotens.

Monitorname

Schwere

Monitorbeschreibung

Korrekturmaßnahme

Knoten mit hoher Latenz

WARNUNG / KRITISCH

Die Knotenlatenz hat ein Niveau erreicht, bei dem sie die Leistung der Anwendungen auf dem Knoten beeinträchtigen könnte. Eine geringere Knotenlatenz gewährleistet eine konsistente Leistung der Anwendungen. Die erwarteten Latenzen je nach Medientyp sind: SSD bis zu 1–2 Millisekunden, SAS bis zu 8–10 Millisekunden und SATA HDD 17–20 Millisekunden.

Wenn ein kritischer Schwellenwert überschritten wird, sollten sofort Maßnahmen ergriffen werden, um die Dienstunterbrechung zu minimieren: 1. Unterbrechen Sie geplante Aufgaben, Snapshots oder die SnapMirror -Replikation 2. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität über QoS-Grenzen 3. Deaktivieren Sie nicht unbedingt erforderliche Workloads. Erwägen Sie sofortige Maßnahmen, wenn der Warnschwellenwert überschritten wird: 1. Verschieben Sie einen oder mehrere Workloads an einen anderen Speicherort 2. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität über QoS-Grenzen 3. Fügen Sie weitere Speicherknoten (AFF) oder Festplattenregale (FAS) hinzu und verteilen Sie die Arbeitslasten neu 4. Ändern Sie die Arbeitslasteigenschaften (Blockgröße, Anwendungs-Caching usw.)

Knotenleistungsgrenze

WARNUNG / KRITISCH

Die Leistungsauslastung des Knotens hat ein Niveau erreicht, bei dem sie die Leistung der E/As und der vom Knoten unterstützten Anwendungen beeinträchtigen könnte. Eine geringe Knotenleistungsauslastung gewährleistet eine gleichbleibende Leistung der Anwendungen.

Um die Serviceunterbrechung bei einer Überschreitung eines kritischen Schwellenwerts zu minimieren, sollten umgehend Maßnahmen ergriffen werden: 1. Unterbrechen Sie geplante Aufgaben, Snapshots oder die SnapMirror -Replikation 2. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität über QoS-Grenzen 3. Deaktivieren Sie nicht unbedingt erforderliche Workloads. Erwägen Sie die folgenden Maßnahmen, wenn der Warnschwellenwert überschritten wird: 1. Verschieben Sie einen oder mehrere Workloads an einen anderen Speicherort 2. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität über QoS-Grenzen 3. Fügen Sie weitere Speicherknoten (AFF) oder Festplattenregale (FAS) hinzu und verteilen Sie die Arbeitslasten neu 4. Ändern Sie die Arbeitslasteigenschaften (Blockgröße, Anwendungs-Caching usw.)

Hohe Latenz der Speicher-VM

WARNUNG / KRITISCH

Die Latenz der Storage-VM (SVM) hat ein Niveau erreicht, bei dem sie die Leistung der Anwendungen auf der Storage-VM beeinträchtigen könnte. Eine geringere Speicher-VM-Latenz gewährleistet eine konsistente Leistung der Anwendungen. Die erwarteten Latenzen je nach Medientyp sind: SSD bis zu 1–2 Millisekunden, SAS bis zu 8–10 Millisekunden und SATA HDD 17–20 Millisekunden.

Wenn ein kritischer Schwellenwert überschritten wird, bewerten Sie sofort die Schwellenwerte für Volumes der Speicher-VM mit einer zugewiesenen QoS-Richtlinie, um zu überprüfen, ob sie eine Drosselung der Volume-Workloads verursachen. Erwägen Sie die folgenden Sofortmaßnahmen, wenn der Warnschwellenwert überschritten wird: 1. Wenn das Aggregat ebenfalls eine hohe Auslastung aufweist, verschieben Sie einige Volumes der Speicher-VM in ein anderes Aggregat. 2. Bewerten Sie für Volumes der Speicher-VM mit zugewiesener QoS-Richtlinie die Schwellenwerte, wenn diese zu einer Drosselung der Volume-Workloads führen 3. Wenn der Knoten eine hohe Auslastung aufweist, verschieben Sie einige Volumes der Speicher-VM auf einen anderen Knoten oder reduzieren Sie die Gesamtarbeitslast des Knotens

Hartes Limit für Benutzerkontingentdateien

KRITISCH

Die Anzahl der im Volume erstellten Dateien hat die kritische Grenze erreicht und es können keine weiteren Dateien erstellt werden. Durch die Überwachung der Anzahl der gespeicherten Dateien wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Um Serviceunterbrechungen zu minimieren, wenn ein kritischer Schwellenwert überschritten wird, sind sofortige Maßnahmen erforderlich. … Erwägen Sie die Durchführung der folgenden Maßnahmen: 1. Erhöhen Sie das Dateianzahlkontingent für den jeweiligen Benutzer 2. Löschen Sie nicht benötigte Dateien, um den Druck auf das Dateikontingent für den jeweiligen Benutzer zu verringern

Soft-Limit für Benutzerkontingentdateien

WARNING (Warnung)

Die Anzahl der im Volume erstellten Dateien hat den Schwellenwert des Kontingents erreicht und liegt nahe der kritischen Grenze. Sie können keine weiteren Dateien erstellen, wenn das Kontingent die kritische Grenze erreicht. Durch die Überwachung der Anzahl der von einem Benutzer gespeicherten Dateien wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Erwägen Sie sofortige Maßnahmen, wenn die Warnschwelle überschritten wird: 1. Erhöhen Sie das Dateianzahlkontingent für das spezifische Benutzerkontingent 2. Löschen Sie nicht benötigte Dateien, um den Druck auf das Dateikontingent für den jeweiligen Benutzer zu verringern

Volume-Cache-Fehlerquote

WARNUNG / KRITISCH

Die Volume Cache Miss Ratio ist der Prozentsatz der Leseanforderungen der Clientanwendungen, die von der Festplatte und nicht vom Cache zurückgegeben werden. Dies bedeutet, dass die Lautstärke den eingestellten Schwellenwert erreicht hat.

Wenn ein kritischer Schwellenwert überschritten wird, sollten sofort Maßnahmen ergriffen werden, um die Dienstunterbrechung zu minimieren: 1. Verschieben Sie einige Workloads vom Knoten des Volumes, um die E/A-Last 2 zu reduzieren. Falls er sich noch nicht auf dem Knoten des Volumes befindet, erhöhen Sie den WAFL Cache, indem Sie einen Flash Cache 3 kaufen und hinzufügen. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität auf demselben Knoten über QoS-Grenzwerte. Erwägen Sie sofortige Maßnahmen, wenn der Warnschwellenwert überschritten wird: 1. Verschieben Sie einige Workloads vom Knoten des Volumes, um die E/A-Last 2 zu reduzieren. Falls er sich noch nicht auf dem Knoten des Volumes befindet, erhöhen Sie den WAFL Cache, indem Sie einen Flash Cache 3 kaufen und hinzufügen. Verringern Sie die Nachfrage nach Workloads mit niedrigerer Priorität auf demselben Knoten über QoS-Grenzwerte 4. Ändern Sie die Arbeitslasteigenschaften (Blockgröße, Anwendungs-Caching usw.)

Volume Qtree-Kontingentüberbelegung

WARNUNG / KRITISCH

Volume Qtree Quota Overcommit gibt den Prozentsatz an, ab dem ein Volume als durch die Qtree-Kontingente überbelegt gilt. Der festgelegte Schwellenwert für das Qtree-Kontingent ist für das Volume erreicht. Durch die Überwachung der Überbelegung des Volume-Qtree-Kontingents wird sichergestellt, dass der Benutzer einen unterbrechungsfreien Datendienst erhält.

Wenn ein kritischer Schwellenwert überschritten wird, sollten sofort Maßnahmen ergriffen werden, um die Dienstunterbrechung zu minimieren: 1. Erhöhen Sie den Speicherplatz des Bandes 2. Löschen Sie nicht benötigte Daten. Wenn der Warnschwellenwert überschritten wird, sollten Sie den Speicherplatz des Datenträgers vergrößern.

Zurück nach oben

Protokollmonitore

Monitorname

Schwere

Beschreibung

Korrekturmaßnahme

AWS-Anmeldeinformationen nicht initialisiert

INFO

Dieses Ereignis tritt auf, wenn ein Modul versucht, auf rollenbasierte Anmeldeinformationen von Amazon Web Services (AWS) Identity and Access Management (IAM) aus dem Cloud-Anmeldeinformations-Thread zuzugreifen, bevor diese initialisiert werden.

Warten Sie, bis der Thread mit den Cloud-Anmeldeinformationen und das System die Initialisierung abgeschlossen haben.

Cloud-Ebene nicht erreichbar

KRITISCH

Ein Speicherknoten kann keine Verbindung zur Cloud Tier-Objektspeicher-API herstellen. Auf einige Daten kann nicht zugegriffen werden.

Wenn Sie lokale Produkte verwenden, führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie mithilfe des Befehls „network interface show“ sicher, dass Ihr Intercluster-LIF online und funktionsfähig ist. … Überprüfen Sie die Netzwerkkonnektivität zum Objektspeicherserver, indem Sie den Befehl „ping“ über das Intercluster-LIF des Zielknotens ausführen. … Stellen Sie Folgendes sicher: … Die Konfiguration Ihres Objektspeichers hat sich nicht geändert. … Die Anmelde- und Konnektivitätsinformationen sind weiterhin gültig. … Wenden Sie sich an den technischen Support von NetApp , wenn das Problem weiterhin besteht. Wenn Sie Cloud Volumes ONTAP verwenden, führen Sie die folgenden Korrekturmaßnahmen durch: …Stellen Sie sicher, dass sich die Konfiguration Ihres Objektspeichers nicht geändert hat.… Stellen Sie sicher, dass die Anmelde- und Verbindungsinformationen noch gültig sind. … Wenden Sie sich an den technischen Support von NetApp, wenn das Problem weiterhin besteht.

Festplatte außer Betrieb

INFO

Dieses Ereignis tritt ein, wenn eine Festplatte außer Betrieb genommen wird, weil sie als fehlerhaft markiert wurde, bereinigt wird oder in das Wartungscenter gelangt ist.

Keiner.

FlexGroup -Bestandteil Voll

KRITISCH

Ein Bestandteil eines FlexGroup -Volumes ist voll, was zu einer möglichen Dienstunterbrechung führen kann. Sie können weiterhin Dateien auf dem FlexGroup -Volume erstellen oder erweitern. Allerdings können keine der auf der Komponente gespeicherten Dateien geändert werden. Daher treten möglicherweise zufällige Fehlermeldungen wegen unzureichendem Speicherplatz auf, wenn Sie versuchen, Schreibvorgänge auf dem FlexGroup -Volume durchzuführen.

Es wird empfohlen, die Kapazität des FlexGroup -Volumes mit dem Befehl „volume modify -files +X“ zu erhöhen. …Alternativ können Sie Dateien aus dem FlexGroup -Volume löschen. Allerdings ist es schwierig festzustellen, welche Dateien beim Wähler gelandet sind.

Flexgroup-Bestandteil fast voll

WARNING (Warnung)

Ein Bestandteil eines FlexGroup -Volumes hat fast keinen Speicherplatz mehr, was zu einer möglichen Dienstunterbrechung führen kann. Dateien können erstellt und erweitert werden. Wenn jedoch der Speicherplatz der Komponente ausgeht, können Sie die Dateien auf der Komponente möglicherweise nicht anhängen oder ändern.

FlexGroup -Bestandteil hat fast keine Inodes mehr

WARNING (Warnung)

Ein Bestandteil eines FlexGroup -Volumes hat fast keine Inodes mehr, was zu einer möglichen Dienstunterbrechung führen kann. Der Bestandteil erhält weniger Erstellungsanfragen als der Durchschnitt. Dies kann die Gesamtleistung des FlexGroup -Volumes beeinträchtigen, da die Anforderungen an Bestandteile mit mehr Inodes weitergeleitet werden.

FlexGroup -Bestandteil außerhalb der Inodes

KRITISCH

Einem Bestandteil eines FlexGroup -Volumes sind die Inodes ausgegangen, was zu einer möglichen Dienstunterbrechung führen kann. Sie können für diesen Bestandteil keine neuen Dateien erstellen. Dies kann zu einer insgesamt unausgewogenen Verteilung der Inhalte über das FlexGroup -Volumen führen.

LUN offline

INFO

Dieses Ereignis tritt auf, wenn eine LUN manuell offline geschaltet wird.

Bringen Sie die LUN wieder online.

Lüfter der Haupteinheit ausgefallen

WARNING (Warnung)

Ein oder mehrere Lüfter der Haupteinheit sind ausgefallen. Das System bleibt betriebsbereit. …Wenn der Zustand jedoch zu lange anhält, kann die Übertemperatur eine automatische Abschaltung auslösen.

Setzen Sie die ausgefallenen Lüfter neu ein. Wenn der Fehler weiterhin besteht, ersetzen Sie sie.

Lüfter der Haupteinheit im Warnzustand

INFO

Dieses Ereignis tritt auf, wenn sich ein oder mehrere Lüfter der Haupteinheit in einem Warnzustand befinden.

Ersetzen Sie die angegebenen Lüfter, um eine Überhitzung zu vermeiden.

NVRAM -Batterie schwach

WARNING (Warnung)

Die NVRAM Batteriekapazität ist kritisch niedrig. Wenn der Akku leer ist, kann es zu einem Datenverlust kommen. … Ihr System generiert und überträgt eine AutoSupport oder „Call Home“-Nachricht an den technischen Support von NetApp und die konfigurierten Ziele, sofern es entsprechend konfiguriert ist. Die erfolgreiche Zustellung einer AutoSupport -Nachricht verbessert die Problembestimmung und -lösung erheblich.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Zeigen Sie den aktuellen Status, die Kapazität und den Ladezustand der Batterie mit dem Befehl „Systemknoten-Umgebungssensoren anzeigen“ an. … Wenn die Batterie vor Kurzem ausgetauscht wurde oder das System längere Zeit nicht betriebsbereit war, überwachen Sie die Batterie, um sicherzustellen, dass sie ordnungsgemäß geladen wird. … Wenden Sie sich an den technischen Support von NetApp , wenn die Batterielaufzeit weiterhin unter kritische Werte sinkt und das Speichersystem automatisch herunterfährt.

Serviceprozessor nicht konfiguriert

WARNING (Warnung)

Dieses Ereignis tritt wöchentlich auf, um Sie daran zu erinnern, den Serviceprozessor (SP) zu konfigurieren. Der SP ist ein physisches Gerät, das in Ihr System integriert wird, um Fernzugriff und Fernverwaltungsfunktionen bereitzustellen. Sie sollten den SP so konfigurieren, dass er seine volle Funktionalität nutzt.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Konfigurieren Sie den SP mit dem Befehl „system service-processor network modify“. … Ermitteln Sie optional die MAC-Adresse des SP mit dem Befehl „system service-processor network show“. … Überprüfen Sie die SP Netzwerkkonfiguration mit dem Befehl „system service-processor network show“. … Überprüfen Sie mit dem Befehl „system service-processor autosupport invoke“, ob der SP eine AutoSupport E-Mail senden kann. HINWEIS: AutoSupport E-Mail-Hosts und -Empfänger sollten in ONTAP konfiguriert werden, bevor Sie diesen Befehl ausführen.

Serviceprozessor offline

KRITISCH

ONTAP empfängt keine Heartbeats mehr vom Serviceprozessor (SP), obwohl alle SP Wiederherstellungsmaßnahmen durchgeführt wurden. ONTAP kann den Zustand der Hardware ohne den SP nicht überwachen. … Das System wird heruntergefahren, um Hardwareschäden und Datenverlust zu verhindern. Richten Sie einen Panikalarm ein, um sofort benachrichtigt zu werden, wenn der SP offline geht.

Führen Sie einen Neustart des Systems durch, indem Sie die folgenden Aktionen ausführen: … Ziehen Sie den Controller aus dem Gehäuse. … Schieben Sie den Controller wieder hinein. … Schalten Sie den Controller wieder ein. … Wenn das Problem weiterhin besteht, ersetzen Sie das Controllermodul.

Regallüfter ausgefallen

KRITISCH

Der angegebene Kühllüfter oder das Lüftermodul des Regals ist ausgefallen. Die Festplatten im Regal erhalten möglicherweise nicht genügend Kühlluftstrom, was zu einem Festplattenausfall führen kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie sicher, dass das Lüftermodul vollständig sitzt und gesichert ist. HINWEIS: Bei einigen Festplatten-Shelves ist der Lüfter in das Stromversorgungsmodul integriert. …Wenn das Problem weiterhin besteht, ersetzen Sie das Lüftermodul. …Wenn das Problem weiterhin besteht, wenden Sie sich an den technischen Support von NetApp , um Hilfe zu erhalten.

Das System kann aufgrund eines Lüfterfehlers der Haupteinheit nicht betrieben werden

KRITISCH

Ein oder mehrere Lüfter der Haupteinheit sind ausgefallen, wodurch der Systembetrieb unterbrochen wird. Dies kann zu einem möglichen Datenverlust führen.

Ersetzen Sie die ausgefallenen Lüfter.

Nicht zugewiesene Datenträger

INFO

Dem System sind keine Festplatten zugewiesen – Kapazität wird verschwendet und Ihr System weist möglicherweise eine Fehlkonfiguration auf oder es wurden teilweise Konfigurationsänderungen vorgenommen.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Ermitteln Sie mit dem Befehl „disk show -n“, welche Datenträger nicht zugewiesen sind. … Weisen Sie die Datenträger mit dem Befehl „disk assign“ einem System zu.

Antivirus-Server ausgelastet

WARNING (Warnung)

Der Antivirenserver ist zu ausgelastet, um neue Scananforderungen anzunehmen.

Wenn diese Meldung häufig auftritt, stellen Sie sicher, dass genügend Antivirenserver vorhanden sind, um die von der SVM generierte Virenscanlast zu bewältigen.

AWS-Anmeldeinformationen für IAM-Rolle abgelaufen

KRITISCH

Auf Cloud Volume ONTAP kann nicht mehr zugegriffen werden. Die rollenbasierten Anmeldeinformationen für Identity and Access Management (IAM) sind abgelaufen. Die Anmeldeinformationen werden mithilfe der IAM-Rolle vom Metadatenserver von Amazon Web Services (AWS) abgerufen und zum Signieren von API-Anfragen an Amazon Simple Storage Service (Amazon S3) verwendet.

Führen Sie Folgendes aus: … Melden Sie sich bei der AWS EC2-Verwaltungskonsole an. … Navigieren Sie zur Seite „Instanzen“. … Suchen Sie die Instanz für die Cloud Volumes ONTAP Bereitstellung und überprüfen Sie ihren Zustand. … Stellen Sie sicher, dass die mit der Instanz verknüpfte AWS IAM-Rolle gültig ist und ihr die entsprechenden Berechtigungen für die Instanz erteilt wurden.

AWS-Anmeldeinformationen für IAM-Rolle nicht gefunden

KRITISCH

Der Thread für Cloud-Anmeldeinformationen kann die rollenbasierten Anmeldeinformationen für das Identity and Access Management (IAM) von Amazon Web Services (AWS) nicht vom AWS-Metadatenserver abrufen. Die Anmeldeinformationen werden zum Signieren von API-Anfragen an Amazon Simple Storage Service (Amazon S3) verwendet. Cloud Volume ONTAP ist nicht mehr zugänglich. …

AWS-Anmeldeinformationen für IAM-Rolle ungültig

KRITISCH

Die rollenbasierten Anmeldeinformationen für Identity and Access Management (IAM) sind ungültig. Die Anmeldeinformationen werden mithilfe der IAM-Rolle vom Metadatenserver von Amazon Web Services (AWS) abgerufen und zum Signieren von API-Anfragen an Amazon Simple Storage Service (Amazon S3) verwendet. Auf Cloud Volume ONTAP kann nicht mehr zugegriffen werden.

AWS IAM-Rolle nicht gefunden

KRITISCH

Der Thread für Identity and Access Management (IAM)-Rollen kann auf dem AWS-Metadatenserver keine Amazon Web Services (AWS)-IAM-Rolle finden. Die IAM-Rolle ist erforderlich, um rollenbasierte Anmeldeinformationen zu erhalten, die zum Signieren von API-Anfragen an Amazon Simple Storage Service (Amazon S3) verwendet werden. Cloud Volume ONTAP ist nicht mehr zugänglich. …

AWS IAM-Rolle ungültig

KRITISCH

Die Amazon Web Services (AWS) Identity and Access Management (IAM)-Rolle auf dem AWS-Metadatenserver ist ungültig. Auf Cloud Volume ONTAP kann nicht mehr zugegriffen werden. …

AWS-Metadatenserver-Verbindung fehlgeschlagen

KRITISCH

Der Rollenthread für Identity and Access Management (IAM) kann keine Kommunikationsverbindung mit dem Metadatenserver von Amazon Web Services (AWS) herstellen. Es sollte eine Kommunikation hergestellt werden, um die erforderlichen rollenbasierten AWS IAM-Anmeldeinformationen zu erhalten, die zum Signieren von API-Anfragen an Amazon Simple Storage Service (Amazon S3) verwendet werden. Cloud Volume ONTAP ist nicht mehr zugänglich. …

Führen Sie Folgendes aus: … Melden Sie sich bei der AWS EC2-Verwaltungskonsole an. … Navigieren Sie zur Seite „Instanzen“. … Suchen Sie die Instanz für die Cloud Volumes ONTAP -Bereitstellung und überprüfen Sie ihren Zustand. …

FabricPool Speicherplatznutzungslimit fast erreicht

WARNING (Warnung)

Die gesamte clusterweite FabricPool Speicherplatznutzung von Objektspeichern von Anbietern mit Kapazitätslizenz hat fast das lizenzierte Limit erreicht.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Überprüfen Sie den Prozentsatz der lizenzierten Kapazität, die von jeder FabricPool Speicherebene verwendet wird, indem Sie den Befehl „storage aggregate object-store show-space“ verwenden. … Löschen Sie Snapshot-Kopien von Volumes mit der Tiering-Richtlinie „Snapshot“ oder „Backup“, indem Sie den Befehl „volume snapshot delete“ verwenden, um Speicherplatz freizugeben. … Installieren Sie eine neue Lizenz auf dem Cluster, um die lizenzierte Kapazität zu erhöhen.

FabricPool Speicherplatznutzungslimit erreicht

KRITISCH

Die gesamte clusterweite FabricPool Speicherplatznutzung von Objektspeichern von Anbietern mit Kapazitätslizenz hat das Lizenzlimit erreicht.

Rückgabe des Aggregats fehlgeschlagen

KRITISCH

Dieses Ereignis tritt während der Migration eines Aggregats im Rahmen einer Speicher-Failover-(SFO)-Rückgabe auf, wenn der Zielknoten die Objektspeicher nicht erreichen kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie mithilfe des Befehls „network interface show“ sicher, dass Ihr Intercluster-LIF online und funktionsfähig ist. … Überprüfen Sie die Netzwerkkonnektivität zum Objektspeicherserver, indem Sie den Befehl „ping“ über das Intercluster-LIF des Zielknotens ausführen. …Überprüfen Sie mit dem Befehl „aggregate object-store config show“, dass sich die Konfiguration Ihres Objektspeichers nicht geändert hat und dass die Anmelde- und Verbindungsinformationen noch immer korrekt sind. …Alternativ können Sie den Fehler überschreiben, indem Sie für den Parameter „require-partner-waiting“ des Giveback-Befehls „false“ angeben. …Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

HA-Verbindung ausgefallen

WARNING (Warnung)

Die Hochverfügbarkeitsverbindung (HA) ist ausgefallen. Risiko eines Dienstausfalls, wenn kein Failover verfügbar ist.

Korrekturmaßnahmen hängen von der Anzahl und Art der von der Plattform unterstützten HA-Verbindungslinks sowie vom Grund für den Verbindungsausfall ab. …Wenn die Links ausgefallen sind: …Überprüfen Sie, ob beide Controller im HA-Paar betriebsbereit sind. …Stellen Sie bei extern verbundenen Links sicher, dass die Verbindungskabel richtig angeschlossen sind und dass die Small Form-Factor Pluggables (SFPs), falls zutreffend, richtig auf beiden Controllern sitzen. …Deaktivieren und aktivieren Sie bei intern verbundenen Links die Links nacheinander mit den Befehlen „ic link off“ und „ic link on“. …Wenn Links deaktiviert sind, aktivieren Sie die Links mit dem Befehl „ic link on“. …Wenn kein Peer verbunden ist, deaktivieren und aktivieren Sie die Links nacheinander mit den Befehlen „ic link off“ und „ic link on“. …Wenden Sie sich an den technischen Support von NetApp, wenn das Problem weiterhin besteht.

Max. Sitzungen pro Benutzer überschritten

WARNING (Warnung)

Sie haben die maximal zulässige Anzahl von Sitzungen pro Benutzer über eine TCP-Verbindung überschritten. Jede Anfrage zum Herstellen einer Sitzung wird abgelehnt, bis einige Sitzungen freigegeben werden. …

Führen Sie die folgenden Korrekturmaßnahmen durch: …Überprüfen Sie alle Anwendungen, die auf dem Client ausgeführt werden, und beenden Sie alle, die nicht ordnungsgemäß funktionieren. …Starten Sie den Client neu. …Überprüfen Sie, ob das Problem durch eine neue oder vorhandene Anwendung verursacht wird: …Wenn die Anwendung neu ist, legen Sie mit dem Befehl „cifs option modify -max-opens-same-file-per-tree“ einen höheren Schwellenwert für den Client fest. In einigen Fällen funktionieren die Clients wie erwartet, erfordern jedoch eine höhere Schwelle. Sie sollten über erweiterte Berechtigungen verfügen, um einen höheren Schwellenwert für den Client festzulegen. …Wenn das Problem durch eine vorhandene Anwendung verursacht wird, liegt möglicherweise ein Problem mit dem Client vor. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

Maximale Anzahl der Öffnungen pro Datei überschritten

WARNING (Warnung)

Sie haben die maximale Anzahl überschritten, die Sie die Datei über eine TCP-Verbindung öffnen können. Jede Anfrage zum Öffnen dieser Datei wird abgelehnt, bis Sie einige geöffnete Instanzen der Datei schließen. Dies weist normalerweise auf ein abnormales Anwendungsverhalten hin.…

Führen Sie die folgenden Korrekturmaßnahmen durch: …Überprüfen Sie die Anwendungen, die auf dem Client über diese TCP-Verbindung ausgeführt werden. Der Client funktioniert möglicherweise aufgrund der darauf ausgeführten Anwendung nicht richtig. … Starten Sie den Client neu. … Prüfen Sie, ob das Problem durch eine neue oder vorhandene Anwendung verursacht wird: … Wenn die Anwendung neu ist, legen Sie mit dem Befehl „cifs option modify -max-opens-same-file-per-tree“ einen höheren Schwellenwert für den Client fest. In einigen Fällen funktionieren die Clients wie erwartet, erfordern jedoch eine höhere Schwelle. Sie sollten über erweiterte Berechtigungen verfügen, um einen höheren Schwellenwert für den Client festzulegen. …Wenn das Problem durch eine vorhandene Anwendung verursacht wird, liegt möglicherweise ein Problem mit dem Client vor. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

NetBIOS-Namenskonflikt

KRITISCH

Der NetBIOS-Namensdienst hat von einem Remotecomputer eine negative Antwort auf eine Namensregistrierungsanforderung erhalten. Dies wird normalerweise durch einen Konflikt im NetBIOS-Namen oder einem Alias verursacht. Dies hat zur Folge, dass Clients möglicherweise nicht auf Daten zugreifen oder keine Verbindung zum richtigen Datenbereitstellungsknoten im Cluster herstellen können.

Führen Sie eine der folgenden Korrekturmaßnahmen durch: …Wenn ein Konflikt im NetBIOS-Namen oder einem Alias vorliegt, führen Sie einen der folgenden Schritte aus: …Löschen Sie den doppelten NetBIOS-Alias mit dem Befehl „vserver cifs delete -aliases alias -vserver vserver“. …Benennen Sie einen NetBIOS-Alias um, indem Sie den doppelten Namen löschen und einen Alias mit einem neuen Namen hinzufügen, indem Sie den Befehl „vserver cifs create -aliases alias -vserver vserver“ verwenden. …Wenn keine Aliase konfiguriert sind und ein Konflikt im NetBIOS-Namen vorliegt, benennen Sie den CIFS-Server mit den Befehlen „vserver cifs delete -vserver vserver“ und „vserver cifs create -cifs-server netbiosname“ um. HINWEIS: Durch das Löschen eines CIFS-Servers kann der Zugriff auf die Daten unzugänglich werden. …Entfernen Sie den NetBIOS-Namen oder benennen Sie das NetBIOS auf dem Remotecomputer um.

NFSv4-Speicherpool erschöpft

KRITISCH

Ein NFSv4-Speicherpool ist erschöpft.

Wenn der NFS-Server nach diesem Ereignis länger als 10 Minuten nicht reagiert, wenden Sie sich an den technischen Support von NetApp .

Keine registrierte Scan-Engine

KRITISCH

Der Antivirus-Connector hat ONTAP benachrichtigt, dass er über keine registrierte Scan-Engine verfügt. Dies kann dazu führen, dass Daten nicht verfügbar sind, wenn die Option „Scan-obligatorisch“ aktiviert ist.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie sicher, dass die auf dem Antivirenserver installierte Scan-Engine-Software mit ONTAP kompatibel ist. … Stellen Sie sicher, dass die Scan-Engine-Software ausgeführt wird und für die Verbindung mit dem Antiviren-Connector über lokales Loopback konfiguriert ist.

Keine Vscan-Verbindung

KRITISCH

ONTAP verfügt über keine Vscan-Verbindung, um Virenscan-Anfragen zu bedienen. Dies kann dazu führen, dass Daten nicht verfügbar sind, wenn die Option „Scan-obligatorisch“ aktiviert ist.

Stellen Sie sicher, dass der Scannerpool richtig konfiguriert ist und die Antivirenserver aktiv und mit ONTAP verbunden sind.

Knoten-Root-Volume-Speicherplatz niedrig

KRITISCH

Das System hat festgestellt, dass auf dem Stammvolume gefährlich wenig Speicherplatz vorhanden ist. Der Knoten ist nicht voll funktionsfähig. Möglicherweise ist innerhalb des Clusters ein Failover der Daten-LIFs aufgetreten, weshalb der NFS- und CIFS-Zugriff auf den Knoten eingeschränkt ist. Die Verwaltungsfunktionen sind auf lokale Wiederherstellungsverfahren für den Knoten beschränkt, um Speicherplatz auf dem Stammvolume freizugeben.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Schaffen Sie Speicherplatz auf dem Stammvolume, indem Sie alte Snapshot-Kopien löschen, nicht mehr benötigte Dateien aus dem Verzeichnis /mroot löschen oder die Kapazität des Stammvolumes erweitern. … Starten Sie den Controller neu. … Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

Nicht vorhandene Admin-Freigabe

KRITISCH

Vscan-Problem: Ein Client hat versucht, eine Verbindung zu einer nicht vorhandenen ONTAP_ADMIN$-Freigabe herzustellen.

Stellen Sie sicher, dass Vscan für die angegebene SVM-ID aktiviert ist. Durch die Aktivierung von Vscan auf einer SVM wird die ONTAP_ADMIN$-Freigabe automatisch für die SVM erstellt.

Nicht genügend Speicherplatz für den NVMe-Namespace

KRITISCH

Ein NVMe-Namespace wurde aufgrund eines Schreibfehlers aufgrund von Speicherplatzmangel offline geschaltet.

Fügen Sie dem Volume Speicherplatz hinzu und bringen Sie dann den NVMe-Namespace online, indem Sie den Befehl „vserver nvme namespace modify“ verwenden.

NVMe-oF-Gnadenfrist aktiv

WARNING (Warnung)

Dieses Ereignis tritt täglich auf, wenn das NVMe over Fabrics (NVMe-oF)-Protokoll verwendet wird und die Nachfrist der Lizenz aktiv ist. Für die NVMe-oF-Funktionalität ist nach Ablauf der Lizenzfrist eine Lizenz erforderlich. Die NVMe-oF-Funktionalität wird deaktiviert, wenn die Lizenzfrist abgelaufen ist.

Wenden Sie sich an Ihren Vertriebsmitarbeiter, um eine NVMe-oF-Lizenz zu erhalten und sie dem Cluster hinzuzufügen, oder entfernen Sie alle Instanzen der NVMe-oF-Konfiguration aus dem Cluster.

NVMe-oF-Karenzzeit abgelaufen

WARNING (Warnung)

Die Nachfrist für die NVMe over Fabrics (NVMe-oF)-Lizenz ist abgelaufen und die NVMe-oF-Funktionalität ist deaktiviert.

Wenden Sie sich an Ihren Vertriebsmitarbeiter, um eine NVMe-oF-Lizenz zu erhalten und sie dem Cluster hinzuzufügen.

NVMe-oF-Gnadenfrist beginnt

WARNING (Warnung)

Die NVMe over Fabrics (NVMe-oF)-Konfiguration wurde während des Upgrades auf die ONTAP 9.5-Software erkannt. Für die NVMe-oF-Funktionalität ist nach Ablauf der Lizenzfrist eine Lizenz erforderlich.

Wenden Sie sich an Ihren Vertriebsmitarbeiter, um eine NVMe-oF-Lizenz zu erhalten und sie dem Cluster hinzuzufügen.

Objektspeicher-Host nicht auflösbar

KRITISCH

Der Hostname des Objektspeicherservers kann nicht in eine IP-Adresse aufgelöst werden. Der Objektspeicherclient kann ohne Auflösung in eine IP-Adresse nicht mit dem Objektspeicherserver kommunizieren. Dies kann dazu führen, dass auf die Daten nicht zugegriffen werden kann.

Überprüfen Sie die DNS-Konfiguration, um sicherzustellen, dass der Hostname korrekt mit einer IP-Adresse konfiguriert ist.

Objektspeicher-Intercluster-LIF ausgefallen

KRITISCH

Der Objektspeicher-Client kann kein funktionsfähiges LIF für die Kommunikation mit dem Objektspeicher-Server finden. Der Knoten lässt keinen Objektspeicher-Clientverkehr zu, bis das Intercluster-LIF betriebsbereit ist. Dies kann dazu führen, dass auf die Daten nicht zugegriffen werden kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Überprüfen Sie den Intercluster-LIF-Status mit dem Befehl „network interface show -role intercluster“. … Stellen Sie sicher, dass das Intercluster-LIF richtig konfiguriert und betriebsbereit ist. … Wenn kein Intercluster-LIF konfiguriert ist, fügen Sie es mit dem Befehl „network interface create -role intercluster“ hinzu.

Nichtübereinstimmung der Objektspeichersignatur

KRITISCH

Die an den Objektspeicherserver gesendete Anforderungssignatur stimmt nicht mit der vom Client berechneten Signatur überein. Dies kann dazu führen, dass auf die Daten nicht zugegriffen werden kann.

Überprüfen Sie, ob der geheime Zugriffsschlüssel richtig konfiguriert ist. Wenn es richtig konfiguriert ist, wenden Sie sich an den technischen Support von NetApp , um Hilfe zu erhalten.

READDIR-Zeitüberschreitung

KRITISCH

Ein READDIR-Dateivorgang hat das zulässige Zeitlimit für die Ausführung in WAFL überschritten. Dies kann an sehr großen oder spärlich gefüllten Verzeichnissen liegen. Es werden Korrekturmaßnahmen empfohlen.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Suchen Sie nach spezifischen Informationen zu aktuellen Verzeichnissen, bei denen READDIR-Dateivorgänge abgelaufen sind, indem Sie den folgenden NodeShell-CLI-Befehl mit der Berechtigung „diag“ verwenden: wafl readdir notice show. … Überprüfen Sie, ob Verzeichnisse als spärlich gekennzeichnet sind oder nicht: … Wenn ein Verzeichnis als spärlich gekennzeichnet ist, wird empfohlen, den Inhalt des Verzeichnisses in ein neues Verzeichnis zu kopieren, um die Spärlichkeit der Verzeichnisdatei zu beheben. …Wenn ein Verzeichnis nicht als spärlich gekennzeichnet ist und das Verzeichnis groß ist, wird empfohlen, die Größe der Verzeichnisdatei zu reduzieren, indem Sie die Anzahl der Dateieinträge im Verzeichnis verringern.

Verlagerung des Aggregats fehlgeschlagen

KRITISCH

Dieses Ereignis tritt während der Verschiebung eines Aggregats auf, wenn der Zielknoten die Objektspeicher nicht erreichen kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie mithilfe des Befehls „network interface show“ sicher, dass Ihr Intercluster-LIF online und funktionsfähig ist. … Überprüfen Sie die Netzwerkkonnektivität zum Objektspeicherserver, indem Sie den Befehl „ping“ über das Intercluster-LIF des Zielknotens ausführen. …Überprüfen Sie mit dem Befehl „aggregate object-store config show“, dass sich die Konfiguration Ihres Objektspeichers nicht geändert hat und dass die Anmelde- und Verbindungsinformationen noch immer korrekt sind. …Alternativ können Sie den Fehler mit dem Parameter „override-destination-checks“ des Umzugsbefehls überschreiben. …Wenden Sie sich an den technischen Support von NetApp, um weitere Informationen oder Unterstützung zu erhalten.

Schattenkopie fehlgeschlagen

KRITISCH

Ein Volume Shadow Copy Service (VSS), ein Sicherungs- und Wiederherstellungsdienstvorgang von Microsoft Server, ist fehlgeschlagen.

Überprüfen Sie anhand der in der Ereignismeldung bereitgestellten Informationen Folgendes: … Ist die Schattenkopiekonfiguration aktiviert? … Sind die entsprechenden Lizenzen installiert? …Auf welchen Freigaben wird der Schattenkopievorgang ausgeführt?…Ist der Freigabename korrekt?…Existiert der Freigabepfad?…Wie ist der Status des Schattenkopiesatzes und seiner Schattenkopien?

Ausfall der Stromversorgung des Speicherschalters

WARNING (Warnung)

Im Cluster-Switch fehlt eine Stromversorgung. Die Redundanz wird reduziert, das Risiko eines Stromausfalls bei weiteren Stromausfällen steigt.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie sicher, dass das Netzteil, das den Cluster-Switch mit Strom versorgt, eingeschaltet ist. … Stellen Sie sicher, dass das Netzkabel an die Stromversorgung angeschlossen ist. … Wenden Sie sich an den technischen Support von NetApp , wenn das Problem weiterhin besteht.

Zu viele CIFS-Authentifizierungen

WARNING (Warnung)

Viele Authentifizierungsverhandlungen fanden gleichzeitig statt. Von diesem Client liegen 256 unvollständige neue Sitzungsanforderungen vor.

Untersuchen Sie, warum der Client 256 oder mehr neue Verbindungsanforderungen erstellt hat. Möglicherweise müssen Sie sich an den Anbieter des Clients oder der Anwendung wenden, um die Ursache des Fehlers zu ermitteln.

Unbefugter Benutzerzugriff auf die Administratorfreigabe

WARNING (Warnung)

Ein Client hat versucht, eine Verbindung zur privilegierten Freigabe ONTAP_ADMIN$ herzustellen, obwohl der angemeldete Benutzer kein zulässiger Benutzer ist.

Führen Sie die folgenden Korrekturmaßnahmen durch: … Stellen Sie sicher, dass der angegebene Benutzername und die IP-Adresse in einem der aktiven Vscan-Scannerpools konfiguriert sind. … Überprüfen Sie die aktuell aktive Scannerpoolkonfiguration mit dem Befehl „vserver vscan scanner pool show-active“.

Virus erkannt

WARNING (Warnung)

Ein Vscan-Server hat dem Speichersystem einen Fehler gemeldet. Dies weist normalerweise darauf hin, dass ein Virus gefunden wurde. Dieses Ereignis kann jedoch auch durch andere Fehler auf dem Vscan-Server verursacht werden. …Der Clientzugriff auf die Datei wird verweigert. Der Vscan-Server kann die Datei je nach seinen Einstellungen und seiner Konfiguration bereinigen, unter Quarantäne stellen oder löschen.

Überprüfen Sie das im „Syslog“-Ereignis gemeldete Protokoll des Vscan-Servers, um festzustellen, ob die infizierte Datei erfolgreich bereinigt, unter Quarantäne gestellt oder gelöscht werden konnte. Wenn dies nicht möglich ist, muss ein Systemadministrator die Datei möglicherweise manuell löschen.

Volume offline

INFO

Diese Meldung zeigt an, dass ein Volume offline geschaltet wurde.

Bringen Sie das Volume wieder online.

Volumenbeschränkt

INFO

Dieses Ereignis zeigt an, dass ein flexibles Volumen eingeschränkt wird.

Bringen Sie das Volume wieder online.

Speicher-VM erfolgreich beendet

INFO

Diese Meldung wird angezeigt, wenn ein „vServer-Stopp“-Vorgang erfolgreich ist.

Verwenden Sie den Befehl „vserver start“, um den Datenzugriff auf einer Speicher-VM zu starten.

Knotenpanik

WARNING (Warnung)

Dieses Ereignis wird ausgelöst, wenn eine Panik auftritt

Wenden Sie sich an den NetApp Kundensupport.

Zurück nach oben

Anti-Ransomware-Protokollmonitore

Monitorname

Schwere

Beschreibung

Korrekturmaßnahme

Storage VM Anti-Ransomware-Überwachung deaktiviert

WARNING (Warnung)

Die Anti-Ransomware-Überwachung für die Speicher-VM ist deaktiviert. Aktivieren Sie Anti-Ransomware, um die Speicher-VM zu schützen.

Keine

Storage VM Anti-Ransomware-Überwachung aktiviert (Lernmodus)

INFO

Die Anti-Ransomware-Überwachung für die Speicher-VM ist im Lernmodus aktiviert.

Keine

Volumen-Anti-Ransomware-Überwachung aktiviert

INFO

Die Anti-Ransomware-Überwachung für das Volume ist aktiviert.

Keine

Volumen-Anti-Ransomware-Überwachung deaktiviert

WARNING (Warnung)

Die Anti-Ransomware-Überwachung für das Volume ist deaktiviert. Aktivieren Sie Anti-Ransomware, um das Volume zu schützen.

Keine

Volumen-Anti-Ransomware-Überwachung aktiviert (Lernmodus)

INFO

Die Anti-Ransomware-Überwachung für das Volume ist im Lernmodus aktiviert.

Keine

Volumen-Anti-Ransomware-Überwachung angehalten (Lernmodus)

WARNING (Warnung)

Die Anti-Ransomware-Überwachung für das Volume wird im Lernmodus angehalten.

Keine

Volumen-Anti-Ransomware-Überwachung angehalten

WARNING (Warnung)

Die Anti-Ransomware-Überwachung für das Volume ist angehalten.

Keine

Deaktivieren der Volumen-Anti-Ransomware-Überwachung

WARNING (Warnung)

Die Anti-Ransomware-Überwachung für das Volume wird deaktiviert.

Keine

Ransomware-Aktivität erkannt

KRITISCH

Um die Daten vor der erkannten Ransomware zu schützen, wurde eine Snapshot-Kopie erstellt, mit der die Originaldaten wiederhergestellt werden können. Ihr System generiert und überträgt eine AutoSupport oder „Call Home“-Nachricht an den technischen Support von NetApp und alle konfigurierten Ziele. AutoSupport -Nachrichten verbessern die Problembestimmung und -lösung.

Informationen zum Ergreifen von Abhilfemaßnahmen gegen Ransomware-Aktivitäten finden Sie im „FINAL-DOCUMENT-NAME“.

Zurück nach oben

FSx für NetApp ONTAP -Monitore

Monitorname

Schwellenwerte

Monitorbeschreibung

Korrekturmaßnahme

Die FSx-Volumenkapazität ist voll

Warnung @ > 85 %…Kritisch @ > 95 %

Um Serviceunterbrechungen zu minimieren, wenn ein kritischer Schwellenwert überschritten wird, sind sofortige Maßnahmen erforderlich: …1. Löschen Sie nicht mehr benötigte Daten, um Speicherplatz freizugeben.

FSx-Volumen, hohe Latenz

Warnung @ > 1000 µs…Kritisch @ > 2000 µs

Volumes sind Objekte, die den E/A-Verkehr bedienen, der häufig von leistungssensiblen Anwendungen wie DevOps-Anwendungen, Home-Verzeichnissen und Datenbanken gesteuert wird. Hohe Volumenlatenzen können dazu führen, dass die Anwendungen selbst darunter leiden und ihre Aufgaben nicht erfüllen können. Die Überwachung der Volume-Latenzen ist entscheidend, um eine konsistente Anwendungsleistung aufrechtzuerhalten.

Um Serviceunterbrechungen zu minimieren, wenn ein kritischer Schwellenwert überschritten wird, sind sofortige Maßnahmen erforderlich: …1. Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, um zu prüfen, ob diese zu einer Drosselung der Volume-Arbeitslast führen. Planen Sie, bald die folgenden Maßnahmen zu ergreifen, wenn der Warnschwellenwert überschritten wird: …1. Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, falls diese zu einer Drosselung der Volume-Arbeitslast führen. …2. Wenn der Knoten ebenfalls stark ausgelastet ist, verschieben Sie das Volume auf einen anderen Knoten oder reduzieren Sie die Gesamtarbeitslast des Knotens.

FSx-Volume-Inodes-Limit

Warnung @ > 85 %…Kritisch @ > 95 %

Volumes, die Dateien speichern, verwenden Indexknoten (Inode) zum Speichern von Dateimetadaten. Wenn ein Volume seine Inode-Zuweisung erschöpft, können ihm keine weiteren Dateien hinzugefügt werden. Eine Warnmeldung weist darauf hin, dass geplante Maßnahmen ergriffen werden sollten, um die Anzahl der verfügbaren Inodes zu erhöhen. Eine kritische Warnung weist darauf hin, dass die Erschöpfung des Dateilimits unmittelbar bevorsteht und Notfallmaßnahmen ergriffen werden sollten, um Inodes freizugeben und so die Servicekontinuität sicherzustellen.

Um Serviceunterbrechungen zu minimieren, wenn ein kritischer Schwellenwert überschritten wird, sind sofortige Maßnahmen erforderlich: …1. Erwägen Sie, den Inodes-Wert für das Volume zu erhöhen. Wenn der Inodes-Wert bereits das Maximum erreicht hat, sollten Sie das Volume in zwei oder mehr Volumes aufteilen, da das Dateisystem die maximale Größe überschritten hat. Planen Sie, bald die folgenden Maßnahmen zu ergreifen, wenn der Warnschwellenwert überschritten wird: …1. Erwägen Sie, den Inodes-Wert für das Volume zu erhöhen. Wenn der Inodes-Wert bereits das Maximum erreicht hat, sollten Sie das Volume in zwei oder mehr Volumes aufteilen, da das Dateisystem über die maximale Größe hinausgewachsen ist

FSx Volume Qtree-Kontingentüberbelegung

Warnung @ > 95 %…Kritisch @ > 100 %

Wenn ein kritischer Schwellenwert überschritten wird, sollten sofort Maßnahmen ergriffen werden, um die Dienstunterbrechung zu minimieren: 1. Löschen Sie nicht benötigte Daten. Wenn der Warnschwellenwert überschritten wird, sollten Sie den Speicherplatz des Datenträgers vergrößern.

Der reservierte Speicherplatz für FSx-Snapshots ist voll

Warnung @ > 90 %…Kritisch @ > 95 %

Um Serviceunterbrechungen zu minimieren, wenn ein kritischer Schwellenwert überschritten wird, sind sofortige Maßnahmen erforderlich: …1. Erwägen Sie die Konfiguration von Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist … 2. Erwägen Sie, einige ältere Snapshots zu löschen, die möglicherweise nicht mehr benötigt werden, um Speicherplatz freizugeben. Planen Sie, bald die folgenden Maßnahmen zu ergreifen, wenn der Warnschwellenwert überschritten wird: …1. Erwägen Sie, den Snapshot-Reservespeicherplatz innerhalb des Volumes zu erhöhen, um dem Wachstum Rechnung zu tragen…2. Erwägen Sie die Konfiguration von Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist

FSx Volume Cache Miss Ratio

Warnung @ > 95 %…Kritisch @ > 100 %

Wenn ein kritischer Schwellenwert überschritten wird, sollten sofort Maßnahmen ergriffen werden, um die Dienstunterbrechung zu minimieren: 1. Verschieben Sie einige Workloads vom Knoten des Volumes, um die E/A-Last 2 zu reduzieren. Reduzieren Sie die Nachfrage nach Workloads mit niedrigerer Priorität auf demselben Knoten über QoS-Grenzwerte. Erwägen Sie sofortige Maßnahmen, wenn der Warnschwellenwert überschritten wird: 1. Verschieben Sie einige Workloads vom Knoten des Volumes, um die E/A-Last 2 zu reduzieren. Verringern Sie die Nachfrage nach Workloads mit niedrigerer Priorität auf demselben Knoten über QoS-Grenzwerte 3. Ändern Sie die Arbeitslasteigenschaften (Blockgröße, Anwendungs-Caching usw.)

Zurück nach oben

K8s-Monitore

Monitorname

Beschreibung

Korrekturmaßnahmen

Schweregrad/Schwellenwert

Hohe Latenz bei persistentem Volume

Hohe, anhaltende Volumenlatenzen können dazu führen, dass die Anwendungen selbst darunter leiden und ihre Aufgaben nicht erfüllen können. Die Überwachung dauerhafter Volume-Latenzen ist entscheidend, um eine konsistente Anwendungsleistung aufrechtzuerhalten. Je nach Medientyp sind folgende Latenzen zu erwarten: SSD bis zu 1–2 Millisekunden, SAS bis zu 8–10 Millisekunden und SATA-HDD 17–20 Millisekunden.

Sofortmaßnahmen Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen in Betracht ziehen, um Dienstunterbrechungen zu minimieren: Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, falls diese zu einer Drosselung der Volume-Arbeitslast führen. Bald zu ergreifende Maßnahmen Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Wenn auch der Speicherpool stark ausgelastet ist, verschieben Sie das Volume in einen anderen Speicherpool. 2. Wenn dem Volume eine QoS-Richtlinie zugewiesen ist, prüfen Sie dessen Grenzwerte, um zu prüfen, ob diese zu einer Drosselung der Volume-Arbeitslast führen. 3. Wenn auch der Controller stark ausgelastet ist, verschieben Sie das Volume auf einen anderen Controller oder reduzieren Sie die Gesamtarbeitslast des Controllers.

Warnung @ > 6.000 μs Kritisch @ > 12.000 μs

Cluster-Speichersättigung hoch

Die Sättigung des dem Cluster zuweisbaren Speichers ist hoch. Die CPU-Sättigung des Clusters wird berechnet als Summe der Speichernutzung geteilt durch die Summe des zuweisbaren Speichers aller K8s-Knoten.

Knoten hinzufügen. Reparieren Sie alle nicht geplanten Knoten. Passen Sie die Größe der Pods an, um Speicher auf Knoten freizugeben.

Warnung @ > 80 % Kritisch @ > 90 %

POD-Anhängen fehlgeschlagen

Diese Warnung wird angezeigt, wenn ein Volume-Anhang mit POD fehlgeschlagen ist.

Warnung

Hohe Neuübertragungsrate

Hohe TCP-Neuübertragungsrate

Auf Netzwerküberlastung prüfen – Identifizieren Sie Arbeitslasten, die viel Netzwerkbandbreite verbrauchen. Überprüfen Sie, ob die CPU-Auslastung des Pods hoch ist. Überprüfen Sie die Hardware-Netzwerkleistung.

Warnung @ > 10 % Kritisch @ > 25 %

Knotendateisystemkapazität hoch

- Erhöhen Sie die Größe der Knotenfestplatten, um sicherzustellen, dass ausreichend Platz für die Anwendungsdateien vorhanden ist. - Reduzieren Sie die Verwendung von Anwendungsdateien.

Warnung @ > 80 % Kritisch @ > 90 %

Hoher Netzwerk-Jitter bei der Arbeitslast

Hoher TCP-Jitter (hohe Latenz-/Antwortzeitschwankungen)

Überprüfen Sie, ob das Netzwerk überlastet ist. Identifizieren Sie Workloads, die viel Netzwerkbandbreite verbrauchen. Überprüfen Sie, ob die CPU-Auslastung des Pods hoch ist. Überprüfen Sie die Leistung des Hardwarenetzwerks

Warnung @ > 30 ms Kritisch @ > 50 ms

Durchsatz persistenter Volumes

MBPS-Schwellenwerte für persistente Volumes können verwendet werden, um einen Administrator zu warnen, wenn persistente Volumes vordefinierte Leistungserwartungen überschreiten, was sich möglicherweise auf andere persistente Volumes auswirkt. Durch die Aktivierung dieses Monitors werden Warnungen generiert, die für das typische Durchsatzprofil persistenter Volumes auf SSDs geeignet sind. Dieser Monitor deckt alle persistenten Volumes Ihres Mandanten ab. Die Warn- und kritischen Schwellenwerte können basierend auf Ihren Überwachungszielen angepasst werden, indem Sie diesen Monitor duplizieren und für Ihre Speicherklasse geeignete Schwellenwerte festlegen. Ein duplizierter Monitor kann außerdem auf eine Teilmenge der persistenten Volumes Ihres Mandanten ausgerichtet werden.

Sofortmaßnahmen Wenn ein kritischer Schwellenwert überschritten wird, planen Sie Sofortmaßnahmen, um die Dienstunterbrechung zu minimieren: 1. Führen Sie QoS-MBPS-Grenzwerte für das Volume ein. 2. Überprüfen Sie die Anwendung, die die Arbeitslast auf dem Datenträger steuert, auf Anomalien. Bald zu ergreifende Maßnahmen Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden sofortigen Maßnahmen: 1. Führen Sie QoS-MBPS-Grenzwerte für das Volume ein. 2. Überprüfen Sie die Anwendung, die die Arbeitslast auf dem Datenträger steuert, auf Anomalien.

Warnung @ > 10.000 MB/s Kritisch @ > 15.000 MB/s

Container, dem die Gefahr besteht, OOM zu werden, wurden getötet

Die Speichergrenzen des Containers sind zu niedrig eingestellt. Es besteht die Gefahr einer Räumung des Containers (Out of Memory Kill).

Erhöhen Sie die Speichergrenzen des Containers.

Warnung @ > 95 %

Arbeitsbelastung reduziert

Die Arbeitslast hat keine gesunden Pods.

Kritisch @ < 1

Bindung des Anspruchs auf persistentes Volume fehlgeschlagen

Diese Warnung wird angezeigt, wenn eine Bindung auf einem PVC fehlschlägt.

Warnung

ResourceQuota-Speicherlimits werden bald überschritten

Die Speichergrenzen für den Namespace überschreiten bald ResourceQuota

Warnung @ > 80 % Kritisch @ > 90 %

ResourceQuota-Speicheranforderungen werden bald überschritten

Speicheranforderungen für Namespace überschreiten bald ResourceQuota

Warnung @ > 80 % Kritisch @ > 90 %

Knotenerstellung fehlgeschlagen

Der Knoten konnte aufgrund eines Konfigurationsfehlers nicht geplant werden.

Suchen Sie im Kubernetes-Ereignisprotokoll nach der Ursache des Konfigurationsfehlers.

Kritisch

Die Wiederherstellung des persistenten Volumes ist fehlgeschlagen

Die automatische Wiederherstellung des Datenträgers ist fehlgeschlagen.

Warnung @ > 0 B

CPU-Drosselung für Container

Die CPU-Grenzen des Containers sind zu niedrig eingestellt. Containerprozesse werden verlangsamt.

Erhöhen Sie die CPU-Grenzen des Containers.

Warnung @ > 95 % Kritisch @ > 98 %

Service Load Balancer konnte nicht gelöscht werden

Warnung

Persistente Volume-IOPS

IOPS-Schwellenwerte für persistente Volumes können verwendet werden, um einen Administrator zu warnen, wenn persistente Volumes vordefinierte Leistungserwartungen überschreiten. Durch die Aktivierung dieses Monitors werden Warnungen generiert, die für das typische IOPS-Profil von Persistenzvolumes geeignet sind. Dieser Monitor deckt alle persistenten Volumes Ihres Mandanten ab. Die Warn- und kritischen Schwellenwerte können basierend auf Ihren Überwachungszielen angepasst werden, indem Sie diesen Monitor duplizieren und für Ihre Arbeitslast geeignete Schwellenwerte festlegen.

Sofortmaßnahmen Wenn ein kritischer Schwellenwert überschritten wird, planen Sie Sofortmaßnahmen, um die Dienstunterbrechung zu minimieren: 1. Führen Sie QoS-IOPS-Grenzwerte für das Volume ein. 2. Überprüfen Sie die Anwendung, die die Arbeitslast auf dem Datenträger steuert, auf Anomalien. Bald zu ergreifende Maßnahmen Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden Sofortmaßnahmen: 1. Führen Sie QoS-IOPS-Grenzwerte für das Volume ein. 2. Überprüfen Sie die Anwendung, die die Arbeitslast auf dem Datenträger steuert, auf Anomalien.

Warnung bei > 20.000 IO/s Kritisch bei > 25.000 IO/s

Service Load Balancer konnte nicht aktualisiert werden

Warnung

POD-Mount fehlgeschlagen

Diese Warnung wird angezeigt, wenn die Bereitstellung eines POD fehlgeschlagen ist.

Warnung

Knoten-PID-Druck

Die Anzahl der verfügbaren Prozesskennungen auf dem (Linux-)Knoten ist unter einen Räumungsschwellenwert gefallen.

Suchen und beheben Sie Pods, die viele Prozesse generieren und dem Knoten die verfügbaren Prozess-IDs vorenthalten. Richten Sie PodPidsLimit ein, um Ihren Knoten vor Pods oder Containern zu schützen, die zu viele Prozesse erzeugen.

Kritisch @ > 0

Fehler beim Abrufen des Pod-Images

Kubernetes konnte das Pod-Container-Image nicht abrufen.

- Stellen Sie sicher, dass das Bild des Pods in der Pod-Konfiguration richtig geschrieben ist. - Überprüfen Sie, ob das Bild-Tag in Ihrer Registrierung vorhanden ist. – Überprüfen Sie die Anmeldeinformationen für die Image-Registrierung. - Überprüfen Sie, ob Probleme mit der Registrierungskonnektivität vorliegen. - Stellen Sie sicher, dass Sie die von öffentlichen Registrierungsanbietern auferlegten Ratenbeschränkungen nicht erreichen.

Warnung

Job läuft zu lange

Der Job läuft zu lange

Warnung @ > 1 Std. Kritisch @ > 5 Std.

Knotenspeicher hoch

Die Knotenspeichernutzung ist hoch

Knoten hinzufügen. Reparieren Sie alle nicht geplanten Knoten. Passen Sie die Größe der Pods an, um Speicher auf Knoten freizugeben.

Warnung @ > 85 % Kritisch @ > 90 %

ResourceQuota-CPU-Grenzwerte werden bald überschritten

CPU-Grenzwerte für Namespace überschreiten bald ResourceQuota

Warnung @ > 80 % Kritisch @ > 90 %

Pod Crash Loop Backoff

Pod ist abgestürzt und hat mehrere Neustartversuche unternommen.

Kritisch @ > 3

Knoten-CPU hoch

Die CPU-Auslastung des Knotens ist hoch.

Knoten hinzufügen. Reparieren Sie alle nicht geplanten Knoten. Passen Sie die Größe der Pods an, um CPU-Leistung auf Knoten freizugeben.

Warnung @ > 80 % Kritisch @ > 90 %

Arbeitslast-Netzwerklatenz RTT Hoch

Hohe TCP RTT (Round Trip Time)-Latenz

Auf Netzwerküberlastung prüfen ▒ Identifizieren Sie Arbeitslasten, die viel Netzwerkbandbreite verbrauchen. Überprüfen Sie, ob die CPU-Auslastung des Pods hoch ist. Überprüfen Sie die Hardware-Netzwerkleistung.

Warnung @ > 150 ms Kritisch @ > 300 ms

Auftrag fehlgeschlagen

Der Auftrag wurde aufgrund eines Knotenabsturzes oder Neustarts, einer Ressourcenerschöpfung, einer Auftragszeitüberschreitung oder eines Pod-Planungsfehlers nicht erfolgreich abgeschlossen.

Überprüfen Sie die Kubernetes-Ereignisprotokolle auf Fehlerursachen.

Warnung @ > 1

Dauerhaftes Volumen in wenigen Tagen voll

Der Speicherplatz des persistenten Volumes wird in einigen Tagen erschöpft sein

-Erhöhen Sie die Volumegröße, um sicherzustellen, dass ausreichend Platz für die Anwendungsdateien vorhanden ist. - Reduzieren Sie die in Anwendungen gespeicherte Datenmenge.

Warnung @ < 8 Tage Kritisch @ < 3 Tage

Knotenspeicherdruck

Dem Knoten geht der Speicher aus. Der verfügbare Speicher hat den Auslagerungsschwellenwert erreicht.

Knoten hinzufügen. Reparieren Sie alle nicht geplanten Knoten. Passen Sie die Größe der Pods an, um Speicher auf Knoten freizugeben.

Kritisch @ > 0

Knoten nicht bereit

Knoten ist seit 5 Minuten nicht bereit

Überprüfen Sie, ob der Knoten über genügend CPU-, Speicher- und Festplattenressourcen verfügt. Überprüfen Sie die Netzwerkkonnektivität des Knotens. Überprüfen Sie die Kubernetes-Ereignisprotokolle auf Fehlerursachen.

Kritisch @ < 1

Hohe persistente Volume-Kapazität

Die genutzte Kapazität des Persistent Volume-Backends ist hoch.

- Erhöhen Sie die Volumegröße, um sicherzustellen, dass ausreichend Platz für die Anwendungsdateien vorhanden ist. - Reduzieren Sie die in Anwendungen gespeicherte Datenmenge.

Warnung @ > 80 % Kritisch @ > 90 %

Service Load Balancer konnte nicht erstellt werden

Erstellen des Service Load Balancers fehlgeschlagen

Kritisch

Workload-Replikat-Missverhältnis

Einige Pods sind derzeit nicht für eine Bereitstellung oder ein DaemonSet verfügbar.

Warnung @ > 1

ResourceQuota-CPU-Anfragen werden bald überschritten

CPU-Anforderungen für Namespace überschreiten bald ResourceQuota

Warnung @ > 80 % Kritisch @ > 90 %

Hohe Neuübertragungsrate

Hohe TCP-Neuübertragungsrate

Warnung @ > 10 % Kritisch @ > 25 %

Knotenplattendruck

Der verfügbare Speicherplatz und die Inodes im Root-Dateisystem oder im Image-Dateisystem des Knotens haben einen Räumungsschwellenwert erreicht.

- Erhöhen Sie die Größe der Knotenfestplatten, um sicherzustellen, dass ausreichend Platz für die Anwendungsdateien vorhanden ist. - Reduzieren Sie die Verwendung von Anwendungsdateien.

Kritisch @ > 0

Cluster-CPU-Sättigung hoch

Die dem Cluster zuweisbare CPU-Sättigung ist hoch. Die CPU-Sättigung des Clusters wird berechnet als Summe der CPU-Auslastung geteilt durch die Summe der zuweisbaren CPUs aller K8s-Knoten.

Knoten hinzufügen. Reparieren Sie alle nicht geplanten Knoten. Passen Sie die Größe der Pods an, um CPU-Leistung auf Knoten freizugeben.

Warnung @ > 80 % Kritisch @ > 90 %

Zurück nach oben

Änderungsprotokoll-Monitore

Monitorname

Schwere

Monitorbeschreibung

Internes Volume entdeckt

Informativ

Diese Meldung wird angezeigt, wenn ein internes Volume erkannt wird.

Internes Volumen geändert

Informativ

Diese Meldung wird angezeigt, wenn ein internes Volume geändert wird.

Speicherknoten erkannt

Informativ

Diese Meldung wird angezeigt, wenn ein Speicherknoten erkannt wird.

Speicherknoten entfernt

Informativ

Diese Meldung wird angezeigt, wenn ein Speicherknoten entfernt wird.

Speicherpool erkannt

Informativ

Diese Meldung wird angezeigt, wenn ein Speicherpool erkannt wird.

Virtuelle Speichermaschine erkannt

Informativ

Diese Meldung wird angezeigt, wenn eine Storage Virtual Machine erkannt wird.

Geänderte virtuelle Speichermaschine

Informativ

Diese Meldung wird angezeigt, wenn eine Storage Virtual Machine geändert wird.

Zurück nach oben

Datenerfassungsmonitore

Monitorname

Beschreibung

Korrekturmaßnahme

Abschaltung der Erfassungseinheit

Data Infrastructure Insights Acquisition Units werden im Rahmen von Upgrades regelmäßig neu gestartet, um neue Funktionen einzuführen. Dies geschieht in einer typischen Umgebung einmal im Monat oder seltener. Auf eine Warnmeldung, dass eine Erfassungseinheit heruntergefahren wurde, sollte bald darauf eine Lösung folgen, in der darauf hingewiesen wird, dass die neu gestartete Erfassungseinheit eine Registrierung bei Data Infrastructure Insights abgeschlossen hat. Normalerweise dauert dieser Zyklus vom Herunterfahren bis zur Registrierung 5 bis 15 Minuten.

Wenn der Alarm häufig auftritt oder länger als 15 Minuten anhält, überprüfen Sie den Betrieb des Systems, auf dem die Erfassungseinheit gehostet wird, des Netzwerks und aller Proxys, die die AU mit dem Internet verbinden.

Collector fehlgeschlagen

Bei der Abfrage eines Datensammlers ist eine unerwartete Fehlersituation aufgetreten.

Besuchen Sie die Datensammlerseite in Data Infrastructure Insights, um mehr über die Situation zu erfahren.

Sammlerwarnung

Dieser Alarm kann typischerweise aufgrund einer fehlerhaften Konfiguration des Datensammlers oder des Zielsystems auftreten. Überprüfen Sie die Konfigurationen erneut, um zukünftige Warnungen zu verhindern. Es kann auch daran liegen, dass unvollständige Daten abgerufen wurden, obwohl der Datensammler alle Daten gesammelt hat, die er konnte. Dies kann passieren, wenn sich die Situation während der Datenerfassung ändert (z. B. wenn eine zu Beginn der Datenerfassung vorhandene virtuelle Maschine während der Datenerfassung und vor der Erfassung ihrer Daten gelöscht wird).

Überprüfen Sie die Konfiguration des Datensammlers oder Zielsystems. Beachten Sie, dass der Monitor für Collector-Warnungen mehr Warnungen senden kann als andere Monitortypen. Daher wird empfohlen, keine Warnungsempfänger festzulegen, es sei denn, Sie führen eine Fehlerbehebung durch.

Zurück nach oben

Sicherheitsmonitore

Monitorname

Schwelle

Monitorbeschreibung

Korrekturmaßnahme

AutoSupport HTTPS-Transport deaktiviert

Warnung @ < 1

AutoSupport unterstützt HTTPS, HTTP und SMTP als Transportprotokolle. Aufgrund der sensiblen Natur von AutoSupport Nachrichten empfiehlt NetApp dringend, HTTPS als Standardtransportprotokoll zum Senden von AutoSupport -Nachrichten an den NetApp Support zu verwenden.

Um HTTPS als Transportprotokoll für AutoSupport Nachrichten festzulegen, führen Sie den folgenden ONTAP Befehl aus: …system node autosupport modify -transport https

Cluster Unsichere Chiffren für SSH

Warnung @ < 1

Zeigt an, dass SSH unsichere Chiffren verwendet, beispielsweise Chiffren, die mit *cbc beginnen.

Um die CBC-Chiffren zu entfernen, führen Sie den folgenden ONTAP Befehl aus: …security ssh remove -vserver <admin vserver> -ciphers aes256-cbc,aes192-cbc,aes128-cbc,3des-cbc

Cluster-Anmeldebanner deaktiviert

Warnung @ < 1

Zeigt an, dass das Anmeldebanner für Benutzer deaktiviert ist, die auf das ONTAP -System zugreifen. Das Anzeigen eines Anmeldebanners ist hilfreich, um Erwartungen hinsichtlich des Zugriffs auf das System und seiner Nutzung zu wecken.

Um das Anmeldebanner für einen Cluster zu konfigurieren, führen Sie den folgenden ONTAP -Befehl aus: …security login banner modify -vserver <admin svm> -message "Access restricted to authorized users"

Cluster-Peer-Kommunikation nicht verschlüsselt

Warnung @ < 1

Wenn Sie Daten für die Notfallwiederherstellung, das Caching oder die Sicherung replizieren, müssen Sie diese Daten während des Transports über die Leitung von einem ONTAP Cluster zu einem anderen schützen. Die Verschlüsselung muss sowohl auf dem Quell- als auch auf dem Zielcluster konfiguriert werden.

Um die Verschlüsselung für Cluster-Peer-Beziehungen zu aktivieren, die vor ONTAP 9.6 erstellt wurden, müssen der Quell- und der Zielcluster auf 9.6 aktualisiert werden. Verwenden Sie dann den Befehl „Cluster Peer Modify“, um sowohl die Quell- als auch die Ziel-Cluster-Peers so zu ändern, dass sie die Cluster-Peering-Verschlüsselung verwenden. … Weitere Informationen finden Sie im NetApp Security Hardening Guide für ONTAP 9.

Standardmäßiger lokaler Administratorbenutzer aktiviert

Warnung @ > 0

NetApp empfiehlt, alle nicht benötigten Standard-Admin-Benutzerkonten (integriert) mit dem Sperrbefehl zu sperren (deaktivieren). Dabei handelt es sich in erster Linie um Standardkonten, deren Passwörter nie aktualisiert oder geändert wurden.

Um das integrierte „Admin“-Konto zu sperren, führen Sie den folgenden ONTAP Befehl aus: …security login lock -username admin

FIPS-Modus deaktiviert

Warnung @ < 1

Wenn die FIPS 140-2-Konformität aktiviert ist, werden TLSv1 und SSLv3 deaktiviert und nur TLSv1.1 und TLSv1.2 bleiben aktiviert. ONTAP verhindert, dass Sie TLSv1 und SSLv3 aktivieren, wenn die FIPS 140-2-Konformität aktiviert ist.

Um die FIPS 140-2-Konformität auf einem Cluster zu aktivieren, führen Sie den folgenden ONTAP -Befehl im erweiterten Berechtigungsmodus aus: …security config modify -interface SSL -is-fips-enabled true

Protokollweiterleitung nicht verschlüsselt

Warnung @ < 1

Das Auslagern von Syslog-Informationen ist notwendig, um den Umfang oder die Auswirkungen einer Sicherheitsverletzung auf ein einzelnes System oder eine einzelne Lösung zu beschränken. Daher empfiehlt NetApp , Syslog-Informationen sicher an einen sicheren Speicher- oder Aufbewahrungsort auszulagern.

Sobald ein Protokollweiterleitungsziel erstellt wurde, kann sein Protokoll nicht mehr geändert werden. Um zu einem verschlüsselten Protokoll zu wechseln, löschen Sie das Protokollweiterleitungsziel und erstellen Sie es mit dem folgenden ONTAP -Befehl neu: …cluster log-forwarding create -destination <Ziel-IP> -protocol tcp-encrypted

MD5-gehashtes Passwort

Warnung @ > 0

NetApp empfiehlt dringend, für ONTAP Benutzerkontenkennwörter die sicherere Hash-Funktion SHA-512 zu verwenden. Konten, die die weniger sichere MD5-Hashfunktion verwenden, sollten zur SHA-512-Hashfunktion migrieren.

NetApp empfiehlt dringend, Benutzerkonten auf die sicherere SHA-512-Lösung zu migrieren, indem Benutzer ihre Passwörter ändern. …Um Konten mit Passwörtern zu sperren, die die MD5-Hash-Funktion verwenden, führen Sie den folgenden ONTAP Befehl aus: …security login lock -vserver * -username * -hash-function md5

Es sind keine NTP-Server konfiguriert

Warnung @ < 1

Zeigt an, dass für den Cluster keine NTP-Server konfiguriert sind. Aus Redundanzgründen und für optimalen Service empfiehlt NetApp , dem Cluster mindestens drei NTP-Server zuzuordnen.

Um einen NTP-Server mit dem Cluster zu verknüpfen, führen Sie den folgenden ONTAP Befehl aus: cluster time-service ntp server create -server <ntp server host name or ip address>

Die Anzahl der NTP-Server ist niedrig

Warnung @ < 3

Zeigt an, dass der Cluster weniger als 3 konfigurierte NTP-Server hat. Aus Redundanzgründen und für optimalen Service empfiehlt NetApp , dem Cluster mindestens drei NTP-Server zuzuordnen.

Um einen NTP-Server mit dem Cluster zu verknüpfen, führen Sie den folgenden ONTAP Befehl aus: …cluster time-service ntp server create -server <ntp server host name or ip address>

Remote Shell aktiviert

Warnung @ > 0

Remote Shell ist keine sichere Methode zum Einrichten des Befehlszeilenzugriffs auf die ONTAP Lösung. Für einen sicheren Fernzugriff sollte Remote Shell deaktiviert werden.

NetApp empfiehlt Secure Shell (SSH) für sicheren Remote-Zugriff. …Um Remote Shell auf einem Cluster zu deaktivieren, führen Sie den folgenden ONTAP -Befehl im erweiterten Berechtigungsmodus aus: …security protocol modify -application rsh- enabled false

Speicher-VM-Auditprotokoll deaktiviert

Warnung @ < 1

Zeigt an, dass die Audit-Protokollierung für SVM deaktiviert ist.

Um das Audit-Protokoll für einen virtuellen Server zu konfigurieren, führen Sie den folgenden ONTAP -Befehl aus: …vserver audit enable -vserver <svm>

Unsichere Verschlüsselungsverfahren für Storage-VMs für SSH

Warnung @ < 1

Zeigt an, dass SSH unsichere Chiffren verwendet, beispielsweise Chiffren, die mit *cbc beginnen.

Um die CBC-Chiffren zu entfernen, führen Sie den folgenden ONTAP Befehl aus: …security ssh remove -vserver <vserver> -ciphers aes256-cbc,aes192-cbc,aes128-cbc,3des-cbc

Storage VM-Anmeldebanner deaktiviert

Warnung @ < 1

Zeigt an, dass das Anmeldebanner für Benutzer deaktiviert ist, die auf SVMs im System zugreifen. Das Anzeigen eines Anmeldebanners ist hilfreich, um Erwartungen hinsichtlich des Zugriffs auf das System und seiner Nutzung zu wecken.

Um das Anmeldebanner für einen Cluster zu konfigurieren, führen Sie den folgenden ONTAP -Befehl aus: …security login banner modify -vserver <svm> -message "Access restricted to authorized users"

Telnet-Protokoll aktiviert

Warnung @ > 0

Telnet ist keine sichere Methode zum Herstellen eines Befehlszeilenzugriffs auf die ONTAP Lösung. Für einen sicheren Fernzugriff sollte Telnet deaktiviert werden.

NetApp empfiehlt Secure Shell (SSH) für sicheren Fernzugriff. Um Telnet auf einem Cluster zu deaktivieren, führen Sie den folgenden ONTAP -Befehl im erweiterten Berechtigungsmodus aus: …security protocol modify -application telnet -enabled false

Zurück nach oben

Datenschutzmonitore

Monitorname

Schwellenwerte

Monitorbeschreibung

Korrekturmaßnahme

Nicht genügend Speicherplatz für die LUN-Snapshot-Kopie

(Filter contains_luns = Ja) Warnung @ > 95 %…Kritisch @ > 100 %

Die Speicherkapazität eines Datenträgers ist zum Speichern von Anwendungs- und Kundendaten erforderlich. Ein Teil dieses Speicherplatzes, der sogenannte reservierte Snapshot-Speicherplatz, wird zum Speichern von Snapshots verwendet, die einen lokalen Schutz der Daten ermöglichen. Je mehr neue und aktualisierte Daten im ONTAP Volume gespeichert werden, desto mehr Snapshot-Kapazität wird verwendet und desto weniger Snapshot-Speicherkapazität steht für zukünftige neue oder aktualisierte Daten zur Verfügung. Wenn die Snapshot-Datenkapazität innerhalb eines Volumes den gesamten Snapshot-Reservespeicherplatz erreicht, kann dies dazu führen, dass der Kunde keine neuen Snapshot-Daten speichern kann und der Schutzgrad der Daten in den LUNs des Volumes verringert wird. Durch die Überwachung der Snapshot-Kapazität des verwendeten Volumes wird die Kontinuität der Datendienste sichergestellt.

Sofortmaßnahmen Wenn ein kritischer Schwellenwert überschritten wird, sollten Sie sofortige Maßnahmen in Betracht ziehen, um die Dienstunterbrechung zu minimieren: 1. Konfigurieren Sie Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist. 2. Löschen Sie einige ältere, nicht mehr benötigte Snapshots, um Speicherplatz freizugeben. Bald zu ergreifende Maßnahmen Wenn der Warnschwellenwert überschritten wird, planen Sie die folgenden sofortigen Maßnahmen: 1. Erhöhen Sie den Snapshot-Reservespeicherplatz innerhalb des Volumes, um dem Wachstum Rechnung zu tragen. 2. Konfigurieren Sie Snapshots, um den Datenspeicherplatz im Volume zu nutzen, wenn die Snapshot-Reserve voll ist.

SnapMirror -Beziehungsverzögerung

Warnung bei > 150 % … Kritisch bei > 300 %

Die SnapMirror Beziehungsverzögerung ist die Differenz zwischen dem Zeitstempel des Snapshots und der Zeit auf dem Zielsystem. Der lag_time_percent ist das Verhältnis der Verzögerungszeit zum Zeitplanintervall der SnapMirror -Richtlinie. Wenn die Verzögerungszeit dem Zeitplanintervall entspricht, beträgt der lag_time_percent 100 %. Wenn die SnapMirror -Richtlinie keinen Zeitplan hat, wird lag_time_percent nicht berechnet.

Überwachen Sie den SnapMirror -Status mit dem Befehl „snapmirror show“. Überprüfen Sie den SnapMirror Übertragungsverlauf mit dem Befehl „snapmirror show-history“

Zurück nach oben

Cloud Volume (CVO)-Monitore

Monitorname

CI-Schweregrad

Monitorbeschreibung

Korrekturmaßnahme

CVO-Festplatte außer Betrieb

INFO

Dieses Ereignis tritt ein, wenn eine Festplatte außer Betrieb genommen wird, weil sie als fehlerhaft markiert wurde, bereinigt wird oder in das Wartungscenter gelangt ist.

Keine

CVO-Rückgabe des Speicherpools fehlgeschlagen

KRITISCH

Dieses Ereignis tritt während der Migration eines Aggregats im Rahmen einer Speicher-Failover-(SFO)-Rückgabe auf, wenn der Zielknoten die Objektspeicher nicht erreichen kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: Überprüfen Sie mit dem Befehl „Network Interface Show“, ob Ihr Intercluster-LIF online und funktionsfähig ist. Überprüfen Sie die Netzwerkkonnektivität zum Objektspeicherserver, indem Sie den Befehl „Ping“ über den Intercluster-LIF des Zielknotens verwenden. Überprüfen Sie mit dem Befehl „aggregate object-store config show“, ob sich die Konfiguration Ihres Objektspeichers geändert hat und ob die Anmelde- und Verbindungsinformationen noch immer korrekt sind. Alternativ können Sie den Fehler überschreiben, indem Sie für den Parameter „require-partner-waiting“ des Giveback-Befehls „false“ angeben. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

CVO HA-Verbindung ausgefallen

WARNING (Warnung)

Die Hochverfügbarkeitsverbindung (HA) ist ausgefallen. Risiko eines Dienstausfalls, wenn kein Failover verfügbar ist.

Korrekturmaßnahmen hängen von der Anzahl und Art der von der Plattform unterstützten HA-Verbindungslinks sowie vom Grund für den Verbindungsausfall ab. Wenn die Links ausgefallen sind: Überprüfen Sie, ob beide Controller im HA-Paar betriebsbereit sind. Stellen Sie bei extern angeschlossenen Links sicher, dass die Verbindungskabel richtig angeschlossen sind und dass die Small Form-Factor Pluggables (SFPs), falls vorhanden, richtig auf beiden Controllern sitzen. Deaktivieren und aktivieren Sie intern verbundene Links nacheinander mit den Befehlen „ic link off“ und „ic link on“. Wenn Links deaktiviert sind, aktivieren Sie die Links mit dem Befehl „ic link on“. Wenn kein Peer verbunden ist, deaktivieren und aktivieren Sie die Links nacheinander mit den Befehlen „ic link off“ und „ic link on“. Wenden Sie sich an den technischen Support von NetApp, wenn das Problem weiterhin besteht.

CVO-Maximale Sitzungen pro Benutzer überschritten

WARNING (Warnung)

Führen Sie die folgenden Korrekturmaßnahmen durch: Überprüfen Sie alle auf dem Client ausgeführten Anwendungen und beenden Sie alle, die nicht ordnungsgemäß funktionieren. Starten Sie den Client neu. Überprüfen Sie, ob das Problem durch eine neue oder vorhandene Anwendung verursacht wird: Wenn die Anwendung neu ist, legen Sie mit dem Befehl „cifs option modify -max-opens-same-file-per-tree“ einen höheren Schwellenwert für den Client fest. In einigen Fällen funktionieren die Clients wie erwartet, erfordern jedoch eine höhere Schwelle. Sie sollten über erweiterte Berechtigungen verfügen, um einen höheren Schwellenwert für den Client festzulegen. Wenn das Problem durch eine vorhandene Anwendung verursacht wird, liegt möglicherweise ein Problem mit dem Client vor. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

CVO NetBIOS-Namenskonflikt

KRITISCH

Führen Sie eine der folgenden Korrekturmaßnahmen durch: Wenn ein Konflikt im NetBIOS-Namen oder einem Alias vorliegt, führen Sie einen der folgenden Schritte aus: Löschen Sie den doppelten NetBIOS-Alias mit dem Befehl „vserver cifs delete -aliases alias -vserver vserver“. Benennen Sie einen NetBIOS-Alias um, indem Sie den doppelten Namen löschen und einen Alias mit einem neuen Namen hinzufügen, indem Sie den Befehl „vserver cifs create -aliases alias -vserver vserver“ verwenden. Wenn keine Aliase konfiguriert sind und ein Konflikt im NetBIOS-Namen vorliegt, benennen Sie den CIFS-Server mit den Befehlen „vserver cifs delete -vserver vserver“ und „vserver cifs create -cifs-server netbiosname“ um. HINWEIS: Durch das Löschen eines CIFS-Servers kann der Zugriff auf die Daten unzugänglich werden. Entfernen Sie den NetBIOS-Namen oder benennen Sie das NetBIOS auf dem Remotecomputer um.

CVO NFSv4-Speicherpool erschöpft

KRITISCH

Ein NFSv4-Speicherpool ist erschöpft.

Wenn der NFS-Server nach diesem Ereignis länger als 10 Minuten nicht reagiert, wenden Sie sich an den technischen Support von NetApp .

CVO-Knotenpanik

WARNING (Warnung)

Dieses Ereignis wird ausgelöst, wenn eine Panik auftritt

Wenden Sie sich an den NetApp Kundensupport.

CVO-Knoten-Root-Volume-Speicherplatz niedrig

KRITISCH

Führen Sie die folgenden Korrekturmaßnahmen durch: Schaffen Sie Speicherplatz auf dem Stammvolume, indem Sie alte Snapshot-Kopien löschen, nicht mehr benötigte Dateien aus dem Verzeichnis /mroot löschen oder die Kapazität des Stammvolumes erweitern. Starten Sie den Controller neu. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

CVO Nicht vorhandene Admin-Freigabe

KRITISCH

Vscan-Problem: Ein Client hat versucht, eine Verbindung zu einer nicht vorhandenen ONTAP_ADMIN$-Freigabe herzustellen.

Stellen Sie sicher, dass Vscan für die angegebene SVM-ID aktiviert ist. Durch die Aktivierung von Vscan auf einer SVM wird die ONTAP_ADMIN$-Freigabe automatisch für die SVM erstellt.

CVO Object Store Host nicht auflösbar

KRITISCH

Überprüfen Sie die DNS-Konfiguration, um sicherzustellen, dass der Hostname korrekt mit einer IP-Adresse konfiguriert ist.

CVO Object Store Intercluster LIF Down

KRITISCH

Führen Sie die folgenden Korrekturmaßnahmen durch: Überprüfen Sie den LIF-Status zwischen Clustern mit dem Befehl „network interface show -role intercluster“. Überprüfen Sie, ob das Intercluster-LIF richtig konfiguriert und betriebsbereit ist. Wenn kein Intercluster-LIF konfiguriert ist, fügen Sie es mit dem Befehl „network interface create -role intercluster“ hinzu.

CVO-Objektspeichersignatur stimmt nicht überein

KRITISCH

Die an den Objektspeicherserver gesendete Anforderungssignatur stimmt nicht mit der vom Client berechneten Signatur überein. Dies kann dazu führen, dass auf die Daten nicht zugegriffen werden kann.

Überprüfen Sie, ob der geheime Zugriffsschlüssel richtig konfiguriert ist. Wenn es richtig konfiguriert ist, wenden Sie sich an den technischen Support von NetApp , um Hilfe zu erhalten.

CVO QoS-Monitor-Speicher voll ausgelastet

KRITISCH

Der dynamische Speicher des QoS-Subsystems hat für die aktuelle Plattformhardware seine Grenze erreicht. Einige QoS-Funktionen sind möglicherweise nur eingeschränkt verfügbar.

Löschen Sie einige aktive Workloads oder Streams, um Speicher freizugeben. Verwenden Sie den Befehl „statistics show -object workload -counter ops“, um zu ermitteln, welche Workloads aktiv sind. Aktive Workloads zeigen Operationen ungleich Null. Verwenden Sie dann den Befehl „workload delete <workload_name>“ mehrmals, um bestimmte Workloads zu entfernen. Alternativ können Sie den Befehl „stream delete -workload <workload name> *“ verwenden, um die zugehörigen Streams aus der aktiven Workload zu löschen.

CVO READDIR-Zeitüberschreitung

KRITISCH

Führen Sie die folgenden Korrekturmaßnahmen durch: Suchen Sie nach spezifischen Informationen zu aktuellen Verzeichnissen, bei denen READDIR-Dateivorgänge abgelaufen sind, indem Sie den folgenden NodeShell-CLI-Befehl mit der Berechtigung „diag“ verwenden: wafl readdir notice show. Überprüfen Sie, ob Verzeichnisse als spärlich gekennzeichnet sind oder nicht: Wenn ein Verzeichnis als spärlich gekennzeichnet ist, wird empfohlen, den Inhalt des Verzeichnisses in ein neues Verzeichnis zu kopieren, um die spärliche Verzeichnisdatei zu entfernen. Wenn ein Verzeichnis nicht als spärlich gekennzeichnet ist und das Verzeichnis groß ist, wird empfohlen, die Größe der Verzeichnisdatei zu reduzieren, indem Sie die Anzahl der Dateieinträge im Verzeichnis verringern.

CVO-Verlagerung des Speicherpools fehlgeschlagen

KRITISCH

Dieses Ereignis tritt während der Verschiebung eines Aggregats auf, wenn der Zielknoten die Objektspeicher nicht erreichen kann.

Führen Sie die folgenden Korrekturmaßnahmen durch: Überprüfen Sie mit dem Befehl „Network Interface Show“, ob Ihr Intercluster-LIF online und funktionsfähig ist. Überprüfen Sie die Netzwerkkonnektivität zum Objektspeicherserver, indem Sie den Befehl „Ping“ über den Intercluster-LIF des Zielknotens verwenden. Überprüfen Sie mit dem Befehl „aggregate object-store config show“, ob sich die Konfiguration Ihres Objektspeichers geändert hat und ob die Anmelde- und Verbindungsinformationen noch immer korrekt sind. Alternativ können Sie den Fehler überschreiben, indem Sie den Parameter „override-destination-checks“ des Umzugsbefehls verwenden. Wenden Sie sich an den technischen Support von NetApp , um weitere Informationen oder Unterstützung zu erhalten.

CVO-Schattenkopie fehlgeschlagen

KRITISCH

Ein Volume Shadow Copy Service (VSS), ein Sicherungs- und Wiederherstellungsdienstvorgang von Microsoft Server, ist fehlgeschlagen.

Überprüfen Sie anhand der in der Ereignismeldung bereitgestellten Informationen Folgendes: Ist die Schattenkopiekonfiguration aktiviert? Sind die entsprechenden Lizenzen installiert? Auf welchen Freigaben wird der Schattenkopievorgang ausgeführt? Ist der Freigabename korrekt? Existiert der Freigabepfad? Wie ist der Status des Schattenkopiesatzes und seiner Schattenkopien?

CVO Storage VM-Stopp erfolgreich

INFO

Diese Meldung wird angezeigt, wenn ein „vServer-Stopp“-Vorgang erfolgreich ist.

Verwenden Sie den Befehl „vserver start“, um den Datenzugriff auf einer Speicher-VM zu starten.

CVO Zu viele CIFS-Authentifizierungen

WARNING (Warnung)

Viele Authentifizierungsverhandlungen fanden gleichzeitig statt. Von diesem Client liegen 256 unvollständige neue Sitzungsanforderungen vor.

Nicht zugewiesene CVO-Datenträger

INFO

Führen Sie die folgenden Korrekturmaßnahmen durch: Ermitteln Sie mit dem Befehl „disk show -n“, welche Datenträger nicht zugewiesen sind. Weisen Sie die Datenträger mit dem Befehl „disk assign“ einem System zu.

CVO: Unbefugter Benutzerzugriff auf die Admin-Freigabe

WARNING (Warnung)

Ein Client hat versucht, eine Verbindung zur privilegierten Freigabe ONTAP_ADMIN$ herzustellen, obwohl der angemeldete Benutzer kein zulässiger Benutzer ist.

Führen Sie die folgenden Korrekturmaßnahmen durch: Stellen Sie sicher, dass der angegebene Benutzername und die IP-Adresse in einem der aktiven Vscan-Scannerpools konfiguriert sind. Überprüfen Sie die aktuell aktive Scannerpool-Konfiguration mit dem Befehl „vserver vscan scanner pool show-active“.

CVO-Virus erkannt

WARNING (Warnung)

Ein Vscan-Server hat dem Speichersystem einen Fehler gemeldet. Dies weist normalerweise darauf hin, dass ein Virus gefunden wurde. Dieses Ereignis kann jedoch auch durch andere Fehler auf dem Vscan-Server verursacht werden. Der Clientzugriff auf die Datei wird verweigert. Der Vscan-Server kann die Datei je nach seinen Einstellungen und seiner Konfiguration bereinigen, unter Quarantäne stellen oder löschen.

CVO-Volumen offline

INFO

Diese Meldung zeigt an, dass ein Volume offline geschaltet wurde.

Bringen Sie das Volume wieder online.

CVO-Volumen beschränkt

INFO

Dieses Ereignis zeigt an, dass ein flexibles Volumen eingeschränkt wird.

Bringen Sie das Volume wieder online.

Zurück nach oben

SnapMirror für Business Continuity (SMBC) Mediator Log Monitors

Monitorname

Schwere

Monitorbeschreibung

Korrekturmaßnahme

ONTAP Mediator hinzugefügt

INFO

Diese Meldung wird angezeigt, wenn ONTAP Mediator erfolgreich zu einem Cluster hinzugefügt wurde.

Keine

ONTAP Mediator nicht zugänglich

KRITISCH

Diese Meldung wird angezeigt, wenn entweder der ONTAP Mediator einem anderen Zweck zugeführt wird oder das Mediator-Paket nicht mehr auf dem Mediator-Server installiert ist. Daher ist ein SnapMirror Failover nicht möglich.

Entfernen Sie die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

ONTAP Mediator entfernt

INFO

Diese Meldung wird angezeigt, wenn ONTAP Mediator erfolgreich aus einem Cluster entfernt wurde.

Keine

ONTAP Mediator nicht erreichbar

WARNING (Warnung)

Diese Meldung wird angezeigt, wenn der ONTAP Mediator in einem Cluster nicht erreichbar ist. Daher ist ein SnapMirror Failover nicht möglich.

Überprüfen Sie die Netzwerkkonnektivität zum ONTAP Mediator mithilfe der Befehle „Network Ping“ und „Network Traceroute“. Wenn das Problem weiterhin besteht, entfernen Sie die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

SMBC CA-Zertifikat abgelaufen

KRITISCH

Diese Meldung wird angezeigt, wenn das Zertifikat der ONTAP Mediator-Zertifizierungsstelle (CA) abgelaufen ist. Infolgedessen ist jegliche weitere Kommunikation mit dem ONTAP Mediator nicht möglich.

Entfernen Sie die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Aktualisieren Sie ein neues CA-Zertifikat auf dem ONTAP Mediator-Server. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

SMBC CA-Zertifikat läuft ab

WARNING (Warnung)

Diese Meldung wird angezeigt, wenn das Zertifikat der ONTAP Mediator-Zertifizierungsstelle (CA) innerhalb der nächsten 30 Tage abläuft.

Entfernen Sie vor Ablauf dieses Zertifikats die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Aktualisieren Sie ein neues CA-Zertifikat auf dem ONTAP Mediator-Server. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

SMBC-Client-Zertifikat abgelaufen

KRITISCH

Diese Meldung wird angezeigt, wenn das ONTAP Mediator-Client-Zertifikat abgelaufen ist. Infolgedessen ist jegliche weitere Kommunikation mit dem ONTAP Mediator nicht möglich.

SMBC-Client-Zertifikat läuft ab

WARNING (Warnung)

Diese Meldung wird angezeigt, wenn das Client-Zertifikat des ONTAP Mediators innerhalb der nächsten 30 Tage abläuft.

Entfernen Sie vor Ablauf dieses Zertifikats die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

SMBC-Beziehung nicht synchron Hinweis: UM hat diese nicht

KRITISCH

Diese Meldung wird angezeigt, wenn sich der Status einer SnapMirror for Business Continuity (SMBC)-Beziehung von „synchronisiert“ in „nicht synchron“ ändert. Dadurch wird der Datenschutz bei RPO=0 gestört.

Überprüfen Sie die Netzwerkverbindung zwischen dem Quell- und dem Zielvolume. Überwachen Sie den SMBC-Beziehungsstatus, indem Sie auf dem Ziel den Befehl „snapmirror show“ und auf der Quelle den Befehl „snapmirror list-destinations“ verwenden. Durch die automatische Neusynchronisierung wird versucht, die Beziehung wieder in den Status „synchronisiert“ zu versetzen. Wenn die Neusynchronisierung fehlschlägt, überprüfen Sie, ob alle Knoten im Cluster im Quorum sind und fehlerfrei funktionieren.

SMBC-Serverzertifikat abgelaufen

KRITISCH

Diese Meldung wird angezeigt, wenn das ONTAP Mediator-Serverzertifikat abgelaufen ist. Infolgedessen ist jegliche weitere Kommunikation mit dem ONTAP Mediator nicht möglich.

Entfernen Sie die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Aktualisieren Sie ein neues Serverzertifikat auf dem ONTAP Mediator-Server. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

SMBC-Serverzertifikat läuft ab

WARNING (Warnung)

Diese Meldung wird angezeigt, wenn das ONTAP Mediator-Serverzertifikat innerhalb der nächsten 30 Tage abläuft.

Entfernen Sie vor Ablauf dieses Zertifikats die Konfiguration des aktuellen ONTAP Mediators mit dem Befehl „snapmirror mediator remove“. Aktualisieren Sie ein neues Serverzertifikat auf dem ONTAP Mediator-Server. Konfigurieren Sie den Zugriff auf den ONTAP Mediator neu, indem Sie den Befehl „snapmirror mediator add“ verwenden.

Zurück nach oben

Zusätzliche Strom-, Heartbeat- und sonstige Systemmonitore

Monitorname	Schwere	Monitorbeschreibung	Korrekturmaßnahme
Disk Shelf-Stromversorgung entdeckt	INFORMATIONS	Diese Meldung wird angezeigt, wenn dem Festplattenregal ein Netzteil hinzugefügt wird.	KEINER
Stromversorgung der Festplattenregale entfernt	INFORMATIONS	Diese Meldung tritt auf, wenn ein Netzteil aus dem Festplattenregal entfernt wird.	KEINER
Automatische ungeplante Umschaltung von MetroCluster deaktiviert	KRITISCH	Diese Meldung wird angezeigt, wenn die Funktion zur automatischen ungeplanten Umschaltung deaktiviert ist.	Führen Sie den Befehl „metrocluster modify -node-name <Knotenname> -automatic-switchover-onfailure true“ für jeden Knoten im Cluster aus, um die automatische Umschaltung zu aktivieren.
MetroCluster Speicherbrücke nicht erreichbar	KRITISCH	Die Speicherbrücke ist über das Verwaltungsnetzwerk nicht erreichbar	1) Wenn die Bridge per SNMP überwacht wird, überprüfen Sie mit dem Befehl „Network Interface Show“, ob das Knotenverwaltungs-LIF aktiv ist. Überprüfen Sie mit dem Befehl „Netzwerk-Ping“, ob die Bridge aktiv ist. 2) Wenn die Bridge In-Band überwacht wird, überprüfen Sie die Fabric-Verkabelung zur Bridge und stellen Sie dann sicher, dass die Bridge eingeschaltet ist.
MetroCluster Bridge-Temperatur anormal – unter dem kritischen Wert	KRITISCH	Der Sensor auf der Fibre Channel Bridge meldet eine Temperatur, die unterhalb des kritischen Schwellenwerts liegt.	1) Überprüfen Sie den Betriebsstatus der Lüfter auf der Speicherbrücke. 2) Stellen Sie sicher, dass die Brücke unter den empfohlenen Temperaturbedingungen betrieben wird.
Temperatur der MetroCluster -Brücke abnormal – über dem kritischen Wert	KRITISCH	Der Sensor auf der Fibre Channel Bridge meldet eine Temperatur, die über dem kritischen Schwellenwert liegt.	1) Überprüfen Sie den Betriebsstatus des Gehäusetemperatursensors auf der Speicherbrücke mit dem Befehl „storage bridge show -cooling“. 2) Stellen Sie sicher, dass die Speicherbrücke unter den empfohlenen Temperaturbedingungen betrieben wird.
MetroCluster -Aggregat bleibt zurück	WARNING (Warnung)	Das Aggregat wurde beim Zurückfahren zurückgelassen.	1) Überprüfen Sie den Aggregatzustand mit dem Befehl „aggr show“. 2) Wenn das Aggregat online ist, geben Sie es mit dem Befehl „metrocluster switchback“ an seinen ursprünglichen Besitzer zurück.
Alle Verbindungen zwischen Metrocluster-Partnern unterbrochen	KRITISCH	RDMA-Verbindungsadapter und Intercluster-LIFs haben die Verbindung zum Peering-Cluster unterbrochen oder der Peering-Cluster ist ausgefallen.	1) Stellen Sie sicher, dass die Intercluster-LIFs betriebsbereit sind. Reparieren Sie die Intercluster-LIFs, wenn sie ausgefallen sind. 2) Überprüfen Sie mit dem Befehl „Cluster Peer Ping“, ob der Peering-Cluster betriebsbereit ist. Wenn der Peering-Cluster ausgefallen ist, lesen Sie den MetroCluster Disaster Recovery Guide. 3) Überprüfen Sie für Fabric MetroCluster, ob die Back-End-Fabric-ISLs betriebsbereit sind. Reparieren Sie die Back-End-Fabric-ISLs, wenn sie ausgefallen sind. 4) Überprüfen Sie bei MetroCluster -Konfigurationen ohne Fabric, ob die Verkabelung zwischen den RDMA-Verbindungsadaptern korrekt ist. Konfigurieren Sie die Verkabelung neu, wenn die Verbindungen unterbrochen sind.
MetroCluster Partner über Peering-Netzwerk nicht erreichbar	KRITISCH	Die Verbindung zum Peer-Cluster ist unterbrochen.	1) Stellen Sie sicher, dass der Port mit dem richtigen Netzwerk/Switch verbunden ist. 2) Stellen Sie sicher, dass das Intercluster-LIF mit dem Peered-Cluster verbunden ist. 3) Stellen Sie mit dem Befehl „Cluster Peer Ping“ sicher, dass der Peering-Cluster betriebsbereit ist. Wenn der Peering-Cluster ausgefallen ist, lesen Sie den MetroCluster Disaster Recovery Guide.
MetroCluster Inter Switch: Alle Links ausgefallen	KRITISCH	Alle Inter-Switch Links (ISLs) auf dem Speicher-Switch sind ausgefallen.	1) Reparieren Sie die Back-End-Fabric-ISLs auf dem Speicher-Switch. 2) Stellen Sie sicher, dass der Partner-Switch aktiv ist und seine ISLs betriebsbereit sind. 3) Stellen Sie sicher, dass Zwischengeräte wie xWDM-Geräte betriebsbereit sind.
MetroCluster -Knoten zum Speicherstapel SAS-Verbindung unterbrochen	WARNING (Warnung)	Möglicherweise liegt ein Fehler am SAS-Adapter oder am daran angeschlossenen Kabel vor.	1. Stellen Sie sicher, dass der SAS-Adapter online und betriebsbereit ist. 2. Überprüfen Sie, ob die physische Kabelverbindung sicher und funktionsfähig ist, und ersetzen Sie das Kabel bei Bedarf. 3. Wenn der SAS-Adapter an Festplatten-Shelves angeschlossen ist, stellen Sie sicher, dass die IOMs und Festplatten richtig sitzen.
Links zum MetroClusterFC-Initiator ausgefallen	KRITISCH	Der FC-Initiatoradapter ist fehlerhaft.	1. Stellen Sie sicher, dass die FC-Initiatorverbindung nicht manipuliert wurde. 2. Überprüfen Sie den Betriebsstatus des FC-Initiatoradapters mit dem Befehl „system node run -node local -command storage show adapter“.
FC-VI-Verbindungsverbindung unterbrochen	KRITISCH	Die physische Verbindung am FC-VI-Port ist offline.	1. Stellen Sie sicher, dass die FC-VI-Verbindung nicht manipuliert wurde. 2. Überprüfen Sie mit dem Befehl „metrocluster interconnect adapter show“, ob der physische Status des FC-VI-Adapters „Aktiv“ lautet. 3. Wenn die Konfiguration Fabric-Switches umfasst, stellen Sie sicher, dass diese ordnungsgemäß verkabelt und konfiguriert sind.
Zurückgelassene MetroCluster -Ersatzfestplatten	WARNING (Warnung)	Die Ersatzfestplatte wurde beim Switchback zurückgelassen.	Wenn die Festplatte nicht ausgefallen ist, geben Sie sie mit dem Befehl „metrocluster switchback“ an ihren ursprünglichen Besitzer zurück.
MetroCluster Speicherbrücken-Port ausgefallen	KRITISCH	Der Port auf der Speicherbrücke ist offline.	1) Überprüfen Sie den Betriebsstatus der Ports auf der Speicherbrücke mit dem Befehl „storage bridge show -ports“. 2) Überprüfen Sie die logische und physische Konnektivität zum Port.
Lüfter des MetroCluster Speicher-Switches ausgefallen	KRITISCH	Der Lüfter am Speicherschalter ist ausgefallen.	1) Stellen Sie sicher, dass die Lüfter im Switch ordnungsgemäß funktionieren, indem Sie den Befehl „storage switch show -cooling“ verwenden. 2) Stellen Sie sicher, dass die Lüfter-FRUs richtig eingesetzt und betriebsbereit sind.
MetroCluster Speicher-Switch nicht erreichbar	KRITISCH	Der Speicher-Switch ist über das Verwaltungsnetzwerk nicht erreichbar.	1) Stellen Sie sicher, dass das Knotenverwaltungs-LIF aktiv ist, indem Sie den Befehl „Network Interface Show“ verwenden. 2) Stellen Sie mit dem Befehl „Netzwerk-Ping“ sicher, dass der Switch aktiv ist. 3) Stellen Sie sicher, dass der Switch über SNMP erreichbar ist, indem Sie nach der Anmeldung beim Switch seine SNMP-Einstellungen überprüfen.
Stromversorgung des MetroCluster -Switches ausgefallen	KRITISCH	Ein Netzteil am Speicherswitch ist nicht betriebsbereit.	1) Überprüfen Sie die Fehlerdetails mit dem Befehl „storage switch show -error -switch-name <switch name>“. 2) Identifizieren Sie das fehlerhafte Netzteil mit dem Befehl „storage switch show -power -switch-name <switch name>“. 3) Stellen Sie sicher, dass das Netzteil ordnungsgemäß in das Gehäuse des Speicherschalters eingesetzt und voll funktionsfähig ist.
Temperatursensoren des MetroCluster -Switches ausgefallen	KRITISCH	Der Sensor am Fibre-Channel-Switch ist ausgefallen.	1) Überprüfen Sie den Betriebszustand der Temperatursensoren am Speicherswitch mit dem Befehl „storage switch show -cooling“. 2) Stellen Sie sicher, dass der Schalter unter den empfohlenen Temperaturbedingungen arbeitet.
MetroCluster -Switch-Temperatur abnormal	KRITISCH	Der Temperatursensor am Fibre-Channel-Switch hat eine abnormale Temperatur gemeldet.	1) Überprüfen Sie den Betriebszustand der Temperatursensoren am Speicherswitch mit dem Befehl „storage switch show -cooling“. 2) Stellen Sie sicher, dass der Schalter unter den empfohlenen Temperaturbedingungen arbeitet.
Heartbeat des Serviceprozessors verpasst	INFORMATIONS	Diese Meldung wird angezeigt, wenn ONTAP kein erwartetes „Heartbeat“-Signal vom Serviceprozessor (SP) empfängt. Zusammen mit dieser Nachricht werden Protokolldateien vom SP zum Debuggen gesendet. ONTAP setzt den SP zurück, um zu versuchen, die Kommunikation wiederherzustellen. Während des Neustarts ist der SP bis zu zwei Minuten lang nicht verfügbar.	Wenden Sie sich an den technischen Support von NetApp .
Heartbeat des Serviceprozessors gestoppt	WARNING (Warnung)	Diese Meldung wird angezeigt, wenn ONTAP keine Heartbeats mehr vom Serviceprozessor (SP) empfängt. Je nach Hardwaredesign kann das System weiterhin Daten bereitstellen oder sich zum Herunterfahren entschließen, um Datenverlust oder Hardwareschäden zu verhindern. Das System stellt weiterhin Daten bereit, aber da der SP möglicherweise nicht funktioniert, kann das System keine Benachrichtigungen über ausgefallene Geräte, Startfehler oder Power-On Self-Test (POST)-Fehler der Open Firmware (OFW) senden. Wenn Ihr System entsprechend konfiguriert ist, generiert und überträgt es eine AutoSupport Nachricht (oder „Call Home“-Nachricht) an den technischen Support von NetApp und an die konfigurierten Ziele. Die erfolgreiche Übermittlung einer AutoSupport -Nachricht verbessert die Problembestimmung und -lösung erheblich.	Wenn das System heruntergefahren wurde, versuchen Sie einen Hard Power Cycle: Ziehen Sie den Controller aus dem Gehäuse, drücken Sie ihn wieder hinein und schalten Sie dann das System ein. Wenden Sie sich an den technischen Support von NetApp, wenn das Problem nach dem Aus- und Wiedereinschalten weiterhin besteht oder wenn ein anderer Zustand vorliegt, der Ihre Aufmerksamkeit erfordert.

Monitorname

Schwere

Monitorbeschreibung

Korrekturmaßnahme

Disk Shelf-Stromversorgung entdeckt

INFORMATIONS

Diese Meldung wird angezeigt, wenn dem Festplattenregal ein Netzteil hinzugefügt wird.

KEINER

Stromversorgung der Festplattenregale entfernt

INFORMATIONS

Diese Meldung tritt auf, wenn ein Netzteil aus dem Festplattenregal entfernt wird.

KEINER

Automatische ungeplante Umschaltung von MetroCluster deaktiviert

KRITISCH

Diese Meldung wird angezeigt, wenn die Funktion zur automatischen ungeplanten Umschaltung deaktiviert ist.

Führen Sie den Befehl „metrocluster modify -node-name <Knotenname> -automatic-switchover-onfailure true“ für jeden Knoten im Cluster aus, um die automatische Umschaltung zu aktivieren.

MetroCluster Speicherbrücke nicht erreichbar

KRITISCH

Die Speicherbrücke ist über das Verwaltungsnetzwerk nicht erreichbar

1) Wenn die Bridge per SNMP überwacht wird, überprüfen Sie mit dem Befehl „Network Interface Show“, ob das Knotenverwaltungs-LIF aktiv ist. Überprüfen Sie mit dem Befehl „Netzwerk-Ping“, ob die Bridge aktiv ist. 2) Wenn die Bridge In-Band überwacht wird, überprüfen Sie die Fabric-Verkabelung zur Bridge und stellen Sie dann sicher, dass die Bridge eingeschaltet ist.

MetroCluster Bridge-Temperatur anormal – unter dem kritischen Wert

KRITISCH

Der Sensor auf der Fibre Channel Bridge meldet eine Temperatur, die unterhalb des kritischen Schwellenwerts liegt.

1) Überprüfen Sie den Betriebsstatus der Lüfter auf der Speicherbrücke. 2) Stellen Sie sicher, dass die Brücke unter den empfohlenen Temperaturbedingungen betrieben wird.

Temperatur der MetroCluster -Brücke abnormal – über dem kritischen Wert

KRITISCH

Der Sensor auf der Fibre Channel Bridge meldet eine Temperatur, die über dem kritischen Schwellenwert liegt.

1) Überprüfen Sie den Betriebsstatus des Gehäusetemperatursensors auf der Speicherbrücke mit dem Befehl „storage bridge show -cooling“. 2) Stellen Sie sicher, dass die Speicherbrücke unter den empfohlenen Temperaturbedingungen betrieben wird.

MetroCluster -Aggregat bleibt zurück

WARNING (Warnung)

Das Aggregat wurde beim Zurückfahren zurückgelassen.

1) Überprüfen Sie den Aggregatzustand mit dem Befehl „aggr show“. 2) Wenn das Aggregat online ist, geben Sie es mit dem Befehl „metrocluster switchback“ an seinen ursprünglichen Besitzer zurück.

Alle Verbindungen zwischen Metrocluster-Partnern unterbrochen

KRITISCH

RDMA-Verbindungsadapter und Intercluster-LIFs haben die Verbindung zum Peering-Cluster unterbrochen oder der Peering-Cluster ist ausgefallen.

1) Stellen Sie sicher, dass die Intercluster-LIFs betriebsbereit sind. Reparieren Sie die Intercluster-LIFs, wenn sie ausgefallen sind. 2) Überprüfen Sie mit dem Befehl „Cluster Peer Ping“, ob der Peering-Cluster betriebsbereit ist. Wenn der Peering-Cluster ausgefallen ist, lesen Sie den MetroCluster Disaster Recovery Guide. 3) Überprüfen Sie für Fabric MetroCluster, ob die Back-End-Fabric-ISLs betriebsbereit sind. Reparieren Sie die Back-End-Fabric-ISLs, wenn sie ausgefallen sind. 4) Überprüfen Sie bei MetroCluster -Konfigurationen ohne Fabric, ob die Verkabelung zwischen den RDMA-Verbindungsadaptern korrekt ist. Konfigurieren Sie die Verkabelung neu, wenn die Verbindungen unterbrochen sind.

MetroCluster Partner über Peering-Netzwerk nicht erreichbar

KRITISCH

Die Verbindung zum Peer-Cluster ist unterbrochen.

1) Stellen Sie sicher, dass der Port mit dem richtigen Netzwerk/Switch verbunden ist. 2) Stellen Sie sicher, dass das Intercluster-LIF mit dem Peered-Cluster verbunden ist. 3) Stellen Sie mit dem Befehl „Cluster Peer Ping“ sicher, dass der Peering-Cluster betriebsbereit ist. Wenn der Peering-Cluster ausgefallen ist, lesen Sie den MetroCluster Disaster Recovery Guide.

MetroCluster Inter Switch: Alle Links ausgefallen

KRITISCH

Alle Inter-Switch Links (ISLs) auf dem Speicher-Switch sind ausgefallen.

1) Reparieren Sie die Back-End-Fabric-ISLs auf dem Speicher-Switch. 2) Stellen Sie sicher, dass der Partner-Switch aktiv ist und seine ISLs betriebsbereit sind. 3) Stellen Sie sicher, dass Zwischengeräte wie xWDM-Geräte betriebsbereit sind.

MetroCluster -Knoten zum Speicherstapel SAS-Verbindung unterbrochen

WARNING (Warnung)

Möglicherweise liegt ein Fehler am SAS-Adapter oder am daran angeschlossenen Kabel vor.

1. Stellen Sie sicher, dass der SAS-Adapter online und betriebsbereit ist. 2. Überprüfen Sie, ob die physische Kabelverbindung sicher und funktionsfähig ist, und ersetzen Sie das Kabel bei Bedarf. 3. Wenn der SAS-Adapter an Festplatten-Shelves angeschlossen ist, stellen Sie sicher, dass die IOMs und Festplatten richtig sitzen.

Links zum MetroClusterFC-Initiator ausgefallen

KRITISCH

Der FC-Initiatoradapter ist fehlerhaft.

1. Stellen Sie sicher, dass die FC-Initiatorverbindung nicht manipuliert wurde. 2. Überprüfen Sie den Betriebsstatus des FC-Initiatoradapters mit dem Befehl „system node run -node local -command storage show adapter“.

FC-VI-Verbindungsverbindung unterbrochen

KRITISCH

Die physische Verbindung am FC-VI-Port ist offline.

1. Stellen Sie sicher, dass die FC-VI-Verbindung nicht manipuliert wurde. 2. Überprüfen Sie mit dem Befehl „metrocluster interconnect adapter show“, ob der physische Status des FC-VI-Adapters „Aktiv“ lautet. 3. Wenn die Konfiguration Fabric-Switches umfasst, stellen Sie sicher, dass diese ordnungsgemäß verkabelt und konfiguriert sind.

Zurückgelassene MetroCluster -Ersatzfestplatten

WARNING (Warnung)

Die Ersatzfestplatte wurde beim Switchback zurückgelassen.

Wenn die Festplatte nicht ausgefallen ist, geben Sie sie mit dem Befehl „metrocluster switchback“ an ihren ursprünglichen Besitzer zurück.

MetroCluster Speicherbrücken-Port ausgefallen

KRITISCH

Der Port auf der Speicherbrücke ist offline.

1) Überprüfen Sie den Betriebsstatus der Ports auf der Speicherbrücke mit dem Befehl „storage bridge show -ports“. 2) Überprüfen Sie die logische und physische Konnektivität zum Port.

Lüfter des MetroCluster Speicher-Switches ausgefallen

KRITISCH

Der Lüfter am Speicherschalter ist ausgefallen.

1) Stellen Sie sicher, dass die Lüfter im Switch ordnungsgemäß funktionieren, indem Sie den Befehl „storage switch show -cooling“ verwenden. 2) Stellen Sie sicher, dass die Lüfter-FRUs richtig eingesetzt und betriebsbereit sind.

MetroCluster Speicher-Switch nicht erreichbar

KRITISCH

Der Speicher-Switch ist über das Verwaltungsnetzwerk nicht erreichbar.

1) Stellen Sie sicher, dass das Knotenverwaltungs-LIF aktiv ist, indem Sie den Befehl „Network Interface Show“ verwenden. 2) Stellen Sie mit dem Befehl „Netzwerk-Ping“ sicher, dass der Switch aktiv ist. 3) Stellen Sie sicher, dass der Switch über SNMP erreichbar ist, indem Sie nach der Anmeldung beim Switch seine SNMP-Einstellungen überprüfen.

Stromversorgung des MetroCluster -Switches ausgefallen

KRITISCH

Ein Netzteil am Speicherswitch ist nicht betriebsbereit.

1) Überprüfen Sie die Fehlerdetails mit dem Befehl „storage switch show -error -switch-name <switch name>“. 2) Identifizieren Sie das fehlerhafte Netzteil mit dem Befehl „storage switch show -power -switch-name <switch name>“. 3) Stellen Sie sicher, dass das Netzteil ordnungsgemäß in das Gehäuse des Speicherschalters eingesetzt und voll funktionsfähig ist.

Temperatursensoren des MetroCluster -Switches ausgefallen

KRITISCH

Der Sensor am Fibre-Channel-Switch ist ausgefallen.

1) Überprüfen Sie den Betriebszustand der Temperatursensoren am Speicherswitch mit dem Befehl „storage switch show -cooling“. 2) Stellen Sie sicher, dass der Schalter unter den empfohlenen Temperaturbedingungen arbeitet.

MetroCluster -Switch-Temperatur abnormal

KRITISCH

Der Temperatursensor am Fibre-Channel-Switch hat eine abnormale Temperatur gemeldet.

Heartbeat des Serviceprozessors verpasst

INFORMATIONS

Diese Meldung wird angezeigt, wenn ONTAP kein erwartetes „Heartbeat“-Signal vom Serviceprozessor (SP) empfängt. Zusammen mit dieser Nachricht werden Protokolldateien vom SP zum Debuggen gesendet. ONTAP setzt den SP zurück, um zu versuchen, die Kommunikation wiederherzustellen. Während des Neustarts ist der SP bis zu zwei Minuten lang nicht verfügbar.

Wenden Sie sich an den technischen Support von NetApp .

Heartbeat des Serviceprozessors gestoppt

WARNING (Warnung)

Diese Meldung wird angezeigt, wenn ONTAP keine Heartbeats mehr vom Serviceprozessor (SP) empfängt. Je nach Hardwaredesign kann das System weiterhin Daten bereitstellen oder sich zum Herunterfahren entschließen, um Datenverlust oder Hardwareschäden zu verhindern. Das System stellt weiterhin Daten bereit, aber da der SP möglicherweise nicht funktioniert, kann das System keine Benachrichtigungen über ausgefallene Geräte, Startfehler oder Power-On Self-Test (POST)-Fehler der Open Firmware (OFW) senden. Wenn Ihr System entsprechend konfiguriert ist, generiert und überträgt es eine AutoSupport Nachricht (oder „Call Home“-Nachricht) an den technischen Support von NetApp und an die konfigurierten Ziele. Die erfolgreiche Übermittlung einer AutoSupport -Nachricht verbessert die Problembestimmung und -lösung erheblich.

Wenn das System heruntergefahren wurde, versuchen Sie einen Hard Power Cycle: Ziehen Sie den Controller aus dem Gehäuse, drücken Sie ihn wieder hinein und schalten Sie dann das System ein. Wenden Sie sich an den technischen Support von NetApp, wenn das Problem nach dem Aus- und Wiedereinschalten weiterhin besteht oder wenn ein anderer Zustand vorliegt, der Ihre Aufmerksamkeit erfordert.

Zurück nach oben

Weitere Informationen

"Anzeigen und Verwerfen von Warnungen"

Systemmonitore

Creating your file...

Monitorbeschreibungen

Metrische Monitore

Protokollmonitore

Anti-Ransomware-Protokollmonitore

FSx für NetApp ONTAP -Monitore

K8s-Monitore

Änderungsprotokoll-Monitore

Datenerfassungsmonitore

Sicherheitsmonitore

Datenschutzmonitore

Cloud Volume (CVO)-Monitore

SnapMirror für Business Continuity (SMBC) Mediator Log Monitors

Zusätzliche Strom-, Heartbeat- und sonstige Systemmonitore

Weitere Informationen