Skip to main content
Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Behebung von Metadatenproblemen

Beitragende

Sie können mehrere Aufgaben durchführen, um die Ursache von Metadatenproblemen zu ermitteln.

Beheben Sie die Warnmeldung zu niedrigen Metadaten-Storage

Wenn die Warnung * Storage* mit niedrigen Metadaten ausgelöst wird, müssen Sie neue Storage-Nodes hinzufügen.

Was Sie benötigen
Über diese Aufgabe

StorageGRID reserviert eine bestimmte Menge an Speicherplatz auf Volume 0 jedes Storage-Nodes für Objekt-Metadaten. Dieser Speicherplatz wird als tatsächlicher reservierter Speicherplatz bezeichnet und in den Speicherplatz für Objekt-Metadaten (zulässiger Metadatenspeicherplatz) und den für wichtige Datenbankvorgänge wie Data-Compaction und Reparatur erforderlichen Speicherplatz unterteilt. Der zulässige Metadatenspeicherplatz bestimmt die gesamte Objektkapazität.

Metadaten Zulässig Speicherplatz Volume 0

Wenn Objekt-Metadaten mehr als 100 % des für Metadaten zulässigen Speicherplatzes belegen, können Datenbankvorgänge nicht effizient ausgeführt werden und es treten Fehler auf.

Das können Sie Überwachen der Objekt-Metadaten-Kapazität für jeden Storage Node Um Ihnen zu helfen, Fehler frühzeitig zu erkennen und zu beheben, bevor sie auftreten.

StorageGRID verwendet die folgende Prometheus Kennzahl, um den vollen Umfang des zulässigen Metadaten-Speicherplatzes zu messen:

storagegrid_storage_utilization_metadata_bytes/storagegrid_storage_utilization_metadata_allowed_bytes

Wenn dieser Prometheus-Ausdruck bestimmte Schwellenwerte erreicht, wird die Warnung Low Metadaten Storage ausgelöst.

  • Minor: Objektmetadaten verwenden 70% oder mehr des zulässigen Metadaten-Speicherplatzes. Sie sollten so bald wie möglich neue Storage-Nodes hinzufügen.

  • Major: Objektmetadaten verwenden 90% oder mehr des zulässigen Metadaten-Speicherplatzes. Sie müssen sofort neue Storage-Nodes hinzufügen.

    Wichtig Wenn Objektmetadaten 90 % oder mehr des zulässigen Metadaten-Speicherplatzes beanspruchen, wird im Dashboard eine Warnung angezeigt. Wenn diese Warnung angezeigt wird, müssen Sie sofort neue Speicherknoten hinzufügen. Es ist nicht zulässig, dass Objektmetadaten mehr als 100 % des zulässigen Speicherplatzes nutzen.
  • Kritisch: Objektmetadaten verbrauchen 100% oder mehr des zulässigen Metadaten-Speicherplatzes und verbrauchen den für wichtige Datenbankvorgänge erforderlichen Speicherplatz. Sie müssen die Aufnahme neuer Objekte beenden und sofort neue Speicherknoten hinzufügen.

In dem folgenden Beispiel belegen die Objektmetadaten mehr als 100 % des zulässigen Metadaten-Speicherplatzes. Hierbei handelt es sich um eine kritische Situation, die zu einem ineffizienten und ineffizienten Datenbankbetrieb und zu Fehlern führt.

Alarm Im Metadaten-Dashboard
Wichtig Wenn die Größe von Volume 0 kleiner ist als die Option „Metadatenreservierter Speicherplatz“ (z. B. in einer nicht-Produktionsumgebung), kann die Berechnung für die Warnmeldung * Low Metadaten Storage* fehlerhaft sein.
Schritte
  1. Wählen Sie ALERTS Current.

  2. Erweitern Sie, falls erforderlich, aus der Warnmeldungstabelle die Warnungsgruppe Low-Metadaten-Speicher und wählen Sie die spezifische Warnung aus, die Sie anzeigen möchten.

  3. Überprüfen Sie die Details im Dialogfeld „Warnung“.

  4. Wenn eine wichtige oder kritische Warnung für * Storage-Systeme mit niedrigen Metadaten* ausgelöst wurde, führen Sie eine Erweiterung durch, um Storage-Nodes sofort hinzuzufügen.

    Hinweis Da StorageGRID komplette Kopien aller Objektmetadaten an jedem Standort speichert, wird die Metadaten-Kapazität des gesamten Grid durch die Metadaten-Kapazität des kleinsten Standorts begrenzt. Wenn Sie Metadaten an einem Standort hinzufügen müssen, sollten Sie auch Erweitern Sie alle anderen Standorte An die gleiche Anzahl von Storage-Nodes.

    Nach der Erweiterung verteilt StorageGRID die vorhandenen Objekt-Metadaten neu auf die neuen Nodes, wodurch die allgemeine Metadaten des Grid erhöht werden. Es ist keine Benutzeraktion erforderlich. Die Warnung * Speicherung von niedrigen Metadaten* wird gelöscht.

Fehlersuche im Alarm Services: Status - Cassandra (SVST) durchführen

Der Alarm Services: Status – Cassandra (SVST) gibt an, dass Sie die Cassandra-Datenbank für einen Storage-Node möglicherweise neu aufbauen müssen. Cassandra dient als Metadatenspeicher für StorageGRID.

Was Sie benötigen
  • Sie müssen mit einem beim Grid Manager angemeldet sein Unterstützter Webbrowser.

  • Sie müssen über spezifische Zugriffsberechtigungen verfügen.

  • Sie müssen die haben Passwords.txt Datei:

Über diese Aufgabe

Wenn Cassandra länger als 15 Tage angehalten wird (z. B. ausgeschaltet), startet Cassandra nicht, wenn der Node wieder online geschaltet wird. Sie müssen die Cassandra-Datenbank für den betroffenen DDS-Dienst neu erstellen.

Das können Sie Führen Sie eine Diagnose aus Um zusätzliche Informationen über den aktuellen Status Ihres Rasters zu erhalten.

Wichtig Wenn mindestens zwei der Cassandra-Datenbankdienste länger als 15 Tage ausgefallen sind, wenden Sie sich an den technischen Support, und fahren Sie nicht mit den folgenden Schritten fort.
Schritte
  1. Wählen Sie SUPPORT > Tools > Grid-Topologie aus.

  2. Wählen Sie Site Storage Node SSM Services Alarme Main, um Alarme anzuzeigen.

    Dieses Beispiel zeigt, dass der SVST-Alarm ausgelöst wurde.

    Alarme: SSM: Dienste Seite

    Auf der SSM Services-Hauptseite wird auch angezeigt, dass Cassandra nicht ausgeführt wird.

    Übersicht: SSM: Services Seite
  3. Neustarten von Cassandra aus dem Storage-Node:

    1. Melden Sie sich beim Grid-Node an:

      1. Geben Sie den folgenden Befehl ein: ssh admin@grid_node_IP

      2. Geben Sie das im aufgeführte Passwort ein Passwords.txt Datei:

      3. Geben Sie den folgenden Befehl ein, um zum Root zu wechseln: su -

      4. Geben Sie das im aufgeführte Passwort ein Passwords.txt Datei: Wenn Sie als root angemeldet sind, ändert sich die Eingabeaufforderung von $ Bis #.

    2. Geben Sie Ein: /etc/init.d/cassandra status

    3. Falls Cassandra nicht ausgeführt wird, starten Sie es neu: /etc/init.d/cassandra restart

  4. Falls Cassandra nicht neu startet, bestimmen Sie, wie lange Cassandra ausgefallen ist. Wenn Cassandra länger als 15 Tage ausfällt, müssen Sie die Cassandra-Datenbank neu aufbauen.

    Wichtig Wenn zwei oder mehr der Cassandra-Datenbankdienste ausgefallen sind, wenden Sie sich an den technischen Support, und fahren Sie nicht mit den folgenden Schritten fort.

    Sie können feststellen, wie lange Cassandra ausgefallen ist, indem Sie sie aufschreiben oder die Datei servermanager.log lesen.

  5. Cassandra Diagramm:

    1. Wählen Sie SUPPORT Tools Grid-Topologie aus. Wählen Sie dann Site Storage Node SSM Services Berichte Diagramme aus.

    2. Wählen Sie Attribut Service: Status - Cassandra.

    3. Geben Sie für Startdatum ein Datum ein, das mindestens 16 Tage vor dem aktuellen Datum liegt. Geben Sie für Enddatum das aktuelle Datum ein.

    4. Klicken Sie Auf Aktualisieren.

    5. Wenn Cassandra für mehr als 15 Tage nicht verfügbar ist, bauen Sie die Cassandra-Datenbank erneut aus.

Das folgende Diagramm zeigt, dass Cassandra seit mindestens 17 Tagen ausgefallen ist.

Übersicht: SSM: Services Seite
  1. So prüfen Sie die Datei servermanager.log auf dem Speicherknoten:

    1. Melden Sie sich beim Grid-Node an:

      1. Geben Sie den folgenden Befehl ein: ssh admin@grid_node_IP

      2. Geben Sie das im aufgeführte Passwort ein Passwords.txt Datei:

      3. Geben Sie den folgenden Befehl ein, um zum Root zu wechseln: su -

      4. Geben Sie das im aufgeführte Passwort ein Passwords.txt Datei: Wenn Sie als root angemeldet sind, ändert sich die Eingabeaufforderung von $ Bis #.

    2. Geben Sie Ein: cat /var/local/log/servermanager.log

      Der Inhalt der Datei servermanager.log wird angezeigt.

      Wenn Cassandra länger als 15 Tage ausfällt, wird die folgende Meldung in der Datei servermanager.log angezeigt:

    "2014-08-14 21:01:35 +0000 | cassandra | cassandra not
    started because it has been offline for longer than
    its 15 day grace period - rebuild cassandra
    1. Stellen Sie sicher, dass der Zeitstempel dieser Nachricht der Zeitpunkt ist, zu dem Sie versucht haben, Cassandra wie in Schritt angegeben neu zu starten Starten Sie Cassandra vom Storage-Node aus neu.

      Für Cassandra gibt es mehrere Einträge; Sie müssen den letzten Eintrag finden.

    2. Wenn Cassandra länger als 15 Tage ausfällt, müssen Sie die Cassandra-Datenbank neu aufbauen.

      Anweisungen hierzu finden Sie unter Stellen Sie Storage Node länger als 15 Tage wieder her.

    3. Wenden Sie sich an den technischen Support, wenn die Alarme nach dem Wiederaufbau von Cassandra nicht gelöscht werden.

Fehlerbehebung bei Cassandra-Fehlern außerhalb des Speichers (SMTT-Alarm)

Ein Alarm für Total Events (SMTT) wird ausgelöst, wenn die Cassandra-Datenbank einen Fehler außerhalb des Arbeitsspeichers hat. Wenn dieser Fehler auftritt, wenden Sie sich an den technischen Support, um das Problem zu bearbeiten.

Über diese Aufgabe

Wenn für die Cassandra-Datenbank ein Fehler außerhalb des Arbeitsspeichers auftritt, wird ein Heap Dump erstellt, ein SMTT-Alarm (Total Events) ausgelöst und die Anzahl der Cassandra Heap Out of Memory-Fehler wird um eins erhöht.

Schritte
  1. Um das Ereignis anzuzeigen, wählen Sie SUPPORT Tools Grid-Topologie Konfiguration.

  2. Stellen Sie sicher, dass die Anzahl der Cassandra Heap-Fehler bei einem Speicherfehler mindestens 1 beträgt.

    Das können Sie Führen Sie eine Diagnose aus Um zusätzliche Informationen über den aktuellen Status Ihres Rasters zu erhalten.

  3. Gehen Sie zu /var/local/core/, Komprimieren Sie die Cassandra.hprof Datei erstellen und an den technischen Support senden.

  4. Erstellen Sie ein Backup der Cassandra.hprof Datei und löschen Sie sie aus dem /var/local/core/ directory.

    Diese Datei kann bis zu 24 GB groß sein, so sollten Sie sie entfernen, um Speicherplatz freizugeben.

  5. Nachdem das Problem behoben wurde, aktivieren Sie das Kontrollkästchen Zurücksetzen für die Anzahl der Cassandra-Heap-Fehler aus dem Speicher. Wählen Sie dann Änderungen anwenden.

    Hinweis Um die Anzahl der Ereignisse zurückzusetzen, müssen Sie über die Berechtigung für die Konfiguration der Grid-Topologie-Seite verfügen.