Ermitteln und Aufheben fehlgeschlagener Storage Volumes
Bei der Wiederherstellung eines Storage-Nodes mit ausgefallenen Storage-Volumes müssen Sie die ausgefallenen Volumes identifizieren und deren Bereitstellung aufheben. Sie müssen überprüfen, ob nur die fehlgeschlagenen Speicher-Volumes im Rahmen der Wiederherstellungsverfahren neu formatiert werden.
Sie müssen mit einem beim Grid Manager angemeldet sein Unterstützter Webbrowser.
Sie sollten ausgefallene Storage Volumes so bald wie möglich wiederherstellen.
Der erste Schritt des Wiederherstellungsprozesses besteht darin, Volumes zu erkennen, die entfernt wurden, abgehängt werden müssen oder I/O-Fehler haben. Wenn weiterhin fehlgeschlagene Volumes angehängt sind, aber ein zufällig beschädigtes Dateisystem vorhanden ist, erkennt das System möglicherweise keine Beschädigung in nicht verwendeten oder nicht zugewiesenen Teilen der Festplatte.
Sie müssen dieses Verfahren abschließen, bevor Sie manuelle Schritte zur Wiederherstellung von Volumes durchführen, z. B. das Hinzufügen oder erneutes Anschließen von Festplatten, das Anhalten des Node, Starten des Node oder Neustarten. Andernfalls, wenn Sie den ausführen reformat_storage_block_devices.rb Skript, möglicherweise tritt ein Dateisystemfehler auf, der zum Aufhängen oder Fehlschlagen des Skripts führt.
|
Reparieren Sie die Hardware und schließen Sie die Festplatten ordnungsgemäß an, bevor Sie den ausführen reboot Befehl.
|
Fehlerhafte Storage-Volumes sorgfältig ermitteln Anhand dieser Informationen können Sie überprüfen, welche Volumes neu formatiert werden müssen. Sobald ein Volume neu formatiert wurde, können die Daten auf dem Volume nicht mehr wiederhergestellt werden. |
Um fehlgeschlagene Speicher-Volumes korrekt wiederherzustellen, müssen Sie sowohl die Gerätenamen der ausgefallenen Speicher-Volumes als auch die zugehörigen Volume-IDs kennen.
Bei der Installation wird jedem Storage-Gerät eine UUID (Universal Unique Identifier) des Filesystems zugewiesen und über die zugewiesene Filesystem-UUID in ein rangedb-Verzeichnis auf dem Storage Node gemountet. Die UUID des Dateisystems und das Verzeichnis „rangedb“ sind im aufgeführt /etc/fstab
Datei: Der Gerätename, das rankgedb-Verzeichnis und die Größe des gemounteten Volumes werden im Grid Manager angezeigt.
Im folgenden Beispiel ist das Gerät /dev/sdc
Hat eine Volume-Größe von 4 TB, wird angehängt auf /var/local/rangedb/0
, Verwenden des Gerätenamens /dev/disk/by-uuid/822b0547-3b2b-472e-ad5e-e1cf1809faba
Im /etc/fstab
Datei:
-
Führen Sie die folgenden Schritte durch, um die fehlgeschlagenen Speicher-Volumes und deren Gerätenamen aufzunehmen:
-
Wählen Sie SUPPORT > Tools > Grid-Topologie aus.
-
Wählen Sie Standort > fehlgeschlagener Speicherknoten > LDR > Storage > Übersicht > Haupt, und suchen Sie nach Objektspeichern mit Alarmen.
-
Wählen Sie Standort > fehlgeschlagener Speicherknoten > SSM > Ressourcen > Übersicht > Haupt. Ermitteln Sie den Mount-Punkt und die Volume-Größe jedes im vorherigen Schritt identifizierten ausgefallenen Storage-Volumes.
Objektspeichern werden in Hex-Notation nummeriert. Zum Beispiel ist 0000 das erste Volumen und 000F das sechzehnte Volumen. Im Beispiel entspricht der Objektspeicher mit der ID 0000
/var/local/rangedb/0
Mit dem Gerätenamen sdc und einer Größe von 107 GB.
-
-
Melden Sie sich beim fehlgeschlagenen Speicherknoten an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei: -
Geben Sie den folgenden Befehl ein, um zum Root zu wechseln:
su -
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei:
Wenn Sie als root angemeldet sind, ändert sich die Eingabeaufforderung von
$
Bis#
. -
-
Führen Sie das folgende Skript aus, um die Speicherdienste zu stoppen und die Bereitstellung eines fehlerhaften Speicher-Volumes aufzuheben:
sn-unmount-volume object_store_ID
Der
object_store_ID
Ist die ID des ausgefallenen Speicher-Volumes. Geben Sie beispielsweise an0
Im Befehl für einen Objektspeicher mit der ID 0000. -
Wenn Sie dazu aufgefordert werden, drücken Sie y, um die Speicherdienste auf dem Speicherknoten zu stoppen.
Wenn die Storage-Services bereits angehalten wurden, werden Sie nicht aufgefordert. Der Cassandra-Service wird nur für Volume 0 angehalten. In wenigen Sekunden werden die Speicherservices angehalten und das Volume wird abgehängt. Die Meldungen werden angezeigt, die jeden Schritt des Prozesses angeben. Die letzte Meldung gibt an, dass das Volume abgehängt wurde.