Ermitteln und Aufheben fehlgeschlagener Storage Volumes
Bei der Wiederherstellung eines Storage-Nodes mit ausgefallenen Storage-Volumes müssen Sie die ausgefallenen Volumes identifizieren und deren Bereitstellung aufheben. Sie müssen überprüfen, ob nur die fehlgeschlagenen Speicher-Volumes im Rahmen der Wiederherstellungsverfahren neu formatiert werden.
Sie sind im Grid Manager mit einem angemeldet"Unterstützter Webbrowser".
Sie sollten ausgefallene Storage Volumes so bald wie möglich wiederherstellen.
Der erste Schritt des Wiederherstellungsprozesses besteht darin, Volumes zu erkennen, die entfernt wurden, abgehängt werden müssen oder I/O-Fehler haben. Wenn weiterhin fehlgeschlagene Volumes angehängt sind, aber ein zufällig beschädigtes Dateisystem vorhanden ist, erkennt das System möglicherweise keine Beschädigung in nicht verwendeten oder nicht zugewiesenen Teilen der Festplatte.
|
Sie müssen dieses Verfahren abschließen, bevor Sie manuelle Schritte zur Wiederherstellung von Volumes durchführen, z. B. das Hinzufügen oder erneutes Anschließen von Festplatten, das Anhalten des Node, Starten des Node oder Neustarten. Andernfalls kann es beim Ausführen des reformat_storage_block_devices.rb Skripts zu einem Dateisystemfehler kommen, der dazu führt, dass das Skript hängen bleibt oder fehlschlägt.
|
|
Reparieren Sie die Hardware und schließen Sie die Festplatten ordnungsgemäß an, bevor Sie den Befehl ausführen reboot .
|
|
Fehlerhafte Storage-Volumes sorgfältig ermitteln Anhand dieser Informationen können Sie überprüfen, welche Volumes neu formatiert werden müssen. Nachdem ein Volume neu formatiert wurde, können Daten auf dem Volume nicht wiederhergestellt werden. |
Um ausgefallene Speichervolumes wiederherzustellen, müssen Sie sowohl die Gerätenamen der ausgefallenen Speichervolumes als auch deren Volume-IDs kennen.
Bei der Installation wird jedem Speichergerät eine universelle eindeutige Kennung (UUID) für das Dateisystem zugewiesen und es wird mithilfe dieser zugewiesenen Dateisystem-UUID in ein rangedb-Verzeichnis auf dem Speicherknoten eingebunden. Die Dateisystem-UUID und das rangedb-Verzeichnis sind in der /etc/fstab
Datei. Der Mount-Punkt, der Gerätename und die Größe des Volumes werden im Grid Manager angezeigt.
-
Führen Sie die folgenden Schritte durch, um die fehlgeschlagenen Speicher-Volumes und deren Gerätenamen aufzunehmen:
-
Wählen Sie Knoten > Site > fehlgeschlagener Speicherknoten > Speicher.
-
Blättern Sie nach unten, um die Volume-Tabelle und die Object Stores-Tabelle zu finden, und notieren Sie die folgenden Informationen für jedes Volume mit dem Status „Unbekannt“ oder „Offline“.
-
Notieren Sie aus der Volume-Tabelle den Einhängepunkt, das Gerät und die Größe.
-
Notieren Sie aus der Objektspeichertabelle die
object_store_ID
.Das
object_store_ID
ist die ID des ausgefallenen Speichervolumes. Geben Sie beispielsweise im Befehl für einen Objektspeicher mit der ID 0000 an0
.
-
-
-
Melden Sie sich beim fehlgeschlagenen Speicherknoten an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
-
Geben Sie das in der Datei aufgeführte Passwort ein
Passwords.txt
. -
Geben Sie den folgenden Befehl ein, um zu root zu wechseln:
su -
-
Geben Sie das in der Datei aufgeführte Passwort ein
Passwords.txt
.Wenn Sie als root angemeldet sind, wechselt die Eingabeaufforderung von
$
zu#
.
-
-
Führen Sie das folgende Skript aus, um die Bereitstellung eines ausgefallenen Speichervolume aufzuheben:
sn-unmount-volume object_store_ID
-
Wenn Sie dazu aufgefordert werden, drücken Sie y, um den Cassandra-Service abhängig von Speichervolume 0 zu beenden.
Wenn der Cassandra-Dienst bereits angehalten wurde, werden Sie nicht dazu aufgefordert. Der Cassandra-Service wird nur für Volume 0 angehalten. root@Storage-180:~/var/local/tmp/storage~ # sn-unmount-volume 0 Services depending on storage volume 0 (cassandra) aren't down. Services depending on storage volume 0 must be stopped before running this script. Stop services that require storage volume 0 [y/N]? y Shutting down services that require storage volume 0. Services requiring storage volume 0 stopped. Unmounting /var/local/rangedb/0 /var/local/rangedb/0 is unmounted.
In einigen Sekunden wird das Volume abgehängt. Die Meldungen werden angezeigt, die jeden Schritt des Prozesses angeben. Die letzte Meldung gibt an, dass das Volume abgehängt wurde.
-
Wenn das Unmounten fehlschlägt, weil das Volume ausgelastet ist, können Sie das Unmounten erzwingen. Verwenden Sie dazu die
--use-umountof
Option:Das Erzwingen einer Unmounten mithilfe der --use-umountof
Option kann dazu führen, dass sich Prozesse oder Dienste, die das Volume verwenden, unerwartet verhalten oder abstürzen.root@Storage-180:~ # sn-unmount-volume --use-umountof /var/local/rangedb/2 Unmounting /var/local/rangedb/2 using umountof /var/local/rangedb/2 is unmounted. Informing LDR service of changes to storage volumes