Datenreparaturaufträge werden überprüft
Bevor Sie einen Grid-Node außer Betrieb nehmen, müssen Sie bestätigen, dass keine Datenreparatur-Jobs aktiv sind. Wenn Reparaturen fehlgeschlagen sind, müssen Sie sie neu starten und vor der Außerbetriebnahme abschließen lassen.
Wenn Sie einen getrennten Speicherknoten stilllegen müssen, führen Sie diese Schritte auch aus, nachdem der Vorgang abgeschlossen wurde, um sicherzustellen, dass der Reparaturauftrag erfolgreich abgeschlossen wurde. Sie müssen sicherstellen, dass alle Fragmente, die mit Erasure-Coding-Verfahren codiert wurden, die sich auf dem entfernten Node befanden, erfolgreich wiederhergestellt wurden.
Die Schritte gelten nur für Systeme mit Erasure-Coding-Objekten.
-
Melden Sie sich beim primären Admin-Node an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
Wenn Sie als root angemeldet sind, ändert sich die Eingabeaufforderung von
$
Bis#
. -
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei: -
Geben Sie den folgenden Befehl ein, um zum Root zu wechseln:
su -
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei:
-
-
Auf laufende Reparaturen prüfen:
repair-data show-ec-repair-status
-
Wenn Sie noch nie einen Datenreparaturauftrag ausgeführt haben, wird die Ausgabe angezeigt
No job found
. Sie müssen keine Reparaturaufträge neu starten. -
Wenn der Datenreparaturauftrag zuvor ausgeführt wurde oder derzeit ausgeführt wird, listet die Ausgabe Informationen für die Reparatur auf. Jede Reparatur hat eine eindeutige Reparatur-ID. Fahren Sie mit dem nächsten Schritt fort.
root@DC1-ADM1:~ # repair-data show-ec-repair-status Repair ID Scope Start Time End Time State Est/Affected Bytes Repaired Retry Repair =================================================================================== 949283 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9 Success 17359 17359 No 949292 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9 Failure 17359 0 Yes 949294 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9 Failure 17359 0 Yes 949299 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9 Failure 17359 0 Yes
-
-
Wenn der Zustand für alle Reparaturen ist
Success
, Sie müssen keine Reparaturaufträge neu starten. -
Wenn der Status für eine Reparatur ist
Failure
, Sie müssen diese Reparatur neu starten.-
Beziehen Sie die Reparatur-ID für die fehlerhafte Reparatur von der Ausgabe.
-
Führen Sie die aus
repair-data start-ec-node-repair
Befehl.Verwenden Sie die
--repair-id
Option zum Festlegen der Reparatur-ID. Wenn Sie beispielsweise eine Reparatur mit der Reparatur-ID 949292 erneut versuchen möchten, führen Sie den folgenden Befehl aus:repair-data start-ec-node-repair --repair-id 949292
-
Verfolgen Sie den Status der EC-Datenreparaturen weiter, bis der Zustand für alle Reparaturen vorliegt
Success
.
-