Wiederherstellen eines Speicherknoten, der länger als 15 Tage ausgefallen ist
Wenn ein einzelner Storage-Node länger als 15 Tage offline war und nicht mit anderen Storage-Nodes verbunden ist, müssen Sie Cassandra auf dem Node neu aufbauen.
-
Sie haben überprüft, dass keine Ausmusterung von Storage-Nodes ausgeführt wird oder Sie den Vorgang zur Deaktivierung eines Node angehalten haben. (Wählen Sie im Grid Manager die Option Wartung Wartungsaufgaben Dekommission.)
-
Sie haben überprüft, dass keine Erweiterung ausgeführt wird. (Wählen Sie im Grid Manager die Option Wartung Wartungsaufgaben Erweiterung.)
Storage-Nodes verfügen über eine Cassandra Datenbank mit Objekt-Metadaten. Wenn ein Storage-Node seit mehr als 15 Tagen nicht mit anderen Storage-Nodes kommunizieren kann, geht StorageGRID davon aus, dass die Cassandra-Datenbank des Node veraltet ist. Der Storage-Node kann erst wieder dem Grid beitreten, wenn Cassandra mithilfe von Informationen anderer Storage-Nodes neu erstellt wurde.
Verwenden Sie dieses Verfahren, um Cassandra nur dann neu aufzubauen, wenn ein einzelner Storage-Node ausfällt. Wenden Sie sich an den technischen Support, wenn weitere Storage-Nodes offline sind oder wenn Cassandra innerhalb der letzten 15 Tage auf einem anderen Storage-Node neu erstellt wurde. Dazu gehört beispielsweise das Verfahren zur Wiederherstellung ausgefallener Storage-Volumes oder zur Wiederherstellung eines ausgefallenen Storage-Nodes.
Wenn mehrere Speicherknoten ausgefallen sind (oder offline ist), wenden Sie sich an den technischen Support. Führen Sie den folgenden Wiederherstellungsvorgang nicht durch. Es kann zu Datenverlusten kommen. |
Falls dies der zweite Ausfall des Storage-Nodes in weniger als 15 Tagen nach Ausfall oder Wiederherstellung eines Storage-Nodes ist, wenden Sie sich an den technischen Support. Führen Sie den folgenden Wiederherstellungsvorgang nicht durch. Es kann zu Datenverlusten kommen. |
Wenn mehr als ein Speicherknoten an einem Standort ausgefallen ist, ist möglicherweise ein Verfahren zur Standortwiederherstellung erforderlich. Wenden Sie sich an den technischen Support. |
-
Schalten Sie ggf. den Storage-Node ein, der wiederhergestellt werden muss.
-
Melden Sie sich beim Grid-Node an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei: -
Geben Sie den folgenden Befehl ein, um zum Root zu wechseln:
su -
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei:
Wenn Sie als root angemeldet sind, ändert sich die Eingabeaufforderung von
$
Bis#
.+ -
Wenn Sie sich beim Grid-Node nicht anmelden können, ist die Systemfestplatte möglicherweise nicht intakt. Gehen Sie das Verfahren zum Wiederherstellen nach einem Systemausfall durch. "Wiederherstellung nach einem Systemausfall" |
-
Führen Sie die folgenden Prüfungen auf dem Speicherknoten durch:
-
Geben Sie diesen Befehl ein:
nodetool status
Die Ausgabe sollte sein
Connection refused
-
Wählen Sie im Grid Manager Support Tools Grid Topology aus.
-
Wählen Sie site Storage Node SSM Services aus. Vergewissern Sie sich, dass der Cassandra-Service angezeigt wird
Not Running
. -
Wählen Sie Storage Node SSM Ressourcen. Vergewissern Sie sich, dass im Abschnitt Volumes kein Fehlerstatus vorhanden ist.
-
Geben Sie diesen Befehl ein:
grep -i Cassandra /var/local/log/servermanager.log
Die folgende Meldung sollte in der Ausgabe angezeigt werden:
Cassandra not started because it has been offline for more than 15 day grace period - rebuild Cassandra
-
-
Geben Sie diesen Befehl ein, und überwachen Sie die Skriptausgabe:
check-cassandra-rebuild
-
Wenn Speicherservices ausgeführt werden, werden Sie aufgefordert, diese zu beenden. Geben Sie ein: Y
-
Überprüfen Sie die Warnungen im Skript. Wenn keine dieser Möglichkeiten gelten, bestätigen Sie, dass Sie Cassandra neu aufbauen möchten. Geben Sie ein: Y
Einige StorageGRID-Wiederherstellungsverfahren verwenden Reaper für die Bearbeitung von Cassandra-Reparaturen. Reparaturen werden automatisch ausgeführt, sobald die entsprechenden oder erforderlichen Services gestartet wurden. Sie können die Skriptausgabe bemerken, die “reaper” oder “Cassandra Reparatur erwähnt.” Wenn eine Fehlermeldung angezeigt wird, dass die Reparatur fehlgeschlagen ist, führen Sie den in der Fehlermeldung angegebenen Befehl aus.
-
-
Führen Sie nach Abschluss der Neuerstellung die folgenden Prüfungen durch:
-
Wählen Sie im Grid Manager Support Tools Grid Topology aus.
-
Wählen Sie site wiederhergestellten Speicherknoten SSM Services.
-
Vergewissern Sie sich, dass alle Dienste ausgeführt werden.
-
Wählen Sie DDS Data Store.
-
Bestätigen Sie, dass der Data Store Status „
up
“ und der Data Store State „normal
“ lautet.
-