Wiederherstellen von Prometheus-Kennzahlen bei der Wiederherstellung eines primären Admin-Knotens
Optional können Sie die historischen Metriken aufbewahren, die von Prometheus auf einem primären Admin-Node gewartet wurden, der ausgefallen ist. Die Prometheus Kennzahlen können nur wiederhergestellt werden, wenn Ihr StorageGRID System einen anderen Admin-Knoten enthält.
-
Der wiederhergestellte Admin-Node muss installiert und ausgeführt werden.
-
Das StorageGRID System muss mindestens zwei Admin-Nodes enthalten.
-
Sie müssen die haben
Passwords.txt
Datei: -
Sie müssen über eine Passphrase für die Bereitstellung verfügen.
Wenn ein Admin-Knoten ausfällt, gehen die in der Prometheus-Datenbank auf dem Admin-Knoten gepflegten Kennzahlen verloren. Wenn Sie den Admin-Knoten wiederherstellen, erstellt der Software-Installationsprozess eine neue Prometheus-Datenbank. Nachdem der wiederhergestellte Admin-Node gestartet wurde, zeichnet er die Metriken auf, als ob Sie eine neue Installation des StorageGRID-Systems durchgeführt hatten.
Wenn Sie einen primären Admin-Knoten wiederhergestellt haben und Ihr StorageGRID-System einen anderen Admin-Knoten hat, können Sie die historischen Metriken wiederherstellen, indem Sie die Prometheus-Datenbank von einem nicht-primären Admin-Knoten (den Source Admin-Knoten) auf den wiederhergestellten primären Admin-Knoten kopieren. Wenn Ihr System nur einen primären Admin-Knoten hat, können Sie die Prometheus-Datenbank nicht wiederherstellen.
Das Kopieren der Prometheus-Datenbank dauert möglicherweise ein Stunde oder länger. Einige Grid Manager-Funktionen sind nicht verfügbar, während Dienste auf dem Quell-Admin-Node angehalten werden. |
-
Melden Sie sich beim Quell-Admin-Node an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei: -
Geben Sie den folgenden Befehl ein, um zum Root zu wechseln:
su -
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei:
-
-
Beenden Sie vom Quell-Admin-Node den Prometheus-Service:
service prometheus stop
-
Führen Sie die folgenden Schritte auf dem wiederhergestellten Admin-Knoten aus:
-
Melden Sie sich beim wiederhergestellten Admin-Knoten an:
-
Geben Sie den folgenden Befehl ein:
ssh admin@grid_node_IP
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei: -
Geben Sie den folgenden Befehl ein, um zum Root zu wechseln:
su -
-
Geben Sie das im aufgeführte Passwort ein
Passwords.txt
Datei:
-
-
Stoppen Sie den Prometheus Service:
service prometheus stop
-
Fügen Sie den SSH-privaten Schlüssel zum SSH-Agenten hinzu. Geben Sie Ein:
ssh-add
-
Geben Sie das SSH-Zugriffspasswort ein, das im aufgeführt ist
Passwords.txt
Datei: -
Kopieren Sie die Prometheus-Datenbank vom Quell-Admin-Knoten auf den wiederhergestellten Admin-Knoten:
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
Wenn Sie dazu aufgefordert werden, drücken Sie Enter, um zu bestätigen, dass Sie die neue Prometheus-Datenbank auf dem wiederhergestellten Admin-Knoten zerstören möchten.
Die ursprüngliche Prometheus-Datenbank und ihre historischen Daten werden auf den wiederhergestellten Admin-Knoten kopiert. Wenn der Kopiervorgang abgeschlossen ist, startet das Skript den wiederhergestellten Admin-Knoten. Der folgende Status wird angezeigt:
Datenbank geklont, Dienste starten
-
Wenn Sie keinen passwortlosen Zugriff auf andere Server mehr benötigen, entfernen Sie den privaten Schlüssel vom SSH-Agent. Geben Sie Ein:
ssh-add -D
-
-
Starten Sie den Prometheus-Service auf dem Quell-Admin-Node neu.
service prometheus start