Ripristinare le metriche Prometheus durante il ripristino del nodo di amministrazione non primario
In alternativa, è possibile conservare le metriche storiche gestite da Prometheus su un nodo amministrativo non primario che ha avuto problemi.
-
Il nodo Admin recuperato è installato e in esecuzione.
-
Il sistema StorageGRID include almeno due nodi di amministrazione.
-
Hai il
Passwords.txt
file. -
Si dispone della passphrase di provisioning.
In caso di guasto di un nodo di amministrazione, le metriche mantenute nel database Prometheus sul nodo di amministrazione andranno perse. Quando si ripristina l'Admin Node, il processo di installazione del software crea un nuovo database Prometheus. Una volta avviato il nodo di amministrazione recuperato, vengono registrate le metriche come se fosse stata eseguita una nuova installazione del sistema StorageGRID.
Se è stato ripristinato un nodo di amministrazione non primario, è possibile ripristinare le metriche storiche copiando il database Prometheus dal nodo di amministrazione primario (il nodo di amministrazione di origine) al nodo di amministrazione recuperato.
La copia del database Prometheus potrebbe richiedere un'ora o più. Alcune funzionalità di Grid Manager non saranno disponibili mentre i servizi vengono arrestati sul nodo di amministrazione di origine. |
-
Accedere al nodo di amministrazione di origine:
-
Immettere il seguente comando:
ssh admin@grid_node_IP
-
Immettere la password elencata in
Passwords.txt
file. -
Immettere il seguente comando per passare a root:
su -
-
Immettere la password elencata in
Passwords.txt
file.
-
-
Dal nodo Admin di origine, arrestare il servizio Prometheus:
service prometheus stop
-
Completare i seguenti passaggi sul nodo di amministrazione ripristinato:
-
Accedere al nodo di amministrazione recuperato:
-
Immettere il seguente comando:
ssh admin@grid_node_IP
-
Immettere la password elencata in
Passwords.txt
file. -
Immettere il seguente comando per passare a root:
su -
-
Immettere la password elencata in
Passwords.txt
file.
-
-
Interrompere il servizio Prometheus:
service prometheus stop
-
Aggiungere la chiave privata SSH all'agente SSH. Inserire:
ssh-add
-
Inserire la password di accesso SSH elencata in
Passwords.txt
file. -
Copiare il database Prometheus dal nodo di amministrazione di origine al nodo di amministrazione recuperato:
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
Quando richiesto, premere Invio per confermare che si desidera distruggere il nuovo database Prometheus nel nodo di amministrazione recuperato.
Il database Prometheus originale e i relativi dati storici vengono copiati nel nodo Admin recuperato. Al termine dell'operazione di copia, lo script avvia il nodo Admin recuperato. Viene visualizzato il seguente stato:
Database clonato, avvio dei servizi
-
Se non si richiede più l'accesso senza password ad altri server, rimuovere la chiave privata dall'agente SSH. Inserire:
ssh-add -D
-
-
Riavviare il servizio Prometheus sul nodo di amministrazione di origine.
service prometheus start