Ripristina le metriche di Prometheus durante il ripristino del nodo di amministrazione non primario
Facoltativamente, è possibile conservare le metriche storiche gestite da Prometheus su un nodo di amministrazione non primario che ha subito un errore.
-
Il nodo amministrativo recuperato è installato e funzionante.
-
Il sistema StorageGRID include almeno due nodi amministrativi.
-
Tu hai il
Passwords.txt
file. -
Hai la passphrase di provisioning.
Se un nodo di amministrazione fallisce, le metriche mantenute nel database Prometheus sul nodo di amministrazione vanno perse. Quando si ripristina il nodo di amministrazione, il processo di installazione del software crea un nuovo database Prometheus. Dopo l'avvio del nodo amministrativo ripristinato, le metriche vengono registrate come se fosse stata eseguita una nuova installazione del sistema StorageGRID .
Se hai ripristinato un nodo amministrativo non primario, puoi ripristinare le metriche storiche copiando il database Prometheus dal nodo amministrativo primario (il nodo amministrativo di origine) al nodo amministrativo ripristinato.
|
La copia del database Prometheus potrebbe richiedere un'ora o più. Alcune funzionalità di Grid Manager non saranno disponibili mentre i servizi sono interrotti sul nodo di amministrazione di origine. |
-
Accedi al nodo di amministrazione di origine:
-
Immettere il seguente comando:
ssh admin@grid_node_IP
-
Inserisci la password elencata nel
Passwords.txt
file. -
Immettere il seguente comando per passare alla root:
su -
-
Inserisci la password elencata nel
Passwords.txt
file.
-
-
Dal nodo di amministrazione di origine, arrestare il servizio Prometheus:
service prometheus stop
-
Completare i seguenti passaggi sul nodo di amministrazione recuperato:
-
Accedi al nodo di amministrazione recuperato:
-
Immettere il seguente comando:
ssh admin@grid_node_IP
-
Inserisci la password elencata nel
Passwords.txt
file. -
Immettere il seguente comando per passare alla root:
su -
-
Inserisci la password elencata nel
Passwords.txt
file.
-
-
Interrompere il servizio Prometheus:
service prometheus stop
-
Aggiungere la chiave privata SSH all'agente SSH. Inserisci:
ssh-add
-
Immettere la password di accesso SSH elencata nel
Passwords.txt
file. -
Copiare il database Prometheus dal nodo amministrativo di origine al nodo amministrativo recuperato:
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
Quando richiesto, premere Invio per confermare che si desidera eliminare il nuovo database Prometheus sul nodo di amministrazione recuperato.
Il database Prometheus originale e i suoi dati storici vengono copiati nel nodo di amministrazione recuperato. Una volta completata l'operazione di copia, lo script avvia il nodo di amministrazione recuperato. Viene visualizzato il seguente stato:
Database clonato, avvio dei servizi
-
Quando non è più necessario l'accesso senza password ad altri server, rimuovere la chiave privata dall'agente SSH. Inserisci:
ssh-add -D
-
-
Riavviare il servizio Prometheus sul nodo di amministrazione di origine.
service prometheus start