Restauration des metrics Prometheus lors de la restauration d'un nœud d'administration non primaire
Vous pouvez également conserver les metrics historiques gérés par Prometheus sur un nœud d'administration non primaire qui a échoué.
-
Le nœud d'administration restauré doit être installé et en cours d'exécution.
-
Le système StorageGRID doit inclure au moins deux nœuds d'administration.
-
Vous devez avoir le
Passwords.txt
fichier. -
Vous devez disposer de la phrase secrète pour le provisionnement.
En cas de panne d'un nœud d'administration, les metrics gérés dans la base de données Prometheus sur le nœud d'administration sont perdus. Lorsque vous restaurez le nœud d'administration, un processus d'installation logicielle crée une nouvelle base de données Prometheus. Une fois le nœud d'administration restauré démarré, il enregistre les metrics comme si vous aviez déjà effectué une nouvelle installation du système StorageGRID.
Si vous avez restauré un noeud d'administration non primaire, vous pouvez restaurer les metrics historiques en copiant la base de données Prometheus du noeud d'administration principal (le source Admin Node) vers le noeud d'administration récupéré.
La copie de la base de données Prometheus peut prendre une heure ou plus. Certaines fonctionnalités de Grid Manager ne seront pas disponibles lorsque les services sont arrêtés sur le nœud d'administration source. |
-
Connectez-vous au nœud d'administration source :
-
Saisissez la commande suivante :
ssh admin@grid_node_IP
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier. -
Entrez la commande suivante pour passer à la racine :
su -
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier.
-
-
Depuis le nœud d'administration source, arrêter le service Prometheus :
service prometheus stop
-
Effectuez les étapes suivantes sur le nœud d'administration restauré :
-
Connectez-vous au nœud d'administration restauré :
-
Saisissez la commande suivante :
ssh admin@grid_node_IP
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier. -
Entrez la commande suivante pour passer à la racine :
su -
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier.
-
-
Arrêtez le service Prometheus :
service prometheus stop
-
Ajoutez la clé privée SSH à l'agent SSH. Entrez :
ssh-add
-
Entrez le mot de passe d'accès SSH répertorié dans le
Passwords.txt
fichier. -
Copiez la base de données Prometheus du nœud d'administration source vers le nœud d'administration restauré :
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
Lorsque vous y êtes invité, appuyez sur Enter pour confirmer que vous souhaitez détruire la nouvelle base de données Prometheus sur le noeud d'administration restauré.
La base de données Prometheus d'origine et ses données historiques sont copiées sur le nœud d'administration restauré. Une fois l'opération de copie effectuée, le script démarre le nœud d'administration restauré. L'état suivant apparaît :
Base de données clonée, démarrage des services
-
Lorsque vous n'avez plus besoin d'un accès sans mot de passe à d'autres serveurs, supprimez la clé privée de l'agent SSH. Entrez :
ssh-add -D
-
-
Redémarrez le service Prometheus sur le nœud d'administration source.
service prometheus start