Restaure las métricas de Prometheus al recuperar un nodo de administración que no sea primario
De manera opcional, puede conservar las métricas históricas que mantiene Prometheus en un nodo de administración no primario que haya fallado.
-
El nodo de administrador recuperado debe estar instalado y en ejecución.
-
El sistema StorageGRID debe incluir al menos dos nodos de administración.
-
Debe tener la
Passwords.txt
archivo. -
Debe tener la clave de acceso de aprovisionamiento.
Si falla un nodo de administración, se pierden las métricas que se mantienen en la base de datos Prometheus del nodo de administración. Cuando recupera el nodo de administración, el proceso de instalación del software crea una nueva base de datos Prometheus. Una vez iniciado el nodo de administración recuperado, este registra las métricas como si hubiera realizado una nueva instalación del sistema StorageGRID.
Si restauró un nodo de administración no primario, puede restaurar las métricas históricas copiando la base de datos Prometheus del nodo de administración principal (el Source Admin Node) en el nodo de administración recuperado.
La copia de la base de datos Prometheus puede tardar una hora o más. Algunas funciones de Grid Manager no estarán disponibles mientras los servicios se detengan en el nodo de administración de origen. |
-
Inicie sesión en el nodo de administrador de origen:
-
Introduzca el siguiente comando:
ssh admin@grid_node_IP
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo. -
Introduzca el siguiente comando para cambiar a la raíz:
su -
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo.
-
-
Desde el nodo de administración de origen, detenga el servicio Prometheus:
service prometheus stop
-
Complete los siguientes pasos en el nodo de administración recuperado:
-
Inicie sesión en el nodo de administración recuperado:
-
Introduzca el siguiente comando:
ssh admin@grid_node_IP
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo. -
Introduzca el siguiente comando para cambiar a la raíz:
su -
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo.
-
-
Detenga el servicio Prometheus:
service prometheus stop
-
Añada la clave privada SSH al agente SSH. Introduzca:
ssh-add
-
Introduzca la contraseña de acceso SSH que aparece en la
Passwords.txt
archivo. -
Copie la base de datos Prometheus del nodo de administración de origen al nodo de administración recuperado:
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
Cuando se le solicite, pulse Intro para confirmar que desea destruir la nueva base de datos Prometheus del nodo de administración recuperado.
La base de datos Prometheus original y sus datos históricos se copian al nodo de administración recuperado. Una vez realizada la operación de copia, el script inicia el nodo de administración recuperado. Aparece el siguiente estado:
Base de datos clonada, servicios de inicio
-
Cuando ya no necesite un acceso sin contraseñas a otros servidores, quite la clave privada del agente SSH. Introduzca:
ssh-add -D
-
-
Reinicie el servicio Prometheus en el nodo de administración de origen.
service prometheus start