비운영 관리자 노드를 복구할 때 Prometheus 메트릭을 복원합니다
선택적으로, 장애가 발생한 비 운영 관리 노드에서 Prometheus가 유지 관리하는 기간별 메트릭을 유지할 수 있습니다.
-
복구된 관리자 노드가 설치되고 실행 중입니다.
-
StorageGRID 시스템에는 최소 2개의 관리 노드가 포함됩니다.
-
`Passwords.txt`파일이 있습니다.
-
프로비저닝 암호가 있습니다.
관리 노드에 장애가 발생하면 관리 노드의 Prometheus 데이터베이스에 유지되는 메트릭이 손실됩니다. 관리 노드를 복구하면 소프트웨어 설치 프로세스에서 새 Prometheus 데이터베이스를 생성합니다. 복구된 관리 노드가 시작된 후 StorageGRID 시스템의 새 설치를 수행한 것처럼 메트릭을 기록합니다.
운영 관리자 노드가 아닌 노드를 복원한 경우 기본 관리 노드(source Admin Node)에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사하여 기간별 메트릭을 복원할 수 있습니다.
Prometheus 데이터베이스를 복사하는 데 1시간 이상이 걸릴 수 있습니다. 소스 관리 노드에서 서비스가 중지되는 동안에는 일부 Grid Manager 기능을 사용할 수 없습니다. |
-
소스 관리 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@grid_node_IP
-
파일에 나열된 암호를
Passwords.txt
입력합니다. -
다음 명령을 입력하여 루트로 전환합니다.
su -
-
파일에 나열된 암호를
Passwords.txt
입력합니다.
-
-
소스 관리자 노드에서 Prometheus 서비스를 중지합니다.
service prometheus stop
-
복구된 관리자 노드에서 다음 단계를 완료합니다.
-
복구된 관리자 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@grid_node_IP
-
파일에 나열된 암호를
Passwords.txt
입력합니다. -
다음 명령을 입력하여 루트로 전환합니다.
su -
-
파일에 나열된 암호를
Passwords.txt
입력합니다.
-
-
Prometheus 서비스를 중지합니다.
service prometheus stop
-
SSH 에이전트에 SSH 개인 키를 추가합니다. 다음을 입력합니다.
ssh-add
-
파일에 나열된 SSH 액세스 암호를
Passwords.txt
입력합니다. -
소스 관리자 노드에서 복구된 관리자 노드로 Prometheus 데이터베이스를 복사합니다.
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
메시지가 표시되면 * Enter * 를 눌러 복구된 관리 노드에서 새 Prometheus 데이터베이스를 파기할지 확인합니다.
원래 Prometheus 데이터베이스와 해당 기록 데이터가 복구된 관리 노드에 복사됩니다. 복사 작업이 완료되면 스크립트는 복구된 관리자 노드를 시작합니다. 다음 상태가 나타납니다.
데이터베이스가 복제되어 서비스를 시작하는 중입니다
-
다른 서버에 대한 암호 없는 액세스가 더 이상 필요하지 않으면 SSH 에이전트에서 개인 키를 제거합니다. 다음을 입력합니다.
ssh-add -D
-
-
소스 관리자 노드에서 Prometheus 서비스를 다시 시작합니다.
service prometheus start