비 운영 관리 노드를 복구할 때 Prometheus 메트릭을 복원하는 중입니다
선택적으로, 장애가 발생한 비 운영 관리 노드에서 Prometheus가 유지 관리하는 기간별 메트릭을 유지할 수 있습니다.
-
복구된 관리자 노드를 설치하고 실행해야 합니다.
-
StorageGRID 시스템에는 적어도 두 개의 관리 노드가 포함되어야 합니다.
-
에 가 있어야 합니다
Passwords.txt
파일. -
프로비저닝 암호가 있어야 합니다.
관리 노드에 장애가 발생하면 관리 노드의 Prometheus 데이터베이스에 유지되는 메트릭이 손실됩니다. 관리 노드를 복구하면 소프트웨어 설치 프로세스에서 새 Prometheus 데이터베이스를 생성합니다. 복구된 관리 노드가 시작된 후 StorageGRID 시스템의 새 설치를 수행한 것처럼 메트릭을 기록합니다.
운영 관리자 노드가 아닌 노드를 복원한 경우 기본 관리 노드(source Admin Node)에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사하여 기간별 메트릭을 복원할 수 있습니다.
Prometheus 데이터베이스를 복사하는 데 1시간 이상이 걸릴 수 있습니다. 소스 관리 노드에서 서비스가 중지되는 동안에는 일부 Grid Manager 기능을 사용할 수 없습니다. |
-
소스 관리 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@grid_node_IP
-
에 나열된 암호를 입력합니다
Passwords.txt
파일. -
루트로 전환하려면 다음 명령을 입력합니다.
su -
-
에 나열된 암호를 입력합니다
Passwords.txt
파일.
-
-
소스 관리 노드에서 Prometheus 서비스를 중지합니다.
service prometheus stop
-
복구된 관리자 노드에서 다음 단계를 완료합니다.
-
복구된 관리자 노드에 로그인합니다.
-
다음 명령을 입력합니다.
ssh admin@grid_node_IP
-
에 나열된 암호를 입력합니다
Passwords.txt
파일. -
루트로 전환하려면 다음 명령을 입력합니다.
su -
-
에 나열된 암호를 입력합니다
Passwords.txt
파일.
-
-
Prometheus 서비스 중지:
service prometheus stop
-
SSH 에이전트에 SSH 개인 키를 추가합니다. 입력:
ssh-add
-
에 나열된 SSH 액세스 암호를 입력합니다
Passwords.txt
파일. -
소스 관리 노드에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사합니다.
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
메시지가 표시되면 * Enter * 를 눌러 복구된 관리 노드에서 새 Prometheus 데이터베이스를 파기할지 확인합니다.
원래 Prometheus 데이터베이스와 해당 기록 데이터가 복구된 관리 노드에 복사됩니다. 복사 작업이 완료되면 스크립트는 복구된 관리자 노드를 시작합니다. 다음 상태가 나타납니다.
데이터베이스가 복제되어 서비스를 시작하는 중입니다
-
다른 서버에 대한 암호 없는 액세스가 더 이상 필요하지 않으면 SSH 에이전트에서 개인 키를 제거합니다. 입력:
ssh-add -D
-
-
소스 관리 노드에서 Prometheus 서비스를 다시 시작합니다.
service prometheus start