비운영 관리자 노드를 복구할 때 Prometheus 메트릭을 복원합니다
선택적으로, 장애가 발생한 비 운영 관리 노드에서 Prometheus가 유지 관리하는 기간별 메트릭을 유지할 수 있습니다.
-
복구된 관리자 노드를 설치하고 실행해야 합니다.
-
StorageGRID 시스템에는 적어도 두 개의 관리 노드가 포함되어야 합니다.
-
"passwords.txt" 파일이 있어야 합니다.
-
프로비저닝 암호가 있어야 합니다.
관리 노드에 장애가 발생하면 관리 노드의 Prometheus 데이터베이스에 유지되는 메트릭이 손실됩니다. 관리 노드를 복구하면 소프트웨어 설치 프로세스에서 새 Prometheus 데이터베이스를 생성합니다. 복구된 관리 노드가 시작된 후 StorageGRID 시스템의 새 설치를 수행한 것처럼 메트릭을 기록합니다.
운영 관리자 노드가 아닌 노드를 복원한 경우 기본 관리 노드(source Admin Node)에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사하여 기간별 메트릭을 복원할 수 있습니다.
Prometheus 데이터베이스를 복사하는 데 1시간 이상이 걸릴 수 있습니다. 소스 관리 노드에서 서비스가 중지되는 동안에는 일부 Grid Manager 기능을 사용할 수 없습니다. |
-
소스 관리 노드에 로그인합니다.
-
'ssh admin@grid_node_ip' 명령을 입력합니다
-
"passwords.txt" 파일에 나열된 암호를 입력합니다.
-
루트로 전환하려면 다음 명령을 입력합니다
-
"passwords.txt" 파일에 나열된 암호를 입력합니다.
-
-
Source Admin Node에서 Prometheus 서비스 'Service Prometheus stop'을 중지합니다
-
복구된 관리자 노드에서 다음 단계를 완료합니다.
-
복구된 관리자 노드에 로그인합니다.
-
'ssh admin@grid_node_ip' 명령을 입력합니다
-
"passwords.txt" 파일에 나열된 암호를 입력합니다.
-
루트로 전환하려면 다음 명령을 입력합니다
-
"passwords.txt" 파일에 나열된 암호를 입력합니다.
-
-
프로메테우스 서비스 '프로메테우스 서비스'를 중단하십시오
-
SSH 에이전트에 SSH 개인 키를 추가합니다. ssh-add를 입력합니다
-
"passwords.txt" 파일에 나열된 SSH 액세스 암호를 입력합니다.
-
소스 관리 노드에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사합니다: "/usr/local/Prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP"
-
메시지가 표시되면 * Enter * 를 눌러 복구된 관리 노드에서 새 Prometheus 데이터베이스를 파기할지 확인합니다.
원래 Prometheus 데이터베이스와 해당 기록 데이터가 복구된 관리 노드에 복사됩니다. 복사 작업이 완료되면 스크립트는 복구된 관리자 노드를 시작합니다. 다음 상태가 나타납니다.
데이터베이스가 복제되어 서비스를 시작하는 중입니다
-
다른 서버에 대한 암호 없는 액세스가 더 이상 필요하지 않으면 SSH 에이전트에서 개인 키를 제거합니다. ssh-add-D를 입력합니다
-
-
Source Admin Node에서 Prometheus 서비스를 다시 시작하고, Service Prometheus start를 한다