Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

비운영 관리자 노드를 복구할 때 Prometheus 메트릭을 복원합니다

기여자

선택적으로, 장애가 발생한 비 운영 관리 노드에서 Prometheus가 유지 관리하는 기간별 메트릭을 유지할 수 있습니다.

시작하기 전에
  • 복구된 관리자 노드가 설치되고 실행 중입니다.

  • StorageGRID 시스템에는 최소 2개의 관리 노드가 포함됩니다.

  • `Passwords.txt`파일이 있습니다.

  • 프로비저닝 암호가 있습니다.

이 작업에 대해

관리 노드에 장애가 발생하면 관리 노드의 Prometheus 데이터베이스에 유지되는 메트릭이 손실됩니다. 관리 노드를 복구하면 소프트웨어 설치 프로세스에서 새 Prometheus 데이터베이스를 생성합니다. 복구된 관리 노드가 시작된 후 StorageGRID 시스템의 새 설치를 수행한 것처럼 메트릭을 기록합니다.

운영 관리자 노드가 아닌 노드를 복원한 경우 기본 관리 노드(source Admin Node)에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사하여 기간별 메트릭을 복원할 수 있습니다.

참고 Prometheus 데이터베이스를 복사하는 데 1시간 이상이 걸릴 수 있습니다. 소스 관리 노드에서 서비스가 중지되는 동안에는 일부 Grid Manager 기능을 사용할 수 없습니다.
단계
  1. 소스 관리 노드에 로그인합니다.

    1. 다음 명령을 입력합니다. ssh admin@grid_node_IP

    2. 파일에 나열된 암호를 Passwords.txt 입력합니다.

    3. 다음 명령을 입력하여 루트로 전환합니다. su -

    4. 파일에 나열된 암호를 Passwords.txt 입력합니다.

  2. 소스 관리자 노드에서 Prometheus 서비스를 중지합니다. service prometheus stop

  3. 복구된 관리자 노드에서 다음 단계를 완료합니다.

    1. 복구된 관리자 노드에 로그인합니다.

      1. 다음 명령을 입력합니다. ssh admin@grid_node_IP

      2. 파일에 나열된 암호를 Passwords.txt 입력합니다.

      3. 다음 명령을 입력하여 루트로 전환합니다. su -

      4. 파일에 나열된 암호를 Passwords.txt 입력합니다.

    2. Prometheus 서비스를 중지합니다. service prometheus stop

    3. SSH 에이전트에 SSH 개인 키를 추가합니다. 다음을 입력합니다.ssh-add

    4. 파일에 나열된 SSH 액세스 암호를 Passwords.txt 입력합니다.

    5. 소스 관리자 노드에서 복구된 관리자 노드로 Prometheus 데이터베이스를 복사합니다. /usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP

    6. 메시지가 표시되면 * Enter * 를 눌러 복구된 관리 노드에서 새 Prometheus 데이터베이스를 파기할지 확인합니다.

      원래 Prometheus 데이터베이스와 해당 기록 데이터가 복구된 관리 노드에 복사됩니다. 복사 작업이 완료되면 스크립트는 복구된 관리자 노드를 시작합니다. 다음 상태가 나타납니다.

    데이터베이스가 복제되어 서비스를 시작하는 중입니다

    1. 다른 서버에 대한 암호 없는 액세스가 더 이상 필요하지 않으면 SSH 에이전트에서 개인 키를 제거합니다. 다음을 입력합니다.ssh-add -D

  4. 소스 관리자 노드에서 Prometheus 서비스를 다시 시작합니다.service prometheus start