Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

비운영 관리자 노드를 복구할 때 Prometheus 메트릭을 복원합니다

기여자

선택적으로, 장애가 발생한 비 운영 관리 노드에서 Prometheus가 유지 관리하는 기간별 메트릭을 유지할 수 있습니다.

  • 복구된 관리자 노드를 설치하고 실행해야 합니다.

  • StorageGRID 시스템에는 적어도 두 개의 관리 노드가 포함되어야 합니다.

  • "passwords.txt" 파일이 있어야 합니다.

  • 프로비저닝 암호가 있어야 합니다.

관리 노드에 장애가 발생하면 관리 노드의 Prometheus 데이터베이스에 유지되는 메트릭이 손실됩니다. 관리 노드를 복구하면 소프트웨어 설치 프로세스에서 새 Prometheus 데이터베이스를 생성합니다. 복구된 관리 노드가 시작된 후 StorageGRID 시스템의 새 설치를 수행한 것처럼 메트릭을 기록합니다.

운영 관리자 노드가 아닌 노드를 복원한 경우 기본 관리 노드(source Admin Node)에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사하여 기간별 메트릭을 복원할 수 있습니다.

참고 Prometheus 데이터베이스를 복사하는 데 1시간 이상이 걸릴 수 있습니다. 소스 관리 노드에서 서비스가 중지되는 동안에는 일부 Grid Manager 기능을 사용할 수 없습니다.
  1. 소스 관리 노드에 로그인합니다.

    1. 'ssh admin@grid_node_ip' 명령을 입력합니다

    2. "passwords.txt" 파일에 나열된 암호를 입력합니다.

    3. 루트로 전환하려면 다음 명령을 입력합니다

    4. "passwords.txt" 파일에 나열된 암호를 입력합니다.

  2. Source Admin Node에서 Prometheus 서비스 'Service Prometheus stop'을 중지합니다

  3. 복구된 관리자 노드에서 다음 단계를 완료합니다.

    1. 복구된 관리자 노드에 로그인합니다.

      1. 'ssh admin@grid_node_ip' 명령을 입력합니다

      2. "passwords.txt" 파일에 나열된 암호를 입력합니다.

      3. 루트로 전환하려면 다음 명령을 입력합니다

      4. "passwords.txt" 파일에 나열된 암호를 입력합니다.

    2. 프로메테우스 서비스 '프로메테우스 서비스'를 중단하십시오

    3. SSH 에이전트에 SSH 개인 키를 추가합니다. ssh-add를 입력합니다

    4. "passwords.txt" 파일에 나열된 SSH 액세스 암호를 입력합니다.

    5. 소스 관리 노드에서 복구된 관리 노드로 Prometheus 데이터베이스를 복사합니다: "/usr/local/Prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP"

    6. 메시지가 표시되면 * Enter * 를 눌러 복구된 관리 노드에서 새 Prometheus 데이터베이스를 파기할지 확인합니다.

      원래 Prometheus 데이터베이스와 해당 기록 데이터가 복구된 관리 노드에 복사됩니다. 복사 작업이 완료되면 스크립트는 복구된 관리자 노드를 시작합니다. 다음 상태가 나타납니다.

    데이터베이스가 복제되어 서비스를 시작하는 중입니다

    1. 다른 서버에 대한 암호 없는 액세스가 더 이상 필요하지 않으면 SSH 에이전트에서 개인 키를 제거합니다. ssh-add-D를 입력합니다

  4. Source Admin Node에서 Prometheus 서비스를 다시 시작하고, Service Prometheus start를 한다