日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

非プライマリ管理ノードをリカバリする際に Prometheus 指標をリストアする

寄稿者

非プライマリ管理ノードで障害が発生した場合、そのノード上の Prometheus で管理されていた過去の指標を必要に応じてリストアすることができます。

  • リカバリした管理ノードをインストールして実行する必要があります。

  • StorageGRID システムには管理ノードが少なくとも 2 つ必要です。

  • 「 passwords.txt 」ファイルが必要です。

  • プロビジョニングパスフレーズが必要です。

管理ノードで障害が発生すると、 Prometheus データベースで管理されていた管理ノード上の指標は失われます。管理ノードをリカバリする際に、ソフトウェアのインストールプロセスによって新しい Prometheus データベースが作成されます。リカバリした管理ノードを起動すると、 StorageGRID システムを新規にインストールした場合と同様に指標が記録されます。

非プライマリ管理ノードをリストアした場合は、プライマリ管理ノード( source Admin Node) の Prometheus データベースをリカバリした管理ノードにコピーすることで、過去の指標をリストアできます。

注記 Prometheus データベースのコピーには 1 時間以上かかる場合があります。ソース管理ノードでサービスが停止している間は、グリッドマネージャの一部の機能が使用できなくなります。
  1. ソース管理ノードにログインします。

    1. 次のコマンドを入力します。 ssh admin@_grid_node_name

    2. 「 passwords.txt 」ファイルに記載されたパスワードを入力します。

    3. root に切り替えるには、次のコマンドを入力します

    4. 「 passwords.txt 」ファイルに記載されたパスワードを入力します。

  2. ソース管理ノードから Prometheus サービス「 service prometheusSTOP 」を停止します

  3. リカバリした管理ノードで次の手順を実行します。

    1. リカバリした管理ノードにログインします。

      1. 次のコマンドを入力します。 ssh admin@_grid_node_name

      2. 「 passwords.txt 」ファイルに記載されたパスワードを入力します。

      3. root に切り替えるには、次のコマンドを入力します

      4. 「 passwords.txt 」ファイルに記載されたパスワードを入力します。

    2. Prometheus サービス「 service prometheusSTOP 」を停止します

    3. SSH エージェントに SSH 秘密鍵を追加します。「 ssh -add 」と入力します

    4. 「 passwords.txt 」ファイルに記載された SSH アクセスパスワードを入力します。

    5. ソース管理ノードの Prometheus データベースをリカバリした管理ノードにコピーします: /usr/local/prometheus/bin/prometheus-clone-db.sh source_Admin_Node_ip

    6. プロンプトが表示されたら、 * Enter * を押して、リカバリした管理ノード上の新しい Prometheus データベースを破棄することを確認します。

      元の Prometheus データベースとその履歴データが、リカバリした管理ノードにコピーされます。コピー処理が完了すると、リカバリした管理ノードがスクリプトによって起動されます。次のステータスが表示されます。

    データベースのクローニング、サービスの開始

    1. 他のサーバにパスワードなしでアクセスする必要がなくなった場合は、 SSH エージェントから秘密鍵を削除します。「 ssh -add-D`` 」と入力します

  4. ソース管理ノードで Prometheus サービスを再起動します。「 service prometheusstart