Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

非プライマリ管理ノードを復旧するときに Prometheus メトリックを復元する

オプションで、障害が発生した非プライマリ管理ノード上で Prometheus によって維持される履歴メトリックを保持できます。

開始する前に
  • 回復された管理ノードがインストールされ、実行されています。

  • StorageGRIDシステムには、少なくとも 2 つの管理ノードが含まれます。

  • あなたは `Passwords.txt`ファイル。

  • プロビジョニング パスフレーズを持っています。

タスク概要

管理ノードに障害が発生すると、管理ノード上の Prometheus データベースに保持されているメトリックが失われます。管理ノードを回復すると、ソフトウェアのインストール プロセスによって新しい Prometheus データベースが作成されます。回復された管理ノードが起動すると、 StorageGRIDシステムの新規インストールを実行した場合と同じようにメトリックが記録されます。

プライマリ以外の管理ノードを復元した場合は、プライマリ管理ノード (ソース管理ノード) から復元された管理ノードに Prometheus データベースをコピーすることで、履歴メトリックを復元できます。

メモ Prometheus データベースのコピーには 1 時間以上かかる場合があります。ソース管理ノードでサービスが停止している間は、一部の Grid Manager 機能は利用できなくなります。
手順
  1. ソース管理ノードにログインします。

    1. 次のコマンドを入力します。 ssh admin@grid_node_IP

    2. 記載されているパスワードを入力してください `Passwords.txt`ファイル。

    3. ルートに切り替えるには、次のコマンドを入力します。 su -

    4. 記載されているパスワードを入力してください `Passwords.txt`ファイル。

  2. ソース管理ノードから、Prometheus サービスを停止します。 service prometheus stop

  3. 回復した管理ノードで次の手順を実行します。

    1. 回復した管理ノードにログインします。

      1. 次のコマンドを入力します。 ssh admin@grid_node_IP

      2. 記載されているパスワードを入力してください `Passwords.txt`ファイル。

      3. ルートに切り替えるには、次のコマンドを入力します。 su -

      4. 記載されているパスワードを入力してください `Passwords.txt`ファイル。

    2. Prometheus サービスを停止します。 service prometheus stop

    3. SSH エージェントに SSH 秘密キーを追加します。入力:ssh-add

    4. に記載されているSSHアクセスパスワードを入力してください `Passwords.txt`ファイル。

    5. ソース管理ノードから回復した管理ノードに Prometheus データベースをコピーします。 /usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP

    6. プロンプトが表示されたら、Enter キーを押して、回復した管理ノード上の新しい Prometheus データベースを破棄することを確認します。

      元の Prometheus データベースとその履歴データは、回復された管理ノードにコピーされます。コピー操作が完了すると、スクリプトは回復された管理ノードを起動します。次のステータスが表示されます。

    データベースのクローンを作成し、サービスを開始しています

    1. 他のサーバーへのパスワードなしのアクセスが不要になったら、SSH エージェントから秘密キーを削除します。入力:ssh-add -D

  4. ソース管理ノードでPrometheusサービスを再起動します。.service prometheus start