Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

非プライマリ管理ノードをリカバリする際に Prometheus 指標をリストアする

共同作成者

非プライマリ管理ノードで障害が発生した場合、そのノード上の Prometheus で管理されていた過去の指標を必要に応じてリストアすることができます。

開始する前に
  • リカバリした管理ノードがインストールされて実行されている。

  • StorageGRID システムには少なくとも2つの管理ノードが含まれています。

  • あなたはファイルを持ってい `Passwords.txt`ます。

  • プロビジョニングパスフレーズを用意します。

タスクの内容

管理ノードで障害が発生すると、 Prometheus データベースで管理されていた管理ノード上の指標は失われます。管理ノードをリカバリする際に、ソフトウェアのインストールプロセスによって新しい Prometheus データベースが作成されます。リカバリした管理ノードを起動すると、 StorageGRID システムを新規にインストールした場合と同様に指標が記録されます。

非プライマリ管理ノードをリストアした場合は、プライマリ管理ノード( source Admin Node) の Prometheus データベースをリカバリした管理ノードにコピーすることで、過去の指標をリストアできます。

メモ Prometheus データベースのコピーには 1 時間以上かかる場合があります。ソース管理ノードでサービスが停止している間は、グリッドマネージャの一部の機能が使用できなくなります。
手順
  1. ソース管理ノードにログインします。

    1. 次のコマンドを入力します。 ssh admin@grid_node_IP

    2. ファイルに記載されているパスワードを入力し `Passwords.txt`ます。

    3. 次のコマンドを入力してrootに切り替えます。 su -

    4. ファイルに記載されているパスワードを入力し `Passwords.txt`ます。

  2. ソース管理ノードからPrometheusサービスを停止します。 service prometheus stop

  3. リカバリした管理ノードで次の手順を実行します。

    1. リカバリした管理ノードにログインします。

      1. 次のコマンドを入力します。 ssh admin@grid_node_IP

      2. ファイルに記載されているパスワードを入力し `Passwords.txt`ます。

      3. 次のコマンドを入力してrootに切り替えます。 su -

      4. ファイルに記載されているパスワードを入力し `Passwords.txt`ます。

    2. Prometheusサービスを停止します。 service prometheus stop

    3. SSH エージェントに SSH 秘密鍵を追加します。入力:ssh-add

    4. ファイルに記載されているSSHアクセスパスワードを入力し `Passwords.txt`ます。

    5. ソース管理ノードのPrometheusデータベースをリカバリした管理ノードにコピーします。 /usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP

    6. プロンプトが表示されたら、 * Enter * を押して、リカバリした管理ノード上の新しい Prometheus データベースを破棄することを確認します。

      元の Prometheus データベースとその履歴データが、リカバリした管理ノードにコピーされます。コピー処理が完了すると、リカバリした管理ノードがスクリプトによって起動されます。次のステータスが表示されます。

    データベースのクローニング、サービスの開始

    1. 他のサーバにパスワードなしでアクセスする必要がなくなった場合は、 SSH エージェントから秘密鍵を削除します。入力:ssh-add -D

  4. ソース管理ノードでPrometheusサービスを再起動します。.service prometheus start