プライマリ管理ノードをリカバリする際のPrometheus指標のリストア
プライマリ管理ノードで障害が発生した場合、そのノード上の Prometheus で管理されていた過去の指標を必要に応じてリストアすることができます。Prometheus 指標をリストアできるのは、 StorageGRID システムに別の管理ノードがある場合のみです。
-
リカバリした管理ノードをインストールして実行する必要があります。
-
StorageGRID システムには管理ノードが少なくとも 2 つ必要です。
-
を用意しておく必要があります
Passwords.txt
ファイル。 -
プロビジョニングパスフレーズが必要です。
管理ノードで障害が発生すると、 Prometheus データベースで管理されていた管理ノード上の指標は失われます。管理ノードをリカバリする際に、ソフトウェアのインストールプロセスによって新しい Prometheus データベースが作成されます。リカバリした管理ノードを起動すると、 StorageGRID システムを新規にインストールした場合と同様に指標が記録されます。
プライマリ管理ノードをリストアした StorageGRID システムに別の管理ノードがある場合は、プライマリでない管理ノード( _SOURCE 管理ノード)の Prometheus データベースをリカバリしたプライマリ管理ノードにコピーすることで、過去の指標をリストアできます。システムにプライマリ管理ノードしかない場合は、 Prometheus データベースをリストアできません。
Prometheus データベースのコピーには 1 時間以上かかる場合があります。ソース管理ノードでサービスが停止している間は、グリッドマネージャの一部の機能が使用できなくなります。 |
-
ソース管理ノードにログインします。
-
次のコマンドを入力します。
ssh admin@grid_node_IP
-
に記載されているパスワードを入力します
Passwords.txt
ファイル。 -
次のコマンドを入力してrootに切り替えます。
su -
-
に記載されているパスワードを入力します
Passwords.txt
ファイル。
-
-
ソース管理ノードからPrometheusサービスを停止します。
service prometheus stop
-
リカバリした管理ノードで次の手順を実行します。
-
リカバリした管理ノードにログインします。
-
次のコマンドを入力します。
ssh admin@grid_node_IP
-
に記載されているパスワードを入力します
Passwords.txt
ファイル。 -
次のコマンドを入力してrootに切り替えます。
su -
-
に記載されているパスワードを入力します
Passwords.txt
ファイル。
-
-
Prometheusサービスを停止します。
service prometheus stop
-
SSH エージェントに SSH 秘密鍵を追加します。入力するコマンド
ssh-add
-
に記載されているSSHアクセスパスワードを入力します
Passwords.txt
ファイル。 -
ソース管理ノードのPrometheusデータベースをリカバリした管理ノードにコピーします。
/usr/local/prometheus/bin/prometheus-clone-db.sh Source_Admin_Node_IP
-
プロンプトが表示されたら、 * Enter * を押して、リカバリした管理ノード上の新しい Prometheus データベースを破棄することを確認します。
元の Prometheus データベースとその履歴データが、リカバリした管理ノードにコピーされます。コピー処理が完了すると、リカバリした管理ノードがスクリプトによって起動されます。次のステータスが表示されます。
データベースのクローニング、サービスの開始
-
他のサーバにパスワードなしでアクセスする必要がなくなった場合は、 SSH エージェントから秘密鍵を削除します。入力するコマンド
ssh-add -D
-
-
ソース管理ノードでPrometheusサービスを再起動します.
service prometheus start