Skip to main content
本製品の最新リリースがご利用いただけます。
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

repair-dataジョブを監視します

共同作成者

を使用して修復ジョブのステータスを監視できます repair-data コマンドラインからスクリプトを実行します。

これには、ユーザが手動で開始したジョブや、運用停止手順 の一環としてStorageGRID によって自動的に開始されたジョブが含まれます。

メモ ボリュームリストアジョブを実行している場合は、 "Grid Managerで進捗状況を監視し、それらのジョブの履歴を表示します" 代わりに、

のステータスを監視します repair-data レプリケートデータ*、イレイジャーコーディング(EC)データ、またはその両方を使用するかどうかに基づくジョブ。

レプリケートデータ
  • レプリケートされた修復の完了率を推定するには、を追加します show-replicated-repair-status repair-dataコマンドのオプション。

    repair-data show-replicated-repair-status

  • 修理が完了しているかどうかを確認するには、次

    1. ノードを選択 * > * _ 修復中のストレージノード _ * > * ILM * を選択します。

    2. 「評価」セクションの属性を確認します。修理が完了すると、 *Awaiting - All * 属性は 0 個のオブジェクトを示します。

  • 修理を詳細に監視するには、次の手順を実行します。

    1. サポート * > * ツール * > * グリッドトポロジ * を選択します。

    2. 「 * grid* > * _ Storage Node being repaired _ * > * LDR * > * Data Store * 」を選択します。

    3. 次の属性を組み合わせて、レプリケートデータの修復が完了したかどうかを可能なかぎり判別します。

      メモ Cassandraに不整合がある可能性があり、失敗した修復は追跡されません。
      • * Repairs Attempted ( XRPA ) * :レプリケートデータの修復の進行状況を追跡します。この属性は、ストレージノードがハイリスクオブジェクトの修復を試みるたびに値が増分します。この属性の値が現在のスキャン期間( * Scan Period - - Estimated * 属性で指定)よりも長い期間にわたって上昇しない場合、 ILM スキャンはすべてのノードで修復が必要なハイリスクオブジェクトを検出していません。

        メモ ハイリスクオブジェクトとは、完全に失われる危険があるオブジェクトです。ILM設定を満たさないオブジェクトは含まれません。
      • * スキャン期間 - 推定( XSCM ) * :この属性を使用して、以前に取り込まれたオブジェクトにポリシー変更が適用されるタイミングを見積もります。「 * Repairs Attempted * 」属性が現在のスキャン期間よりも長くなっていない場合は、複製修復が実行されている可能性があります。スキャン期間は変わる可能性があるので注意してください。* Scan Period - - Estimated ( XSCM ) * 属性は、グリッド全体の環境 を示します。これは、すべてのノードのスキャン期間の最大値です。グリッドの * Scan Period - - Estimated * 属性履歴を照会して、適切な期間を判断できます。

イレイジャーコーディング(EC)データ

イレイジャーコーディングデータの修復を監視し、失敗した可能性のある要求を再試行するには、次の手順を実行します。

  1. イレイジャーコーディングデータの修復ステータスを確認します。

    • サポート * > * Tools * > * Metrics * を選択して、現在のジョブの完了までの推定時間と完了率を表示します。次に、 Grafana のセクションで * EC Overview * を選択します。グリッド EC ジョブの完了予想時間 * ダッシュボードと * グリッド EC ジョブの完了率 * ダッシュボードを確認します。

    • 特定のののステータスを表示するには、このコマンドを使用します repair-data 操作:

      repair-data show-ec-repair-status --repair-id repair ID

    • すべての修復処理を表示するには、次のコマンドを使用します

      repair-data show-ec-repair-status

    出力には、などの情報が表示されます `repair ID`以前に、現在実行中のすべての修復。

  2. 失敗した修復処理が出力された場合は、を使用します --repair-id 修復を再試行するオプションです。

    このコマンドは、修復 ID 6949309319275667690 を使用して、障害が発生したノードの修復を再試行します。

    repair-data start-ec-node-repair --repair-id 6949309319275667690

    このコマンドは、修復 ID 6949309319275667690 を使用して、障害が発生したボリュームの修復を再試行します。

    repair-data start-ec-volume-repair --repair-id 6949309319275667690