問題を特定し、失敗した保護ジョブの修正アクションを実行します
ジョブの失敗に関するエラー メッセージを[イベントの詳細]ページの[原因]フィールドで確認し、ジョブが失敗した原因がSnapshotコピー エラーであることを特定します。次に、[ボリューム / 健全性の詳細]ページに移動して詳細情報を収集します。
アプリケーション管理者のロールが必要です。
[イベントの詳細]ページの[原因]フィールドに表示されるエラー メッセージには、失敗したジョブに関する次のテキストが記載されています。
Protection Job Failed. Reason: (Transfer operation for relationship 'cluster2_src_svm:cluster2_src_vol2->cluster3_dst_svm: managed_svc2_vol3' ended unsuccessfully. Last error reported by Data ONTAP: Failed to create Snapshot copy 0426cluster2_src_vol2snap on volume cluster2_src_svm:cluster2_src_vol2. (CSM: An operation failed due to an ONC RPC failure.) Job Details
このメッセージから得られる情報は次のとおりです。
-
バックアップ ジョブまたはミラー ジョブが正常に完了しなかった。
このジョブにはソースボリューム間の保護関係が含まれていました
cluster2_src_vol2`仮想サーバー上 `cluster2_src_svm`宛先ボリューム `managed_svc2_vol3`仮想サーバー上の `cluster3_dst_svm
。 -
スナップショットコピージョブが失敗しました
0426cluster2_src_vol2snap`ソースボリューム上 `cluster2_src_svm:/cluster2_src_vol2
。
このシナリオでは、ジョブが失敗した原因と考えられる対処策を特定できます。ただし、失敗を解決するには、System Manager Web UIまたはONTAP CLIコマンドを使用する必要があります。
-
エラー メッセージを確認し、ソース ボリュームでSnapshotコピー ジョブが失敗していることから、おそらくソース ボリュームに問題があると判断します。
オプションで、エラー メッセージの最後にある ジョブの詳細 リンクをクリックすることもできますが、このシナリオでは、それを行わないことを選択します。
-
イベントを解決するために、次の作業を行います。
-
[割り当て先] ボタンをクリックし、メニューから [自分] を選択します。
-
イベントにアラートが設定されている場合は、アラート通知を繰り返し受信しないように、[確認] ボタンをクリックします。
-
必要に応じて、イベントに関するメモを追加することもできます。
-
-
ソース ボリュームの詳細を表示するには、[概要] ペインの [ソース] フィールドをクリックします。
ソース フィールドには、ソース オブジェクトの名前が含まれます。この場合は、スナップショット コピー ジョブがスケジュールされたボリュームです。
ボリューム/健全性の詳細ページには、
cluster2_src_vol2
、保護タブの内容を表示します。 -
保護トポロジ グラフを見ると、トポロジの最初のボリューム(SnapMirror関係のソース ボリューム)にエラー アイコンが関連付けられています。
また、そのボリュームに設定されている警告とエラーのしきい値を示す水平のバーが、ソース ボリューム アイコンに表示されています。
-
エラー アイコンにカーソルを合わせると、ポップアップ ダイアログが開いてしきい値の設定が表示され、ボリュームがエラーしきい値を超えて容量の問題が発生していることがわかります。
-
*容量*タブをクリックします。
ボリュームの容量情報 `cluster2_src_vol2`表示されます。
-
容量 パネルの棒グラフにエラー アイコンが表示されています。これも、ボリューム容量がボリュームに設定されたしきい値レベルを超えたことを示しています。
-
容量グラフの下には、ボリュームの自動拡張が無効になっていることと、ボリュームのスペース ギャランティが設定されていることが示されています。
自動拡張を有効にすることもできますが、このシナリオの目的上、さらに調査を進めてから、容量の問題を解決する方法を決定することにします。
-
イベント リストまで下にスクロールすると、保護ジョブの失敗、ボリュームがいっぱいになるまでの日数、ボリューム領域がいっぱいのイベントが生成されていることがわかります。
-
イベント リストで、ボリューム スペースがいっぱい イベントをクリックして詳細情報を取得し、このイベントが容量の問題に最も関連していると判断しました。
[イベントの詳細]ページには、ソース ボリュームに対して「ボリューム スペースがフル」イベントが表示されています。
-
概要 領域で、イベントの原因フィールドを確認します。
The full threshold set at 90% is breached. 45.38 MB (95.54%) of 47.50 MB is used
。 -
[サマリ]領域の下の[推奨される対処方法]に、推奨される対処策が表示されます。
[推奨される対処方法]は一部のイベントだけに表示されるため、どのタイプのイベントでもこの領域が表示されるわけではありません。
「ボリューム スペースがフル」イベントを解決するために実施する推奨対処策をクリックしていきます。
-
このボリュームの自動拡張を有効にします。
-
ボリュームのサイズを変更する。
-
このボリュームで重複排除を有効にして実行します。
-
このボリュームで圧縮を有効にして実行します。
-
-
ボリュームの自動拡張を有効にすることにしましたが、これを行うには、親アグリゲート上の空きスペースと現在のボリューム増加率を確認する必要があります。
-
親集計を見てください。
cluster2_src_aggr1
関連デバイス ペインで。アグリゲートの名前をクリックすると、アグリゲートに関する詳細情報を参照できます。
ボリュームに自動拡張を有効にするための十分なスペースがあることを確認します。
-
ページ上部に重要なインシデントを示すアイコンが表示されるので、アイコンの下のテキストを確認します。
「完了までの日数: 1 日未満 | 1 日あたりの増加率: 5.4%」であると判断します。
-
-
システムマネージャに移動するか、 ONTAP CLIにアクセスして有効にします。 `volume autogrow`オプション。
ボリュームとアグリゲートの名前をメモしておいて、自動拡張を有効にするときに参照できるようにします。
-
容量の問題を解決したら、Unified Manager の イベント 詳細ページに戻り、イベントを解決済みとしてマークします。