日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

システムモニタ

Cloud Insights には、指標とログの両方を監視するシステム定義のモニタが多数含まれています。使用可能なシステムモニタは、環境内にあるデータコレクタによって異なります。そのため、 Cloud Insights で使用できるモニタは、データコレクタが追加されたり、設定が変更されたりすると変更される可能性があります。

注記 ほとんどのシステムモニタは、デフォルトで Paused ステータスになっています。モニタを再開する前に、 Data Collector で _Advanced Counter Data Collection_and _Enable ONTAP EMS log collection_が 有効になっていることを確認する必要があります。これらのオプションは、 ONTAP データコレクタの _Advanced Configuration にあります。ONTAP の Advanced Counter および EMS Log Collection を有効にします

モニタの説明

システム定義のモニタは、事前に定義されたメトリックと条件に加えて、デフォルトの説明と修正アクションで構成されています。これらは変更できません。システム定義モニタの通知受信者リストを変更できます。メトリック、条件、概要、および修正アクションを表示したり、受信者リストを変更したりするには、システム定義のモニタグループを開き、リスト内のモニタ名をクリックします。

システム定義のモニタグループは変更または削除できません。

以下のシステム定義モニタは、記載されたグループで使用できます。

  • * ONTAP インフラストラクチャ * は、 ONTAP クラスタのインフラストラクチャ関連の問題を監視します。

  • * ONTAP ワークロードの例 * には、ワークロード関連の問題のモニターが含まれています。

  • 両方のグループのモニタのデフォルトは _Paused _ state です。

Cloud Insights に現在搭載されているシステムモニタは次のとおりです。

メトリックモニタ

モニタ名

CI の重大度

概要を監視します

対処方法

ファイバチャネルポートの利用率が高い

重要

ファイバチャネルプロトコルポートは、お客様のホストシステムと ONTAP LUN の間で SAN トラフィックを送受信するために使用されます。ポートの利用率が高い場合は、 そして、これはボトルネックになり、最終的にはファイバチャネルプロトコルの負荷の影響を受けやすいパフォーマンスに影響を与えます。…警告アラートは、ネットワークトラフィックのバランスを取るために計画されたアクションを実行する必要があることを示します。…重大アラートは、サービスの中断が差し迫っていること、およびネットワークのバランスを取るための緊急措置を示します サービスの継続性を確保するためのトラフィック。

重大のしきい値を超えた場合は、サービスの中断を最小限に抑えるための緊急の対処方法を検討してください: 1 。利用率の低い別の FCP ポートにワークロードを移動します。2. ONTAP またはホスト側の設定で QoS ポリシーを使用して、 FCP ポートの利用率を向上させることにより、特定の LUN のトラフィックを重要な処理のみに制限します。… 警告しきい値を超えた場合は、次の操作を実行するように計画してください: 1.データトラフィックを処理する FCP ポートを増やして、ポート利用率をより多くのポートに分散させます。2. 使用率の低い別の FCP ポートにワークロードを移動します。3. ONTAP またはホスト側の設定で QoS ポリシーを使用して、特定の LUN のトラフィックを重要な処理のみに制限し、 FCP ポートの利用率を高めます。

LUN レイテンシが高くなっています

重要

LUN は、 I/O トラフィックを処理するオブジェクトで、多くの場合、データベースなどのパフォーマンス重視のアプリケーションによって駆動されます。LUN のレイテンシが高いと、アプリケーション自体が影響を受け、タスクを実行できなくなる可能性があります。…警告アラートは、 LUN を適切なノードまたはアグリゲートに移動するために計画的なアクションが必要であることを示しています。…重大アラートは、サービスの停止が差し迫っていること、および緊急時の措置を講じる必要があることを示してい サービスの継続性を確保します。次に、メディアタイプに基づく想定レイテンシを示します。これは、最大 1 ~ 2 ミリ秒の SSD 、最大 8 ~ 10 ミリ秒の SAS 、および 17 ~ 20 ミリ秒の SATA HDD です

重大のしきい値を超えた場合は、サービスの中断を最小限に抑えるために次の操作を実行します。 LUN またはそのボリュームに QoS ポリシーが関連付けられている場合は、そのしきい値の制限を評価し、 LUN ワークロードの調整が原因であるかどうかを確認します。 警告しきい値を超えた場合は、次の操作を実行するように計画してください: 1.アグリゲートの利用率も高い場合は、 LUN を別のアグリゲートに移動してください。2. ノードの利用率が高い場合は、ボリュームを別のノードに移動するか、ノードのワークロードの合計を減らします。3. LUN またはそのボリュームに QoS ポリシーが関連付けられている場合は、しきい値の制限を評価し、 LUN ワークロードが調整されているかどうかを検証します。

ネットワークポートの利用率が高い

重要

ネットワークポートは、 NFS 、 CIFS 、および iSCSI のプロトコルトラフィックを受信して、お客様のホストシステムと ONTAP の間で転送するために使用されます。ポート利用率が高いとボトルネックになり、最終的には NFS のパフォーマンスに影響します。 CIFS と iSCSI のワークロード。警告アラートは、ネットワークトラフィックのバランスを取るために計画されたアクションを実行する必要があることを示しています。重要アラートは、サービスの中断が差し迫っていることを示しており、サービスの継続性を確保するためにネットワークトラフィックの負荷を分散するために緊急措置を講じる

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.ONTAP の QoS ポリシーまたはホスト側の分析によって、ネットワークポートの使用率を下げるために、特定のボリュームのトラフィックを重要な処理のみに制限します。2. 利用率の低い別のネットワークポートを使用するように 1 つ以上のボリュームを構成します。… 警告しきい値を超えた場合は、すぐに次の操作を実行することを検討してください。 1.データトラフィックを処理するネットワークポートを増やして、ポート利用率をより多くのポートに分散させます。2. 利用率の低い別のネットワークポートを使用するように 1 つ以上のボリュームを構成します。

NVMe ネームスペースレイテンシが高です

重要

NVMe ネームスペースは、データベースなどのパフォーマンス重視のアプリケーションで I/O トラフィックを処理するオブジェクトです。NVMe ネームスペースのレイテンシが高いと、アプリケーション自体が影響を受けてタスクを実行できなくなる可能性があります。…警告アラートは、 LUN を適切なノードまたはアグリゲートに移動するための計画的なアクションが必要であることを示しています。…重大アラートは、サービスの停止が迫っていること、および緊急時の措置を講じる必要があることを示し サービスの継続性を確保するため。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるための即時対処方法を検討します。 NVMe ネームスペースまたはそのボリュームに QoS ポリシーが割り当てられている場合は、それらが NVMe ネームスペースのワークロードを調整する原因となった場合に、制限のしきい値を評価します。 警告しきい値を超えた場合は、次の操作を実行することを検討してください。 1.アグリゲートの利用率も高い場合は、 LUN を別のアグリゲートに移動してください。2. ノードの利用率が高い場合は、ボリュームを別のノードに移動するか、ノードのワークロードの合計を減らします。3. NVMe ネームスペースまたはそのボリュームに QoS ポリシーが割り当てられている場合、 NVMe ネームスペースのワークロードが調整されている原因となった場合に備えて、ネームスペースまたはそのボリュームの制限のしきい値を評価します。

qtree 容量がフルです

重要

qtree とは、論理的に定義されたファイルシステムで、ボリューム内のルートディレクトリに特別なサブディレクトリとして作成できます。各 qtree には、ボリューム容量内でツリーに格納されるデータ量を制限するために、クォータポリシーによって定義されるデフォルトスペースクォータがあります。……警告アラートは、スペースを増やすために計画的な処理が必要であることを示します。…重大アラートは、サービスの停止が差し迫っていることを示します サービスの継続性を確保するために、スペースを空けるために緊急措置を講じる必要があります。

重大のしきい値を超えた場合は、サービスの中断を最小限に抑えるための緊急の対処方法を検討してください: 1 。この増加に対応するために、 qtree のスペースを増やしてください。2. 不要なデータを削除してスペースを解放 …​ 警告のしきい値を超える場合は、すぐに次の操作を実行するように計画してください: 1.この増加に対応するために、 qtree のスペースを増やしてください。2. 不要なデータを削除してスペースを解放します。

qtree 容量ハードリミット

重要

qtree とは、論理的に定義されたファイルシステムで、ボリューム内のルートディレクトリに特別なサブディレクトリとして作成できます。各 qtree には、ボリューム内のユーザデータの増加を制御し、合計容量を超えないようにデータを格納するために使用される KB 単位のスペースクォータがあります。 qtree は、ユーザにアラートを提供するソフトストレージ容量クォータを維持し、合計容量に達する前にユーザにアラートを送信します qtree 内の容量クォータ制限が超過したため、データを格納できなくなりました。qtree に格納されているデータ量を監視することで、ユーザに中断のないデータサービスを確実に提供できます。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.増加に対応するために、ツリースペースクォータを増やします 2 。ツリー内の不要なデータを削除してスペースを解放するようにユーザーに指示します

qtree 容量のソフトリミット

警告

qtree とは、論理的に定義されたファイルシステムで、ボリューム内のルートディレクトリに特別なサブディレクトリとして作成できます。各 qtree には、ボリューム内のユーザデータの増加を制御し、その合計容量を超えないようにデータを格納するために使用できる、 KB 単位のスペースクォータがあります。 qtree は、に到達する前にユーザにプロアクティブにアラートを提供するソフトストレージ容量クォータを維持します qtree 内の容量クォータの合計制限で、データを格納できなくなります。qtree に格納されているデータ量を監視することで、ユーザに中断のないデータサービスを確実に提供できます。

警告しきい値を超えた場合は、すぐに次の操作を実行することを検討してください。 1.増加に対応するために、ツリースペースクォータを増やしてください。2. ツリー内の不要なデータを削除してスペースを解放するようにユーザーに指示します。

qtree のファイル数のハードリミット

重要

qtree とは、論理的に定義されたファイルシステムで、ボリューム内のルートディレクトリに特別なサブディレクトリとして作成できます。各 qtree には、ボリューム内で管理可能なファイルシステムサイズを維持するために含めることができるファイル数のクォータがあります。… qtree は、ツリー内の新しいファイルが拒否されるハードファイル数のクォータを保持します。qtree 内のファイル数を監視すると、ユーザには中断のないデータサービスが確実に提供されます。

重大のしきい値を超えた場合は、サービスの中断を最小限に抑えるための緊急の対処方法を検討してください: 1 。qtree のファイル数クォータを増やします。2. qtree ファイルシステムから不要なファイルを削除します。

qtree のファイル数がソフトリミット

警告

qtree とは、論理的に定義されたファイルシステムで、ボリューム内のルートディレクトリに特別なサブディレクトリとして作成できます。各 qtree には、ボリューム内の管理可能なファイルシステムサイズを維持するために、格納できるファイル数のクォータがあります。… qtree は、ソフトファイル番号のクォータを保持し、 qtree および内のファイル数の上限に達する前にユーザにプロアクティブにアラートを送信します 追加のファイルを保存できません。qtree 内のファイル数を監視すると、ユーザには中断のないデータサービスが確実に提供されます。

警告のしきい値を超える場合は、すぐに次の操作を実行するように計画してください: 1.qtree のファイル数クォータを増やします。2. qtree ファイルシステムから不要なファイルを削除します。

Snapshot リザーブスペースがフルです

重要

アプリケーションとお客様のデータを格納するには、ボリュームのストレージ容量が必要です。スナップショット予約領域と呼ばれる領域の一部はスナップショットの保存に使用され、データをローカルで保護できます。ONTAP ボリュームに格納される新規データや更新データが多いほど、使用される Snapshot 容量は増えますが、今後追加または更新されるデータに使用できる Snapshot ストレージ容量は少なくなります。ボリューム内の Snapshot データ容量が Snapshot リザーブスペースの合計に達すると、新しい Snapshot データを格納できなくなり、ボリューム内のデータの保護レベルが低下する可能性があります。ボリュームの使用済み Snapshot 容量を監視して、データサービスの継続性を確保します。

重大のしきい値を超えた場合は、サービスの中断を最小限に抑えるための緊急の対処方法を検討してください: 1 。Snapshot リザーブがフルになったときにボリューム内のデータスペースを使用するように Snapshot を設定します。2. 古い不要なスナップショットをいくつか削除して、容量を解放します。… 警告のしきい値を超える場合は、すぐに次の操作を実行するように計画してください: 1.この増加に対応するために、ボリューム内の Snapshot リザーブスペースを増やしてください。2. スナップショット予約がいっぱいになったときにボリューム内のデータ領域を使用するようにスナップショットを設定します。

ストレージ容量の制限

重要

ストレージプール(アグリゲート)がいっぱいになると I/O 処理が低速化し、最後にストレージ停止インシデントが発生します。警告アラートは、最小限の空きスペースをリストアするために計画的な対処が必要であることを示しています。重大アラートは、サービスの停止が差し迫っていることを示しており、サービスの継続性を確保するためにスペースを解放するために緊急措置を講じる必要があることを示しています。

重大のしきい値を超えた場合は、すぐに次の処理を実行してサービスの中断を最小限に抑えてください: 1.重要でないボリュームの Snapshot を削除します。2. 重要でないワークロードであり、ストレージコピーからリストアされる可能性があるボリュームまたは LUN を削除します。……警告しきい値を超えた場合は、すぐに次の操作を計画します。 1.1 つ以上のボリュームを別のストレージに移動します。2. ストレージ容量を追加します。3. ストレージ効率の設定を変更するか、アクセス頻度の低いデータをクラウドストレージに階層化します。

ストレージパフォーマンスの制限

重要

ストレージシステムのパフォーマンスが上限に達すると、処理速度が低下し、レイテンシが増大し、ワークロードやアプリケーションで障害が発生する可能性があります。ONTAP は、ワークロードのストレージプールの使用率を評価し、パフォーマンスの消費率を推定します。…警告アラートは、ストレージプールの負荷を軽減するために、ワークロードのピークに対応できるだけの十分なストレージプールのパフォーマンスが確保されるように、計画されたアクションを実行する必要があることを示します パフォーマンスの低下が切迫しており、サービスの継続性を確保するためにストレージプールの負荷を軽減するために緊急措置を講じる必要があります。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.Snapshot や SnapMirror レプリケーションなどのスケジュールされたタスクを一時停止2. 重要ではないワークロードをアイドル状態にする… 警告しきい値を超えた場合は、すぐに次の操作を実行してください。 1.1 つ以上のワークロードを別のストレージに移動します。2. ストレージノード( AFF )またはディスクシェルフ( FAS )を追加し、ワークロードを再配分します。 3.ワークロードの特性(ブロックサイズ、アプリケーションのキャッシング)を変更する。

ユーザクォータ容量のハードリミット

重要

ONTAP は、ボリューム内のボリューム、ファイル、またはディレクトリにアクセスする権限を持つ UNIX または Windows システムのユーザを認識します。その結果、ユーザやユーザグループが使用する Linux または Windows システムのストレージ容量を ONTAP で設定できるようになります。ユーザまたはグループのポリシークォータによって、ユーザが自身のデータに使用できるスペース量が制限されます。このクォータのハードリミットにより、ボリューム内で使用されている容量が適切である場合に、合計容量クォータに達する前にユーザに通知できます。ユーザクォータまたはグループクォータに保存されているデータ量を監視することで、ユーザに中断のないデータサービスを確実に提供できます。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.増加に対応するために、ユーザクォータまたはグループクォータのスペースを増やしてください。2. 不要なデータを削除してスペースを解放するようにユーザまたはグループに指示します。

ユーザクォータ容量のソフトリミット

警告

ONTAP は、ボリューム内のボリューム、ファイル、またはディレクトリにアクセスできる権限を持つ UNIX または Windows システムのユーザを認識します。その結果、ユーザやユーザグループが使用する Linux または Windows システムのストレージ容量を ONTAP で設定できるようになります。ユーザまたはグループのポリシークォータによって、ユーザが自身のデータに使用できるスペース量が制限されます。このクォータのソフトリミットにより、ボリューム内で使用されている容量が合計容量クォータに達したときにユーザにプロアクティブな通知が可能になります。ユーザクォータまたはグループクォータに保存されているデータ量を監視することで、ユーザに中断のないデータサービスを確実に提供できます。

警告のしきい値を超える場合は、すぐに次の操作を実行するように計画してください: 1.増加に対応するために、ユーザクォータまたはグループクォータのスペースを増やしてください。2. 不要なデータを削除してスペースを解放します。

ボリュームの容量がフルです

重要

アプリケーションとお客様のデータを格納するには、ボリュームのストレージ容量が必要です。ONTAP ボリュームに格納されるデータが多いほど、以降のデータで使用できるストレージ容量は少なくなります。ボリューム内のデータストレージ容量が合計ストレージ容量に達すると、ストレージ容量の不足によりデータを格納できなくなる可能性があります。ボリュームの使用済みストレージ容量を監視して、データサービスの継続性を確保します。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.増加に対応するためにボリュームのスペースを増やしてください。2. 不要なデータを削除してスペースを解放します。3. Snapshot コピーが Snapshot リザーブよりも多くのスペースを占有している場合は、古い Snapshot を削除するか、ボリュームの Snapshot の自動削除を有効にします。…警告しきい値を超えた場合は、すぐに次の操作を実行するように計画してください: 1.増加に対応するために、ボリュームのスペースを増やしてください。 2.Snapshot コピーが Snapshot リザーブよりも多くのスペースを占有している場合は、古い Snapshot を削除するか、ボリュームの Snapshot の自動削除を有効にしています …​

ボリュームの inode 制限

重要

ファイルを格納するボリュームでは、インデックスノード( inode )を使用してファイルメタデータが格納されます。ボリュームの inode 割り当てが使用されなくなった場合は、 これ以上ファイルを追加できません。…警告アラートは、使用可能な inode の数を増やすために計画的なアクションを実行する必要があることを示しています。重要なアラートは、ファイル制限の枯渇が差し迫っていることを示しており、サービスの継続性を確保するために緊急対策を講じる必要があることを示しています。

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の緊急アクションを検討してください: 1.ボリュームの inode の値を増やします。inode の値がすでに最大値に達している場合は、ファイルシステムのサイズが最大サイズを超えているため、ボリュームを複数のボリュームにスプリットします。2. 大規模なファイルシステムに対応するために FlexGroup を使用する。… 警告のしきい値を超える場合は、すぐに次の操作を実行するように計画してください: 1.ボリュームの inode の値を増やします。inode の値がすでに最大値に達している場合は、ファイルシステムのサイズが最大サイズを超えているため、ボリュームを 2 つ以上のボリュームにスプリットします。2. 大規模なファイルシステムに対応するために FlexGroup を使用する

ボリュームレイテンシが高くなっています

重要

ボリュームは、 I/O トラフィックを処理するオブジェクトで、多くの場合、 DevOps アプリケーション、ホームディレクトリ、データベースなどのパフォーマンス重視のアプリケーションによって駆動されます。ボリュームのレイテンシが高いと、アプリケーション自体に影響を及ぼし、タスクを実行できなくなる可能性があります。ボリュームのレイテンシを監視することは、アプリケーションの整合性を維持するうえで非常に重要です。メディアタイプに基づく想定レイテンシは、最大 1 ~ 2 ミリ秒、 SAS は最大 8 ~ 10 ミリ秒、 SATA HDD は 17 ~ 20 ミリ秒です

重大のしきい値を超えた場合は、サービスの停止を最小限に抑えるために次の即時対処を検討します。ボリュームに QoS ポリシーが割り当てられている場合は、ボリュームのワークロードが抑制される原因となった場合に制限のしきい値を評価します。… 警告しきい値を超えた場合は、すぐに次の操作を実行することを検討してください。 1.アグリゲートの利用率も高い場合は、ボリュームを別のアグリゲートに移動します。2. ボリュームに QoS ポリシーが割り当てられている場合、ボリュームワークロードが調整される原因となった場合に備えて、制限しきい値を評価します。3. ノードの利用率が高い場合は、ボリュームを別のノードに移動するか、ノードの合計ワークロードを減らします。

モニタ名

CI の重大度

概要を監視します

対処方法

ノードの高レイテンシ

警告 / 重大

ノードのレイテンシが、ノード上のアプリケーションのパフォーマンスに影響する可能性があるレベルに達しました。ノードのレイテンシが低いため、アプリケーションのパフォーマンスが安定します。メディアタイプに基づく想定レイテンシは次のとおりです。 SSD は最大 1 ~ 2 ミリ秒、 SAS は最大 8 ~ 10 ミリ秒、 SATA HDD は 17 ~ 20 ミリ秒。

重大しきい値を超える場合は、サービスの中断を最小限に抑えるためにただちに対処する必要があります: 1 。スケジュールされたタスク、 Snapshot 、または SnapMirror レプリケーション 2 を一時停止QoS 制限により、優先度の低いワークロードの需要を低減します。 3.重要でないワークロードを非アクティブ化すると、警告しきい値を超えた場合の即時対処が考慮されます: 1 。1 つ以上のワークロードを別のストレージに移動します。 2.QoS 制限により、優先度の低いワークロードの需要を低減します。 3.ストレージノード( AFF )またはディスクシェルフ( FAS )を追加し、ワークロードを再配分します。 4.ワークロード特性(ブロックサイズ、アプリケーションキャッシングなど)の変更

ノードのパフォーマンス制限

警告 / 重大

ノードのパフォーマンス使用率が、 IOS およびノードでサポートされているアプリケーションのパフォーマンスに影響する可能性があるレベルに達しました。ノードのパフォーマンス利用率が低いため、アプリケーションのパフォーマンスが安定します。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるために、ただちに対処する必要があります: 1 。スケジュールされたタスク、 Snapshot 、または SnapMirror レプリケーション 2 を一時停止QoS 制限により、優先度の低いワークロードの需要を低減します。 3.重要でないワークロードを非アクティブ化すると、警告しきい値を超えた場合に次の処理が実行されることが考慮されます。 1.1 つ以上のワークロードを別のストレージに移動します。 2.QoS 制限により、優先度の低いワークロードの需要を低減します。 3.ストレージノード( AFF )またはディスクシェルフ( FAS )を追加し、ワークロードを再配分します。 4.ワークロード特性(ブロックサイズ、アプリケーションキャッシングなど)の変更

Storage VM のレイテンシが高くなっています

警告 / 重大

Storage VM ( SVM )のレイテンシが Storage VM のアプリケーションのパフォーマンスに影響する可能性があるレベルに達しました。Storage VM のレイテンシが低いため、アプリケーションのパフォーマンスが安定します。メディアタイプに基づく想定レイテンシは次のとおりです。 SSD は最大 1 ~ 2 ミリ秒、 SAS は最大 8 ~ 10 ミリ秒、 SATA HDD は 17 ~ 20 ミリ秒。

重大しきい値を超えた場合は、 QoS ポリシーが割り当てられた Storage VM のボリュームについてすぐにしきい値を評価して、ボリュームワークロードの負荷が調整されているかどうかを確認し、警告しきい値を超えた場合の即時対処方法として次の点を考慮します: 1 。アグリゲートの利用率も高い場合は、 Storage VM の一部のボリュームを別のアグリゲートに移動します。2. QoS ポリシーが割り当てられている Storage VM のボリュームで、ボリュームワークロードが調整されている場合にしきい値の制限を評価します。 3.ノードの利用率が高い場合は、 Storage VM の一部のボリュームを別のノードに移動するか、ノードの合計ワークロードを減らします

ユーザクォータのファイル数のハードリミット

重要

ボリューム内に作成されたファイル数が重大な制限に達したため、追加ファイルを作成できません。保存されたファイル数を監視することで、ユーザに中断のないデータサービスを確実に提供できます。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。次のアクションを実行することを検討してください。 1.特定のユーザのファイル数クォータを増やします 2.不要なファイルを削除して、特定のユーザのファイルクォータに対する圧力を軽減します

ユーザクォータのファイル数がソフトリミット

警告

ボリューム内に作成されたファイル数がクォータのしきい値に達し、重大な制限に近づいています。クォータが重大の上限に達した場合、追加のファイルを作成できません。ユーザが保存するファイル数を監視することで、ユーザに中断のないデータサービスが確実に提供されます。

警告しきい値を超えた場合は、ただちに対処することを検討してください。 1.特定のユーザクォータ 2 のファイル数クォータを増やします。不要なファイルを削除して、特定のユーザのファイルクォータに対する圧力を軽減します

ボリュームキャッシュミス率

警告 / 重大

ボリュームキャッシュミス率は、クライアントアプリケーションからの読み取り要求に対してキャッシュからではなくディスクからデータが返される割合です。これは、ボリュームが設定されたしきい値に達したことを意味します。

重大しきい値を超える場合は、サービスの中断を最小限に抑えるためにただちに対処する必要があります: 1 。ボリュームのノードから一部のワークロードを移動して、 IO 負荷を軽減してください 2 。ボリュームのノードに Flash Cache 3 がない場合は、 Flash Cache 3 を購入して追加し、 WAFL キャッシュを拡張します。QoS 制限を使用して同じノードに対する優先度の低いワークロードの要求を下げ、警告しきい値を超えた場合の即時対処を検討します。 1.ボリュームのノードから一部のワークロードを移動して、 IO 負荷を軽減してください 2 。ボリュームのノードに Flash Cache 3 がない場合は、 Flash Cache 3 を購入して追加し、 WAFL キャッシュを拡張します。QoS 制限により、同じノードでの優先度の低いワークロードの要求を軽減します。 4ワークロード特性(ブロックサイズ、アプリケーションキャッシングなど)の変更

ボリュームの qtree クォータオーバーコミット

警告 / 重大

ボリュームの qtree クォータオーバーコミットは、ボリュームが qtree クォータによってオーバーコミットされているとみなす割合を示します。ボリュームの qtree クォータの設定しきい値に達しました。ボリューム qtree クォータオーバーコミットを監視することで、ユーザに中断のないデータサービスが確実に提供されます。

重大しきい値を超える場合は、サービスの中断を最小限に抑えるためにただちに対処する必要があります: 1 。ボリューム 2 のスペースを増やします。警告しきい値を超えたときに不要なデータを削除してから、ボリュームのスペースを増やすことを検討してください。

ログモニタ

モニタ名

重大度

説明

対処方法

AWS クレデンシャルが初期化されて

情報

このイベントは、モジュールが初期化される前に、クラウドクレデンシャルスレッドから Amazon Web Services ( AWS )の Identity and Access Management ( IAM )ロールベースクレデンシャルにアクセスしようとした場合に発生します。

" クラウドクレデンシャルのスレッドとシステムの初期化が完了するまで待ちます。

クラウド階層に到達不能です

重要

ストレージノードからクラウド階層のオブジェクトストア API に接続することはできません。一部のデータにアクセスできません。

オンプレミス製品を使用している場合は、次の対処策を実施します。 …「 network interface show 」コマンドを使用して、クラスタ間 LIF がオンラインで機能していることを確認します。…デスティネーションノードのクラスタ間 LIF で「 ping 」コマンドを使用して、オブジェクトストアサーバへのネットワーク接続を確認します。…オブジェクトストアの設定が変更されていないことを確認します。ログインおよび接続の情報はです それでも有効です。問題が解決しない場合は、ネットアップのテクニカルサポートにお問い合わせください。Cloud Volumes ONTAP を使用する場合は、次の対処方法を実行します。…オブジェクトストアの設定が変更されていないことを確認します。 ログイン情報と接続情報がまだ有効であることを確認してください。問題が有効でない場合は、ネットアップのテクニカルサポートにお問い合わせください。

ディスクがサービスを停止しています

情報

「このイベントは、ディスクが障害としてマークされているか、完全消去中であるか、 Maintenance Center に入力されたためにサービスから削除された場合に発生します。」

なし

FlexGroup 構成要素がフルです

重要

「 FlexGroup ボリューム内のコンスティチュエントがいっぱいになっているため、原因がサービスを停止する可能性があります。この場合も、 FlexGroup ボリュームでファイルを作成または拡張できます。ただし、コンスティチュエントに格納されているファイルを変更することはできません。その結果、 FlexGroup ボリュームに対して書き込み処理を実行しようとしたときに、ランダムなスペース不足エラーが発生することがあります。」

「 volume modify -files + X 」コマンドを使用して、 FlexGroup ボリュームに容量を追加することを推奨します。または、 FlexGroup ボリュームからファイルを削除することもできます。しかし、どのファイルがコンスティチュエントに置かれているかを特定するのは難しい」

FlexGroup コンスティチュエントがほぼフルです

警告

「 FlexGroup ボリューム内のコンスティチュエントのスペースがほとんどなくなると、原因によってサービスが停止する可能性があります。ファイルを作成して展開できます。ただし、コンスティチュエントのスペースが不足すると、コンスティチュエントにファイルを追加したり変更したりできなくなる可能性があります。

「 volume modify -files + X 」コマンドを使用して、 FlexGroup ボリュームに容量を追加することを推奨します。または、 FlexGroup ボリュームからファイルを削除することもできます。しかし、どのファイルがコンスティチュエントに置かれているかを特定するのは難しい」

FlexGroup コンスティチュエントの inode がほぼなくなっています

警告

「 FlexGroup ボリューム内のコンスティチュエントは inode がほとんどなくなっており、原因がサービスの停止を招く可能性があります。コンスティチュエントに平均よりも少ない作成要求が送信されます。FlexGroup ボリュームの全体的なパフォーマンスに影響することがあります。これは、 inode が多いコンスティチュエントに要求がルーティングされるためです。」

「 volume modify -files + X 」コマンドを使用して、 FlexGroup ボリュームに容量を追加することを推奨します。または、 FlexGroup ボリュームからファイルを削除することもできます。しかし、どのファイルがコンスティチュエントに置かれているかを特定するのは難しい」

FlexGroup コンスティチュエントの inode が不明です

重要

「 FlexGroup ボリュームのコンスティチュエントの inode が不足しており、原因によってサービスが停止する可能性があります。この構成要素には新しいファイルを作成できません。これにより、 FlexGroup ボリューム間でコンテンツが全体的に不均衡な状態に分散される可能性があります。」

「 volume modify -files + X 」コマンドを使用して、 FlexGroup ボリュームに容量を追加することを推奨します。または、 FlexGroup ボリュームからファイルを削除することもできます。しかし、どのファイルがコンスティチュエントに置かれているかを特定するのは難しい」

LUN はオフラインです

情報

このイベントは、 LUN が手動でオフラインになった場合に発生します。

LUN をオンラインに戻します。

メインユニットファンに障害が発生しました

警告

1 つ以上のメインユニットファンで障害が発生しました。システムは動作し続けます。しかし、状態が長く続くと、過熱によって自動シャットダウンがトリガーされることがあります。

" 障害が発生したファンを取り付け直します。エラーが解消されない場合は、交換します。

警告状態のメインユニットファン

情報

このイベントは、 1 つまたは複数のメインユニットファンが警告状態のときに発生します。

過熱を防ぐため、示されたファンを交換してください。

NVRAM バッテリ低下

警告

NVRAM バッテリ容量が非常に少なくなっています。バッテリの電力が不足すると、データが失われる可能性があります。 …​NetApp テクニカルサポートと設定済みの送信先(該当する場合)に、 AutoSupport または「 call home 」というメッセージが生成されて送信されます。AutoSupport メッセージが正常に配信されると、問題の特定と解決方法が大幅に改善されます。

「 system node environment sensors show 」コマンドを使用して、バッテリの現在のステータス、容量、および充電状態を表示します。バッテリを最近交換した場合や、システムが長時間にわたって動作していない場合は、次の対処方法を実行します。 バッテリを監視して、適切に充電されていることを確認してください。…バッテリの稼働時間が引き続きクリティカルなレベルを下回ると、ストレージシステムが自動的にシャットダウンする場合は、ネットアップテクニカルサポートにお問い合わせください。

サービスプロセッサが設定されていません

警告

「このイベントは毎週発生し、サービスプロセッサ( SP )の設定を通知するために使用されます。SP は、システムに組み込まれている物理デバイスであり、リモートアクセス機能とリモート管理機能を提供します。すべての機能を使用できるように SP を設定する必要があります。

次の対処方法を実行します。…「 system service-processor network modify 」コマンドを使用して SP を設定します。オプションで、 「 system service-processor network show 」コマンドを使用して、 SP の MAC アドレスを取得します。…「 system service-processor network show 」コマンドを使用して、 SP ネットワーク設定を確認します。「 system service-processor AutoSupport invoke 」コマンドを使用して、 SP から AutoSupport E メールを送信できることを確認します。注 AutoSupport :このコマンドを実行する前に、 ONTAP E メールホストと受信者を問題で設定する必要があります。

サービスプロセッサはオフラインです

重要

「すべての SP リカバリアクションが実行されていても、 ONTAP はサービスプロセッサ( SP )からハートビートを受信しなくなりました。ONTAP は、 SP なしでハードウェアの状態を監視できません。システムはシャットダウンして、ハードウェアの損傷やデータの損失を防ぎます。SP がオフラインになった場合にすぐに通知されるようにパニック・アラートを設定する

次の操作を実行して、システムの電源を再投入します。…コントローラをシャーシから引き出します。…コントローラをもう一度押し込みます。…コントローラをオンに戻します。問題が解決しない場合は、コントローラモジュールを交換します。

シェルフのファンに障害があります

重要

" シェルフの冷却ファンまたはファンモジュールに障害が発生しました。シェルフ内のディスクに十分な通気による冷却が確保されないと、ディスク障害が発生する可能性があります。」

次の対処方法を実行します。ファンモジュールが完全に装着され、固定されていることを確認します。メモ:一部のディスクシェルフの電源装置モジュールにファンが内蔵されています。問題が解決しない場合は、ファンモジュールを交換してください。それでも問題が解決しない場合は、ネットアップのテクニカルサポートにお問い合わせください。

メインユニットファンの障害により、システムは動作できません

重要

「 1 つまたは複数のメインユニットファンで障害が発生し、システムの動作が中断しました。これにより、データが失われる可能性があります。

障害が発生したファンを交換します。

未割り当てディスク

情報

システムに未割り当てのディスクがあります - 容量が無駄になっており、構成の設定ミスや部分的な変更がシステムに適用されている可能性があります。

次の対処方法を実行します。「 disk show -n 」コマンドを使用して、どのディスクが割り当てられていないかを確認します。「 disk assign 」コマンドを使用して、ディスクをシステムに割り当てます。

アンチウイルスサーバビジー

警告

ウィルス対策サーバがビジーのため、新しいスキャン要求を受け入れることができません。

このメッセージが頻繁に表示される場合は、 SVM で生成されるウィルススキャンの負荷を処理できるだけの十分なウィルス対策サーバがあることを確認してください。

IAM ロールの AWS クレデンシャルの期限が切れました

重要

Cloud Volume ONTAP にアクセスできなくなりました。ID およびアクセス管理( IAM )ロールベースのクレデンシャルの期限が切れている。クレデンシャルは、 IAM ロールを使用して Amazon Web Services ( AWS )メタデータサーバから取得され、 Amazon Simple Storage Service ( Amazon S3 )への API 要求に署名するために使用されます。

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健常性を確認します。…インスタンスに関連付けられている AWS IAM ロールが有効であり、インスタンスに適切な権限が付与されていることを確認します。

IAM ロールの AWS クレデンシャルが見つかりません

重要

クラウドクレデンシャルスレッドで、 Amazon Web Services ( AWS )の Identity and Access Management ( IAM )ロールベースのクレデンシャルを AWS メタデータサーバから取得することはできません。クレデンシャルは、 Amazon Simple Storage Service ( Amazon S3 )への API 要求への署名に使用されます。Cloud Volume ONTAP にアクセスできなくなりました。…

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健常性を確認します。…インスタンスに関連付けられている AWS IAM ロールが有効であり、インスタンスに適切な権限が付与されていることを確認します。

IAM ロールの AWS クレデンシャルが無効です

重要

ID およびアクセス管理( IAM )ロールベースのクレデンシャルが無効です。クレデンシャルは、 IAM ロールを使用して Amazon Web Services ( AWS )メタデータサーバから取得され、 Amazon Simple Storage Service ( Amazon S3 )への API 要求に署名するために使用されます。Cloud Volume ONTAP にアクセスできなくなりました。

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健常性を確認します。…インスタンスに関連付けられている AWS IAM ロールが有効であり、インスタンスに適切な権限が付与されていることを確認します。

AWS IAM ロールが見つかりません

重要

Identity and Access Management ( IAM )ロールスレッドで、 AWS メタデータサーバに Amazon Web Services ( AWS ) IAM ロールが見つかりません。IAM ロールは、 Amazon Simple Storage Service ( Amazon S3 )への API 要求の署名に使用するロールベースのクレデンシャルを取得する必要があります。Cloud Volume ONTAP にアクセスできなくなりました。…

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健常性を確認します。…インスタンスに関連付けられている AWS IAM ロールが有効であることを確認します。

AWS IAM ロールが無効です

重要

AWS メタデータサーバの Amazon Web Services ( AWS ) Identity and Access Management ( IAM )ロールが無効です。Cloud Volume ONTAP にアクセスできなくなりました。…

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健常性を確認します。…インスタンスに関連付けられている AWS IAM ロールが有効であり、インスタンスに適切な権限が付与されていることを確認します。

AWS メタデータサーバに接続できませんでした

重要

Identity and Access Management ( IAM )役割スレッドで、 Amazon Web Services ( AWS )メタデータサーバとの通信リンクを確立できません。Amazon Simple Storage Service ( Amazon S3 )への API 要求の署名に使用する AWS IAM ロールベースの必要なクレデンシャルを取得するために通信を確立する必要があります。Cloud Volume ONTAP にアクセスできなくなりました。…

次の手順を実行します。… AWS EC2 管理コンソールにログインします。…インスタンスページに移動します。… Cloud Volumes ONTAP 導入のインスタンスを探してその健全性を確認します。

FabricPool のスペース使用制限にほぼ達しました

警告

容量ライセンスのあるプロバイダが提供するオブジェクトストアでのクラスタ全体の FabricPool スペースの使用量が、ライセンスで許可された上限にほぼ達しています。

次の対処方法を実行します。…「 storage aggregate object-store show-space 」コマンドを使用して、各 FabricPool ストレージ階層で使用されているライセンス容量の割合を確認します。…「 volume snapshot delete 」コマンドを使用して、階層化ポリシー「 snapshot 」または「 backup 」が設定されたボリュームから Snapshot コピーを削除します。…新しいライセンスをインストールします クラスタ上でライセンス容量を拡張します。

FabricPool のスペース使用制限に達しました

重要

容量ライセンスプロバイダが提供するオブジェクトストアでのクラスタ全体の FabricPool スペースの使用量がライセンスの上限に達しました。

次の対処方法を実行します。…「 storage aggregate object-store show-space 」コマンドを使用して、各 FabricPool ストレージ階層で使用されているライセンス容量の割合を確認します。…「 volume snapshot delete 」コマンドを使用して、階層化ポリシー「 snapshot 」または「 backup 」が設定されたボリュームから Snapshot コピーを削除します。…新しいライセンスをインストールします クラスタ上でライセンス容量を拡張します。

アグリゲートのギブバックに失敗しました

重要

ストレージフェイルオーバー( SFO )ギブバックの一環としてアグリゲートを移行したときに、デスティネーションノードがオブジェクトストアに到達できない場合に発生します。

次の対処方法を実行します。…「 network interface show 」コマンドを使用して、インタークラスタ LIF がオンラインで機能していることを確認します。…デスティネーションノードのクラスタ間 LIF で「 ping 」コマンドを使用して、オブジェクトストアサーバへのネットワーク接続を確認します。…「 aggregate object-store config show 」コマンドを使用して、オブジェクトストアの設定が変更されておらず、ログインおよび接続の情報が正確であることを確認してください。または、 このエラーを無効にするには、 giveback コマンドの「 require-partner-waiting 」パラメータに false を指定します。詳細やサポートについては、ネットアップテクニカルサポートにお問い合わせください。

HA インターコネクトが停止しています

警告

ハイアベイラビリティ( HA )インターコネクトが停止しています。フェイルオーバーを利用できない場合、サービスが停止するリスクがあります。

対処方法は、プラットフォームでサポートされている HA インターコネクトリンクの数と種類、およびインターコネクトが停止している理由によって異なります。…リンクがダウンしている場合 : … HA ペアの両方のコントローラが動作していることを確認します。外部接続リンクの場合は、相互接続ケーブルが正しく接続されていること、および小型フォームファクタプラガブル( SFP )が両方のコントローラに正しく装着されていることを確認します。内部接続されているリンクの場合は、リンクを無効にし、リンクを有効にします。 一方は、「 IC LINK OFF 」コマンドと「 IC LINK ON 」コマンドを使用して行います。…リンクが無効になっている場合は、「 ic link on 」コマンドを使用してリンクを有効にします。…ピアが接続されていない場合は、「 ic link off 」コマンドと「 ic link on 」コマンドを使用して、一方のリンクを無効にし、再度有効にします。…問題が解決しない場合は、ネットアップのテクニカルサポートにお問い合わせください。

ユーザあたりの最大セッション数を超えました

警告

TCP 接続でのユーザあたりの最大許容セッション数を超えました。セッションを確立する要求は、一部のセッションが解放されるまで拒否されます。…

次の対処策を実行します。 …クライアントで実行されているすべてのアプリケーションを検査し、正常に動作していないアプリケーションを終了します。…クライアントを再起動します。…問題が新規または既存のアプリケーションによって発生しているかどうかを確認します。アプリケーションが新規の場合は、「 cifs option modify -max-opense-opense-file-per-tree 」コマンドを使用して、クライアントのしきい値を大きく設定します。クライアントが想定どおりに動作していても、しきい値の上昇が必要となる場合があります。クライアントのしきい値を高く設定するには、 advanced 権限が必要です。…問題が既存のアプリケーションに起因している場合は、クライアントに問題が存在する可能性があります。詳細またはサポートについては、ネットアップテクニカルサポートにお問い合わせください。

ファイルあたりの最大オープン回数を超えました

警告

TCP 接続でファイルを開くことができる最大回数を超えました。このファイルを開く要求は、ファイルの開いているインスタンスをいくつか閉じるまでは拒否されます。これは通常、異常なアプリケーション動作を示します。

次の修正アクションを実行します。この TCP 接続を使用してクライアントで実行されているアプリケーションを検査します。クライアントが正しく動作していない可能性があります。クライアントを再起動します。クライアントが新規または既存のアプリケーションによって問題が発生しているかどうかを確認します。アプリケーションが新規である場合は、「 cifs option modify -max-opense-opense-file-per-tree 」コマンドを使用して、クライアントのしきい値を大きく設定します。クライアントが想定どおりに動作していても、しきい値の上昇が必要となる場合があります。クライアントのしきい値を高く設定するには、 advanced 権限が必要です。…問題が既存のアプリケーションに起因している場合は、クライアントに問題が存在する可能性があります。詳細またはサポートについては、ネットアップテクニカルサポートにお問い合わせください。

NetBIOS 名が競合しています

重要

NetBIOS ネームサービスが、リモートマシンから名前登録要求に対して否定的な応答を受信しました。これは通常、 NetBIOS 名またはエイリアスの競合が原因です。その結果、クライアントがデータにアクセスできなくなったり、クラスタ内の適切なデータを提供しているノードに接続できなくなったりすることがあります。

次のいずれかの修正処置を実行します。… NetBIOS 名またはエイリアスに競合がある場合、 次のいずれかを実行します。…「 vserver cifs delete -aliases alias -vserver vserver 」コマンドを使用して、重複する NetBIOS エイリアスを削除します。…「 vserver cifs create -aliases alias -vserver vserver 」コマンドを使用して、重複する名前を削除し、新しい名前のエイリアスを追加して、 NetBIOS エイリアスの名前を変更します。… NetBIOS 名にエイリアスが設定されておらず、競合がある場合は、「 vserver cifs delete -vserver vserver 」コマンドと「 vserver cifs create -cifs -server netbiosname 」コマンドを使用して CIFS サーバの名前を変更します。メモ: CIFS サーバを削除すると、データにアクセスできなくなる可能性があります。…リモートマシンの NetBIOS 名を削除するか、 NetBIOS 名を変更します。

NFSv4 ストアプールを使い果たしました

重要

NFSv4 ストアプールを使い果たしました。

NFS サーバが応答しなくなってから 10 分以上が経過した場合は、ネットアップテクニカルサポートにお問い合わせください。

登録済みのスキャンエンジンがありません

重要

Antivirus Connector は、スキャンエンジンが登録されていないことを ONTAP に通知しました。「 scan-mandatory 」オプションを有効にすると、原因データを使用できなくなることがあります。

次の対処方法を実行します。…アンチウイルスサーバーにインストールされているスキャンエンジンソフトウェアが ONTAP と互換性があることを確認します。スキャンエンジンソフトウェアが実行中で、ローカルループバックを介してアンチウイルスコネクタに接続するように設定されていることを確認します。

Vscan 接続なし

重要

ONTAP では、ウィルススキャン要求への対応に関する Vscan 接続はありません。「 scan-mandatory 」オプションを有効にすると、原因データを使用できなくなることがあります。

スキャナプールが正しく設定され、ウィルス対策サーバがアクティブで ONTAP に接続されていることを確認します。

ノードのルートボリュームのスペースが不足しています

重要

ルートボリュームのスペースが危険なほど少なくなっていることが検出されました。ノードが完全には動作していません。ノードで NFS アクセスと CIFS アクセスが制限されているため、クラスタ内でデータ LIF がフェイルオーバーされる可能性があります。管理機能は、ノードがルートボリューム上のスペースをクリアするためのローカルリカバリ手順に限定されます。

次の対処方法を実行します。…古い Snapshot コピーを削除してルートボリュームのスペースをクリアする、 /mrootDirectory から不要になったファイルを削除する、またはルートボリュームの容量を拡張する。…コントローラをリブートする…詳細やサポートについては、ネットアップのテクニカルサポートにお問い合わせください。

存在しない管理共有です

重要

vscan 問題:クライアントが、存在しない ONTAP_ADMIN$ 共有に接続しようとしました。

指定した SVM ID で Vscan が有効になっていることを確認してください。SVM で Vscan を有効にすると、 SVM 用に ONTAP_ADMIN$ 共有が自動的に作成されます。

NVMe ネームスペースのスペースが不足しています

重要

スペース不足が原因の書き込みエラーが原因で NVMe ネームスペースがオフラインになりました。

ボリュームにスペースを追加し、「 vserver nvme namespace modify 」コマンドを使用して NVMe ネームスペースをオンラインにします。

NVMF の猶予期間 - アクティブ

警告

このイベントは、 NVMe over Fabrics ( NVMe-oF )プロトコルを使用していてライセンスの猶予期間がアクティブになっている場合に毎日発生します。NVMe-oF 機能には、ライセンスの猶予期間が終了したあとにライセンスが必要です。ライセンスの猶予期間が終了すると、 NVMe-oF 機能は無効になります。

営業担当者に連絡して NVMe-oF ライセンスを取得し、クラスタに追加するか、 NVMe-oF 構成のすべてのインスタンスをクラスタから削除してください。

NVMF の猶予期間 - 終了

警告

NVMe over Fabrics ( NVMe-oF )ライセンスの猶予期間が終了し、 NVMe-oF 機能は無効になります。

営業担当者に連絡して NVMe-oF ライセンスを取得し、クラスタに追加してください。

NVMF の猶予期間 - 開始

警告

ONTAP 9.5 ソフトウェアへのアップグレード中に NVMe over Fabrics ( NVMe-oF )設定が検出されました。NVMe-oF 機能を使用するには、ライセンスの猶予期間が終了したあとにライセンスが必要です。

営業担当者に連絡して NVMe-oF ライセンスを取得し、クラスタに追加してください。

オブジェクトストアのホスト解決不可

重要

オブジェクトストアサーバのホスト名を IP アドレスに解決できません。オブジェクトストアクライアントが IP アドレスに解決しないとオブジェクトストアサーバと通信できません。その結果、データにアクセスできなくなる可能性があります。

DNS 設定を調べて、ホスト名が IP アドレスで正しく設定されていることを確認します。

オブジェクトストアのクラスタ間 LIF が停止しています

重要

オブジェクトストアクライアントが、オブジェクトストアサーバと通信するための稼働している LIF を見つけることができません。クラスタ間 LIF が動作可能になるまで、このノードはオブジェクトストアクライアントトラフィックを許可しません。その結果、データにアクセスできなくなる可能性があります。

次の対処方法を実行します。…「 network interface show -role intercluster 」コマンドを使用して、クラスタ間 LIF のステータスを確認します。…クラスタ間 LIF が正しく設定されていて動作していることを確認します。…クラスタ間 LIF が設定されていない場合は、「 network interface create -role intercluster 」コマンドを使用して追加します。

オブジェクトストアシグネチャの不一致

重要

オブジェクトストアサーバに送信された要求の署名が、クライアントで計算された署名と一致しません。その結果、データにアクセスできなくなる可能性があります。

シークレットアクセスキーが正しく設定されていることを確認します。正しく設定されている場合は、ネットアップテクニカルサポートにお問い合わせください。

READDIR タイムアウト

重要

READDIR ファイル処理が、 WAFL で実行が許可されているタイムアウトを超えました。これは、ディレクトリが非常に大きく、スパースであるためです。対処方法を推奨します。

次の対処方法を実行します。 …​READDIR ファイル操作が期限切れになった最近のディレクトリに関する情報を検索するには、次の 'diag ' 特権ノードシェル CLI コマンドを使用します。 WAFL readdir notice show…​ ディレクトリが sparse または not: として示されているかどうかを確認します。ディレクトリが sparse として示されている場合は、ディレクトリの内容を新しいディレクトリにコピーしてディレクトリファイルの sparsess を削除することをお勧めします。…ディレクトリがスパースとして示されておらず、ディレクトリが大きい場合は、ディレクトリ内のファイルエントリの数を減らすことでディレクトリファイルのサイズを小さくすることをお勧めします。

アグリゲートの再配置に失敗しました

重要

このイベントは、アグリゲートの再配置時にデスティネーションノードがオブジェクトストアに到達できない場合に発生します。

次の対処方法を実行します。…「 network interface show 」コマンドを使用して、インタークラスタ LIF がオンラインで機能していることを確認します。…デスティネーションノードのクラスタ間 LIF で「 ping 」コマンドを使用して、オブジェクトストアサーバへのネットワーク接続を確認します。…「 aggregate object-store config show 」コマンドを使用して、オブジェクトストアの設定が変更されておらず、ログインおよび接続の情報が正確であることを確認してください。または、再配置コマンドの「 override-destination-checks 」パラメータを使用してエラーを無効にすることもできます。詳細やサポートについては、ネットアップのテクニカルサポートにお問い合わせください。

シャドウコピーに失敗しました

重要

ボリュームシャドウコピーサービス( VSS )の実行に失敗しました。 VSS は、 Microsoft Server のバックアップおよびリストアサービス処理です。

イベントメッセージに表示される情報を使用して、次の項目を確認します。… Is shadow copy configuration enabled? …適切なライセンスがインストールされているか ? …どの共有でシャドウコピー操作が実行されますか ? 共有名は正しいですか ? 共有パスは存在しますか ? シャドウコピーセットとそのシャドウコピーの状態はどうなっていますか ?

ストレージスイッチの電源装置に障害が発生しました

警告

クラスタスイッチに電源装置がありません。冗長性が低下し、停電が発生するリスクが高まります。

次の対処方法を実行します。クラスタスイッチに電力を供給する電源装置の電源がオンになっていることを確認します。電源コードが電源装置に接続されていることを確認します。問題が解決しない場合は、ネットアップのテクニカルサポートにお問い合わせください。

CIFS 認証が多すぎます

警告

多数の認証ネゴシエーションが同時に行われています。このクライアントからの新規セッション要求は 256 個あります。

クライアントが新しい接続要求を 256 個以上作成した理由を調べます。エラーの原因を特定するために、クライアントまたはアプリケーションのベンダーに問い合わせなければならない場合があります。

管理共有への権限のないユーザアクセス

警告

クライアントが ONTAP_ADMIN$ 共有に接続しようとしましたが、ログインしているユーザが許可されていません。

次の対処方法を実行します。…指定したユーザ名と IP アドレスがアクティブな Vscan スキャナプールの 1 つに設定されていることを確認します。… vserver vscan scanner pool show-active コマンドを使用して、現在アクティブなスキャナプールの設定を確認します。

ウイルスを検出しました

警告

Vscan サーバからストレージシステムにエラーが報告されました。通常は、ウイルスが検出されたことを示します。ただし、 Vscan サーバでその他のエラーが発生すると、このイベントを原因できます。ファイルへのクライアントアクセスは拒否されます。Vscan サーバは、設定に応じて、ファイルをクリーンアップするか、ファイルを隔離するか、または削除する可能性があります。

「 syslog 」イベントで報告された Vscan サーバのログを調べて、感染ファイルのクリーンアップ、隔離、削除が正常に完了したかどうかを確認します。削除できなかった場合は、システム管理者が手動でファイルを削除しなければならないことがあります。

ボリュームはオフラインです

情報

ボリュームがオフラインになりました。

ボリュームをオンラインに戻します。

ボリュームは制限状態です

情報

フレキシブルボリュームが制限されたことを示すイベントです。

ボリュームをオンラインに戻します。

Storage VMが停止しました

情報

このメッセージは、「vserver stop」処理が成功した場合に表示されます。

Storage VMでデータアクセスを開始するには、「vserver start」コマンドを使用します。

ノードのパニック

警告

このイベントはパニック状態になった場合に生成されます

ネットアップカスタマーサポートにお問い合わせください。

ランサムウェア対策ログモニタ

モニタ名

重大度

説明

対処方法

Storage VM ランサムウェア対策監視が無効になっています

警告

Storage VM のランサムウェア対策監視は無効になっています。Storage VM を保護するには、ランサムウェア対策を有効にしてください。

なし

Storage VM ランサムウェア対策監視有効(ラーニングモード)

情報

Storage VM のランサムウェア対策監視は、学習モードで有効になっています。

なし

Volume Anti-Ransomware Monitoring を有効にしました

情報

ボリュームのランサムウェア対策監視が有効になっている。

なし

ボリュームのアンチランサムウェア監視が無効になっています

警告

ボリュームのランサムウェア対策監視は無効になっています。ランサムウェア対策を有効にしてボリュームを保護

なし

ボリュームでのランサムウェア対策監視の有効化(ラーニングモード)

情報

ボリュームのランサムウェア対策監視は、学習モードで有効になっています。

なし

ボリュームのアンチランサムウェア監視が一時停止されました(ラーニングモード)

警告

ボリュームのアンチランサムウェアモニタリングが学習モードで一時停止しています。

なし

ボリュームのアンチランサムウェアモニタリングが一時停止されました

警告

ボリュームのランサムウェア対策監視が一時停止されています。

なし

Volume Anti-Ransomware Monitoring Disabling の略

警告

ボリュームのアンチランサムウェア監視が無効になっています。

なし

ランサムウェアのアクティビティが検出され

重要

検出されたランサムウェアからデータを保護するために、元のデータをリストアするために使用できる Snapshot コピーが作成されました。システムによって AutoSupport または「コールホーム」メッセージが生成され、ネットアップテクニカルサポートおよび設定された宛先に送信されます。AutoSupport メッセージを使用すると、問題の特定と解決方法が向上します

ランサムウェアの活動を修復する方法については、「 final-document-name 」を参照してください。

Astra データストア( ADS )モニタ

モニタ名

CI の重大度

概要を監視します

対処方法

クラスタ容量がフルです

警告 @>85% 重大 @>95%

ADS クラスタのストレージ容量は、アプリケーションデータと顧客データの格納に使用されます。クラスタに格納されたデータが多いほど、将来のデータに使用できるストレージ容量は少なくなります。クラスタ内のストレージ容量が合計クラスタ容量に達すると、クラスタはこれ以上のデータを格納できなくなります。クラスタの物理容量を監視することで、データサービスの継続性が確保されます。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.増加に対応するために、クラスタに割り当てられる容量を増やすことを検討してください。 2.容量を解放するために不要になったデータを削除することを検討してください。警告しきい値に違反した場合は、すぐに次のアクションを実行するよう計画してください。 …​1.この増加に対応するために、クラスタに割り当てられるスペースを増やすことを検討してください。

ボリュームの容量がフルです

警告 @<15% 重大 @<5%

ボリュームのストレージ容量は、アプリケーションデータと顧客データの格納に使用されます。クラスタボリュームに格納されているデータが多いほど、将来のデータに使用できるストレージ容量は少なくなります。ボリューム内で使用されているデータストレージ容量が合計ストレージ容量に達すると、 使用可能なストレージ容量が不足しているため、ボリュームはこれ以上データを格納できません。…ボリュームの使用済みストレージ容量を監視することで、データサービスの継続性が確保されます。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.増加に対応するために、ボリュームのスペースを増やすことを検討してください。 2.容量を解放するために不要になったデータを削除することを検討してください。警告しきい値に違反した場合は、すぐに次のアクションを実行するよう計画してください。 …​1.拡張に対応するために、ボリュームのスペースを増やすことを検討してください。

NetApp ONTAP モニタの FSX

モニタ名

CI の重大度

概要を監視します

対処方法

FSX ボリューム容量がフルです

警告 @>85% …重大 @>95%

アプリケーションとお客様のデータを格納するには、ボリュームのストレージ容量が必要です。ONTAP ボリュームに格納されるデータが多いほど、以降のデータで使用できるストレージ容量は少なくなります。ボリューム内のデータストレージ容量が合計ストレージ容量に達すると、ストレージ容量の不足によりデータを格納できなくなる可能性があります。ボリュームの使用済みストレージ容量を監視して、データサービスの継続性を確保します。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.スペースを解放するために、不要になったデータを削除することを検討してください

FSX ボリューム高レイテンシ

警告 @ > 1000 µ s …クリティカル @ > 2000 µ s

ボリュームとは、多くの場合、 DevOps アプリケーション、ホームディレクトリ、データベースなどのパフォーマンス重視のアプリケーションによって I/O トラフィックを処理するオブジェクトです。ボリュームのレイテンシが高いと、アプリケーション自体に影響を及ぼし、タスクを実行できなくなる可能性があります。ボリュームのレイテンシを監視することは、アプリケーションの整合性を維持するうえで非常に重要です。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.ボリュームに QoS ポリシーが割り当てられている場合は、ボリュームのワークロードが抑制される原因になった場合に制限しきい値を評価します。……警告しきい値を超えた場合には、すぐに次の処理を実行するよう計画してください。 1.ボリュームに QoS ポリシーが割り当てられている場合は、ボリュームのワークロードが調整される原因となった場合に備えて、制限のしきい値を評価します。… 2.ノードの利用率も高い場合は、ボリュームを別のノードに移動するか、ノードの合計ワークロードを減らしてください。

FSX ボリュームの inode 制限

警告 @>85% …重大 @>95%

ファイルを格納するボリュームでは、インデックスノード( inode )を使用してファイルメタデータが格納されます。ボリュームが inode の割り当てを使用しなくなると、そのボリュームにはこれ以上ファイルを追加できません。警告アラートは、使用可能な inode の数を増やすために計画的な処理が必要であることを示しています。重大アラートは、ファイル制限の枯渇が差し迫っていることを示し、サービスの継続性を確保するために inode を解放するための緊急対策を講じる必要があることを示しています

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.ボリュームの inode の値を増やすことを検討してください。inode の値がすでに最大値に達している場合は、ファイルシステムが最大サイズを超えているため、ボリュームを 2 つ以上のボリュームに分割することを検討してください。次の処理は、警告しきい値に違反した場合にすぐに実行されます。 1.ボリュームの inode の値を増やすことを検討してください。inode の値がすでに最大値に達している場合は、ファイルシステムの最大サイズを超えたためにボリュームを 2 つ以上のボリュームにスプリットすることを検討してください

FSX ボリュームの qtree クォータオーバーコミット

警告 @>95% …危険 @>100%

ボリュームの qtree クォータオーバーコミットは、ボリュームが qtree クォータによってオーバーコミットされているとみなす割合を示します。ボリュームの qtree クォータの設定しきい値に達しました。ボリューム qtree クォータオーバーコミットを監視することで、ユーザに中断のないデータサービスが確実に提供されます。

重大しきい値を超える場合は、サービスの中断を最小限に抑えるためにただちに対処する必要があります: 1 。不要なデータを削除してください。警告しきい値を超えた場合は、ボリュームのスペースを増やすことを検討してください。

FSX Snapshot リザーブスペースがフルです

警告 @>90% …重大 @>95%

アプリケーションとお客様のデータを格納するには、ボリュームのストレージ容量が必要です。スナップショット予約領域と呼ばれる領域の一部はスナップショットの保存に使用され、データをローカルで保護できます。ONTAP ボリュームに格納される新規データや更新データが多いほど、使用される Snapshot 容量は増えますが、今後追加または更新されるデータに使用できる Snapshot ストレージ容量は少なくなります。ボリューム内の Snapshot データ容量が Snapshot リザーブの合計スペースに達すると、新しい Snapshot データを格納できなくなり、ボリューム内のデータの保護レベルが低下する可能性があります。ボリュームの使用済み Snapshot 容量を監視して、データサービスの継続性を確保します。

重大のしきい値を超えた場合にサービスの中断を最小限に抑えるには、即時アクションが必要です。 1.スナップショット予約がいっぱいになったときに、ボリューム内のデータ領域を使用するようにスナップショットを設定することを検討してください。 2.容量を解放するために不要になった古いスナップショットを削除することを検討してください……警告しきい値を超えた場合には、すぐに次のアクションを実行するよう計画してください。 …​1.ボリューム内のスナップショット予約容量を増やして、増加に対応することを検討してください。 2.Snapshot リザーブがフルになったときにボリューム内のデータスペースを使用するように Snapshot を設定することを検討してください

FSX ボリュームキャッシュミス率

警告 @>95% …危険 @>100%

ボリュームキャッシュミス率は、クライアントアプリケーションからの読み取り要求に対してキャッシュからではなくディスクからデータが返される割合です。これは、ボリュームが設定されたしきい値に達したことを意味します。

重大しきい値を超える場合は、サービスの中断を最小限に抑えるためにただちに対処する必要があります: 1 。ボリュームのノードから一部のワークロードを移動して、 IO 負荷を軽減してください 2 。QoS 制限により、同じノードでの優先度の低いワークロードの要求を軽減 …​ 警告しきい値を超えた場合の即時対処を検討する。 1.ボリュームのノードから一部のワークロードを移動して、 IO 負荷を軽減してください 2 。QoS 制限により、同じノードでの優先度の低いワークロードの要求を軽減します。 3.ワークロード特性(ブロックサイズ、アプリケーションキャッシングなど)の変更

K8s モニタ

モニタ名

重大度

概要を監視します

ポッドが作成されました

情報

このアラートは、ポッドが作成されたときに発生します。

ポッドが削除されました

情報

このアラートは、ポッドが削除されたときに発生します。

Demonset が作成されます

情報

このアラートは、 Demonset が作成されたときに発生します。

Demonset が削除されました

情報

このアラートは、 Demonset が削除された場合に発生します。

ReplicaSet が作成されました

情報

このアラートは 'ReplicaSet が作成されたときに発生します

ReplicaSet が削除されました

情報

このアラートは 'ReplicaSet が削除されたときに発生します

展開が作成されました

情報

このアラートは、展開が作成されたときに発生します。

ポッドで障害が発生しまし

警告

このアラートは、ポッドに障害が発生したときに発生します。

ポッドの接続に失敗しました

警告

このアラートは、ポッドとのボリューム接続に失敗した場合に発生します。

永続的ボリューム要求のバインドに失敗しました

警告

このアラートは、 PVC でバインディングが失敗した場合に発生します。

ポッドのマウントに失敗しました

警告

このアラートは、ポッドでマウントに失敗したときに発生します。

変更ログモニタ

モニタ名

重大度

概要を監視します

内部ボリュームが検出されました

情報

このメッセージは、内部ボリュームが検出された場合に表示されます。

内部ボリュームが変更されました

情報

このメッセージは、内部ボリュームが変更された場合に表示されます。

ストレージノードを検出

情報

このメッセージは、ストレージノードが検出された場合に表示されます。

ストレージノードが削除されました

情報

このメッセージは、ストレージノードが削除された場合に表示されます。

ストレージプールが検出されました

情報

このメッセージは、ストレージプールが検出された場合に表示されます。

Storage Virtual Machineを検出

情報

このメッセージは、Storage Virtual Machineが検出された場合に表示されます。

Storage Virtual Machineを変更

情報

このメッセージは、Storage Virtual Machineが変更された場合に表示されます。

データ収集モニタ

モニタ名

説明

対処方法

Acquisition Unit のシャットダウン

Cloud Insights Acquisition Unitは、新機能を導入するためのアップグレードの一環として定期的に再起動します。これは、一般的な環境で月に1回以下の頻度で発生します。新たに再起動したAcquisition UnitでCloud Insights への登録が完了したことを示すResolutionを通知するまで、Acquisition Unitがシャットダウンした場合は、すぐに警告アラートが表示されます。通常、このシャットダウンと登録のサイクルには5~15分かかります。

このアラートが頻繁に発生する場合や15分以上続く場合は、Acquisition Unit、ネットワーク、およびAUをインターネットに接続するプロキシをホストしているシステムの動作を確認してください。

コレクタでエラーが

データコレクタのポーリングで予期しない障害が発生しました。

Cloud Insights のデータコレクタのページにアクセスして、その状況の詳細を確認してください。

コレクタ警告

このアラートは通常、データコレクタまたはターゲットシステムの設定に誤りがある場合に発生します。今後のアラートを防止するために、設定を再確認してください。また、データコレクタがすべてのデータを収集した、完了していないデータの取得が原因の可能性もあります。これは、データ収集中に状況が変化した場合に発生します(データ収集の開始時に存在する仮想マシンが、データ収集の実行中とキャプチャの前に削除された場合など)。

データコレクタまたはターゲットシステムの設定を確認します。コレクタ警告のモニタは他のモニタタイプよりも多くのアラートを送信できるため、トラブルシューティングを行っていない限り、アラート受信者を設定しないことをお勧めします。