Workload Factory for EDA の概要ダッシュボードについて説明します
概要ダッシュボードは、複数のFSx for ONTAPファイルシステムにわたるEDAワークロードを管理するIT管理者に一元化されたビューを提供します。これを使用すると、クラスターの状態と使用状況を迅速に評価し、新しいボリュームやジョブの配置場所を決定し、ボリュームやSVMの移動候補を特定し、容量の拡張やスループットを拡張するタイミングを判断できます。
概要
概要ダッシュボードは、設定済みのAWS認証情報に関連付けられたすべてのFSx for ONTAPファイルシステムのCloudWatchメトリクスを収集します。
内容は以下の通りです:
-
クラスターの健全性ステータス:ファイルシステム全体のレイテンシイベント、SSD の使用率と容量の推奨事項、および ONTAP EMS イベントを強調表示する概要情報が上部に表示されます。
-
クラスタテーブル:各クラスタの使用状況とパフォーマンス指標を示す詳細な検索可能なテーブルで、フィルタリング、ソート、ページネーション、CSVエクスポートをサポートしています。
これはあなたに役立ちます:
-
新しいボリュームを配置し、ワークロードのバランスを再調整する
-
容量またはスループットの拡張を計画する
-
大規模なクラスターの健全性を監視する
-
ボリューム配置について十分な情報に基づいた意思決定を行う
-
容量限界に近づいているクラスタを特定する
ダッシュボードコンポーネント
クラスタのヘルスステータス
クラスターの健全性ステータスは、フィルタリングされたファイルシステム全体の活動状況のスナップショットを提供します。この情報は、少なくとも 1 つの FSx for ONTAP リンクがファイルシステムに関連付けられている場合にのみ表示されます。
健康ステータスには、次の領域が含まれます。
- レイテンシ
-
対象となるファイルシステム全体で検出されたレイテンシイベントの数を表示します。レイテンシ監視を有効にしている場合にのみ、レイテンシ情報を表示できます。
- SSD 容量管理
-
SSD使用率が80%を超えるファイルシステムの数と、アクティブな容量推奨値を持つファイルシステムの数を表示します。これにより、容量の見直しが必要となる可能性のあるファイルシステムを迅速に特定できます。
- ONTAP イベント
-
検出されたEMSイベントの数を、容量、可用性および保護、セキュリティおよびその他に分類して表示します。
クラスタテーブル
クラスターテーブルには、アクティブなリージョンとAWSアカウントの選択に基づいてフィルタリングされた各FSx for ONTAPファイルシステムの詳細なビューが表示されます。データはCloudWatchメトリックから収集されます。
この表を使用して次の操作を実行します:
-
容量制限に近づいているファイルシステムを特定する(SSD使用率列)
-
プロビジョニングされたスループット SKU とスループット需要を比較します(スループット使用量 P99 列)
-
複数のクラスタ全体でパフォーマンス指標を追跡
-
リンク設定ステータスの確認(関連リンク列) - 接続の有効性は毎日検証されます
-
パラメータを一括更新する複数のクラスタを選択してください
SSD容量管理
概要ダッシュボードは、インテリジェントな SSD 容量管理機能を提供します。
管理モード
- 自動化
-
Workload Factoryは、事前に定義されたしきい値と使用パターンに基づいて、SSD容量を自動的に増加させます。システムは手動による介入なしに容量の拡張を管理します。これは、自動管理が望ましい環境に最適です。
- 推奨
-
Workload FactoryはSSDの使用パターンを分析し、容量増加の推奨事項を提供します。推奨事項を手動で確認して適用します。これにより、自動分析のメリットを享受しながら、容量に関する意思決定を完全にコントロールできます。
- なし
-
容量に関する推奨事項や自動的なアクションは実行されません。これは、システムの支援なしに手動で容量を管理したい場合に便利です。
容量に関する推奨事項
Workload Factory が自動化モードまたは推奨モードの場合、システムは各 FSx for ONTAP ファイルシステムに対して容量推奨アルゴリズムを自動的に実行します。このアルゴリズムは 24 時間ごとにスキャンを実行し、SSD の容量調整が推奨されるタイミングを特定します。
推奨事項が特定された場合:
-
Workload Factoryの通知設定に基づいて、即座に通知が届きます。
-
推奨事項のあるファイルシステムは、クラスタテーブルを「最終 SSD 増加タイムスタンプ」または「最終 SSD 増加説明」列でフィルタリングすることで特定できます
-
推奨事項がアクティブなファイルシステムの総数が表示されます
推奨事項では、提案された変更とその理由について説明しています。例:ファイルシステムSSDの使用パターンに基づいて、SSDのサイズを増やすことを推奨します。
SSD管理パラメータ
パラメータは、容量管理システムがSSDの使用状況を分析し、それに基づいてどのような動作を行うかを制御します:
- しきい値(10~90%)
-
容量の推奨または自動化アクションをトリガーするSSD使用率。たとえば、しきい値が80%の場合、SSD使用率が80%に達すると推奨またはアクションが実行されます。推奨モードと自動化モードの両方で使用できます。
- Lookback(1~200時間)
-
過去のSSD使用パターンを分析するために使用される期間。ルックバック期間が長いほど、容量に関する意思決定のための履歴コンテキストが多く提供されます。Automateモードでのみ使用できます。
- Ahead(1~200時間)
-
将来の容量ニーズを予測するために使用される期間。先行期間が長いほど、容量の拡張に向けてより先の将来を計画します。Automateモードでのみ使用できます。
これらのパラメータは、ファイルシステムごとに個別に設定することも、一括編集を使用して複数のファイルシステムに一貫した設定を適用することもできます。
容量に関する決定ポイントについて
SSD使用状況グラフには、容量推奨値が生成された時点、または自動化アクションが実行された時点を示す決定ポイントが表示されます。これらの視覚的な指標は、容量管理アルゴリズムの経時的な動作を理解するのに役立ちます。
- 推奨事項の決定ポイント
-
容量推奨アルゴリズムが追加のSSD容量が必要であると判断した場合に表示されます。SSD容量が増やされていない場合、これらのポイントは30分ごとに発生する可能性があります。グラフは、可能な限りすべての決定ポイントを表示しますが、時間範囲によって個々のポイントが密集しすぎる場合は、それらを統合します。
- 自動化の意思決定ポイント
-
自動化システムがSSD容量を増やそうとした際に表示されます。これらの点は、自動化処理が成功したか失敗したかを示しています。
過去のSSD使用状況グラフと意思決定ポイントを使用して、次のことを行います:
-
容量調整がどのくらいの頻度で必要になるかを理解する
-
自動化モードと推奨モードのどちらがワークロードパターンに適しているかを評価してください。
-
繰り返し発生する容量制約を特定する
-
成長傾向に基づいて将来の容量ニーズを計画する
-
自動化の失敗に関するトラブルシューティング