Workload Factory for EDAでレイテンシ監視を設定する
読み取りおよび書き込みレイテンシの警告しきい値とクリティカルしきい値を設定して、FSx for ONTAP ボリュームのパフォーマンスを監視します。オプションのメールまたは Amazon SNS 通知を設定して、レイテンシイベントが検出されたときにリアルタイムアラートを受信します。
開始する前に
レイテンシー監視を設定する前に、以下の要件を満たしていることを確認してください。
AWS の認証情報と権限
読み取り / 書き込み権限を持つAWS認証情報をWorkload Factoryに追加する必要があります。レイテンシ監視機能では、AWS認証情報に関連付けられたすべてのFSx for ONTAPボリュームのCloudWatchメトリクスへのアクセスが必要です。
レイテンシ監視では、_Basic_モードおよび_Read-only_モードの権限はサポートされていません。
AWS 認証情報をまだ設定していない場合は、"AWS認証情報を追加する"を参照してください。
FSx for ONTAPファイルシステム
AWS 環境にデプロイされたボリュームを持つ少なくとも 1 つの FSx for ONTAP ファイルシステムが必要です。レイテンシー監視機能は、設定された AWS 認証情報に関連付けられているすべてのボリュームのメトリクスを自動的に収集します。
FSx for ONTAP へのリンク
基本的な分析結果を表示するには、FSx for ONTAPファイルシステムにリンクを関連付ける必要があります。リンクがなくてもイベントを検出することはできますが、分析から得られる知見は限られます。リンクがまだ関連付けられていない場合は、EDAで*リンクの関連付け*を選択し、新しいリンクを作成するか既存のリンクを関連付けるかを選択してから、*続行*を選択すると、ストレージワークロードのリンク作成ページに自動的に移動します。
リンクの作成と関連付けの手順については、"リンクを作成"を参照してください。
Amazon Bedrock モデル ARN(オプション)
オプションのAIエージェント分析機能を使用するには、Workload Factoryの設定でAmazon BedrockモデルのARNを指定する必要があります。
詳細については、"GenAIの基本要件"を参照してください。
BedrockモデルのARNを設定しない場合でも、レイテンシ監視と自動基本分析は使用できますが、AIエージェントによる分析は利用できません。
通知設定(オプション)
レイテンシーイベントが検出された際にメールまたはAmazon SNS通知を受信するには、Workload Factoryの設定で通知設定を構成してください。詳細については、レイテンシ通知を設定するを参照してください。
レイテンシしきい値を設定する
読み取りおよび書き込み操作に対する警告しきい値とクリティカルしきい値を設定します。システムはしきい値を継続的に評価し、条件が満たされた際にアラートを生成します。
|
|
適切なアラートエスカレーションを確実に行うには、重大イベントのしきい値を警告イベントのしきい値よりも高く設定する必要があります。そうでない場合、設定を保存できません。 |
|
|
EDAで設定したレイテンシのしきい値は、デフォルトではアカウント全体に適用されます。また、一般ストレージワークロードで個々のボリュームのレイテンシしきい値を設定することもでき、そのボリュームの設定は当該ボリュームに対して優先されます。EDAでアカウントレベルのしきい値を更新しても、ボリュームレベルの設定は変更されません。 |
-
次のいずれかを使用してログインします "コンソール体験"。
-
メニュー
を選択し、*EDA*を選択します。 -
*レイテンシ*タブを選択します。
-
EDAレイテンシ設定ページで、以下のしきい値を設定します:
-
読み取りレイテンシ(警告および重大)
-
書き込みレイテンシ(警告および重大)
-
各IOPSのしきい値
-
評価の期間
-
-
*適用*を選択して設定を保存します。
Workload Factory は、AWS クレデンシャルに関連付けられたすべての FSx for ONTAP ボリュームのレイテンシメトリックの収集を開始します。メトリックは少なくとも 20 分ごとに収集されます。設定したしきい値を超えたボリュームはすべて、レイテンシイベントテーブルに表示されます。
レイテンシ通知を設定する
レイテンシーイベントが検出された際にアラートを受信するように、メールまたはAmazon SNS通知を設定します。ボリュームが設定されたしきい値を超えるたびに通知が送信され、パフォーマンスの問題をリアルタイムで認識できます。
レイテンシ通知はファイルシステムごとに送信されます。ファイルシステム内の1つ以上のボリュームがレイテンシのしきい値を超えると、影響を受けるすべてのボリュームを一覧表示する単一の通知が届きます。
|
|
影響を受けるボリュームが10個を超える場合、メールには最初の10個のボリュームが表示され、さらに影響を受けるボリュームの数が示されます。影響を受けるすべてのボリュームは、Workload Factoryコンソールで確認できます。 |
通知チャネル:
-
メール:Workload Factoryの通知設定で設定されているメールアドレスに送信されます。
-
Amazon SNS:他のシステムとの統合のために、設定済みのSNSトピックに公開されます
通知を有効にするには、"通知を設定する"を参照してください。
レイテンシ設定を管理する
初期設定後、必要に応じてしきい値を編集できます。
-
Latency ページで、Edit を選択します。
-
必要に応じて、しきい値を変更します。
重要しきい値が警告しきい値よりも高い値に設定されていることを確認してください。重要しきい値を警告しきい値よりも低く設定した場合、システムはエラーを表示します。 -
変更を保存するには、*適用*を選択します。
ベストプラクティス
レイテンシー監視を設定する際には、以下の推奨事項を考慮してください:
-
現実的なしきい値を設定する:ワークロード要件に基づいてしきい値を設定します。デフォルト値は出発点となりますが、特定の環境に合わせて調整が必要になる場合があります。
-
警告しきい値から開始:重要なしきい値を微調整する前に、警告イベントを使用してベースラインパフォーマンスの期待値を確立します。
-
時間範囲を慎重に検討してください:短い時間範囲(5~10分)では問題の検出が速くなりますが、アラートが多く生成される可能性があります。長い時間範囲(15~20分)では誤検知は減りますが、検出が遅れる可能性があります。
-
IOPSとレイテンシのしきい値を調整する:二重条件ロジックでは、両方のしきい値を超える必要があります。IOPSしきい値を非常に高く設定すると、レイテンシが問題となる場合でもアラートが発生しない可能性があります。
-
却下されたイベントを確認する:イベントが却下された理由を定期的に確認し、しきい値の調整やインフラストラクチャの改善の機会を特定します。