ポートのパフォーマンス ポリシーとしきい値の作成

ポートに関連付けられている指標のしきい値を設定したパフォーマンス ポリシーを作成することができます。デフォルトでは、パフォーマンス ポリシーは作成時に指定したタイプのすべてのデバイスに適用されます。特定の1台のデバイスまたは一部のデバイスだけをパフォーマンス ポリシーに含める場合は、アノテーションを作成します。ここでは、手順を簡単にするためにアノテーションは使用しません。

開始する前に

このパフォーマンス ポリシーと一緒にアノテーションも使用する場合は、パフォーマンス ポリシーを作成する前にアノテーションを作成する必要があります。

手順

  1. Insightのツールバーで、[Manage] > [Performance policies]をクリックします。
    既存のポリシーが表示されます。スイッチ ポート用のポリシーがすでにある場合は、その既存のポリシーを編集することも、新しいポリシーとしきい値を追加することもできます。
  2. 既存のポート ポリシーを編集するか、新しいポート ポリシーを作成します。
    • 既存のポリシーの右端にある鉛筆のアイコンをクリックします。手順「d」「e」の説明にあるしきい値を追加します。
    • [+Add]をクリックして新しいポリシーを追加します。
    1. 「ポリシー名」として、「Slow Drain Device」を追加します。
    2. オブジェクト タイプでポートを選択します。
    3. 「Apply after a window of」に「First occurrence」と入力します。
    4. [BB credit zero - Rx]のしきい値として、「1,000,000」を入力します。
    5. [BB credit zero - Tx]のしきい値として、「1,000,000」を入力します。
    6. 「Stop processing further policies if alert is generated」をクリックします。
    7. [Save]をクリックします。
    作成したポリシーにより、設定したしきい値が24時間監視されます。しきい値を超えた場合は、ポリシー違反が報告されます。
  3. [Dashboards] > [Violations Dashboard]をクリックします。
    システムには、システムで発生したすべてのポリシー違反が表示されます。「Slow Drain Device」の違反を表示するには、検索するか違反のリストをソートします。[Violations Dashboard]には、パフォーマンス ポリシーに設定済みのしきい値を超える「BBクレジット0」エラーが発生したポートがすべて表示されます。[Violations Dashboard]で強調表示されている各スイッチ ポートは、ポートのランディング ページに移動できるリンクです。
  4. 強調表示されているポートのリンクをクリックして、ポートのランディング ページを表示します。
    ポートのランディング ページに、BBクレジット0のトラブルシューティングに役立つ次の情報が表示されます。
    • ポートの接続先デバイス
    • 違反が発生しているポート(ファイバチャネル スイッチ ポート)のID
    • ポートの速度
    • 関連付けられているノードとポートの名前
  5. ポートの指標が表示されるまで下にスクロールします。[Select metrics to show] > [BB credit zero]をクリックして、BBクレジットのグラフを表示します。
  6. [Top correlated]をクリックします。
    関連する上位のリソース分析では、パフォーマンスと最も関連性の高いリソースとして特定されたポートに接続されているコントローラ ノードが示されます。この手順では、ポートのアクティビティのIOPS指標をノードのアクティビティ全体と比較します。この例の画面は、BB credit zeroのTxおよびRx指標と、コントローラ ノードのIOPSを示しています。これらの情報から次のことがわかります。
    • コントローラのIOがポートのトラフィックに大きく関連している。
    • ポートがサーバにIOを転送するときにパフォーマンス ポリシー違反が発生している。
    • ポート パフォーマンス違反がストレージ コントローラ上の高いIOPS負荷と連動して発生していることから、ストレージ ノードのワークロードが違反の原因と考えられる。

  7. ポートのランディング ページに戻り、ストレージ コントローラ ノードのランディング ページにアクセスして、ワークロードの指標を分析します。
    ノードは利用率違反を示し、指標はバッファ間クレジット数がゼロになったことに関連する高い「キャッシュ読み取り回数」を示しています。

  8. ノードのランディング ページで、関連性のあるリソース リストからポートを選択し、指標メニューからキャッシュの使用率データなどの使用率データを選択すれば、BBクレジットがゼロになっているノードを比較できます。

    このデータから、キャッシュ ヒット率は他の指標と反比例していることがわかります。ストレージ ノードは、キャッシュからのサーバ負荷に応答できていないにもかかわらず、キャッシュ読み取り回数は多くなっています。データのほとんどをキャッシュではなくディスクから取得する必要があるために、ポートからサーバへのデータ転送に遅延が発生している可能性があります。パフォーマンスの問題の原因は、I/O動作の変化により発生したワークロード、およびノードのキャッシュとその設定にあるようです。このような場合は、ノードのキャッシュ サイズを増やすか、キャッシュ アルゴリズムの動作を変更すると問題が解決されることがあります。