Network Receive Error(NRER)アラームのトラブルシューティング

Network Receive Error(NRER)アラームは、StorageGRIDとネットワーク ハードウェアの間の接続に問題がある場合に発生します。NRERエラーは、何もしなくても解消されることがあります。エラーが解消されない場合は、推奨される対処方法を実行してください。

タスク概要

NRERアラームは、StorageGRIDに接続するネットワーク ハードウェアに関する次の問題が原因で発生することがあります。

手順

  1. ネットワーク設定に応じて考えらえるNRERアラームのすべての原因に対し、トラブルシューティング手順を実行します。
    • FECの不一致がエラーの原因である場合は、次の手順を実行します。
      注: この手順は、StorageGRIDアプライアンスでFECの不一致が原因でNRERエラーが発生した場合にのみ該当します。
      1. StorageGRIDアプライアンスに接続されているスイッチのポートのFECステータスを確認します。
      2. アプライアンスからスイッチへのケーブル接続を確認します。
      3. NRERアラームを解決するためにFEC設定を変更する場合は、最初にStorageGRIDアプライアンス インストーラの[Link Configuration]でアプライアンスが[Auto]モードに設定されていることを確認します(アプライアンスのインストールとメンテナンスの手順を参照してください)。次に、スイッチ ポートのFEC設定を変更します。StorageGRIDアプライアンスのポートは、可能であれば同じFEC設定に自動で調整されます。

        FEC設定はStorageGRIDアプライアンスでは設定できません。代わりに、アプライアンスに接続されたスイッチ ポートのFEC設定を検出され、ミラーリングが試行されます。リンクのネットワーク速度が25GbEまたは100GbEに限定されている場合、スイッチとNICで共通のFEC設定をネゴシエートできないことがあります。共通のFEC設定がない場合、ネットワークはno-FECモードに戻ります。FECが有効になっていない場合、接続は電気的ノイズによるエラーの影響を受けやすくなります。

      注: StorageGRIDアプライアンスでは、no-FECのほかに、Firecode(FC)FECとReed Solomon(RS)FECをサポートしています。
    • スイッチ ポートとNICのMTUの不一致がエラーの原因である場合は、ノードに設定されているMTUサイズがスイッチ ポートのMTU設定と同じであることを確認します。

      ノードに設定されたMTUサイズが接続先のスイッチ ポートの設定よりも小さくなっている可能性があります。その場合、設定されたMTUよりも大きいイーサネット フレームをStorageGRIDノードが受信してNRERアラームが報告されることがあります。この状況に該当する場合は、システム全体でのMTUの目標または要件に応じて、スイッチ ポートのMTUをStorageGRIDネットワーク インターフェイスのMTUに合わせて変更するか、StorageGRIDネットワーク インターフェイスのMTUをスイッチ ポートに合わせて変更します。

      注意: 最適なネットワーク パフォーマンスを実現するには、すべてのノードのグリッド ネットワーク インターフェイスでMTU値がほぼ同じになるように設定する必要があります。個々のノードのグリッド ネットワークのMTU設定に大きな違いがある場合は、Grid Network MTU mismatchアラートがトリガーされます。MTU値はすべてのネットワーク タイプで同じである必要はありません。
      注: MTU設定を変更するには、アプライアンスのインストールとメンテナンスのガイドを参照してください。
    • リンク エラー率の高さがエラーの原因である場合は、次の手順を実行します。
      1. FECが有効になっていない場合は有効にします。
      2. ネットワーク ケーブルに問題がないこと、また損傷や間違った接続がないことを確認します。
      3. ケーブルに問題が見つからない場合は、テクニカル サポートに連絡してください。
      注: 電気的ノイズが大きい環境では、エラー率が高くなることがあります。
    • NICリング バッファのオーバーランがエラーの原因である場合は、テクニカル サポートに連絡してください。

      StorageGRIDシステムが過負荷状態で、ネットワーク イベントをタイムリーに処理できない場合、リング バッファがオーバーランする可能性があります。

  2. 原因となっている問題を解決したら、エラー カウンタをリセットします。
    1. [Support]を選択します。次に、メニューの[Tools]セクションで[Grid Topology]を選択します。
    2. [site] > [grid node] > [SSM] > [Resources] > [Configuration] > [Main]を選択します。
    3. [Reset Receive Error Count]を選択し、[Apply Changes]をクリックします。