ストレージ フェイルオーバー インターコネクト リンクが停止した場合の対処策の実施

ストレージ フェイルオーバー関連イベントの[イベントの詳細]ページを表示し、ページの概要情報を確認して、イベントの緊急性や、問題の考えられる原因と解決策を特定できます。

開始する前に

オペレータ、アプリケーション管理者、またはストレージ管理者のロールが必要です。

タスク概要

この例では、[イベントの詳細]ページに表示されるイベントの概要に、ストレージ フェイルオーバー インターコネクト リンクの停止状態に関する次の情報が表示されます。

Event: Storage Failover Interconnect One or More Links Down

Summary

Severity: Warning
State: New
Impact Level: Risk
Impact Area: Availability
Source: aardvark
Source Type: Node
Acknowledged By:
Resolved By:
Assigned To:
Cause: At least one storage failover interconnected link 
       between the nodes aardvark and bonobo is down.
       RDMA interconnect is up (Link0 up, Link1 down)

このイベント情報から、HAペアのaardvarkノードとbonoboノードの間のストレージ フェイルオーバー インターコネクト リンクLink1が停止している一方で、AppleとBoyの間のLink0はアクティブであることがわかります。一方のリンクがアクティブであるため、Remote Dynamic Memory Access (RDMA)は引き続き機能し、ストレージ フェイルオーバー ジョブも正常に実行されます。

ただし、両方のリンクが停止してストレージのフェイルオーバー保護が完全に無効になる状態を防ぐために、Link1が停止した理由を詳しく診断することにします。

手順

  1. [イベントの詳細]ページの[ソース]フィールドに示されているイベントへのリンクをクリックして、ストレージ フェイルオーバー インターコネクト リンクの停止状態に関連している可能性がある他のイベントの詳細情報を表示します。
    この例では、aardvarkというノードがイベントのソースです。このノード名をクリックすると、該当するHAペア(aardvarkとbonobo)の[HA の詳細][クラスタ / 健全性の詳細]ページ[ノード]タブに表示され、このHAペアで最近発生したその他のイベントが表示されます。
  2. [HA の詳細]でイベントに関連する詳細情報を確認します。
    この例では、[イベント]表に関連情報が表示されます。この表には、「ストレージ フェイルオーバー インターコネクトの 1 つ以上のリンクが停止」イベント、イベントが生成された時刻、およびこのイベントの生成元のノードが表示されます。

終了後の操作

[HA の詳細]で確認したノードの場所情報を使用して、該当するHAペア ノードで発生したストレージ フェイルオーバーの問題の物理的な調査と修復を依頼するか、または自ら実施します。