I/OモジュールのホットスワップFAS50
モジュールに障害が発生し、ストレージ システムがすべてのONTAPバージョン要件を満たしている場合は、FAS50ストレージ システム内のEthernet I/Oモジュールをホット スワップできます。
I/O モジュールをホットスワップするには、ストレージ システムがONTAPのバージョン要件を満たしていることを確認し、ストレージ システムと I/O モジュールを準備し、障害のあるモジュールをホットスワップし、交換用モジュールをオンラインにして、ストレージ システムを通常の動作に復元し、障害のあるモジュールをNetAppに戻します。
-
I/O モジュールのホット スワップでは、障害が発生した I/O モジュールを交換する前に手動でテイクオーバーを実行する必要がありません。
-
I/O モジュールをホット スワップする場合は、正しいコントローラと I/O スロットにコマンドを適用します。
-
障害のあるコントローラ は、I/O モジュールをホット スワップしているコントローラです。
-
正常なコントローラ は、障害のあるコントローラの HA パートナーです。
-
-
ストレージシステムの位置情報(青色)LEDを点灯させることで、影響を受けたストレージシステムの物理的な位置を特定しやすくなります。SSHを使用してBMCにログインし、 `system location-led on`コマンドを入力してください。
ストレージシステムにはロケーションLEDが3つあります。1つはオペレータ用ディスプレイパネルに、もう1つは各コントローラにあります。ロケーションLEDは30分間点灯したままになります。
無効にするには、コマンドを入力し
system location-led off`ます。LEDが点灯しているか消灯しているかが不明な場合は、コマンドを入力してLEDの状態を確認できます `system location-led show。
ステップ1: ストレージシステムが手順の要件を満たしていることを確認する
この手順を使用するには、ストレージ システムで ONTAP 9.17.1 以降が実行されており、ストレージ システムが実行している ONTAP のバージョンのすべての要件を満たしている必要があります。
|
|
ストレージ システムで ONTAP 9.17.1 以降が実行されていない場合、またはストレージ システムで実行されている ONTAP のバージョンのすべての要件を満たしていない場合は、この手順は使用できません。"I/Oモジュールの交換手順"を使用する必要があります。 |
-
障害が発生したクラスタとスロット4のHA I/Oモジュールを、同等のI/Oモジュールにホット スワップしています。I/Oモジュールのタイプは変更できません。
-
障害が発生したクラスタとHA I/Oモジュールを持つコントローラ(障害コントローラ)は、正常なパートナー コントローラをすでにテイクオーバーしている必要があります。I/Oモジュールに障害が発生した場合、テイクオーバーは自動的に実行されるはずです。
2ノードクラスタの場合、ストレージシステムはどちらのコントローラに障害が発生したI/Oモジュールがあるかを判別できないため、どちらかのコントローラがテイクオーバーを開始する可能性があります。ホットスワップは、障害が発生したI/Oモジュールを持つコントローラ(障害コントローラ)が正常なコントローラをテイクオーバーした場合にのみサポートされます。I/Oモジュールのホットスワップは、システムを停止させずに復旧する唯一の方法です。
障害のあるコントローラが正常なコントローラを正常に引き継いだかどうかを確認するには、 `storage failover show`指示。
故障したI/Oモジュールがどのコントローラにあるのか分からない場合は、 "ネットアップサポート" 。
-
ストレージ システム構成では、スロット 4 にクラスタと HA I/O モジュールが 2 つではなく、クラスタと HA I/O モジュールが 1 つだけ配置されている必要があります。
-
ストレージ システムは、2 ノード (スイッチレスまたはスイッチ) のクラスター構成である必要があります。
-
ストレージシステムの他のすべてのコンポーネントが正常に動作している必要があります。正常に動作していない場合は、この手順を続行する前にににお問い合わせください "ネットアップサポート"。
-
クラスタ、HA、クライアントで使用されるポートの組み合わせが任意のスロットにあるイーサネットI/Oモジュールを、同等のI/Oモジュールとホット スワップしています。I/Oモジュールのタイプを変更することはできません。
ストレージまたはMetroClusterに使用されるポートを持つEthernet I/Oモジュールはホットスワップ対応ではありません。
-
ストレージ システム(スイッチレスまたはスイッチ クラスタ構成)には、ストレージ システムでサポートされる任意の数のノードを含めることができます。
-
クラスタ内のすべてのノードは、同じONTAPバージョン(ONTAP 9.18.1GA以降)を実行しているか、同じONTAPバージョンの異なるパッチ レベルを実行している必要があります。
クラスタ内のノードが異なるONTAPバージョンを実行している場合、これは混合バージョンのクラスタと見なされ、I/Oモジュールのホットスワップはサポートされません。
-
ストレージ システム内のコントローラは、次のいずれかの状態になります:
-
両方のコントローラが起動して I/O(データの提供)を実行できます。
-
テイクオーバーが障害が発生した I/O モジュールによって発生し、コントローラがそれ以外は正常に機能している場合、いずれかのコントローラがテイクオーバー状態になることがあります。
特定の状況では、ONTAPは、障害が発生したI/Oモジュールが原因で、いずれかのコントローラの自動テイクオーバーを実行できます。たとえば、障害が発生したI/Oモジュールにすべてのクラスタポートが含まれている場合(そのコントローラ上のすべてのクラスタリンクがダウンしている場合)、ONTAPは自動的にテイクオーバーを実行します。
-
-
ストレージシステムの他のすべてのコンポーネントが正常に動作している必要があります。正常に動作していない場合は、この手順を続行する前にににお問い合わせください "ネットアップサポート"。
ステップ2:ストレージシステムとI/Oモジュールスロットを準備する
障害が発生した I/O モジュールを安全に取り外せるように、ストレージ システムと I/O モジュール スロットを準備します:
-
自身の適切な接地対策を行います
-
故障した I/O モジュールからケーブルを取り外します。
この手順の後半で同じポートに再接続できるように、ケーブルに必ずラベルを付けてください。
I/O モジュールは障害状態(ポートはリンク ダウン状態)にあるはずですが、リンクがまだアップ状態であり、そこに機能している最後のクラスタ ポートが含まれている場合は、ケーブルを取り外すと自動テイクオーバーがトリガーされます。
この手順を続行する前に、ケーブルを外してから5分間待って、テイクオーバーまたはLIFフェイルオーバーが完了していることを確認してください。
-
AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。
system node autosupport invoke -node * -type all -message MAINT=<number of hours down>hたとえば、次のAutoSupportメッセージは、自動ケース作成を 2 時間抑制します。
node2::> system node autosupport invoke -node * -type all -message MAINT=2h -
ストレージ システムで実行されている ONTAP のバージョンとコントローラの状態に応じて、自動ギブバックを無効にします。
ONTAP バージョン 状況 作業 9.17.1または9.18.1RC
障害のあるコントローラが正常なコントローラを自動的にテイクオーバーした場合
自動ギブバックを無効にする:
-
障害のあるコントローラのコンソールから次のコマンドを入力します
storage failover modify -node local -auto-giveback false -
入力
y「自動ギブバックを無効にしますか?」というプロンプトが表示されたら、
9.18.1GA以降
どちらかのコントローラが自動的にパートナー コントローラを引き継いだ場合
自動ギブバックを無効にする:
-
パートナーを引き継いだコントローラのコンソールから次のコマンドを入力します:
storage failover modify -node local -auto-giveback false -
入力
y「自動ギブバックを無効にしますか?」というプロンプトが表示されたら、
9.18.1GA以降
両方のコントローラが起動し、I/O(データの提供)を実行しています
次の手順に進みます。
-
-
障害が発生した I/O モジュールをサービスから削除し、電源をオフにして、取り外す準備をします:
-
次のコマンドを入力します。
system controller slot module remove -node impaired_node_name -slot slot_number -
入力
y「続行しますか?」というプロンプトが表示されたらたとえば、次のコマンドは、ノード 2(障害のあるコントローラ)のスロット 4 にある障害のあるモジュールを取り外す準備をし、安全に取り外せることを示すメッセージを表示します:
node2::> system controller slot module remove -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered off for removal. Do you want to continue? {y|n}: y The module has been successfully removed from service and powered off. It can now be safely removed. -
-
障害が発生した I/O モジュールの電源がオフになっていることを確認します:
system controller slot module show出力には、障害が発生したモジュールとそのスロット番号の `status`列に `powered-off`が表示されます。
ステップ3:故障したI/Oモジュールをホットスワップする
障害が発生した I/O モジュールを同等の I/O モジュールとホット スワップします:
-
接地対策がまだの場合は、自身で適切に実施します。
-
障害のあるコントローラから障害のある I/O モジュールを取り外します:
I/Oモジュールの取り付けネジを反時計回りに回して緩めます。
左側のポート ラベル タブと右側のつまみネジを使用して、I/O モジュールをコントローラーから引き出します。
-
交換用 I/O モジュールを取り付けます。
-
I/O モジュールをスロットの端に合わせます。
-
I/O モジュールをゆっくりとスロットの奥まで押し込み、I/O モジュールがコネクタに正しく装着されていることを確認します。
左側のタブと右側のつまみネジを使用して、I/O モジュールを押し込むことができます。
-
蝶ネジを時計回りに回して締めます。
-
-
交換用 I/O モジュールをケーブル接続します。
ステップ4:交換用I/Oモジュールをオンラインにする
交換用 I/O モジュールをオンラインにして、I/O モジュール ポートが正常に初期化されたことを確認し、スロットの電源がオンになっていることを確認してから、I/O モジュールがオンラインで認識されていることを確認します。
I/O モジュールが交換され、ポートが正常な状態に戻ると、LIF は交換された I/O モジュールにリバートされます。
-
交換用 I/O モジュールをオンラインにします:
-
次のコマンドを入力します。
system controller slot module insert -node impaired_node_name -slot slot_number -
入力
y「続行しますか?」というプロンプトが表示されたら、出力により、I/O モジュールが正常にオンラインになったこと(電源がオンになり、初期化され、サービスが開始されたこと)が確認されます。
たとえば、次のコマンドは、ノード 2 (障害のあるコントローラ) のスロット 4 をオンラインにし、プロセスが成功したことを示すメッセージを表示します。
node2::> system controller slot module insert -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered on and initialized. Do you want to continue? {y|n}: `y` The module has been successfully powered on, initialized and placed into service. -
-
I/O モジュールの各ポートが正常に初期化されたことを確認します:
-
障害のあるコントローラのコンソールから次のコマンドを入力します。
event log show -event *hotplug.init*必要なファームウェアの更新とポートの初期化には数分かかる場合があります。 出力には、I/O モジュール上の各ポートが正常に初期化されたことを示す 1 つ以上の hotplug.init.success EMS イベントが表示されます。
たとえば、次の出力は、I/O ポート e4b と e4a の初期化が成功したことを示しています:
node2::> event log show -event *hotplug.init* Time Node Severity Event ------------------- ---------------- ------------- --------------------------- 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4b" in slot 4 succeeded 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4a" in slot 4 succeeded 2 entries were displayed.
-
ポートの初期化に失敗した場合は、EMS ログを確認して次の手順を実行してください。
-
-
I/O モジュール スロットの電源がオンになっていて、操作の準備ができていることを確認します:
system controller slot module show出力にはスロットのステータスが `powered-on`と表示され、I/O モジュールの操作準備が完了していることがわかります。
-
I/O モジュールがオンラインで認識されていることを確認します。
障害のあるコントローラのコンソールから次のコマンドを入力します。
system controller config show -node local -slot slot_numberI/O モジュールが正常にオンラインになり、認識された場合、出力にはスロットのポート情報を含む I/O モジュール情報が表示されます。
たとえば、スロット 4 の I/O モジュールの場合、次のような出力が表示されます:
node2::> system controller config show -node local -slot 4 Node: node2 Sub- Device/ Slot slot Information ---- ---- ----------------------------- 4 - Dual 40G/100G Ethernet Controller CX6-DX e4a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2807GJFM-B e4b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2809G26F-A Device Type: CX6-DX PSID(NAP0000000027) Firmware Version: 22.44.1700 Part Number: 111-05341 Hardware Revision: 20 Serial Number: 032403001370
ステップ5: ストレージシステムを通常の動作に復元する
引き継がれたコントローラにストレージを戻し(必要に応じて)、自動ギブバックを復元し(必要に応じて)、LIF がホーム ポートにあることを確認し、AutoSupport 自動ケース作成を再度有効にして、ストレージ システムを通常の動作に復元します。
-
ストレージ システムで実行されている ONTAP のバージョンとコントローラの状態に応じて、必要に応じて、テイクオーバーされたコントローラでストレージをギブバックし、自動ギブバックを復元します:
ONTAP バージョン 状況 作業 9.17.1または9.18.1RC
障害のあるコントローラが正常なコントローラを自動的にテイクオーバーした場合
-
ストレージをギブバックして、正常なコントローラを通常の動作に戻します。
storage failover giveback -ofnode healthy_node_name -
障害のあるコントローラのコンソールから自動ギブバックをリストアします。
storage failover modify -node local -auto-giveback true
9.18.1GA以降
どちらかのコントローラが自動的にパートナー コントローラを引き継いだ場合
-
ストレージを戻して、テイクオーバーされたコントローラを通常の動作に戻します:
storage failover giveback -ofnode controller that was taken over_name -
引き継がれたコントローラのコンソールから自動ギブバックをリストアします。
storage failover modify -node local -auto-giveback true
9.18.1GA以降
両方のコントローラが起動し、I/O(データの提供)を実行しています
次の手順に進みます。
-
-
論理インターフェイスがホームサーバとポートに報告されていることを確認します。「 network interface show -is-home false 」
いずれかのLIFがfalseと表示された場合は、ホームポートにリバートします。
network interface revert -vserver * -lif * -
AutoSupportが有効になっている場合は、ケースの自動作成をリストアします。
system node autosupport invoke -node * -type all -message MAINT=end
手順 6 :障害が発生したパーツをネットアップに返却する
障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。