Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

I/OモジュールのホットスワップFAS50

共同作成者 netapp-lisa

モジュールに障害が発生し、ストレージ システムがすべてのONTAPバージョン要件を満たしている場合は、FAS50ストレージ システム内のEthernet I/Oモジュールをホット スワップできます。

I/O モジュールをホットスワップするには、ストレージ システムがONTAPのバージョン要件を満たしていることを確認し、ストレージ システムと I/O モジュールを準備し、障害のあるモジュールをホットスワップし、交換用モジュールをオンラインにして、ストレージ システムを通常の動作に復元し、障害のあるモジュールをNetAppに戻します。

このタスクについて
  • I/O モジュールのホット スワップでは、障害が発生した I/O モジュールを交換する前に手動でテイクオーバーを実行する必要がありません。

  • I/O モジュールをホット スワップする場合は、正しいコントローラと I/O スロットにコマンドを適用します。

    • 障害のあるコントローラ は、I/O モジュールをホット スワップしているコントローラです。

    • 正常なコントローラ は、障害のあるコントローラの HA パートナーです。

  • ストレージシステムの位置情報(青色)LEDを点灯させることで、影響を受けたストレージシステムの物理的な位置を特定しやすくなります。SSHを使用してBMCにログインし、 `system location-led on`コマンドを入力してください。

    ストレージシステムにはロケーションLEDが3つあります。1つはオペレータ用ディスプレイパネルに、もう1つは各コントローラにあります。ロケーションLEDは30分間点灯したままになります。

    無効にするには、コマンドを入力し system location-led off`ます。LEDが点灯しているか消灯しているかが不明な場合は、コマンドを入力してLEDの状態を確認できます `system location-led show

ステップ1: ストレージシステムが手順の要件を満たしていることを確認する

この手順を使用するには、ストレージ システムで ONTAP 9.17.1 以降が実行されており、ストレージ システムが実行している ONTAP のバージョンのすべての要件を満たしている必要があります。

メモ ストレージ システムで ONTAP 9.17.1 以降が実行されていない場合、またはストレージ システムで実行されている ONTAP のバージョンのすべての要件を満たしていない場合は、この手順は使用できません。"I/Oモジュールの交換手順"を使用する必要があります。
ONTAP 9.17.1 または 9.18.1RC
  • 障害が発生したクラスタとスロット4のHA I/Oモジュールを、同等のI/Oモジュールにホット スワップしています。I/Oモジュールのタイプは変更できません。

  • 障害が発生したクラスタとHA I/Oモジュールを持つコントローラ(障害コントローラ)は、正常なパートナー コントローラをすでにテイクオーバーしている必要があります。I/Oモジュールに障害が発生した場合、テイクオーバーは自動的に実行されるはずです。

    2ノードクラスタの場合、ストレージシステムはどちらのコントローラに障害が発生したI/Oモジュールがあるかを判別できないため、どちらかのコントローラがテイクオーバーを開始する可能性があります。ホットスワップは、障害が発生したI/Oモジュールを持つコントローラ(障害コントローラ)が正常なコントローラをテイクオーバーした場合にのみサポートされます。I/Oモジュールのホットスワップは、システムを停止させずに復旧する唯一の方法です。

    障害のあるコントローラが正常なコントローラを正常に引き継いだかどうかを確認するには、 `storage failover show`指示。

    故障したI/Oモジュールがどのコントローラにあるのか分からない場合は、 "ネットアップサポート"

  • ストレージ システム構成では、スロット 4 にクラスタと HA I/O モジュールが 2 つではなく、クラスタと HA I/O モジュールが 1 つだけ配置されている必要があります。

  • ストレージ システムは、2 ノード (スイッチレスまたはスイッチ) のクラスター構成である必要があります。

  • ストレージシステムの他のすべてのコンポーネントが正常に動作している必要があります。正常に動作していない場合は、この手順を続行する前にににお問い合わせください "ネットアップサポート"

ONTAP 9.18.1GA以降
  • クラスタ、HA、クライアントで使用されるポートの組み合わせが任意のスロットにあるイーサネットI/Oモジュールを、同等のI/Oモジュールとホット スワップしています。I/Oモジュールのタイプを変更することはできません。

    ストレージまたはMetroClusterに使用されるポートを持つEthernet I/Oモジュールはホットスワップ対応ではありません。

  • ストレージ システム(スイッチレスまたはスイッチ クラスタ構成)には、ストレージ システムでサポートされる任意の数のノードを含めることができます。

  • クラスタ内のすべてのノードは、同じONTAPバージョン(ONTAP 9.18.1GA以降)を実行しているか、同じONTAPバージョンの異なるパッチ レベルを実行している必要があります。

    クラスタ内のノードが異なるONTAPバージョンを実行している場合、これは混合バージョンのクラスタと見なされ、I/Oモジュールのホットスワップはサポートされません。

  • ストレージ システム内のコントローラは、次のいずれかの状態になります:

    • 両方のコントローラが起動して I/O(データの提供)を実行できます。

    • テイクオーバーが障害が発生した I/O モジュールによって発生し、コントローラがそれ以外は正常に機能している場合、いずれかのコントローラがテイクオーバー状態になることがあります。

      特定の状況では、ONTAPは、障害が発生したI/Oモジュールが原因で、いずれかのコントローラの自動テイクオーバーを実行できます。たとえば、障害が発生したI/Oモジュールにすべてのクラスタポートが含まれている場合(そのコントローラ上のすべてのクラスタリンクがダウンしている場合)、ONTAPは自動的にテイクオーバーを実行します。

  • ストレージシステムの他のすべてのコンポーネントが正常に動作している必要があります。正常に動作していない場合は、この手順を続行する前にににお問い合わせください "ネットアップサポート"

ステップ2:ストレージシステムとI/Oモジュールスロットを準備する

障害が発生した I/O モジュールを安全に取り外せるように、ストレージ システムと I/O モジュール スロットを準備します:

手順
  1. 自身の適切な接地対策を行います

  2. 故障した I/O モジュールからケーブルを取り外します。

    この手順の後半で同じポートに再接続できるように、ケーブルに必ずラベルを付けてください。

    メモ

    I/O モジュールは障害状態(ポートはリンク ダウン状態)にあるはずですが、リンクがまだアップ状態であり、そこに機能している最後のクラスタ ポートが含まれている場合は、ケーブルを取り外すと自動テイクオーバーがトリガーされます。

    この手順を続行する前に、ケーブルを外してから5分間待って、テイクオーバーまたはLIFフェイルオーバーが完了していることを確認してください。

  3. AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。

    system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

    たとえば、次のAutoSupportメッセージは、自動ケース作成を 2 時間抑制します。

    node2::> system node autosupport invoke -node * -type all -message MAINT=2h

  4. ストレージ システムで実行されている ONTAP のバージョンとコントローラの状態に応じて、自動ギブバックを無効にします。

    ONTAP バージョン 状況 作業

    9.17.1または9.18.1RC

    障害のあるコントローラが正常なコントローラを自動的にテイクオーバーした場合

    自動ギブバックを無効にする:

    1. 障害のあるコントローラのコンソールから次のコマンドを入力します

      storage failover modify -node local -auto-giveback false

    2. 入力 y「自動ギブバックを無効にしますか?」というプロンプトが表示されたら、

    9.18.1GA以降

    どちらかのコントローラが自動的にパートナー コントローラを引き継いだ場合

    自動ギブバックを無効にする:

    1. パートナーを引き継いだコントローラのコンソールから次のコマンドを入力します:

      storage failover modify -node local -auto-giveback false

    2. 入力 y「自動ギブバックを無効にしますか?」というプロンプトが表示されたら、

    9.18.1GA以降

    両方のコントローラが起動し、I/O(データの提供)を実行しています

    次の手順に進みます。

  5. 障害が発生した I/O モジュールをサービスから削除し、電源をオフにして、取り外す準備をします:

    1. 次のコマンドを入力します。

      system controller slot module remove -node impaired_node_name -slot slot_number

    2. 入力 y「続行しますか?」というプロンプトが表示されたら

      たとえば、次のコマンドは、ノード 2(障害のあるコントローラ)のスロット 4 にある障害のあるモジュールを取り外す準備をし、安全に取り外せることを示すメッセージを表示します:

    node2::> system controller slot module remove -node node2 -slot 4
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered off for removal.
    
    Do you want to continue? {y|n}: y
    
    The module has been successfully removed from service and powered off. It can now be safely removed.
  6. 障害が発生した I/O モジュールの電源がオフになっていることを確認します:

    system controller slot module show

    出力には、障害が発生したモジュールとそのスロット番号の `status`列に `powered-off`が表示されます。

ステップ3:故障したI/Oモジュールをホットスワップする

障害が発生した I/O モジュールを同等の I/O モジュールとホット スワップします:

手順
  1. 接地対策がまだの場合は、自身で適切に実施します。

  2. 障害のあるコントローラから障害のある I/O モジュールを取り外します:

    スロット4のホットスワップクラスタとHA I/Oモジュール
    番号1

    I/Oモジュールの取り付けネジを反時計回りに回して緩めます。

    番号2

    左側のポート ラベル タブと右側のつまみネジを使用して、I/O モジュールをコントローラーから引き出します。

  3. 交換用 I/O モジュールを取り付けます。

    1. I/O モジュールをスロットの端に合わせます。

    2. I/O モジュールをゆっくりとスロットの奥まで押し込み、I/O モジュールがコネクタに正しく装着されていることを確認します。

      左側のタブと右側のつまみネジを使用して、I/O モジュールを押し込むことができます。

    3. 蝶ネジを時計回りに回して締めます。

  4. 交換用 I/O モジュールをケーブル接続します。

ステップ4:交換用I/Oモジュールをオンラインにする

交換用 I/O モジュールをオンラインにして、I/O モジュール ポートが正常に初期化されたことを確認し、スロットの電源がオンになっていることを確認してから、I/O モジュールがオンラインで認識されていることを確認します。

このタスクについて

I/O モジュールが交換され、ポートが正常な状態に戻ると、LIF は交換された I/O モジュールにリバートされます。

手順
  1. 交換用 I/O モジュールをオンラインにします:

    1. 次のコマンドを入力します。

      system controller slot module insert -node impaired_node_name -slot slot_number

    2. 入力 y「続行しますか?」というプロンプトが表示されたら、

      出力により、I/O モジュールが正常にオンラインになったこと(電源がオンになり、初期化され、サービスが開始されたこと)が確認されます。

      たとえば、次のコマンドは、ノード 2 (障害のあるコントローラ) のスロット 4 をオンラインにし、プロセスが成功したことを示すメッセージを表示します。

    node2::> system controller slot module insert -node node2 -slot 4
    
    Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered on and initialized.
    
    Do you want to continue? {y|n}: `y`
    
    The module has been successfully powered on, initialized and placed into service.
  2. I/O モジュールの各ポートが正常に初期化されたことを確認します:

    1. 障害のあるコントローラのコンソールから次のコマンドを入力します。

      event log show -event *hotplug.init*

      メモ 必要なファームウェアの更新とポートの初期化には数分かかる場合があります。

      出力には、I/O モジュール上の各ポートが正常に初期化されたことを示す 1 つ以上の hotplug.init.success EMS イベントが表示されます。

      たとえば、次の出力は、I/O ポート e4b と e4a の初期化が成功したことを示しています:

    node2::> event log show -event *hotplug.init*
    
    Time                Node             Severity      Event
    
    ------------------- ---------------- ------------- ---------------------------
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e4b" in slot 4 succeeded
    
    7/11/2025 16:04:06  node2      NOTICE        hotplug.init.success: Initialization of ports "e4a" in slot 4 succeeded
    
    2 entries were displayed.
    1. ポートの初期化に失敗した場合は、EMS ログを確認して次の手順を実行してください。

  3. I/O モジュール スロットの電源がオンになっていて、操作の準備ができていることを確認します:

    system controller slot module show

    出力にはスロットのステータスが `powered-on`と表示され、I/O モジュールの操作準備が完了していることがわかります。

  4. I/O モジュールがオンラインで認識されていることを確認します。

    障害のあるコントローラのコンソールから次のコマンドを入力します。

    system controller config show -node local -slot slot_number

    I/O モジュールが正常にオンラインになり、認識された場合、出力にはスロットのポート情報を含む I/O モジュール情報が表示されます。

    たとえば、スロット 4 の I/O モジュールの場合、次のような出力が表示されます:

    node2::> system controller config show -node local -slot 4
    
    Node: node2
    Sub- Device/
    Slot slot Information
    ---- ---- -----------------------------
       4    - Dual 40G/100G Ethernet Controller CX6-DX
                      e4a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2807GJFM-B
                      e4b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up)
                              QSFP Vendor:        CISCO-BIZLINK
                              QSFP Part Number:   L45593-D218-D10
                              QSFP Serial Number: LCC2809G26F-A
                      Device Type:        CX6-DX PSID(NAP0000000027)
                      Firmware Version:   22.44.1700
                      Part Number:        111-05341
                      Hardware Revision:  20
                      Serial Number:      032403001370

ステップ5: ストレージシステムを通常の動作に復元する

引き継がれたコントローラにストレージを戻し(必要に応じて)、自動ギブバックを復元し(必要に応じて)、LIF がホーム ポートにあることを確認し、AutoSupport 自動ケース作成を再度有効にして、ストレージ システムを通常の動作に復元します。

手順
  1. ストレージ システムで実行されている ONTAP のバージョンとコントローラの状態に応じて、必要に応じて、テイクオーバーされたコントローラでストレージをギブバックし、自動ギブバックを復元します:

    ONTAP バージョン 状況 作業

    9.17.1または9.18.1RC

    障害のあるコントローラが正常なコントローラを自動的にテイクオーバーした場合

    1. ストレージをギブバックして、正常なコントローラを通常の動作に戻します。

      storage failover giveback -ofnode healthy_node_name

    2. 障害のあるコントローラのコンソールから自動ギブバックをリストアします。

      storage failover modify -node local -auto-giveback true

    9.18.1GA以降

    どちらかのコントローラが自動的にパートナー コントローラを引き継いだ場合

    1. ストレージを戻して、テイクオーバーされたコントローラを通常の動作に戻します:

      storage failover giveback -ofnode controller that was taken over_name

    2. 引き継がれたコントローラのコンソールから自動ギブバックをリストアします。

      storage failover modify -node local -auto-giveback true

    9.18.1GA以降

    両方のコントローラが起動し、I/O(データの提供)を実行しています

    次の手順に進みます。

  2. 論理インターフェイスがホームサーバとポートに報告されていることを確認します。「 network interface show -is-home false 」

    いずれかのLIFがfalseと表示された場合は、ホームポートにリバートします。 network interface revert -vserver * -lif *

  3. AutoSupportが有効になっている場合は、ケースの自動作成をリストアします。

    system node autosupport invoke -node * -type all -message MAINT=end

手順 6 :障害が発生したパーツをネットアップに返却する

障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。