Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

I/O モジュールを交換してください - AFF A700 および FAS9000

共同作成者

I/O モジュールを交換するには、特定の順序でタスクを実行する必要があります。

  • この手順は、システムでサポートされるすべてのバージョンの ONTAP で使用できます

  • システムのその他のコンポーネントがすべて正常に動作している必要があります。問題がある場合は、必ずテクニカルサポートにお問い合わせください。

手順 1 :障害のあるコントローラをシャットダウンします

ストレージシステムのハードウェア構成に応じた手順を使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーできます。

オプション 1 :ほとんどの構成

障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。

このタスクについて
  • SANシステムを使用している場合は、イベントメッセージを確認しておく必要があります cluster kernel-service show)を参照してください。。 cluster kernel-service show コマンドは、ノード名、そのノードのクォーラムステータス、ノードの可用性ステータス、およびノードの動作ステータスを表示します。

    各 SCSI ブレードプロセスは、クラスタ内の他のノードとクォーラムを構成している必要があります。交換を進める前に、すべての問題を解決しておく必要があります。

  • ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"

手順
  1. AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。「 system node AutoSupport invoke -node * -type all -message MAINT=number_OF_hours_downh

    次のAutoSupport メッセージは、ケースの自動作成を2時間停止します。 cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify – node local-auto-giveback false

    メモ 自動ギブバックを無効にしますか?_と表示されたら'y'を入力します
  3. 障害のあるコントローラに LOADER プロンプトを表示します。

    障害のあるコントローラの表示 作業

    LOADER プロンプト

    次の手順に進みます。

    ギブバックを待っています

    Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します

    システムプロンプトまたはパスワードプロンプト

    正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _

    障害のあるコントローラに「 Waiting for giveback…​ 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。

オプション 2 :コントローラは 2 ノード MetroCluster に搭載されています

障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをスイッチオーバーする必要があります。

このタスクについて
  • NetApp Storage Encryption を使用している場合は、の「 FIPS ドライブまたは SED を非保護モードに戻す」セクションの手順に従って MSID をリセットしておく必要があります "CLI での NetApp Encryption の概要"

  • 正常なコントローラに電力を供給するために、この手順 の最後で電源装置をオンのままにしておく必要があります。

手順
  1. MetroCluster ステータスをチェックして、障害のあるコントローラが正常なコントローラに自動的にスイッチオーバーしたかどうかを確認します。「 MetroCluster show 」

  2. 自動スイッチオーバーが発生したかどうかに応じて、次の表に従って処理を進めます。

    障害のあるコントローラの状況 作業

    自動的にスイッチオーバーした

    次の手順に進みます。

    自動的にスイッチオーバーしていない

    正常なコントローラから計画的なスイッチオーバー操作を実行します : MetroCluster switchover

    スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された

    拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。

  3. サバイバークラスタから MetroCluster heal-phase aggregates コマンドを実行して、データアグリゲートを再同期します。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

  4. MetroCluster operation show コマンドを使用して、処理が完了したことを確認します。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 「 storage aggregate show 」コマンドを使用して、アグリゲートの状態を確認します。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 「 MetroCluster heal-phase root-aggregates 」コマンドを使用して、ルートアグリゲートを修復します。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal' コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

  7. デスティネーションクラスタで「 MetroCluster operation show 」コマンドを使用して、修復処理が完了したことを確認します。

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 障害のあるコントローラモジュールで、電源装置の接続を解除します。

手順 2 : I/O モジュールを交換します

I/O モジュールを交換するには、シャーシ内で I/O モジュールの場所を確認し、特定の順序で手順を実行します。

手順
  1. 接地対策がまだの場合は、自身で適切に実施します。

  2. ターゲットの I/O モジュールに接続されているケーブルをすべて取り外します。

    元の場所がわかるように、ケーブルにラベルを付けておいてください。

  3. ターゲットの I/O モジュールをシャーシから取り外します。

    1. 文字と数字が記載されたカムボタンを押し下げます。

      カムボタンがシャーシから離れます。

    2. カムラッチを下に回転させて水平にします。

      I/O モジュールがシャーシから外れ、 I/O スロットから約 1/2 インチアウトします。

    3. I/O モジュール前面の両側にあるプルタブを引いて、 I/O モジュールをシャーシから取り外します。

      I/O モジュールが取り付けられていたスロットを記録しておいてください。

      DRW 9000 PCIe モジュールを取り外します

    番号1

    文字と数字が記載された I/O カムラッチ

    番号2

    ロックが完全に解除された I/O カムラッチ

  4. I/O モジュールを脇へ置きます。

  5. 交換用 I/O モジュールを I/O モジュールをスロットにそっと挿入し、文字と数字が記載された I/O カムラッチを上に押してモジュールを所定の位置にロックし、 I/O モジュールをシャーシに取り付けます。

  6. 必要に応じて、 I/O モジュールにケーブルを再接続します。

手順 3 : I/O モジュールの交換後にコントローラをリブートします

I/O モジュールを交換したら、コントローラモジュールをリブートする必要があります。

メモ 新しいI/Oモジュールが障害の発生したモジュールと同じモデルでない場合は、最初にBMCをリブートする必要があります。
手順
  1. 交換用モジュールのモデルが古いモジュールと同じでない場合は、BMCをリブートします。

    1. LOADERプロンプトから、advanced権限モードに切り替えます。「priv set advanced」

    2. BMCを再起動します:「SP reboot

  2. LOADERプロンプトからノードをリブートします。bye

    メモ これにより、PCIeカードおよびその他のコンポーネントが再初期化され、ノードがリブートされます。
  3. システムが、 40 GbE NIC またはオンボードポート上で 10 GbE クラスタインターコネクトおよびデータ接続をサポートするように構成されている場合、メンテナンスモードから「 nicadmin convert 」コマンドを使用して、これらのポートを 10 GbE 接続に変換します。

    メモ 変換が完了したら必ずメンテナンスモードを終了してください。
  4. ノードを通常動作に戻します。storage failover giveback -ofnode impaired_node_name _

  5. 自動ギブバックを無効にした場合は、再度有効にします。「 storage failover modify -node local-auto-giveback true 」

    メモ システムが2ノードMetroCluster 構成の場合は、次の手順で説明するようにアグリゲートをスイッチバックする必要があります。

手順 4 : 2 ノード MetroCluster 構成のアグリゲートをスイッチバックする

2 ノード MetroCluster 構成で FRU の交換が完了したら、 MetroCluster スイッチバック処理を実行できます。これにより構成が通常の動作状態に戻ります。また、障害が発生していたサイトの同期元 Storage Virtual Machine ( SVM )がアクティブになり、ローカルディスクプールからデータを提供します。

このタスクでは、環境の 2 ノード MetroCluster 構成のみを実行します。

手順
  1. すべてのノードの状態が「 enabled 」であることを確認します。 MetroCluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. すべての SVM で再同期が完了したことを確認します。「 MetroCluster vserver show 」

  3. 修復処理によって実行される LIF の自動移行が正常に完了したことを確認します。 MetroCluster check lif show

  4. サバイバークラスタ内の任意のノードから MetroCluster switchback コマンドを使用して、スイッチバックを実行します。

  5. スイッチバック処理が完了したことを確認します MetroCluster show

    クラスタの状態が waiting-for-switchback の場合は、スイッチバック処理がまだ実行中です。

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    クラスタが「 normal 」状態のとき、スイッチバック処理は完了しています。

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    スイッチバックが完了するまでに時間がかかる場合は、「 MetroCluster config-replication resync-status show 」コマンドを使用することで、進行中のベースラインのステータスを確認できます。

  6. SnapMirror 構成または SnapVault 構成があれば、再確立します。

手順 5 :障害が発生したパーツをネットアップに返却する

障害のある部品は、キットに付属する RMA 指示書に従ってネットアップに返却してください。を参照してください "パーツの返品と交換" 詳細については、を参照してください。