日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

キャッシングモジュール FAS8200 を交換します

寄稿者 dougthomp thrisun netapp-martyh

モジュールがオフラインになったことを示す単一の AutoSupport ( ASUP )メッセージがシステムに登録された場合は、コントローラモジュールのキャッシングモジュールを交換する必要があります。交換しないと、パフォーマンスが低下します。

キャッシングモジュールを交換する前に、その内容を消去することを推奨します。。キャッシングモジュールのデータは暗号化されていますが、障害のあるキャッシングモジュールからデータをすべて消去してデータが残らないようにしたい場合があります。キャッシングモジュールのデータを消去します。「 system controller flash-cache secure-erase run 」。キャッシングモジュールからデータが消去されたことを確認します。「 system controller flash-cache secure-erase show -node node_name 」

+ 出力に、キャッシングモジュールのステータスが消去済みと表示されます。

  • 障害が発生したコンポーネントは、プロバイダから受け取った交換用 FRU コンポーネントと交換する必要があります。

手順 1 :障害のあるコントローラをシャットダウンします

ストレージシステムのハードウェア構成に応じた手順を使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーできます。

オプション 1 :ほとんどの構成

障害ノードをシャットダウンするには、ノードのステータスを確認し、必要に応じて正常なノードが障害ノードのストレージからデータを引き続き提供できるようにノードをテイクオーバーする必要があります。

ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合や、正常なノードの資格と健全性に false と表示される場合は、障害ノードをシャットダウンする前に問題を修正する必要があります。を参照してください "CLI での管理の概要"

手順
  1. AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。「 system node AutoSupport invoke -node * -type all -message MAINT=number_OF_hours_downh

    次の AutoSupport メッセージは、ケースの自動作成を 2 時間停止します。 cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h`

  2. 正常なノードのコンソールから自動ギブバックを無効にします。「 storage failover modify – node local-auto-giveback false

  3. 障害ノードに LOADER プロンプトを表示します。

    障害ノードの表示 作業

    LOADER プロンプト

    次の手順に進みます。

    ギブバックを待っています

    Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します

    システムプロンプトまたはパスワードプロンプト(システムパスワードの入力)

    障害ノードをテイクオーバーまたは停止します。

    • HA ペアの場合は、正常なノードから障害ノードをテイクオーバーします。「 storage failover takeover -ofnode impaired_node_name _

      障害ノードに「 Waiting for giveback…​ 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。

オプション 2 :コントローラが MetroCluster に搭載されている

注記 2 ノード MetroCluster 構成のシステムでは、この手順を使用しないでください。

障害ノードをシャットダウンするには、ノードのステータスを確認し、必要に応じて正常なノードが障害ノードのストレージからデータを引き続き提供できるようにノードをテイクオーバーする必要があります。

  • ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合や、正常なノードの資格と健全性に false と表示される場合は、障害ノードをシャットダウンする前に問題を修正する必要があります。を参照してください "CLI での管理の概要"

  • MetroCluster 構成を使用している場合は、 MetroCluster 構成状態が構成済みで、ノードが有効かつ正常な状態であることを確認しておく必要があります(「 MetroCluster node show 」)。

手順
  1. AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。「 system node AutoSupport invoke -node * -type all -message MAINT=number_OF_hours_downh

    次の AutoSupport メッセージは、ケースの自動作成を 2 時間停止します。 cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h`

  2. 正常なノードのコンソールから自動ギブバックを無効にします。「 storage failover modify – node local-auto-giveback false

  3. 障害ノードに LOADER プロンプトを表示します。

    障害ノードの表示 作業

    LOADER プロンプト

    次の手順に進みます。

    ギブバックを待っています

    Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します

    システムプロンプトまたはパスワードプロンプト(システムパスワードの入力)

    障害ノードをテイクオーバーまたは停止します。

    • HA ペアの場合は、正常なノードから障害ノードをテイクオーバーします。「 storage failover takeover -ofnode impaired_node_name _

      障害ノードに「 Waiting for giveback…​ 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。

オプション 3 :コントローラは 2 ノード MetroCluster に搭載されています

障害ノードをシャットダウンするには、ノードのステータスを確認し、必要に応じて正常なノードが障害ノードのストレージからデータを引き続き提供できるようにノードをスイッチオーバーする必要があります。

このタスクについて
  • NetApp Storage Encryption を使用している場合は、の「 SED を非保護モードに戻す」セクションの手順に従って MSID をリセットしておく必要があります "CLI での管理の概要"

  • 正常なノードに電力を供給するために、この手順の最後で電源装置をオンのままにしておく必要があります。

手順
  1. MetroCluster ステータスをチェックして、障害ノードが正常なノードに自動的にスイッチオーバーしたかどうかを確認します。「 MetroCluster show 」

  2. 自動スイッチオーバーが発生したかどうかに応じて、次の表に従って処理を進めます。

    障害ノードの状況 作業

    自動的にスイッチオーバーした

    次の手順に進みます。

    自動的にスイッチオーバーしていない

    正常なノードから計画的スイッチオーバー処理を実行します: MetroCluster switchover

    スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された

    拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。

  3. サバイバークラスタから MetroCluster heal-phase aggregates コマンドを実行して、データアグリゲートを再同期します。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

  4. MetroCluster operation show コマンドを使用して、処理が完了したことを確認します。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 「 storage aggregate show 」コマンドを使用して、アグリゲートの状態を確認します。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 「 MetroCluster heal-phase root-aggregates 」コマンドを使用して、ルートアグリゲートを修復します。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal' コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

  7. デスティネーションクラスタで「 MetroCluster operation show 」コマンドを使用して、修復処理が完了したことを確認します。

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 障害のあるコントローラモジュールで、電源装置の接続を解除します。

手順 2 :コントローラモジュールを開く

コントローラ内部のコンポーネントにアクセスするには、まずコントローラモジュールをシステムから取り外し、続いてコントローラモジュールのカバーを外す必要があります。

  1. 接地対策がまだの場合は、自身で適切に実施します。

  2. ケーブルマネジメントデバイスに接続しているケーブルをまとめているフックとループストラップを緩め、システムケーブルと SFP をコントローラモジュールから外し(必要な場合)、どのケーブルが何に接続されていたかを記録します。

    ケーブルはケーブルマネジメントデバイスに収めたままにします。これにより、ケーブルマネジメントデバイスを取り付け直すときに、ケーブルを整理する必要がありません。

  3. ケーブルマネジメントデバイスをコントローラモジュールの右側と左側から取り外し、脇に置きます。

    DRW 32xx CBL mgmt arm ( DRW 32xx CBL 管理アーム
  4. コントローラモジュールのカムハンドルの取り付けネジを緩めます。

    DRW 8020 カムハンドルの取り付けネジ

    取り付けネジ

    カムハンドル

  5. カムハンドルを下に引き、コントローラモジュールをシャーシから引き出します。

    このとき、空いている手でコントローラモジュールの底面を支えてください。

手順 3 :キャッシングモジュールを交換または追加する

コントローラでラベルが M.2 PCIe カードとなっているキャッシングモジュールを交換または追加するには、コントローラ内のスロットの場所を確認して、特定の手順を実行します。

状況に応じて、ストレージシステムが次に示す特定の条件を満たしている必要があります。

  • 取り付けるキャッシングモジュールに適したオペレーティングシステムが必要です。

  • キャッシュ容量をサポートする必要があります。

  • ストレージシステムのその他のコンポーネントがすべて正常に動作している必要があります。問題がある場合は、必ずテクニカルサポートにお問い合わせください。

    1. コントローラモジュールの背面にあるキャッシングモジュールの場所を確認して取り外します。

      1. リリースタブを押します。

      2. ヒートシンクを取り外します。

        ストレージシステムには、キャッシングモジュール用の 2 つのスロットが用意されており、デフォルトでは 1 つのスロットのみ使用されます。

    DRW rxl fcache
    1. キャッシングモジュールを追加する場合は、次の手順に進みます。キャッシングモジュールを交換する場合は、ケースからまっすぐにゆっくりと引き出します。

    2. キャッシングモジュールの端をケースのソケットに合わせ、ソケットにゆっくりと押し込みます。

    3. キャッシングモジュールが正しい向きでソケットに完全に装着されたことを確認します。

      必要に応じて、キャッシングモジュールを取り外してソケットへの装着をやり直します。

    4. ヒートシンクを再び装着して押し下げ、キャッシングモジュールケースの固定ボタンをはめ込みます。

    5. 2 つ目のキャッシングモジュールがある場合は、上記の手順を繰り返します。必要に応じて、コントローラモジュールカバーを閉じます。

手順 4 :コントローラを再度取り付けます

コントローラモジュール内のコンポーネントを交換したら、システムシャーシにコントローラモジュールを再設置してブートし、交換したコンポーネントの診断テストを実行できる状態にする必要があります。

  1. コントローラモジュールの端をシャーシの開口部に合わせ、コントローラモジュールをシステムに半分までそっと押し込みます。

    注記 指示があるまでコントローラモジュールをシャーシに完全に挿入しないでください。
  2. 必要に応じてシステムにケーブルを再接続します。

    光ファイバケーブルを使用する場合は、メディアコンバータ( QSFP または SFP )を取り付け直してください(取り外した場合)。

  3. コントローラモジュールの再取り付けを完了します。

    コントローラモジュールは、シャーシに完全に装着されるとすぐにブートを開始します。ブートプロセスを中断できるように準備しておきます。

    1. カムハンドルを開き、コントローラモジュールをミッドプレーンまでしっかりと押し込んで完全に装着し、カムハンドルをロック位置まで閉じます。

      注記 コネクタの破損を防ぐため、コントローラモジュールをスライドしてシャーシに挿入する際に力を入れすぎないでください。
    2. コントローラモジュール背面のカムハンドルの取り付けネジを締めます。

    3. ケーブルマネジメントデバイスをまだ取り付けていない場合は、取り付け直します。

    4. ケーブルマネジメントデバイスに接続されているケーブルをフックとループストラップでまとめます。

    5. 各ノードがブートを開始したら 'Press Ctrl-C for Boot Menu' というメッセージが表示されたら 'Ctrl+C キーを押してブートプロセスを中断します

    6. 表示されたメニューからメンテナンスモードでブートするオプションを選択します。

手順 5 :システムレベルの診断を実行します

新しいキャッシングモジュールを取り付けたら、診断を実行する必要があります。

システムレベルの診断を開始するには、システムに LOADER プロンプトが表示されている必要があります。

診断手順のコマンドは、すべてコンポーネントを交換するノードから実行します。

  1. 作業をするノードに LOADER プロンプトが表示されていない場合は、次の手順を実行します。

    1. 表示されたメニューからメンテナンスモードオプションを選択します。

    2. ノードが保守モードでブートしたら ' ノードを停止します

      コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。

    注記 起動プロセス中に 'y' をプロンプトに安全に応答できます
  2. LOADER プロンプトで、システムレベルの診断用に特別に設計されたドライバ「 boot_diags 」にアクセスします

    ブート・プロセス中に 'Maintenance] モードのプロンプト( *> )が表示されるまで 'y とプロンプトを入力しても安全です

  3. キャッシングモジュール「 'lddiag device run -dev fcache' 」の診断を実行します

  4. キャッシングモジュールの交換が原因でハードウェアの問題が発生していないことを確認します。 'lddiag device status -dev fcache-long-state failed

    テストに失敗した場合は、プロンプトに戻ります。失敗した場合は、そのステータスがすべて表示されます。

  5. 前述の手順の結果に応じて、次に進みます。

    システムレベルの診断のテスト結果 作業

    は失敗なしで完了しました

    1. ステータスログ「 diag device clearstatus 」を消去します

    2. ログがクリアされたことを確認します。「 diag device status 」

      次のデフォルトの応答が表示されます。

      SLDIAG :ログメッセージが存在しません。

    3. 保守モードを終了します :halt

      ノードに LOADER プロンプトが表示されます。

    4. LOADER プロンプトからノードをブートします。 bye

    5. ノードを通常動作に戻します。

    ノードの構成 作業

    HA ペア

    ギブバックを実行します。「 storage failover giveback -ofnode replacement_node_name _

    注記 自動ギブバックを無効にした場合は、 storage failover modify コマンドを使用して再度有効にします。

    2 ノード MetroCluster 構成

    次の手順に進みます。MetroCluster スイッチバック手順は、交換プロセスの次のタスクで実行します。

    スタンドアロン構成です

    次の手順に進みます。対処は不要です。これで、システムレベルの診断が完了しました。

    テストが失敗しました

    問題の原因を特定します。

    1. 保守モードを終了します :halt

      コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。

    2. シャーシ内のコントローラモジュールの数に応じて、電源装置をオフにするか、オンのままにします。

      • シャーシ内にコントローラモジュールが 2 つある場合は、他のコントローラモジュールに電力を供給するために、電源装置をオンのままにします。

      • シャーシ内にコントローラモジュールが 1 つしかない場合は、電源装置をオフにして電源から取り外します。

    3. システムレベルの診断を実行するための考慮事項をすべて確認するとともに、ケーブルがしっかりと接続されているか、ハードウェアコンポーネントがストレージシステムに適切に取り付けられているかを確認します。

    4. 対象となるコントローラモジュールをブートし、ブートメニューを表示するよう求められたら Ctrl+C キーを押してブートを中断します。

      • シャーシ内にコントローラモジュールが 2 つある場合は、対象となるコントローラモジュールをシャーシに完全に取り付けます。

        コントローラモジュールを完全に取り付けると、モジュールがブートします。

      • シャーシ内にコントローラモジュールが 1 つしかない場合は、電源装置を接続して電源をオンにします。

    5. メニューから、メンテナンスモードでのブートを選択します。

    6. 次のコマンドを入力して保守モードを終了します :halt

      コマンドを問題したら、システムが LOADER プロンプトで停止するまで待ちます。

    7. システムレベルの診断テストを再実行します。

手順 6 : 2 ノード MetroCluster 構成のアグリゲートをスイッチバックする

2 ノード MetroCluster 構成で FRU の交換が完了したら、 MetroCluster スイッチバック処理を実行できます。これにより構成が通常の動作状態に戻ります。また、障害が発生していたサイトの同期元 Storage Virtual Machine ( SVM )がアクティブになり、ローカルディスクプールからデータを提供します。

このタスクでは、環境の 2 ノード MetroCluster 構成のみを実行します。

手順
  1. すべてのノードの状態が「 enabled 」であることを確認します。 MetroCluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. すべての SVM で再同期が完了したことを確認します。「 MetroCluster vserver show 」

  3. 修復処理によって実行される LIF の自動移行が正常に完了したことを確認します。 MetroCluster check lif show

  4. サバイバークラスタ内の任意のノードから MetroCluster switchback コマンドを使用して、スイッチバックを実行します。

  5. スイッチバック処理が完了したことを確認します MetroCluster show

    クラスタの状態が waiting-for-switchback の場合は、スイッチバック処理がまだ実行中です。

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    クラスタが「 normal 」状態のとき、スイッチバック処理は完了しています。

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    スイッチバックが完了するまでに時間がかかる場合は、「 MetroCluster config-replication resync-status show 」コマンドを使用することで、進行中のベースラインのステータスを確認できます。

  6. SnapMirror 構成または SnapVault 構成があれば、再確立します。

手順 7 :交換プロセスを完了します

部品を交換したあと、障害のある部品をネットアップに返却することができます。詳細については、キットに付属する RMA 指示書を参照してください。テクニカルサポートにお問い合わせください "ネットアップサポート"RMA 番号を確認する場合や、交換用手順にサポートが必要な場合は、日本国内サポート用電話番号:国内フリーダイヤル 0066-33-123-265 または 0066-33-821-274 (国際フリーフォン 800-800-80-800 も使用可能)までご連絡ください。