日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

PCIe カードを交換してください - AFF A300

12/18/2024 共同作成者

PDF

PCIe カードを交換するには、特定の順序でタスクを実行する必要があります。

この手順は、システムでサポートされるすべてのバージョンの ONTAP で使用できます
システムのその他のコンポーネントがすべて正常に動作している必要があります。問題がある場合は、必ずテクニカルサポートにお問い合わせください。

手順 1 ：障害のあるコントローラをシャットダウンします

ストレージシステムのハードウェア構成に応じた手順を使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーできます。

オプション 1 ：ほとんどの構成

障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。

このタスクについて

SANシステムを使用している場合は、障害コントローラのSCSIブレードのイベントメッセージを確認しておく必要があり `cluster kernel-service show`ます）。コマンド（priv advancedモードから）を実行すると、 `cluster kernel-service show`そのノードのノード名、そのノードの可用性ステータス、およびそのノードの動作ステータスが表示され"クォーラムステータス"ます。

各 SCSI ブレードプロセスは、クラスタ内の他のノードとクォーラムを構成している必要があります。交換を進める前に、すべての問題を解決しておく必要があります。
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題を修正する必要があります。を参照してください "ノードをクラスタと同期します"。

手順

AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。 system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

次のAutoSupport メッセージは、ケースの自動作成を2時間停止します。 cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify -node local -auto-giveback false

自動ギブバックを無効にしますか?_と表示されたら'y'を入力します

障害のあるコントローラに LOADER プロンプトを表示します。

障害のあるコントローラの表示	作業
LOADER プロンプト	次の手順に進みます。
ギブバックを待っています	Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト	正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _ 障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。

障害のあるコントローラの表示

作業

LOADER プロンプト

次の手順に進みます。

ギブバックを待っています

Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します

システムプロンプトまたはパスワードプロンプト

正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _

障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。

オプション 2 ：コントローラは 2 ノード MetroCluster に搭載されています

障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをスイッチオーバーする必要があります。

このタスクについて

正常なコントローラに電力を供給するために、この手順の最後で電源装置をオンのままにしておく必要があります。

手順

MetroCluster ステータスをチェックして、障害のあるコントローラが正常なコントローラに自動的にスイッチオーバーしたかどうかを確認します。「 MetroCluster show 」

自動スイッチオーバーが発生したかどうかに応じて、次の表に従って処理を進めます。

障害のあるコントローラの状況	作業
自動的にスイッチオーバーした	次の手順に進みます。
自動的にスイッチオーバーしていない	正常なコントローラから計画的なスイッチオーバー操作を実行します : MetroCluster switchover
スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された	拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。

障害のあるコントローラの状況

作業

自動的にスイッチオーバーした

次の手順に進みます。

自動的にスイッチオーバーしていない

正常なコントローラから計画的なスイッチオーバー操作を実行します : MetroCluster switchover

スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された

拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。

サバイバークラスタから MetroCluster heal-phase aggregates コマンドを実行して、データアグリゲートを再同期します。
```
controller_A_1::> metrocluster heal -phase aggregates
[Job 130] Job succeeded: Heal Aggregates is successful.
```
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

MetroCluster operation show コマンドを使用して、処理が完了したことを確認します。

controller_A_1::> metrocluster operation show
    Operation: heal-aggregates
      State: successful
Start Time: 7/25/2016 18:45:55
   End Time: 7/25/2016 18:45:56
     Errors: -

「 storage aggregate show 」コマンドを使用して、アグリゲートの状態を確認します。

controller_A_1::> storage aggregate show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...

「 MetroCluster heal-phase root-aggregates 」コマンドを使用して、ルートアグリゲートを修復します。
```
mcc1A::> metrocluster heal -phase root-aggregates
[Job 137] Job succeeded: Heal Root Aggregates is successful
```
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal' コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。

デスティネーションクラスタで「 MetroCluster operation show 」コマンドを使用して、修復処理が完了したことを確認します。

mcc1A::> metrocluster operation show
  Operation: heal-root-aggregates
      State: successful
 Start Time: 7/29/2016 20:54:41
   End Time: 7/29/2016 20:54:42
     Errors: -

障害のあるコントローラモジュールで、電源装置の接続を解除します。

手順 2 ：コントローラモジュールを開く

コントローラ内部のコンポーネントにアクセスするには、まずコントローラモジュールをシステムから取り外し、続いてコントローラモジュールのカバーを外す必要があります。

接地対策がまだの場合は、自身で適切に実施します。
ケーブルマネジメントデバイスに接続しているケーブルをまとめているフックとループストラップを緩め、システムケーブルと SFP をコントローラモジュールから外し（必要な場合）、どのケーブルが何に接続されていたかを記録します。

ケーブルはケーブルマネジメントデバイスに収めたままにします。これにより、ケーブルマネジメントデバイスを取り付け直すときに、ケーブルを整理する必要がありません。
ケーブルマネジメントデバイスをコントローラモジュールの右側と左側から取り外し、脇に置きます。
コントローラモジュールのカムハンドルの取り付けネジを緩めます。

取り付けネジ

カムハンドル
カムハンドルを下に引き、コントローラモジュールをシャーシから引き出します。

このとき、空いている手でコントローラモジュールの底面を支えてください。

手順 3 ： PCIe カードを交換します

PCIe カードを交換するには、コントローラ内で PCIe カードの場所を確認し、特定の手順を実行します。

接地対策がまだの場合は、自身で適切に実施します。
コントローラモジュールのサイドパネルにある取り付けネジを緩めます。
コントローラモジュールからサイドパネルを取り外します。

サイドパネル

PCIe カード
PCIe カードをコントローラモジュールから取り外し、脇に置きます。

交換用 PCIe カードを取り付けます。

カードをソケットに装着するときは、カードをスロットに合わせ、均等に力を加えてください。PCIe カードはスロットにまっすぐ差し込む必要があります。

下のスロットにカードを取り付けてもカードソケットがよく見えない場合は、上のカードを取り外してカードソケットを確認し、カードを取り付けてから、上のスロットから取り外したカードを取り付け直します。

サイドパネルを閉じ、取り付けネジを締めます。

手順 4 ：コントローラを再度取り付けます

コントローラモジュール内のコンポーネントを交換したら、コントローラモジュールをシステムシャーシに再度取り付けてブートする必要があります。

接地対策がまだの場合は、自身で適切に実施します。
コントローラモジュールの端をシャーシの開口部に合わせ、コントローラモジュールをシステムに半分までそっと押し込みます。

指示があるまでコントローラモジュールをシャーシに完全に挿入しないでください。
必要に応じてシステムにケーブルを再接続します。

光ファイバケーブルを使用する場合は、メディアコンバータ（ QSFP または SFP ）を取り付け直してください（取り外した場合）。

コントローラモジュールの再取り付けを完了します。

コントローラモジュールは、シャーシに完全に装着されるとすぐにブートを開始します。

システムの構成

実行する手順

HA ペア

カムハンドルを開き、コントローラモジュールをミッドプレーンまでしっかりと押し込んで完全に装着し、カムハンドルをロック位置まで閉じます。コントローラモジュール背面のカムハンドルの取り付けネジを締めます。

コネクタの破損を防ぐため、コントローラモジュールをスライドしてシャーシに挿入する際に力を入れすぎないでください。
ケーブルマネジメントデバイスをまだ取り付けていない場合は、取り付け直します。
まだケーブルをコントローラモジュールに再接続していない場合は、再接続します。
ケーブルマネジメントデバイスに接続されているケーブルをフックとループストラップでまとめます。

2 ノード MetroCluster 構成

カムハンドルを開き、コントローラモジュールをミッドプレーンまでしっかりと押し込んで完全に装着し、カムハンドルをロック位置まで閉じます。コントローラモジュール背面のカムハンドルの取り付けネジを締めます。

コネクタの破損を防ぐため、コントローラモジュールをスライドしてシャーシに挿入する際に力を入れすぎないでください。
ケーブルマネジメントデバイスをまだ取り付けていない場合は、取り付け直します。
まだケーブルをコントローラモジュールに再接続していない場合は、再接続します。
ケーブルマネジメントデバイスに接続されているケーブルをフックとループストラップでまとめます。
電源装置と電源に電源ケーブルを再接続し、電源をオンにしてブートプロセスを開始します。

システムが 40GbE NIC またはオンボードポートで 10GbE のクラスタインターコネクトとデータ接続をサポートするように設定されている場合は、保守モードで nicadmin convert コマンドを使用して、これらのポートを 10GbE 接続に変換します。

変換が完了したら必ずメンテナンスモードを終了してください。

コントローラを通常動作に戻します。

システムの構成	問題パートナーコンソールからのコマンド
HA ペア	「 storage failover giveback -ofnode _impaired_node_name _
2 ノード MetroCluster 構成	次の手順に進みます。MetroCluster スイッチバック手順は、交換プロセスの次のタスクで実行します。

システムの構成

問題パートナーコンソールからのコマンド

HA ペア

「 storage failover giveback -ofnode _impaired_node_name _

2 ノード MetroCluster 構成

次の手順に進みます。MetroCluster スイッチバック手順は、交換プロセスの次のタスクで実行します。

自動ギブバックを無効にした場合は、再度有効にします。「 storage failover modify -node local-auto-giveback true 」

手順 5 （ 2 ノード MetroCluster のみ）：アグリゲートをスイッチバックする

2 ノード MetroCluster 構成で FRU の交換が完了したら、 MetroCluster スイッチバック処理を実行できます。これにより構成が通常の動作状態に戻ります。また、障害が発生していたサイトの同期元 Storage Virtual Machine （ SVM ）がアクティブになり、ローカルディスクプールからデータを提供します。

このタスクでは、環境の 2 ノード MetroCluster 構成のみを実行します。

手順

すべてのノードの状態が「 enabled 」であることを確認します。 MetroCluster node show

cluster_B::>  metrocluster node show

DR                           Configuration  DR
Group Cluster Node           State          Mirroring Mode
----- ------- -------------- -------------- --------- --------------------
1     cluster_A
              controller_A_1 configured     enabled   heal roots completed
      cluster_B
              controller_B_1 configured     enabled   waiting for switchback recovery
2 entries were displayed.

すべての SVM で再同期が完了したことを確認します。「 MetroCluster vserver show 」
修復処理によって実行される LIF の自動移行が正常に完了したことを確認します。 MetroCluster check lif show
サバイバークラスタ内の任意のノードから MetroCluster switchback コマンドを使用して、スイッチバックを実行します。
スイッチバック処理が完了したことを確認します MetroCluster show

クラスタの状態が waiting-for-switchback の場合は、スイッチバック処理がまだ実行中です。
```
cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured       	switchover
Remote: cluster_A configured       	waiting-for-switchback
```
クラスタが「 normal 」状態のとき、スイッチバック処理は完了しています。
```
cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured      		normal
Remote: cluster_A configured      		normal
```
スイッチバックが完了するまでに時間がかかる場合は、「 MetroCluster config-replication resync-status show 」コマンドを使用することで、進行中のベースラインのステータスを確認できます。
SnapMirror 構成または SnapVault 構成があれば、再確立します。

手順 6 ：障害が発生したパーツをネットアップに返却する

障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。