DIMMの交換- AFF A70 and AFF A90
ストレージシステムでヘルスモニタアラートに基づく大量のCECC(修正可能なエラー訂正コード)エラーや修正不可能なECCエラーなどのエラーが発生した場合は、コントローラのDIMMを交換する必要があります。これらのエラーは通常、DIMMの1つの障害が原因でストレージシステムがONTAPをブートできないことが原因です。
システムのその他のコンポーネントがすべて正常に動作している必要があります。問題がある場合は、必ずテクニカルサポートにお問い合わせください。
障害が発生したコンポーネントは、NetAppから受け取った交換用FRUコンポーネントと交換する必要があります。
手順 1 :障害のあるコントローラをシャットダウンします
次のいずれかのオプションを使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーします。
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。
-
SANシステムを使用している場合は、障害コントローラのSCSIブレードのイベントメッセージを確認しておく必要があり `cluster kernel-service show`ます)。コマンド(priv advancedモードから)を実行すると、 `cluster kernel-service show`そのノードのノード名、そのノードの可用性ステータス、およびそのノードの動作ステータスが表示され"クォーラムステータス"ます。
各 SCSI ブレードプロセスは、クラスタ内の他のノードとクォーラムを構成している必要があります。交換を進める前に、すべての問題を解決しておく必要があります。
-
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"。
-
AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
次のAutoSupport メッセージは、ケースの自動作成を2時間停止します。
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify – node local-auto-giveback false
自動ギブバックを無効にしますか?_と表示されたら'y'を入力します -
障害のあるコントローラに LOADER プロンプトを表示します。
障害のあるコントローラの表示 作業 LOADER プロンプト
次の手順に進みます。
ギブバックを待っています
Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト
正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _
障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。
-
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"。
-
MetroClusterの設定状態が「設定済み」になっていること、およびノードが有効かつ正常な状態であること(`metrocluster node show`を確認しておく必要があります。
-
AutoSupport が有効になっている場合は、 AutoSupport メッセージを呼び出してケースの自動作成を抑制します。「 system node AutoSupport invoke -node * -type all -message MAINT=number_OF_hours_downh
次の AutoSupport メッセージは、ケースの自動作成を 2 時間停止します。 cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h`
-
正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify – node local-auto-giveback false
-
障害のあるコントローラに LOADER プロンプトを表示します。
障害のあるコントローラの表示 作業 LOADER プロンプト
次のセクションに進みます。
ギブバックを待っています
Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト(システムパスワードの入力)
正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _
障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。
手順 2 :コントローラモジュールを取り外す
コントローラモジュールを交換する場合やコントローラモジュール内部のコンポーネントを交換する場合は、コントローラモジュールをシャーシから取り外す必要があります。
-
シャーシの前面で、プラスのストッパーになるまで、親指で各ドライブをしっかりと押し込みます。これにより、ドライブがシャーシのミッドプレーンにしっかりと装着されます。
-
障害コントローラモジュールの背面にあるスロット4 / 5にある黄色のNVRAMのステータスLEDが消灯していることを確認します。NVアイコンを探します。
NVRAMステータスLED
NVRAM警告LED
-
NV LEDが消灯している場合は、次の手順に進みます。
-
NV LEDが点滅している場合は、点滅が停止するまで待ちます。点滅が5分以上続く場合は、テクニカルサポートにお問い合わせください。
-
-
接地対策がまだの場合は、自身で適切に実施します。
-
コントローラモジュールの電源装置(PSU)からコントローラモジュールの電源装置ケーブルを抜きます。
システムにDC電源がある場合は、電源ブロックをPSUから取り外します。 -
システムケーブルとSFPモジュールおよびQSFPモジュール(必要な場合)をコントローラモジュールから外し、ケーブルがどこに接続されていたかを記録します。
ケーブルはケーブルマネジメントデバイスに収めたままにします。これにより、ケーブルマネジメントデバイスを取り付け直すときに、ケーブルを整理する必要がありません。
-
ケーブルマネジメントデバイスをコントローラモジュールから取り外します。
-
両方のロックラッチを押し下げ、両方のラッチを同時に下方向に回転させます。
コントローラモジュールがシャーシから少し引き出されます。
固定ラッチ
ロッキングピン
-
コントローラモジュールをスライドしてシャーシから引き出し、平らで安定した場所に置きます。
このとき、空いている手でコントローラモジュールの底面を支えてください。
手順 3 : DIMM を交換する
DIMM を交換するには、コントローラ内で DIMM の場所を確認し、特定の手順を実行します。
-
接地対策がまだの場合は、自身で適切に実施します。
-
コントローラ上部のコントローラエアダクトを開きます。
-
エアダクトの遠端にあるくぼみに指を入れます。
-
エアダクトを持ち上げ、所定の位置まで上に回転させます。
-
-
コントローラモジュールでDIMMの場所を確認し、ターゲットDIMMを特定します。
AFF A70またはAFF A90のDIMMの正確な位置については、またはコントローラモジュールのFRUマップを参照してください "NetApp Hardware Universe" 。 -
DIMM の両側にある 2 つのツメをゆっくり押し開いて DIMM をスロットから外し、そのままスライドさせてスロットから取り出します。
DIMM 回路基板のコンポーネントに力が加わらないように、 DIMM の両端を慎重に持ちます。 DIMM と DIMM のツメ
-
交換用 DIMM を静電気防止用の梱包バッグから取り出し、 DIMM の端を持ってスロットに合わせます。
DIMM のピンの間にある切り欠きを、ソケットの突起と揃える必要があります。
-
コネクタにある DIMM のツメが開いた状態になっていることを確認し、 DIMM をスロットに対して垂直に挿入します。
DIMM のスロットへの挿入にはある程度の力が必要です。簡単に挿入できない場合は、 DIMM をスロットに正しく合わせてから再度挿入してください。
DIMM がスロットにまっすぐ差し込まれていることを目で確認してください。 -
DIMM の両端のノッチにツメがかかるまで、 DIMM の上部を慎重にしっかり押し込みます。
-
コントローラのエアダクトを閉じます。
手順 4 :コントローラモジュールを再度取り付けます
コントローラモジュールを再度取り付けてリブートします。
-
エアダクトをできるだけ下に回転させて、完全に閉じていることを確認します。
コントローラモジュールのシートメタルと面一になるように配置する必要があります。
-
コントローラモジュールの端をシャーシの開口部に合わせ、コントローラモジュールをシステムに半分までそっと押し込みます。
指示があるまでコントローラモジュールをシャーシに完全に挿入しないでください。 -
必要に応じて、ストレージシステムにケーブルを再接続します。
トランシーバ(QSFPまたはSFP)を取り外した場合は、光ファイバケーブルを使用しているときに再度取り付けてください。
リブート時にコンソールメッセージを受信できるように、修復されたコントローラモジュールにコンソールケーブルが接続されていることを確認します。修復されたコントローラは正常なコントローラから給電され、シャーシに完全に装着されるとすぐにリブートを開始します。 -
コントローラモジュールの再取り付けを完了します。
-
コントローラモジュールをシャーシに挿入し、ミッドプレーンまでしっかりと押し込んで完全に装着します。
コントローラモジュールが完全に装着されると、ロックラッチが上がります。
コネクタの破損を防ぐため、コントローラモジュールをスライドしてシャーシに挿入する際に力を入れすぎないでください。 -
ロックラッチを上方向に回してロック位置にします。
コントローラがブートしてLoaderプロンプトが表示されたら、コマンドを使用してリブートし `boot_ontap`ます。 -
-
電源装置に電源コードを接続します。
DC電源装置がある場合は、コントローラモジュールをシャーシに完全に装着したら、電源装置に電源ブロックを再接続します。 -
障害コントローラのストレージをギブバックして、障害コントローラを通常動作に戻します。
storage failover giveback -ofnode impaired_node_name
-
自動ギブバックが無効になっていた場合は、再度有効にします。
storage failover modify -node local -auto-giveback true
-
AutoSupportが有効になっている場合は、ケースの自動作成をリストアまたは抑制解除します。
system node autosupport invoke -node * -type all -message MAINT=END
手順 5 :障害が発生したパーツをネットアップに返却する
障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。