NVRAMモジュールまたはNVRAM DIMMの交換- AFF A700
NVRAM モジュールは、 NVRAM モジュールあたり NVRAM10 と DIMM 、および最大 2 つの NVMe SSD Flash Cache モジュール( FlashCache またはキャッシングモジュール)で構成されます。障害が発生した NVRAM モジュールまたは NVRAM モジュール内の DIMM を交換できます。
障害が発生した NVRAM モジュールを交換するには、シャーシからモジュールを取り外し、 NVRAM モジュールから FlashCache モジュールを取り外し、 DIMM を交換用モジュールに移し、 FlashCache モジュールまたはモジュールを再度取り付け、交換用 NVRAM モジュールをシャーシに取り付ける必要があります。
システム ID は NVRAM モジュールから取得されるため、モジュールを交換する場合は、システムに属するディスクを新しいシステム ID に再割り当てします。
-
すべてのディスクシェルフが適切に動作している必要があります。
-
HA ペアのシステムの場合は、交換する NVRAM モジュールに関連付けられているノードをパートナーノードがテイクオーバーできる必要があります。
-
この手順では次の用語を使用します。
-
impaired_node は、保守を実行しているノードです。
-
healthy_node は、障害ノードの HA パートナーです。
-
-
この手順には、新しい NVRAM モジュールに関連付けられているコントローラモジュールにディスクを自動または手動で再割り当てする手順が含まれています。手順でに指示された場合は、ディスクを再割り当てする必要があります。ギブバックで CAN 原因の問題が発生する前にディスクの再割り当てを完了する。
-
障害が発生したコンポーネントは、プロバイダから受け取った交換用 FRU コンポーネントと交換する必要があります。
-
この手順の一部としてディスクやディスクシェルフを変更することはできません。
手順 1 :障害のあるコントローラをシャットダウンします
次のいずれかのオプションを使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーします。
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをテイクオーバーする必要があります。
-
SANシステムを使用している場合は、障害コントローラのSCSIブレードのイベントメッセージを確認しておく必要があり `cluster kernel-service show`ます)。コマンド(priv advancedモードから)を実行すると、 `cluster kernel-service show`そのノードのノード名、そのノードの可用性ステータス、およびそのノードの動作ステータスが表示され"クォーラムステータス"ます。
各 SCSI ブレードプロセスは、クラスタ内の他のノードとクォーラムを構成している必要があります。交換を進める前に、すべての問題を解決しておく必要があります。
-
ノードが 3 つ以上あるクラスタは、クォーラムを構成している必要があります。クラスタがクォーラムを構成していない場合、または正常なコントローラで適格性と正常性についてfalseと表示される場合は、障害のあるコントローラをシャットダウンする前に問題 を修正する必要があります。を参照してください "ノードをクラスタと同期します"。
-
AutoSupportが有効になっている場合は、AutoSupportメッセージを呼び出してケースの自動作成を停止します。
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
次のAutoSupport メッセージは、ケースの自動作成を2時間停止します。
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
正常なコントローラのコンソールから自動ギブバックを無効にします。 storage failover modify – node local-auto-giveback false
自動ギブバックを無効にしますか?_と表示されたら'y'を入力します -
障害のあるコントローラに LOADER プロンプトを表示します。
障害のあるコントローラの表示 作業 LOADER プロンプト
次の手順に進みます。
ギブバックを待っています
Ctrl キーを押しながら C キーを押し ' プロンプトが表示されたら y と入力します
システムプロンプトまたはパスワードプロンプト
正常なコントローラから障害のあるコントローラをテイクオーバーまたは停止します。「 storage failover takeover -ofnode impaired_node_name _
障害のあるコントローラに「 Waiting for giveback… 」と表示されたら、 Ctrl+C キーを押し、「 y 」と入力します。
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをスイッチオーバーする必要があります。
-
正常なコントローラに電力を供給するために、この手順 の最後で電源装置をオンのままにしておく必要があります。
-
MetroCluster ステータスをチェックして、障害のあるコントローラが正常なコントローラに自動的にスイッチオーバーしたかどうかを確認します。「 MetroCluster show 」
-
自動スイッチオーバーが発生したかどうかに応じて、次の表に従って処理を進めます。
障害のあるコントローラの状況 作業 自動的にスイッチオーバーした
次の手順に進みます。
自動的にスイッチオーバーしていない
正常なコントローラから計画的なスイッチオーバー操作を実行します : MetroCluster switchover
スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された
拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。
-
サバイバークラスタから MetroCluster heal-phase aggregates コマンドを実行して、データアグリゲートを再同期します。
controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。
-
MetroCluster operation show コマンドを使用して、処理が完了したことを確認します。
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
「 storage aggregate show 」コマンドを使用して、アグリゲートの状態を確認します。
controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
「 MetroCluster heal-phase root-aggregates 」コマンドを使用して、ルートアグリゲートを修復します。
mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal' コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。
-
デスティネーションクラスタで「 MetroCluster operation show 」コマンドを使用して、修復処理が完了したことを確認します。
mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
障害のあるコントローラモジュールで、電源装置の接続を解除します。
手順 2 : NVRAM モジュールを交換します
NVRAM モジュールを交換するには、シャーシのスロット 6 にある NVRAM モジュールの場所を確認し、特定の手順に従います。
-
接地対策がまだの場合は、自身で適切に実施します。
-
FlashCache モジュールを古い NVRAM モジュールから新しい NVRAM モジュールに移します。
オレンジ色のリリースボタン( FlashCache モジュールが空の場合はグレー)
FlashCache のカムハンドル
-
FlashCache モジュール前面にあるオレンジ色のボタンを押します。
FlashCache モジュールが空の場合、リリースボタンの色はグレーです。 -
モジュールが古い NVRAM モジュールから少し引き出されるまでカムハンドルを外に開きます。
-
カムハンドルをつかみ、 NVRAM モジュールから引き出して、新しい NVRAM モジュールの前面に挿入します。
-
FlashCache モジュールを NVRAM モジュールの奥までそっと押し込み、モジュールが所定の位置に固定されるまでカムハンドルを閉じます。
-
-
ターゲットの NVRAM モジュールをシャーシから取り外します。
-
文字と数字が記載されたカムボタンを押し下げます。
カムボタンがシャーシから離れます。
-
カムラッチを下に回転させて水平にします。
NVRAM モジュールがシャーシから外れ、数インチ外に出ます。
-
NVRAM モジュール前面の両側にあるプルタブを引いてモジュールをシャーシから取り外します。
文字と数字が記載された I/O カムラッチ
ロックが完全に解除された I/O ラッチ
-
-
NVRAM モジュールを安定した場所に置き、カバーの青色のロックボタンを押し下げてカバーを NVRAM モジュールから取り外します。青いボタンを押しながら、カバーをスライドさせて NVRAM モジュールから外します。
カバーのロックボタン
DIMM と DIMM のツメ
-
古い NVRAM モジュールから DIMM を 1 つずつ取り外し、交換用 NVRAM モジュールに取り付けます。
-
モジュールのカバーを閉じます。
-
交換用 NVRAM モジュールをシャーシに取り付けます。
-
モジュールをスロット 6 のシャーシ開口部の端に合わせます。
-
モジュールをスロットにそっと挿入し、文字と数字が記載された I/O カムラッチを上に押してモジュールを所定の位置にロックします。
-
手順 3 : NVRAM DIMM を交換します
NVRAM モジュールの NVRAM DIMM を交換するには、 NVRAM モジュールを取り外し、モジュールを開き、ターゲット DIMM を交換する必要があります。
-
接地対策がまだの場合は、自身で適切に実施します。
-
ターゲットの NVRAM モジュールをシャーシから取り外します。
-
文字と数字が記載されたカムボタンを押し下げます。
カムボタンがシャーシから離れます。
-
カムラッチを下に回転させて水平にします。
NVRAM モジュールがシャーシから外れ、数インチ外に出ます。
-
NVRAM モジュール前面の両側にあるプルタブを引いてモジュールをシャーシから取り外します。
文字と数字が記載された I/O カムラッチ
ロックが完全に解除された I/O ラッチ
-
-
NVRAM モジュールを安定した場所に置き、カバーの青色のロックボタンを押し下げてカバーを NVRAM モジュールから取り外します。青いボタンを押しながら、カバーをスライドさせて NVRAM モジュールから外します。
カバーのロックボタン
DIMM と DIMM のツメ
-
NVRAM モジュール内で交換する DIMM の場所を確認し、 DIMM の固定ツメを押し下げ、ソケットから持ち上げて取り外します。
-
DIMM をソケットに合わせ、固定ツメが所定の位置に収まるまで DIMM をそっとソケットに押し込み、交換用 DIMM を取り付けます。
-
モジュールのカバーを閉じます。
-
交換用 NVRAM モジュールをシャーシに取り付けます。
-
モジュールをスロット 6 のシャーシ開口部の端に合わせます。
-
モジュールをスロットにそっと挿入し、文字と数字が記載された I/O カムラッチを上に押してモジュールを所定の位置にロックします。
-
手順 4 : FRU の交換後にコントローラをリブートします
FRU を交換したら、コントローラモジュールをリブートする必要があります。
-
LOADER プロンプトから ONTAP を起動するには、「 bye 」と入力します。
手順 5 :ディスクを再割り当てする
HA ペア構成と 2 ノード MetroCluster 構成のどちらを使用しているかに応じて、新しいコントローラモジュールへのディスクの再割り当てを確認するか、ディスクを手動で再割り当てする必要があります。
新しいコントローラへのディスクの再割り当て方法については、次のいずれかのオプションを選択します。
_replacement _node のブート時にシステム ID の変更を確定し、その変更が実施されたことを確認する必要があります。
ディスクの再割り当てはNVRAMモジュールを交換する場合にのみ必要で、NVRAM DIMMの交換には該当しません。 |
-
交換用ノードがメンテナンス・モード(プロンプトが表示されている)の場合は ' メンテナンス・モードを終了し ' LOADER プロンプト: halt を表示します
-
交換用ノードの LOADER プロンプトからノードをブートし、システム ID が一致しないためにシステム ID を上書きするかどうかを尋ねられたら、「 y 」と入力します。
「 boot_ontap bye 」というプロンプトが表示されます
自動ブートが設定されている場合は、ノードがリブートします。
-
_replacement _node コンソールに「 Waiting for giveback… 」というメッセージが表示されるまで待ち、正常なノードから、新しいパートナーシステム ID が自動的に割り当てられていることを確認します。「 storage failover show
コマンド出力には、障害ノードでシステム ID が変更されたことを示すメッセージが表示され、正しい古い ID と新しい ID が示されます。次の例では、 node2 の交換が実施され、新しいシステム ID として 151759706 が設定されています。
node1> `storage failover show` Takeover Node Partner Possible State Description ------------ ------------ -------- ------------------------------------- node1 node2 false System ID changed on partner (Old: 151759755, New: 151759706), In takeover node2 node1 - Waiting for giveback (HA mailboxes)
-
正常なノードから、コアダンプがすべて保存されたことを確認します。
-
advanced 権限レベルに切り替えます。「 set -privilege advanced 」
advanced モードで続行するかどうかを確認するプロンプトが表示されたら、「 y 」と入力します。advanced モードのプロンプトが表示されます( * > )。
-
コアダンプをすべて保存します。「 system node run -node _local-node-name_partner savecore 」
-
savecore コマンドが完了するのを待ってからギブバックを実行します
次のコマンドを入力すると、 savecore コマンドの進行状況を監視できます。 'system node run -node _local-node-name_partner savecore -s
-
admin 権限レベルに戻ります。「 set -privilege admin 」
-
-
ノードをギブバックします。
-
正常なノードから、交換したノードのストレージをギブバックします。「 storage failover giveback -ofnode replacement_node_name _
_replacement _node はストレージをテイクバックしてブートを完了します。
システム ID が一致しないためにシステム ID を上書きするかどうかを確認するメッセージが表示された場合は 'y' と入力する必要があります
ギブバックが拒否されている場合は、拒否を無効にすることを検討してください。
-
ギブバックが完了したら、 HA ペアが正常で、テイクオーバーが可能であることを確認します。「 storage failover show
storage failover show コマンドの出力には 'System ID changed on partner というメッセージは含まれていません
-
-
ディスクが正しく割り当てられたことを確認します。「 storage disk show -ownership
replacement _node には、新しいシステム ID が表示されます。次の例では、 node1 で所有されているディスクに、新しいシステム ID 1873775277 が表示されています。
node1> `storage disk show -ownership` Disk Aggregate Home Owner DR Home Home ID Owner ID DR Home ID Reserver Pool ----- ------ ----- ------ -------- ------- ------- ------- --------- --- 1.0.0 aggr0_1 node1 node1 - 1873775277 1873775277 - 1873775277 Pool0 1.0.1 aggr0_1 node1 node1 1873775277 1873775277 - 1873775277 Pool0 . . .
-
システムが MetroCluster 構成になっている場合は ' ノードのステータスを監視します MetroCluster node show
MetroCluster 構成では、交換後に通常の状態に戻るまで数分かかります。この時点で各ノードの状態が設定済みになります。 DR ミラーリングは有効で、通常モードになります。MetroCluster node show -fields node-systemid' コマンドの出力には、 MetroCluster 設定が通常の状態に戻るまで古いシステム ID が表示されます。
-
ノードが MetroCluster 構成になっている場合は、 MetroCluster の状態に応じて、元の所有者がディザスタサイトのノードである場合に DR ホーム ID のフィールドにディスクの元の所有者が表示されることを確認します。
これは、次の両方に該当する場合に必要です。
-
MetroCluster 構成がスイッチオーバー状態である。
-
replacement _node は、ディザスタサイトのディスクの現在の所有者です。
-
-
システムが MetroCluster 構成になっている場合は、各ノードが構成されていることを確認します。「 MetroCluster node show -fields configurion-state 」
node1_siteA::> metrocluster node show -fields configuration-state dr-group-id cluster node configuration-state ----------- ---------------------- -------------- ------------------- 1 node1_siteA node1mcc-001 configured 1 node1_siteA node1mcc-002 configured 1 node1_siteB node1mcc-003 configured 1 node1_siteB node1mcc-004 configured 4 entries were displayed.
-
各ノードに、想定されるボリュームが存在することを確認します。 vol show -node node-name
-
リブート時の自動テイクオーバーを無効にした場合は、正常なノードで「 storage failover modify -node replacement-node-name -onreboot true 」を有効にします
ONTAP を実行している 2 ノード MetroCluster 構成では、システムを通常の動作状態に戻す前に、新しいコントローラのシステム ID にディスクを手動で再割り当てする必要があります。
この手順は、 ONTAP を実行している 2 ノード MetroCluster 構成のシステムにのみ適用されます。
この手順のコマンドは、必ず正しいノードで問題に接続してください。
-
impaired_node は、保守を実行しているノードです。
-
replacement _node は、この手順で障害ノードと交換した新しいノードです。
-
healthy_node は、障害ノードの DR パートナーです。
-
まだ実行していない場合は、 _replacement _node を再起動し、 Ctrl+C キーを押してブートプロセスを中断して、表示されたメニューから Maintenance mode を起動するオプションを選択します。
システム ID が一致しないためにシステム ID を上書きするかどうかを確認するメッセージが表示されたら 'Y' を入力する必要があります
-
正常なノードから古いシステム ID を表示します MetroCluster node show -fields node-systemid'dr-partner-systemid
この例では、 Node_B_1 が古いノードであり、古いシステム ID は 118073209 です。
dr-group-id cluster node node-systemid dr-partner-systemid ----------- --------------------- -------------------- ------------- ------------------- 1 Cluster_A Node_A_1 536872914 118073209 1 Cluster_B Node_B_1 118073209 536872914 2 entries were displayed.
-
障害ノードの保守モードプロンプトで新しいシステム ID を表示します。「 Disk show
この例では、新しいシステム ID は 118065481 です。
Local System ID: 118065481 ... ...
-
disk show コマンドで取得したシステム ID 情報を使用して、ディスク所有権( FAS システムの場合)または LUN 所有権( FlexArray システムの場合)を再割り当てします。「ディスク再割り当て -s old system ID 」
上記の例の場合、コマンドは「 Disk reassign -s 118073209 」です
続行するかどうかを確認するメッセージが表示されたら、「 Y 」と入力します。
-
ディスク(または FlexArray LUN )が正しく割り当てられていることを確認します。「 Disk show -a 」
replacement _node に属するディスクに、 _replacement _node に割り当てられた新しいシステム ID が表示されていることを確認します。次の例では、 system-1 が所有するディスクに、新しいシステム ID 118065481 が表示されています。
*> disk show -a Local System ID: 118065481 DISK OWNER POOL SERIAL NUMBER HOME ------- ------------- ----- ------------- ------------- disk_name system-1 (118065481) Pool0 J8Y0TDZC system-1 (118065481) disk_name system-1 (118065481) Pool0 J8Y09DXC system-1 (118065481) . . .
-
正常なノードから、コアダンプがすべて保存されたことを確認します。
-
advanced 権限レベルに切り替えます。「 set -privilege advanced 」
advanced モードで続行するかどうかを確認するプロンプトが表示されたら、「 y 」と入力します。advanced モードのプロンプトが表示されます( * > )。
-
コアダンプが保存されたことを確認します。「 system node run -node _local-node-name_partner savecore 」
コマンド出力に savecore が進行中であることが示された場合は、 savecore が完了してからギブバックを実行します。「 system node run -node _local-node-name_partner savecore -s コマンド」を使用して、 savecore の進行状況を監視できます。 </info>
-
admin 権限レベルに戻ります。「 set -privilege admin 」
-
-
_replacement _node が Maintenance モード( *> プロンプトが表示されている)の場合、 Maintenance モードを終了して LOADER プロンプト「 halt 」に進みます
-
_replacement node: 'boot_ontap ' をブートします
-
_replacement _node が完全にブートしたら ' スイッチバックを実行します MetroCluster switchback
-
MetroCluster 構成を確認します MetroCluster node show -fields configurion-state
node1_siteA::> metrocluster node show -fields configuration-state dr-group-id cluster node configuration-state ----------- ---------------------- -------------- ------------------- 1 node1_siteA node1mcc-001 configured 1 node1_siteA node1mcc-002 configured 1 node1_siteB node1mcc-003 configured 1 node1_siteB node1mcc-004 configured 4 entries were displayed.
-
Data ONTAP で MetroCluster 構成の動作を確認します。
-
両方のクラスタにヘルスアラートがないかどうかを確認します。 'system health alert show'
-
MetroCluster が構成されており、通常モードであることを確認します。「 MetroCluster show 」
-
MetroCluster チェック「 MetroCluster check run 」を実行します
-
MetroCluster チェックの結果を表示します。「 MetroCluster check show 」
-
Config Advisor を実行します。次のURLにあるNetApp Support SiteのConfig Advisorページに移動します。 "support.netapp.com/NOW/download/tools/config_advisor/"。
Config Advisor の実行後、ツールの出力を確認し、推奨される方法で検出された問題に対処します。
-
-
スイッチオーバー処理をシミュレートします。
-
いずれかのノードのプロンプトで、 advanced 権限レベルに切り替えます。「 set -privilege advanced 」
advanced モードで続けるかどうかを尋ねられたら、「 y 」と入力して応答する必要があります。 advanced モードのプロンプトが表示されます( * > )。
-
simulate パラメータを指定して、スイッチバック処理を実行します。 MetroCluster switchover -simulate
-
admin 権限レベルに戻ります。「 set -privilege admin 」
-
手順 6 :障害が発生したパーツをネットアップに返却する
障害が発生したパーツは、キットに付属のRMA指示書に従ってNetAppに返却してください。 "パーツの返品と交換"詳細については、ページを参照してください。