コントローラをシャットダウンします - AFF A400
構成に応じた適切な手順 を使用して、障害のあるコントローラをシャットダウンまたはテイクオーバーします。
オプション 1 :シャーシを交換する場合は、コントローラをシャットダウンします
シャーシのメンテナンスを実施できるように、コントローラをシャットダウンします。
この手順は、2ノード構成のシステムが対象です。システムのノードが3つ以上の場合は、を参照してください "4ノードクラスタで1つのHAペアの正常なシャットダウンと電源投入の実行方法"。
-
すべてのクライアント/ホストからネットアップシステム上のデータへのアクセスを停止します。
-
外部バックアップジョブを一時停止します。
-
必要な権限とクレデンシャルがあることを確認します。
-
ONTAP のローカル管理者のクレデンシャル。
-
ストレージ暗号化またはNVE / NAEを使用する場合は、NetAppのオンボードキー管理(OKM)クラスタ全体のパスフレーズ。
-
各コントローラのBMCへのアクセス性。
-
-
交換に必要な工具と機器が揃っていることを確認します。
-
シャットダウン前のベストプラクティスは次のとおりです。
-
追加を実行します "システムの健全性チェック"。
-
ONTAP をシステムの推奨リリースにアップグレードします。
-
いずれかを解決します "Active IQ ウェルネスアラートとリスク"。システムコンポーネントのLEDなど、現在システムに発生している障害をメモします。
-
-
SSHを使用してクラスタにログインするか、クラスタ内の任意のノードからローカルのコンソールケーブルとラップトップ/コンソールを使用してログインします。
-
AutoSupportをオフにして、システムがオフラインになるまでの時間を指定します。
system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"
-
すべてのノードのSP / BMCアドレスを特定します。
system service-processor show -node * -fields address
-
クラスタシェルを終了します。
exit
-
前の手順の出力に表示されたいずれかのノードのIPアドレスを使用して、SSH経由でSP / BMCにログインします。
コンソール/ラップトップを使用している場合は、同じクラスタ管理者のクレデンシャルを使用してコントローラにログインします。
進捗状況を監視できるように、すべてのSP / BMC接続とのSSHセッションを開きます。 -
障害のあるシャーシにある2つのノードを停止します。
system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
StrictSyncモードで動作するSnapMirror同期を使用するクラスタの場合: system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
-
表示されたら、クラスタ内の各コントローラに「* y *」と入力します。
Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:
-
各コントローラが停止するまで待ち、LOADERプロンプトを表示します。
オプション 2 : 2 ノード MetroCluster 構成のコントローラをシャットダウンする
障害のあるコントローラをシャットダウンするには、コントローラのステータスを確認し、必要に応じて正常なコントローラが障害のあるコントローラストレージからデータを引き続き提供できるようにコントローラをスイッチオーバーする必要があります。
-
正常なコントローラに電力を供給するために、この手順 の最後で電源装置をオンのままにしておく必要があります。
-
MetroCluster ステータスをチェックして、障害のあるコントローラが正常なコントローラに自動的にスイッチオーバーしたかどうかを確認します。「 MetroCluster show 」
-
自動スイッチオーバーが発生したかどうかに応じて、次の表に従って処理を進めます。
障害のあるコントローラの状況 作業 自動的にスイッチオーバーした
次の手順に進みます。
自動的にスイッチオーバーしていない
正常なコントローラから計画的なスイッチオーバー操作を実行します : MetroCluster switchover
スイッチオーバーは自動的には行われておらず、 MetroCluster switchover コマンドを使用してスイッチオーバーを試みたが、スイッチオーバーは拒否された
拒否メッセージを確認し、可能であれば問題を解決してやり直します。問題を解決できない場合は、テクニカルサポートにお問い合わせください。
-
サバイバークラスタから MetroCluster heal-phase aggregates コマンドを実行して、データアグリゲートを再同期します。
controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。
-
MetroCluster operation show コマンドを使用して、処理が完了したことを確認します。
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
「 storage aggregate show 」コマンドを使用して、アグリゲートの状態を確認します。
controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
「 MetroCluster heal-phase root-aggregates 」コマンドを使用して、ルートアグリゲートを修復します。
mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
修復が拒否された場合は '-override-vetoes パラメータを指定して MetroCluster heal' コマンドを再実行できますこのオプションパラメータを使用すると、修復処理を妨げるソフトな拒否はすべて無視されます。
-
デスティネーションクラスタで「 MetroCluster operation show 」コマンドを使用して、修復処理が完了したことを確認します。
mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
障害のあるコントローラモジュールで、電源装置の接続を解除します。