關閉控制器AFF -現象A400
使用適合您組態的適當程序來關閉或接管受損的控制器。
選項1:更換機箱時關閉控制器
關閉控制器、以便在機箱上執行維護。
此程序適用於具有兩個節點組態的系統。如果您的系統具有兩個以上的節點、請參閱 "如何在四節點叢集中執行一個 HA 配對的正常關機和開機"。
-
停止所有用戶端 / 主機存取 NetApp 系統上的資料。
-
暫停外部備份工作。
-
請確定您擁有必要的權限和認證:
-
ONTAP 的本機系統管理員認證。
-
NetApp 板載金鑰管理( OKM )叢集範圍的複雜密碼(如果使用儲存加密或 NVE/NAE )。
-
每個控制器的 BMC 存取能力。
-
-
請確定您擁有必要的工具和設備以進行更換。
-
關機前的最佳做法是:
-
執行其他 "系統健全狀況檢查"。
-
將 ONTAP 升級至建議的系統版本。
-
解決任何問題 "Active IQ 健康警示與風險"。記下系統上目前存在的任何故障、例如系統元件上的 LED 。
-
-
透過 SSH 登入叢集、或使用本機主控台纜線和筆記型電腦 / 主控台、從叢集中的任何節點登入。
-
關閉 AutoSupport 並指出您預期系統離線的時間:
system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"
-
識別所有節點的 SP/BMC 位址:
system service-processor show -node * -fields address
-
結束叢集 Shell :
exit
-
使用上一步輸出中列出的任何節點的 IP 位址、透過 SSH 登入 SP/BMC 。
如果您使用的是主控台 / 筆記型電腦、請使用相同的叢集管理員認證登入控制器。
開啟每個 SP/BMC 連線的 SSH 工作階段、以便監控進度。 -
停止位於受損機箱中的兩個節點:
system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
對於在 StrictSync 模式下使用 SnapMirror 同步操作的叢集: system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
-
當您看到時、請為叢集中的每個控制器輸入 * y*
Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:
-
等待每個控制器停止並顯示載入器提示。
選項2:在雙節點MetroCluster 的現象組態中關閉控制器
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。
-
您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。
-
檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」
-
視是否發生自動切換而定、請根據下表繼續進行:
如果控制器受損… 然後… 已自動切換
繼續下一步。
尚未自動切換
從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」
尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決
請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。
-
從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。
controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。
-
使用MetroCluster flexoperationshow命令確認作業已完成。
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
使用「shorage Aggregate show」命令來檢查集合體的狀態。
controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。
mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。
-
在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:
mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
在受損的控制器模組上、拔下電源供應器。