Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

關閉控制器AFF -現象A400

貢獻者

使用適合您組態的適當程序來關閉或接管受損的控制器。

選項1:更換機箱時關閉控制器

關閉控制器、以便在機箱上執行維護。

此程序適用於具有兩個節點組態的系統。如果您的系統具有兩個以上的節點、請參閱 "如何在四節點叢集中執行一個 HA 配對的正常關機和開機"

開始之前
  • 停止所有用戶端 / 主機存取 NetApp 系統上的資料。

  • 暫停外部備份工作。

  • 請確定您擁有必要的權限和認證:

    • ONTAP 的本機系統管理員認證。

    • NetApp 板載金鑰管理( OKM )叢集範圍的複雜密碼(如果使用儲存加密或 NVE/NAE )。

    • 每個控制器的 BMC 存取能力。

  • 請確定您擁有必要的工具和設備以進行更換。

  • 關機前的最佳做法是:

步驟
  1. 透過 SSH 登入叢集、或使用本機主控台纜線和筆記型電腦 / 主控台、從叢集中的任何節點登入。

  2. 關閉 AutoSupport 並指出您預期系統離線的時間:

    system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  3. 識別所有節點的 SP/BMC 位址:

    system service-processor show -node * -fields address

  4. 結束叢集 Shell : exit

  5. 使用上一步輸出中列出的任何節點的 IP 位址、透過 SSH 登入 SP/BMC 。

    如果您使用的是主控台 / 筆記型電腦、請使用相同的叢集管理員認證登入控制器。

    註 開啟每個 SP/BMC 連線的 SSH 工作階段、以便監控進度。
  6. 停止位於受損機箱中的兩個節點:

    system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

    註 對於在 StrictSync 模式下使用 SnapMirror 同步操作的叢集: system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
  7. 當您看到時、請為叢集中的每個控制器輸入 * y* Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:

  8. 等待每個控制器停止並顯示載入器提示。

選項2:在雙節點MetroCluster 的現象組態中關閉控制器

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。

步驟
  1. 檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」

  2. 視是否發生自動切換而定、請根據下表繼續進行:

    如果控制器受損…​ 然後…​

    已自動切換

    繼續下一步。

    尚未自動切換

    從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」

    尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決

    請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。

  3. 從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  4. 使用MetroCluster flexoperationshow命令確認作業已完成。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 使用「shorage Aggregate show」命令來檢查集合體的狀態。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  7. 在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 在受損的控制器模組上、拔下電源供應器。