Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

使用 CLI 手動進行四節點或八節點 MetroCluster 組態的 ONTAP 不中斷升級

貢獻者

手動升級四個或八個節點的 MetroCluster 組態、包括準備更新、同時更新一或兩個 DR 群組中的每個 DR 配對、以及執行升級後的工作。

  • 此工作適用於下列組態:

    • 執行不含更新版本的4節點MetroCluster 的不含功能的FC或IP組態ONTAP

    • 八節點MetroCluster 的不ONTAP 受限於任何版本的不受影響的不受限的FFC組態

  • 如果您有雙節點MetroCluster 的不全功能組態、請勿使用此程序。

  • 下列工作是指ONTAP 舊版和新版的《不一樣》。

    • 升級時、舊版ONTAP 是舊版的版次、版本編號比新版ONTAP 的版次低。

    • 降級時、舊版本ONTAP 是更新版本的版次、版本編號比ONTAP 新版的版次更高。

  • 此工作使用下列高層級工作流程:

    MetroCluster 組態升級決策流程

在八節點或四節點 MetroCluster 組態上更新 ONTAP 軟體時的差異

MetroCluster 軟體升級程序會因 MetroCluster 組態中有八個或四個節點而異。

一個由一或兩個DR群組所組成的支援組態。MetroCluster每個DR群組包含兩個HA配對、每MetroCluster 個VMware叢集各一個HA配對。八節點MetroCluster 的功能不全包含兩個DR群組:

八節點 MetroCluster 組態的圖表。

您一次升級一個 DR 群組。

對於四節點MetroCluster 的不完整組態:
  1. 升級 DR Group One :

    1. 升級 node_a_1 和 node_B_1 。

    2. 升級 node_a_2 和 node_B_2 。

對於八節點 MetroCluster 組態、您可以執行 DR 群組升級程序兩次:
  1. 升級 DR Group One :

    1. 升級 node_a_1 和 node_B_1 。

    2. 升級 node_a_2 和 node_B_2 。

  2. 升級 DR 群組二:

    1. 升級 node_a_3 和 node_B_3 。

    2. 升級 node_a_4 和 node_B_4 。

準備升級 MetroCluster DR 群組

在節點上升級 ONTAP 軟體之前、您必須先識別節點之間的 DR 關係、傳送一則 AutoSupport 訊息、告知您正在初始化升級、並確認每個節點上執行的 ONTAP 版本。

您必須擁有 "已下載""已安裝" 軟體映像。

此工作必須在每個DR群組上重複執行。如果這個支援功能組態由八個節點組成、則有兩個DR群組。MetroCluster因此、此工作必須在每個DR群組上重複執行。

本工作所提供的範例使用下圖所示的名稱來識別叢集和節點:

八節點 MetroCluster 組態的圖表。

  1. 識別組態中的 DR 配對:

    metrocluster node show -fields dr-partner
     cluster_A::> metrocluster node show -fields dr-partner
       (metrocluster node show)
     dr-group-id cluster     node       dr-partner
     ----------- -------     --------   ----------
     1           cluster_A   node_A_1   node_B_1
     1           cluster_A   node_A_2   node_B_2
     1           cluster_B   node_B_1   node_A_1
     1           cluster_B   node_B_2   node_A_2
     4 entries were displayed.
    
     cluster_A::>
  2. 將權限等級從 admin 設定為進階、在提示繼續時輸入 * y* :

    set -privilege advanced

    進階提示 (*>)。

  3. 確認叢集 A 上的 ONTAP 版本:

    system image show
     cluster_A::*> system image show
                      Is      Is                Install
     Node     Image   Default Current Version   Date
     -------- ------- ------- ------- -------   -------------------
     node_A_1
              image1  true    true    X.X.X     MM/DD/YYYY TIME
              image2  false   false   Y.Y.Y     MM/DD/YYYY TIME
     node_A_2
              image1  true    true    X.X.X     MM/DD/YYYY TIME
              image2  false   false   Y.Y.Y     MM/DD/YYYY TIME
     4 entries were displayed.
    
     cluster_A::>
  4. 確認叢集 B 上的版本:

    system image show
     cluster_B::*> system image show
                      Is      Is                 Install
     Node     Image   Default Current Version    Date
     -------- ------- ------- ------- -------    -------------------
     node_B_1
              image1  true    true    X.X.X      MM/DD/YYYY TIME
              image2  false   false   Y.Y.Y      MM/DD/YYYY TIME
     node_B_2
              image1  true    true    X.X.X      MM/DD/YYYY TIME
              image2  false   false   Y.Y.Y      MM/DD/YYYY TIME
     4 entries were displayed.
    
     cluster_B::>
  5. 觸發AutoSupport 功能不支援通知:

    autosupport invoke -node * -type all -message "Starting_NDU"

    此 AutoSupport 通知包含升級前的系統狀態記錄。如果升級程序發生問題、它會儲存實用的疑難排解資訊。

    如果您的叢集未設定為傳送AutoSupport 功能性訊息、則通知複本會儲存在本機。

  6. 針對第一組中的每個節點、將目標 ONTAP 軟體映像設為預設映像:

    system image modify {-node nodename -iscurrent false} -isdefault true

    此命令會使用延伸查詢、將安裝為替代映像的目標軟體映像變更為節點的預設映像。

  7. 確認目標 ONTAP 軟體映像已設為叢集 A 上的預設映像:

    system image show

    在下列範例中、image2是新ONTAP 的版本、並在第一組的每個節點上設為預設影像:

     cluster_A::*> system image show
                      Is      Is              Install
     Node     Image   Default Current Version Date
     -------- ------- ------- ------- ------- -------------------
     node_A_1
              image1  false   true    X.X.X   MM/DD/YYYY TIME
              image2  true    false   Y.Y.Y   MM/DD/YYYY TIME
     node_A_2
              image1  false   true    X.X.X   MM/DD/YYYY TIME
              image2  true   false   Y.Y.Y   MM/DD/YYYY TIME
    
     2 entries were displayed.
    1. 確認目標 ONTAP 軟體映像已設為叢集 B 上的預設映像:

      system image show

      下列範例顯示、目標版本已設定為第一組中每個節點的預設映像:

     cluster_B::*> system image show
                      Is      Is              Install
     Node     Image   Default Current Version Date
     -------- ------- ------- ------- ------- -------------------
     node_A_1
              image1  false   true    X.X.X   MM/DD/YYYY TIME
              image2  true    false   Y.Y.Y   MM/YY/YYYY TIME
     node_A_2
              image1  false   true    X.X.X   MM/DD/YYYY TIME
              image2  true    false   Y.Y.Y   MM/DD/YYYY TIME
    
     2 entries were displayed.
  8. 確定要升級的節點目前是否為每個節點提供兩次任何用戶端服務:

    system node run -node target-node -command uptime

    正常運作時間命令會顯示節點自上次開機以來、針對NFS、CIFS、FC和iSCSI用戶端執行的作業總數。對於每個傳輸協定、您需要執行兩次命令、以判斷作業數是否增加。如果數量不斷增加、則節點目前正在為該傳輸協定的用戶端提供服務。如果不增加、則節點目前不會為該傳輸協定的用戶端提供服務。

    註 您應該記下每個增加用戶端作業的傳輸協定、以便在節點升級之後、您可以確認用戶端流量已恢復。

    此範例顯示具有NFS、CIFS、FC和iSCSI作業的節點。不過、節點目前僅提供NFS和iSCSI用戶端服務。

     cluster_x::> system node run -node node0 -command uptime
       2:58pm up  7 days, 19:16 800000260 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32810 iSCSI ops
    
     cluster_x::> system node run -node node0 -command uptime
       2:58pm up  7 days, 19:17 800001573 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32815 iSCSI ops

更新MetroCluster 不只一個DR群組的第一個DR配對

您必須以正確順序執行節點的接管和恢復、才能使ONTAP 節點的新版本成為節點的目前版本。

所有節點都必須執行舊版ONTAP 的功能。

在此工作中、 node_a_1 和 node_B_1 會升級。

如果您已在第一個 DR 群組上升級 ONTAP 軟體、並正在八節點 MetroCluster 組態中升級第二個 DR 群組、則在此工作中、您將會更新 node_a_3 和 node_B_3 。

  1. 如果MetroCluster 啟用了《斷電器軟體》、請將其停用。

  2. 針對 HA 配對中的每個節點、停用自動恢復:

    storage failover modify -node target-node -auto-giveback false

    此命令必須針對HA配對中的每個節點重複執行。

  3. 確認已停用自動恢復:

    storage failover show -fields auto-giveback

    此範例顯示兩個節點上的自動恢復功能均已停用:

     cluster_x::> storage failover show -fields auto-giveback
     node     auto-giveback
     -------- -------------
     node_x_1 false
     node_x_2 false
     2 entries were displayed.
  4. 確保每個控制器的 I/O 不超過約 50% 、而且每個控制器的 CPU 使用率不超過約 50% 。

  5. 啟動叢集A上目標節點的接管:

    請勿指定-option Immediate參數、因為要重新啟動至新軟體映像的節點需要正常接管。

    1. 接管叢集 A ( node_a_1 )上的 DR 合作夥伴:

      storage failover takeover -ofnode node_A_1

      節點會開機至「等待恢復」狀態。

      註 如果啟用了「支援」、則會傳送一則消息「不支援」、指出節點已超出叢集仲裁。AutoSupport AutoSupport您可以忽略此通知並繼續升級。
    2. 確認接管成功:

      storage failover show

      以下範例顯示接管作業成功。node_a_1處於「等待恢復」狀態、node_a_2則處於「接管」狀態。

     cluster1::> storage failover show
                                   Takeover
     Node           Partner        Possible State Description
     -------------- -------------- -------- -------------------------------------
     node_A_1       node_A_2       -        Waiting for giveback (HA mailboxes)
     node_A_2       node_A_1       false    In takeover
     2 entries were displayed.
  6. 接管叢集B(node_B_1)上的DR合作夥伴:

    請勿指定-option Immediate參數、因為要重新啟動至新軟體映像的節點需要正常接管。

    1. 接管 node_B_1 :

      storage failover takeover -ofnode node_B_1

      節點會開機至「等待恢復」狀態。

      註 如果啟用了「支援」、則會傳送一則消息「不支援」、指出節點已超出叢集仲裁。AutoSupport AutoSupport您可以忽略此通知並繼續升級。
    2. 確認接管成功:

      storage failover show

      以下範例顯示接管作業成功。node_B_1處於「等待恢復」狀態、node_B_2則處於「接管」狀態。

     cluster1::> storage failover show
                                   Takeover
     Node           Partner        Possible State Description
     -------------- -------------- -------- -------------------------------------
     node_B_1       node_B_2       -        Waiting for giveback (HA mailboxes)
     node_B_2       node_B_1       false    In takeover
     2 entries were displayed.
  7. 至少等待八分鐘、以確保發生下列情況:

    • 用戶端多重路徑(若已部署)會穩定下來。

    • 用戶端會從接管期間發生的I/O暫停中恢復。

      還原時間是用戶端專屬的、視用戶端應用程式的特性而定、可能需要8分鐘以上的時間。

  8. 將集合體傳回目標節點:

    將MetroCluster 靜態IP組態升級ONTAP 為EFlash 9.5或更新版本之後、集合體將會在重新同步並返回鏡射狀態之前、處於降級狀態一小段時間。

    1. 將集合物傳回叢集 A 上的 DR 合作夥伴:

      storage failover giveback -ofnode node_A_1
    2. 將集合物傳回叢集 B 上的 DR 合作夥伴:

      storage failover giveback -ofnode node_B_1

      恢復作業會先將根Aggregate傳回節點、然後在節點完成開機之後、傳回非根Aggregate。

  9. 在兩個叢集上發出下列命令、確認已傳回所有的集合體:

    storage failover show-giveback

    如果「歸還狀態」欄位指出沒有要歸還的集合體、則會傳回所有集合體。如果恢復被否決、命令會顯示恢復進度、以及哪個子系統已對恢復執行了指令。

  10. 如果尚未傳回任何Aggregate、請執行下列動作:

    1. 請檢閱「否決因應措施」、以判斷您是否想要處理「『直接』條件、或是要撤銷「否決」。

    2. 如有必要、請解決錯誤訊息中所述的「『驗證』條件、確保所有已識別的作業都能正常終止。

    3. 重新輸入儲存容錯移轉恢復命令。

      如果您決定覆寫「vito'」條件、請將-overre-etoes參數設為true。

  11. 至少等待八分鐘、以確保發生下列情況:

    • 用戶端多重路徑(若已部署)會穩定下來。

    • 用戶端會從還原期間發生的I/O暫停中恢復。

      還原時間是用戶端專屬的、視用戶端應用程式的特性而定、可能需要8分鐘以上的時間。

  12. 將權限等級從 admin 設定為進階、在提示繼續時輸入 * y* :

    set -privilege advanced

    進階提示 (*>)。

  13. 確認叢集 A 上的版本:

    system image show

    下列範例顯示、節點a_1上的系統影像2應為預設版本和目前版本:

     cluster_A::*> system image show
                      Is      Is               Install
     Node     Image   Default Current Version  Date
     -------- ------- ------- ------- -------- -------------------
     node_A_1
              image1  false   false    X.X.X   MM/DD/YYYY TIME
              image2  true    true     Y.Y.Y   MM/DD/YYYY TIME
     node_A_2
              image1  false   true     X.X.X   MM/DD/YYYY TIME
              image2  true    false    Y.Y.Y   MM/DD/YYYY TIME
     4 entries were displayed.
    
     cluster_A::>
  14. 確認叢集 B 上的版本:

    system image show

    下列範例顯示、節點ONTAP _a_1上的系統影像2(0版)為預設版本和目前版本:

     cluster_A::*> system image show
                      Is      Is               Install
     Node     Image   Default Current Version  Date
     -------- ------- ------- ------- -------- -------------------
     node_B_1
              image1  false   false    X.X.X   MM/DD/YYYY TIME
              image2  true    true     Y.Y.Y   MM/DD/YYYY TIME
     node_B_2
              image1  false   true     X.X.X   MM/DD/YYYY TIME
              image2  true    false    Y.Y.Y   MM/DD/YYYY TIME
     4 entries were displayed.
    
     cluster_A::>

正在更新MetroCluster 不只是個DR群組的第二個DR配對

您必須以正確順序執行節點接管與恢復、才能使ONTAP 節點的新版本成為節點的目前版本。

您應該已經升級第一個DR配對(node_a_1和node_B_1)。

在此工作中、 node_a_2 和 node_B_2 會升級。

如果您已在第一個 DR 群組上升級 ONTAP 軟體、並正在八節點 MetroCluster 組態中更新第二個 DR 群組、則在此工作中、您將更新 node_a_4 和 node_B_4 。

  1. 將所有資料生命從節點移轉至其他位置:

    network interface migrate-all -node nodenameA
  2. 啟動叢集A上目標節點的接管:

    請勿指定-option Immediate參數、因為要重新啟動至新軟體映像的節點需要正常接管。

    1. 接管叢集_A上的DR合作夥伴:

      storage failover takeover -ofnode node_A_2 -option allow-version-mismatch
      註 allow-version-mismatch 從 ONTAP 9.0 升級至 ONTAP 9.1 或任何修補程式升級時、都不需要選項。

      節點會開機至「等待恢復」狀態。

      如果啟用了「支援」、則會傳送一則消息「不支援」、指出節點已超出叢集仲裁。AutoSupport AutoSupport您可以忽略此通知並繼續升級。

    2. 確認接管成功:

      storage failover show

      以下範例顯示接管作業成功。node_a_2處於「等待恢復」狀態、node_a_1處於「接管」狀態。

    cluster1::> storage failover show
                                  Takeover
    Node           Partner        Possible State Description
    -------------- -------------- -------- -------------------------------------
    node_A_1       node_A_2       false    In takeover
    node_A_2       node_A_1       -        Waiting for giveback (HA mailboxes)
    2 entries were displayed.
  3. 在叢集B上啟動目標節點的接管:

    請勿指定-option Immediate參數、因為要重新啟動至新軟體映像的節點需要正常接管。

    1. 接管叢集 B 上的 DR 合作夥伴( node_B_2 ):

      如果您要從…​升級 輸入此命令…​

      部分版本ONTAP ONTAP

      storage failover takeover -ofnode node_B_2

      部分版本的升級版ONTAP Data ONTAP

      storage failover takeover -ofnode node_B_2 -option allow-version-mismatch
      註 allow-version-mismatch 從 ONTAP 9.0 升級至 ONTAP 9.1 或任何修補程式升級時、都不需要選項。

      節點會開機至「等待恢復」狀態。

      註 如果啟用 AutoSupport 、則會傳送 AutoSupport 訊息、指出節點已超出叢集仲裁。您可以安全地忽略此通知並繼續升級。
    2. 確認接管成功:

      storage failover show

      以下範例顯示接管作業成功。node_B_2處於「等待恢復」狀態、node_B_1處於「接管中」狀態。

    cluster1::> storage failover show
                                  Takeover
    Node           Partner        Possible State Description
    -------------- -------------- -------- -------------------------------------
    node_B_1       node_B_2       false    In takeover
    node_B_2       node_B_1       -        Waiting for giveback (HA mailboxes)
    2 entries were displayed.
  4. 至少等待八分鐘、以確保發生下列情況:

    • 用戶端多重路徑(若已部署)會穩定下來。

    • 用戶端會從接管期間發生的I/O暫停中恢復。

      還原時間是用戶端專屬的、視用戶端應用程式的特性而定、可能需要8分鐘以上的時間。

  5. 將集合體傳回目標節點:

    將MetroCluster 靜態IP組態升級ONTAP 為EFlash 9.5之後、集合體將會在重新同步並返回鏡射狀態之前、處於降級狀態一小段時間。

    1. 將集合物傳回叢集 A 上的 DR 合作夥伴:

      storage failover giveback -ofnode node_A_2
    2. 將集合物傳回叢集 B 上的 DR 合作夥伴:

      storage failover giveback -ofnode node_B_2

      恢復作業會先將根Aggregate傳回節點、然後在節點完成開機之後、傳回非根Aggregate。

  6. 在兩個叢集上發出下列命令、確認已傳回所有的集合體:

    storage failover show-giveback

    如果「歸還狀態」欄位指出沒有要歸還的集合體、則會傳回所有集合體。如果恢復被否決、命令會顯示恢復進度、以及哪個子系統已對恢復執行了指令。

  7. 如果尚未傳回任何Aggregate、請執行下列動作:

    1. 請檢閱「否決因應措施」、以判斷您是否想要處理「『直接』條件、或是要撤銷「否決」。

    2. 如有必要、請解決錯誤訊息中所述的「『驗證』條件、確保所有已識別的作業都能正常終止。

    3. 重新輸入儲存容錯移轉恢復命令。

      如果您決定覆寫「vito'」條件、請將-overre-etoes參數設為true。

  8. 至少等待八分鐘、以確保發生下列情況:

    • 用戶端多重路徑(若已部署)會穩定下來。

    • 用戶端會從還原期間發生的I/O暫停中恢復。

      還原時間是用戶端專屬的、視用戶端應用程式的特性而定、可能需要8分鐘以上的時間。

  9. 將權限等級從 admin 設定為進階、在提示繼續時輸入 * y* :

    set -privilege advanced

    進階提示 (*>)。

  10. 確認叢集 A 上的版本:

    system image show

    下列範例顯示、節點ONTAP _a_2上的系統影像2(目標版本)為預設版本和目前版本:

    cluster_B::*> system image show
                     Is      Is                 Install
    Node     Image   Default Current Version    Date
    -------- ------- ------- ------- ---------- -------------------
    node_A_1
             image1  false   false    X.X.X     MM/DD/YYYY TIME
             image2  true    true     Y.Y.Y     MM/DD/YYYY TIME
    node_A_2
             image1  false   false    X.X.X     MM/DD/YYYY TIME
             image2  true    true     Y.Y.Y     MM/DD/YYYY TIME
    4 entries were displayed.
    
    cluster_A::>
  11. 確認叢集 B 上的版本:

    system image show

    下列範例顯示、節點ONTAP _B_2上的系統影像2(目標版本)為預設版本和目前版本:

    cluster_B::*> system image show
                     Is      Is                 Install
    Node     Image   Default Current Version    Date
    -------- ------- ------- ------- ---------- -------------------
    node_B_1
             image1  false   false    X.X.X     MM/DD/YYYY TIME
             image2  true    true     Y.Y.Y     MM/DD/YYYY TIME
    node_B_2
             image1  false   false    X.X.X     MM/DD/YYYY TIME
             image2  true    true     Y.Y.Y     MM/DD/YYYY TIME
    4 entries were displayed.
    
    cluster_A::>
  12. 針對 HA 配對中的每個節點、啟用自動恢復:

    storage failover modify -node target-node -auto-giveback true

    此命令必須針對HA配對中的每個節點重複執行。

  13. 確認已啟用自動恢復:

    storage failover show -fields auto-giveback

    此範例顯示兩個節點均已啟用自動恢復功能:

    cluster_x::> storage failover show -fields auto-giveback
    node     auto-giveback
    -------- -------------
    node_x_1 true
    node_x_2 true
    2 entries were displayed.