Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換快取模組或新增 / 更換核心傾印模組: FAS9000

貢獻者

當系統登錄單AutoSupport 一的故障資訊(ASUP)訊息、指出模組已離線時、您必須更換控制器模組中的快取模組、否則會導致效能降低。如果AutoSupport 未啟用此功能、您可以透過模組正面的故障LED尋找故障快取模組。您也可以新增或更換1TB的X9170A核心傾印模組、如果您要將NS224磁碟機櫃安裝在AFF SVA700系統中、則需要此模組。

開始之前
  • 您必須使用從供應商處收到的替換FRU元件來更換故障元件。

  • 如需熱交換快取模組的相關指示、請參閱 "熱交換快取模組"

  • 在移除、更換或新增快取或核心傾印模組時、必須將目標節點暫停至載入器。

  • 支援1TB核心傾印模組X9170A、如果您要新增NS224磁碟機櫃、則需要此模組。AFF

  • 核心傾印模組可安裝在插槽6-1和6-2中。建議的最佳實務做法是將模組安裝在插槽6-1中。

  • X9170A核心傾印模組不可熱交換。

步驟1:關閉受損的控制器

根據儲存系統硬體組態的不同、您可以使用不同的程序來關閉或接管受損的控制器。

選項1:大多數組態

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息 cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用 AutoSupport 、請叫用 AutoSupport 訊息來隱藏自動建立個案: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」

    註 當您看到_是否要停用自動恢復?_時、請輸入「y」。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

選項2:控制器位於雙節點MetroCluster 的不二

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。

步驟
  1. 檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」

  2. 視是否發生自動切換而定、請根據下表繼續進行:

    如果控制器受損…​ 然後…​

    已自動切換

    繼續下一步。

    尚未自動切換

    從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」

    尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決

    請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。

  3. 從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  4. 使用MetroCluster flexoperationshow命令確認作業已完成。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 使用「shorage Aggregate show」命令來檢查集合體的狀態。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  7. 在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 在受損的控制器模組上、拔下電源供應器。

步驟2:更換或新增快取模組

NVMe SSD Flash Cache模組(FlashCache或快取模組)是獨立的模組。它們位於NVRAM模組的正面。若要更換或新增快取模組、請將其放在系統背面的插槽6上、然後依照特定的步驟順序進行更換。

開始之前

您的儲存系統必須符合特定條件、視您的情況而定:

  • 它必須具備適用於您所安裝之快取模組的作業系統。

  • 它必須支援快取容量。

  • 在新增或更換快取模組之前、目標節點必須處於載入器提示狀態。

  • 更換快取模組的容量必須與故障快取模組相同、但可以來自不同的支援廠商。

  • 儲存系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 在插槽6中、透過快取模組正面亮起的黃色警示LED、找到故障快取模組。

  3. 移除快取模組:

    註 如果您要在系統中新增其他快取模組、請移除空白模組、然後執行下一步。
    快取模組移除

    編號 1

    橘色釋放鈕。

    編號 2

    快取模組CAM處理。

    1. 按下快取模組正面的橘色釋放按鈕。

      註 請勿使用編號和有字母標記的I/O CAM栓鎖來退出快取模組。編號和有字母的I/O CAM栓鎖會退出整個NVRAM10模組、而非快取模組。
    2. 旋轉CAM握把、直到快取模組開始滑出NVRAM10模組。

    3. 將CAM握把往您的方向輕拉、即可從NVRAM10模組中移除快取模組。

      從NVRAM10模組移除快取模組時、請務必支援該模組。

  4. 安裝快取模組:

    1. 將快取模組的邊緣與NVRAM10模組的開孔對齊。

    2. 將快取模組輕推入支架、直到CAM把手上卡入。

    3. 旋轉CAM握把、直到鎖定到位。

步驟3:新增或更換X9170A核心傾印模組

1TB快取核心傾印(X9170A)僅用於AFF 填寫故障資料的功能。核心傾印模組無法熱交換。核心傾印模組通常位於系統背面插槽6-1的NVRAM模組正面。若要更換或新增核心傾印模組、請找出插槽6至1、然後依照特定步驟順序來新增或更換。

開始之前
  • 您的系統必須執行ONTAP 不含更新版本的功能、才能新增核心傾印模組。

  • X9170A核心傾印模組不可熱交換。

  • 在新增或更換程式碼傾印模組之前、目標節點必須處於載入器提示狀態。

  • 您必須收到兩個X9170核心傾印模組、每個控制器一個。

  • 儲存系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 如果您要更換故障的核心傾印模組、請找出並移除:

    快取模組移除

    編號 1

    橘色釋放鈕。

    編號 2

    核心傾印模組CAM握把。

    1. 透過模組正面的黃色警示LED尋找故障模組。

    2. 按下核心傾印模組正面的橘色釋放按鈕。

      註 請勿使用編號和有字母標記的I/O CAM栓鎖來退出核心傾印模組。編號和有字母的I/O CAM栓鎖會退出整個NVRAM10模組、而非核心傾印模組。
    3. 旋轉CAM握把、直到核心傾印模組開始滑出NVRAM10模組。

    4. 將CAM握把往您的方向輕拉、以從NVRAM10模組中移除核心傾印模組、並將其放在一邊。

      從NVRAM10模組移除核心傾印模組時、請務必支援核心傾印模組。

  3. 安裝核心傾印模組:

    1. 如果您要安裝新的核心傾印模組、請從插槽6-1中移除空白模組。

    2. 將核心傾印模組的邊緣與NVRAM10模組的開孔對齊。

    3. 將核心傾印模組輕推入支架、直到CAM把手上卡入。

    4. 旋轉CAM握把、直到鎖定到位。

步驟4:更換FRU後重新啟動控制器

更換FRU之後、您必須重新啟動控制器模組。

步驟
  1. 若要ONTAP 從載入程式提示字元開機、請輸入「bye」。

步驟5:在雙節點MetroCluster 的不二組態中切換回集合體

完成雙節點MetroCluster 的故障恢復組態中的FRU更換之後、您就可以執行MetroCluster 還原還原作業。這會將組態恢復至正常運作狀態、使先前受損站台上的同步來源儲存虛擬機器(SVM)現在處於作用中狀態、並從本機磁碟集區提供資料。

此工作僅適用於雙節點MetroCluster 的不完整組態。

步驟
  1. 驗證所有節點是否都處於「啟用」狀態:MetroCluster 「顯示節點」

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. 確認所有SVM上的重新同步已完成:MetroCluster 「Svserver show」

  3. 驗證修復作業所執行的任何自動LIF移轉是否已成功完成:「MetroCluster 還原檢查LIF show」

  4. 從存續叢集中的任何節點使用「MetroCluster 還原」命令執行切換。

  5. 確認切換作業已完成:MetroCluster 「不顯示」

    當叢集處於「等待切換」狀態時、切換回復作業仍在執行中:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    當叢集處於「正常」狀態時、即可完成切換作業:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    如果切換需要很長時間才能完成、您可以使用「MetroCluster show config-repl複 寫res同步 狀態show」命令來檢查進行中的基準狀態。

  6. 重新建立任何SnapMirror或SnapVault 不完整的組態。

步驟6:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。