Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換 NVRAM 模組或 NVRAM DIMM - FAS9000

貢獻者

NVRAM模組包含NVRAM10和DIMM、每個NVRAM模組最多可有兩個NVMe SSD Flash Cache模組(FlashCache或快取模組)。您可以更換故障的NVRAM模組或NVRAM模組內的DIMM。

若要更換故障的NVRAM模組、您必須將其從機箱中移除、從NVRAM模組中移除FlashCache模組或模組、將DIMM移至更換模組、重新安裝FlashCache模組或模組、然後將替換的NVRAM模組安裝到機箱中。

由於系統ID是從NVRAM模組衍生而來、因此如果更換模組、則屬於系統的磁碟會重新指派至新的系統ID。

開始之前
  • 所有磁碟櫃都必須正常運作。

  • 如果您的系統是HA配對、則合作夥伴節點必須能夠接管與要更換的NVRAM模組相關的節點。

  • 本程序使用下列術語:

    • _減損_節點是您要執行維護的節點。

    • Healthy」節點是受損節點的HA合作夥伴。

  • 此程序包括自動或手動將磁碟重新指派給與新NVRAM模組相關聯的控制器模組的步驟。您必須依照程序中的指示重新指派磁碟。在恢復之前完成磁碟重新指派可能會造成問題。

  • 您必須使用從供應商處收到的替換FRU元件來更換故障元件。

  • 在此程序中、您無法變更任何磁碟或磁碟櫃。

步驟1:關閉受損的控制器

使用下列其中一個選項來關閉或接管受損的控制器。

選項1:大多數系統

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息 cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用 AutoSupport 、請叫用 AutoSupport 訊息來隱藏自動建立個案: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」

    註 當您看到_是否要停用自動恢復?_時、請輸入「y」。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

選項2:控制器位於雙節點MetroCluster 的不二

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。

步驟
  1. 檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」

  2. 視是否發生自動切換而定、請根據下表繼續進行:

    如果控制器受損…​ 然後…​

    已自動切換

    繼續下一步。

    尚未自動切換

    從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」

    尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決

    請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。

  3. 從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  4. 使用MetroCluster flexoperationshow命令確認作業已完成。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 使用「shorage Aggregate show」命令來檢查集合體的狀態。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  7. 在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 在受損的控制器模組上、拔下電源供應器。

步驟2:更換NVRAM模組

若要裝回NVRAM模組、請將其置於機箱的插槽6中、然後依照特定的步驟順序進行。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 將FlashCache模組從舊的NVRAM模組移至新的NVRAM模組:

    更換快取模組

    編號 1

    橘色釋放按鈕(空白FlashCache模組為灰色)

    編號 2

    FlashCache CAM處理

    1. 按下FlashCache模組正面的橘色按鈕。

      註 空白FlashCache模組上的釋放按鈕為灰色。
    2. 將CAM握把向外旋轉、直到模組開始滑出舊的NVRAM模組。

    3. 抓住模組CAM把手上、將其從NVRAM模組中滑出、然後將其插入新的NVRAM模組正面。

    4. 將FlashCache模組一路輕推入NVRAM模組、然後將CAM握把旋開、直到鎖定模組到位。

  3. 從機箱中移除目標NVRAM模組:

    1. 按下帶有字母和編號的CAM按鈕。

      CAM按鈕會從機箱移出。

    2. 向下轉動CAM栓鎖、直到其處於水平位置。

      NVRAM模組會從機箱中鬆脫、然後移出幾英吋。

    3. 拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。

      卸下NVRAM模組

    編號 1

    I/O CAM栓鎖有編號和編號

    編號 2

    I/O鎖定完全解除鎖定

  4. 將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。

    卸下 NVRAM 模組內容

    編號 1

    護蓋鎖定按鈕

    編號 2

    DIMM和DIMM彈出卡舌

  5. 從舊的NVRAM模組中一次移除一個DIMM、然後將其安裝到替換的NVRAM模組中。

  6. 合上模組的護蓋。

  7. 將替換的NVRAM模組安裝到機箱:

    1. 將模組對齊插槽6中機箱開孔的邊緣。

    2. 將模組輕推入插槽、直到帶有字母和編號的I/O CAM栓開始與I/O CAM銷接合、然後將I/O CAM栓完全推入、將模組鎖定到位。

步驟3:更換NVRAM DIMM

若要更換NVRAM模組中的NVRAM DIMM、您必須移除NVRAM模組、開啟模組、然後更換目標DIMM。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 從機箱中移除目標NVRAM模組:

    1. 按下帶有字母和編號的CAM按鈕。

      CAM按鈕會從機箱移出。

    2. 向下轉動CAM栓鎖、直到其處於水平位置。

      NVRAM模組會從機箱中鬆脫、然後移出幾英吋。

    3. 拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。

      卸下NVRAM模組

    編號 1

    I/O CAM栓鎖有編號和編號

    編號 2

    I/O鎖定完全解除鎖定

  3. 將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。

    卸下 NVRAM 模組內容

    編號 1

    護蓋鎖定按鈕

    編號 2

    DIMM和DIMM彈出卡舌

  4. 找到NVRAM模組內要更換的DIMM、然後按下DIMM鎖定彈片並將DIMM從插槽中提出來將其卸下。

  5. 將DIMM對齊插槽、然後將DIMM輕推入插槽、直到鎖定彈片鎖定到位、即可安裝替換DIMM。

  6. 合上模組的護蓋。

  7. 將替換的NVRAM模組安裝到機箱:

    1. 將模組對齊插槽6中機箱開孔的邊緣。

    2. 將模組輕推入插槽、直到帶有字母和編號的I/O CAM栓開始與I/O CAM銷接合、然後將I/O CAM栓完全推入、將模組鎖定到位。

步驟4:更換FRU後重新啟動控制器

更換FRU之後、您必須重新啟動控制器模組。

步驟
  1. 若要ONTAP 從載入程式提示字元開機、請輸入「bye」。

步驟5:重新指派磁碟

視您是否有HA配對或雙節點MetroCluster 的功能表組態而定、您必須驗證磁碟是否重新指派至新的控制器模組、或手動重新指派磁碟。

請選取下列其中一個選項、以取得如何將磁碟重新指派給新控制器的指示。

選項1:驗證ID(HA配對)
驗證HA系統上的系統ID變更

您必須在開機_replaced_節點時確認系統ID變更、然後驗證變更是否已實作。

警告 只有在更換 NVRAM 模組時才需要重新指派磁碟、而且不適用於 NVRAM DIMM 更換。
步驟
  1. 如果替換節點處於維護模式(顯示「*」>提示、請結束維護模式、然後前往載入程式提示:「halt」

  2. 從替換節點的載入器提示中、啟動節點、如果系統ID不相符、系統提示您覆寫系統ID、請輸入「y」。

    'boot_ONTAP bye'

    如果已設定自動開機、節點將會重新開機。

  3. 請等待、直到畫面上的「waiting for org食品 傳回…​」(正在等待恢復…​)訊息顯示在_replace_節點主控台、然後從正常節點驗證是否已自動指派新的合作夥伴系統ID:「torage容錯移轉顯示」(torage容錯移轉顯示)

    在命令輸出中、您應該會看到一則訊息、指出受損節點上的系統ID已變更、顯示正確的舊ID和新ID。在下列範例中、node2已完成更換、新的系統ID為151759706。

    node1> `storage failover show`
                                        Takeover
    Node              Partner           Possible     State Description
    ------------      ------------      --------     -------------------------------------
    node1             node2             false        System ID changed on partner (Old:
                                                      151759755, New: 151759706), In takeover
    node2             node1             -            Waiting for giveback (HA mailboxes)
  4. 從健全節點、確認已儲存任何核心傾印:

    1. 變更為進階權限等級:「et -priv榮幸 進階」

      當系統提示您繼續進入進階模式時、您可以回應「Y」。出現進階模式提示(*>)。

    2. 儲存任何核心傾印:「系統節點執行節點_nocal-node-name_合作夥伴儲存資源」

    3. 在發出恢復之前、請等待「命令」完成。

      您可以輸入下列命令來監控savecore命令的進度:「ystem節點run -node-node-name_合作夥伴savecore -ss」

    4. 返回管理員權限等級:「et -priv. admin」

  5. 回饋節點:

    1. 從健全的節點、歸還替換節點的儲存設備:「儲存容錯移轉恢復-節點_replace_node_name_」

      _replacy_nodes將恢復其儲存設備並完成開機。

      如果系統ID不相符、系統提示您覆寫系統ID、請輸入「y」。

      註 如果被否決、您可以考慮覆寫否決。
    1. 完成恢復後、請確認HA配對正常、而且可以接管:「顯示容錯移轉」

      從「儲存容錯移轉show」命令輸出的內容、不應包含「系統ID已在合作夥伴上變更」訊息。

  6. 驗證是否已正確分配磁碟:「torage disk show -所有權」

    屬於_replaced_節點的磁碟應顯示新的系統ID。在下列範例中、node1擁有的磁碟現在顯示新的系統ID:1873775277:

    node1> `storage disk show -ownership`
    
    Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
    ----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
    1.0.0  aggr0_1  node1 node1  -        1873775277 1873775277  -       1873775277 Pool0
    1.0.1  aggr0_1  node1 node1           1873775277 1873775277  -       1873775277 Pool0
    .
    .
    .
  7. 如果系統採用MetroCluster 的是一套不全功能的組態、請監控節點的狀態:MetroCluster 「不只是顯示節點」

    更換後、需要幾分鐘時間才能恢復正常狀態、此時每個節點都會顯示已設定的狀態、並啟用DR鏡射和正常模式。MetroCluster「停止節點show -Fields node-SystemID」命令輸出會顯示舊的系統ID、直到該組態恢復正常狀態為止。MetroCluster MetroCluster

  8. 如果節點是MetroCluster 以支援功能為基礎的組態、請MetroCluster 視支援狀況而定、確認如果原始擁有者是災難站台上的節點、則DR主ID欄位會顯示磁碟的原始擁有者。

    如果下列兩項條件均為真、則必須執行此動作:

  9. 如果您的系統使用MetroCluster 的是E驗 證組態、請確認每個節點都已設定:「MetroCluster E節點 顯示-欄位組態狀態」

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  10. 驗證每個節點是否存在預期的磁碟區:「vol show -node-name」

  11. 如果您在重新開機時停用自動接管、請從正常節點「torage容錯移轉修改節點置換節點名稱-onreboottrue」啟用

選項2:重新指派ID MetroCluster (資訊組態)
在雙節點MetroCluster 的不全功能組態中重新指派系統ID

在執行支援功能的雙節點MetroCluster 版的支援功能組態ONTAP 中、您必須手動將磁碟重新指派給新的控制器系統ID、才能將系統恢復正常運作。

關於這項工作

此程序僅適用於MetroCluster 執行ONTAP 下列項目的雙節點系統:

您必須確定在正確的節點上發出此程序中的命令:

  • _減損_節點是您要執行維護的節點。

  • _replaced_節點是新的節點、在本程序中會取代受損節點。

  • Healthy」節點是受損節點的DR合作夥伴。

步驟
  1. 如果您尚未重新啟動_replaced_節點、請輸入「Ctrl-C」來中斷開機程序、然後從顯示的功能表中選取開機至維護模式的選項。

    由於系統ID不相符、當系統提示您置換系統ID時、您必須輸入「Y」。

  2. 從正常節點上檢視舊的系統ID:「MetroCluster 『節點show -Fields node-SystemID、dr-Partner SystemID」

    在此範例中、Node_B_1是舊節點、舊系統ID為118673209:

    dr-group-id cluster         node                 node-systemid dr-partner-systemid
     ----------- --------------------- -------------------- ------------- -------------------
     1           Cluster_A             Node_A_1             536872914     118073209
     1           Cluster_B             Node_B_1             118073209     536872914
     2 entries were displayed.
  3. 在「受損」節點上的「維護」模式提示字元中檢視新的系統ID:「顯示」

    在此範例中、新的系統ID為118065481:

    Local System ID: 118065481
        ...
        ...
  4. 使用FAS 從disk show命令「磁碟重新指派舊系統ID」取得的系統ID資訊、重新指派磁碟擁有權(適用於整個系統)或LUN擁有權(FlexArray 適用於整個系統)

    在上述範例中、命令為:「磁碟重新指派-s 118673209」

    系統提示您繼續時、您可以回應「Y」。

  5. 確認磁碟(或FlexArray 稱「LUN」)已正確指派:「磁碟show -A」

    確認屬於_replaced_節點的磁碟顯示_replaced_節點的新系統ID。在下列範例中、system-1擁有的磁碟現在顯示新的系統ID 118065481:

    *> disk show -a
    Local System ID: 118065481
    
      DISK     OWNER                 POOL   SERIAL NUMBER  HOME
    -------    -------------         -----  -------------  -------------
    disk_name   system-1  (118065481) Pool0  J8Y0TDZC       system-1  (118065481)
    disk_name   system-1  (118065481) Pool0  J8Y09DXC       system-1  (118065481)
    .
    .
    .
  6. 從健全節點、確認已儲存任何核心傾印:

    1. 變更為進階權限等級:「et -priv榮幸 進階」

      當系統提示您繼續進入進階模式時、您可以回應「Y」。出現進階模式提示(*>)。

    2. 驗證是否已儲存核心傾印:「System Node run -node-node-name_合作夥伴savecore」(系統節點執行節點_local-node-name_合作夥伴savecore)

      如果命令輸出顯示Savecore正在進行中、請先等待Savecore完成、再發出恢復。您可以使用「系統節點執行-node-local-node-name_合作夥伴儲存資源-s命令」來監控儲存資源的進度。</info>。

    3. 返回管理員權限等級:「et -priv. admin」

  7. 如果_replaced_節點處於維護模式(顯示*>提示)、請結束維護模式、然後前往載入程式提示:「halt(停止)」

  8. 開機_replace_節點:「boot_ontap」

  9. 在_replacement節點完全開機之後、執行切換:MetroCluster 「還原」

  10. 驗證MetroCluster 不實的組態:MetroCluster 「不實節點顯示-欄位組態狀態」

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  11. 驗證MetroCluster 下列項目中的功能:Data ONTAP

    1. 檢查兩個叢集上是否有任何健全狀況警示:「System health alerts show」(系統健全狀況警示顯示)

    2. 確認MetroCluster 已設定好此功能、並處於正常模式:MetroCluster 「show」

    3. 執行MetroCluster 功能不全的檢查:MetroCluster 「執行功能不全」

    4. 顯示MetroCluster 「不MetroCluster 實檢查」的結果:「不實檢查顯示」

    5. 執行Config Advisor請前往 NetApp 支援網站上的 Config Advisor 頁面: "support.netapp.com/NOW/download/tools/config_advisor/"

      執行Config Advisor 完功能後、請檢閱工具的輸出結果、並依照輸出中的建議來解決發現的任何問題。

  12. 模擬切換作業:

    1. 從任何節點的提示字元、變更為進階權限層級:「et -priv榮幸advanc進 階」

      當系統提示您繼續進入進階模式時、您需要用「y」回應、並看到進階模式提示(*>)。

    2. 使用-Simulate參數「MetroCluster 還原切換模擬」來執行切換作業

    3. 返回管理員權限等級:「et -priv. admin」

步驟6:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。