Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換NVRAM模組和/或NVRAM DIMM AFF - REVA900

貢獻者

NVRAM模組由NVRAM11和DIMM組成。您可以更換故障的NVRAM模組或NVRAM模組內的DIMM。若要更換故障的NVRAM模組、您必須將其從機箱中取出、將DIMM移至更換模組、然後將替換的NVRAM模組安裝到機箱中。

若要更換和NVRAM DIMM、您必須從機箱中移除NVRAM模組、更換模組中故障的DIMM、然後重新安裝NVRAM模組。

關於這項工作

由於系統ID是從NVRAM模組衍生而來、因此如果更換模組、則屬於系統的磁碟會重新指派至新的系統ID。

開始之前
  • 所有磁碟櫃都必須正常運作。

  • 如果您的系統是HA配對、則合作夥伴控制器必須能夠接管與要更換的NVRAM模組相關的控制器。

  • 本程序使用下列術語:

    • 受損的控制器是您要執行維護的控制器。

    • 健全的控制器是受損控制器的HA合作夥伴。

  • 此程序包括將磁碟自動重新指派給與新NVRAM模組相關聯的控制器模組的步驟。您必須依照程序中的指示重新指派磁碟。在恢復之前完成磁碟重新指派可能會造成問題。

  • 您必須使用從供應商處收到的替換FRU元件來更換故障元件。

  • 在此程序中、您無法變更任何磁碟或磁碟櫃。

步驟1:關閉受損的控制器

使用下列其中一個選項來關閉或接管受損的控制器。

選項1:大多數系統

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有SAN系統、則必須檢查事件訊息 cluster kernel-service show(用於控制器SCSI刀鋒伺服器)。。 cluster kernel-service show 命令會顯示節點名稱、該節點的仲裁狀態、該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用了此功能、請叫用下列訊息來抑制自動建立案例:「System Node現象叫用節點*-type all -Message MAn=number_of_hs_Downh」AutoSupport AutoSupport AutoSupport

    下列AutoSupport 資訊不顯示自動建立案例兩小時: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」

    註 當您看到_是否要停用自動恢復?_時、請輸入「y」。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

選項2:控制器位於MetroCluster 一個不二之處
註 如果您的系統採用雙節點MetroCluster 的功能、請勿使用此程序。

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

  • 如果您使用MetroCluster 的是功能不全的組態、則必須確認MetroCluster 已設定「功能不全」狀態、且節點處於啟用且正常的狀態(「MetroCluster 功能不全」)。

步驟
  1. 如果啟用了此功能、請叫用下列訊息來抑制自動建立案例:「System Node現象叫用節點*-type all -Message MAn=number_of_hs_Downh」AutoSupport AutoSupport AutoSupport

    下列AutoSupport 資訊不顯示自動建立案例兩小時的訊息:「cluster1:>系統節點AutoSupport 、叫用節點-輸入ALL -Message MAn=2h」

  2. 停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」

  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示(輸入系統密碼)

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

步驟2:更換NVRAM模組

若要裝回NVRAM模組、請將其置於機箱的插槽6中、然後依照特定的步驟順序進行。

  1. 如果您尚未接地、請正確接地。

  2. 從機箱中移除目標NVRAM模組:

    1. 按下帶有字母和編號的CAM按鈕。

      CAM按鈕會從機箱移出。

    2. 向下轉動CAM栓鎖、直到其處於水平位置。

      NVRAM模組會從機箱中鬆脫、然後移出幾英吋。

    3. 拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。

      動畫-更換NVRAM模組
      DRW A900 Move移除NVRAM模組

    編號 1

    帶有字母和編號的CAM栓鎖

    編號 2

    CAM栓鎖完全解除鎖定

  3. 將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。

    DRW A900移除NVRAM模組內容

    編號 1

    護蓋鎖定按鈕

    編號 2

    DIMM和DIMM彈出卡舌

  4. 從舊的NVRAM模組中一次移除一個DIMM、然後將其安裝到替換的NVRAM模組中。

  5. 合上模組的護蓋。

  6. 將替換的NVRAM模組安裝到機箱:

    1. 將模組對齊插槽6中機箱開孔的邊緣。

    2. 將模組輕推入插槽、直到有字母和編號的CAM栓開始與I/O CAM銷接合、然後將CAM栓完全推入、將模組鎖定到位。

步驟3:更換NVRAM DIMM

若要更換NVRAM模組中的NVRAM DIMM、您必須移除NVRAM模組、開啟模組、然後更換目標DIMM。

  1. 如果您尚未接地、請正確接地。

  2. 從機箱中移除目標NVRAM模組:

    1. 按下帶有字母和編號的CAM按鈕。

      CAM按鈕會從機箱移出。

    2. 向下轉動CAM栓鎖、直到其處於水平位置。

      NVRAM模組會從機箱中鬆脫、然後移出幾英吋。

    3. 拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。

      動畫-更換NVRAM DIMM
      DRW A900 Move移除NVRAM模組

    編號 1

    帶有字母和編號的CAM栓鎖

    編號 2

    CAM栓鎖完全解除鎖定

  3. 將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。

    DRW A900移除NVRAM模組內容

    編號 1

    護蓋鎖定按鈕

    編號 2

    DIMM和DIMM彈出卡舌

  4. 找到NVRAM模組內要更換的DIMM、然後按下DIMM鎖定彈片並將DIMM從插槽中提出來將其卸下。

  5. 將DIMM對齊插槽、然後將DIMM輕推入插槽、直到鎖定彈片鎖定到位、即可安裝替換DIMM。

  6. 合上模組的護蓋。

  7. 將NVRAM模組安裝至機箱:

    1. 將模組對齊插槽6中機箱開孔的邊緣。

    2. 將模組輕推入插槽、直到有字母和編號的CAM栓開始與I/O CAM銷接合、然後將CAM栓完全推入、將模組鎖定到位。

步驟 4 :重新啟動控制器

更換FRU之後、您必須重新啟動控制器模組。

  1. 若要ONTAP 從載入程式提示字元開機、請輸入「bye」。

步驟5:重新指派磁碟

您必須在開機更換控制器時確認系統ID變更、然後驗證變更是否已實作。

警告 只有在更換 NVRAM 模組時才需要重新指派磁碟、而且不適用於 NVRAM DIMM 更換。
步驟
  1. 如果更換的控制器處於維護模式(顯示 *> 提示)、結束維護模式、然後前往載入程式提示: halt

  2. 在更換控制器的載入器提示中、啟動控制器、如果系統ID不相符、系統提示您覆寫系統ID、請輸入y。

  3. 等待等待恢復…​訊息會顯示在控制器的主控台上、並顯示更換模組、然後從健全的控制器確認已自動指派新的合作夥伴系統ID: storage failover show

    在命令輸出中、您應該會看到一則訊息、指出受損控制器上的系統ID已變更、顯示正確的舊ID和新ID。在下列範例中、node2已完成更換、新的系統ID為151759706。

    node1:> storage failover show
                                        Takeover
    Node              Partner           Possible     State Description
    ------------      ------------      --------     -------------------------------------
    node1             node2             false        System ID changed on partner (Old:
                                                      151759755, New: 151759706), In takeover
    node2             node1             -            Waiting for giveback (HA mailboxes)
  4. 退回控制器:

    1. 從健全的控制器中、歸還更換的控制器儲存設備:「torage容錯移轉恢復-ofnode替 用節點名稱」

      更換的控制器會恢復儲存設備、並完成開機。

      如果系統ID不相符、系統提示您覆寫系統ID、請輸入「y」。

      註 如果被否決、您可以考慮覆寫否決。

    如需詳細資訊、請參閱 "手動恢復命令" 取代否決的主題。

    1. 完成恢復後、請確認HA配對正常、而且可以接管:「顯示容錯移轉」

      「儲存容錯移轉show」命令的輸出不應包含在合作夥伴訊息中變更的系統ID。

  5. 驗證是否已正確分配磁碟:「torage disk show -所有權」

    屬於替換控制器的磁碟應顯示新的系統ID。在下列範例中、node1擁有的磁碟現在顯示新的系統ID:151759706:

    node1:> storage disk show -ownership
    
    Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
    ----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
    1.0.0  aggr0_1  node1 node1  -        151759706  151759706  -       151759706 Pool0
    1.0.1  aggr0_1  node1 node1           151759706  151759706  -       151759706 Pool0
    .
    .
    .
  6. 如果系統採用MetroCluster 的是一套不全功能的組態、請監控控制器的狀態:MetroCluster 「不只是顯示節點」

    更換後、需要幾分鐘時間才能恢復正常狀態、此時每個控制器都會顯示已設定的狀態、並啟用DR鏡射和正常模式。MetroCluster「停止節點show -Fields node-SystemID」命令輸出會顯示舊的系統ID、直到該組態恢復正常狀態為止。MetroCluster MetroCluster

  7. 如果控制器是MetroCluster 以支援功能為基礎的組態、請MetroCluster 視所用的情況而定、確認如果原始擁有者是災難站台上的控制器、DR主ID欄位會顯示磁碟的原始擁有者。

    如果下列兩項條件均為真、則必須執行此動作:

  8. 如果您的系統使用MetroCluster 的是E驗 證組態、請確認每個控制器都已設定:「MetroCluster E節點 顯示-欄位組態狀態」

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  9. 驗證每個控制器是否存在預期的磁碟區:「vol. show -node-name」

  10. 如果已啟用儲存加密、則必須還原功能。

  11. 如果您在重新開機時停用自動接管、請從健全的控制器啟用:「torage容錯移轉修改節點置換節點名稱-onreboottrue」

步驟6:還原儲存設備和Volume Encryption功能

如果您已啟用儲存加密、請使用適當的程序。

重要 此步驟不適用於 NVRAM DIMM 更換。
選項1:使用Onboard Key Manager
步驟
  1. 將節點開機至開機功能表。

  2. 選取選項10、 Set onboard key management recovery secrets

  3. 輸入您從客戶處取得的機載金鑰管理程式密碼。

  4. 出現提示時、請貼上輸出的備份金鑰資料 security key-manager backup showsecurity key-manager onboard show-backup 命令。

    備份資料範例:

    ------------ 開始備份

    TmV0QbewlesbGbG9iAAAAAAAAAAAAAAAAAcAAAAAAAAAAAAAADuD+byAAAAACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAUD+AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA1AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA1AAAAAAAAAAAAAAAAAAAAA1AAAAAAACAAAAAAAAAAAAAAAAAAAAAAAAAAAACAAAAAAAAAAAAAAAACAAAAAAAAAAAAAAAAAAAAAAAAAA1AAAAAAAAAAAAAAAAAAAAMAZAMAZAAAAAA。。。H4nPQM0nrDRYRa9SCv8AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

    ------------- 結束備份

    註 控制器會返回開機功能表。
  5. 選取選項1、 Normal Boot

  6. 只讓CFO使用「儲存容錯移轉回傳回-fromNode local -only CFO Aggregate true」命令來集合體。

    • 如果命令因磁碟故障而失敗、請實際移除故障磁碟、但將磁碟留在插槽中、直到收到更換磁碟為止。

    • 如果命令因為開啟的CIFS工作階段而失敗、請洽詢客戶如何結束CIFS工作階段。

      註 終止CIFS可能導致資料遺失。
    • 如果該命令因為合作夥伴「未就緒」而失敗、請等待5分鐘、讓NVRAM同步。

    • 如果由於NDMP、SnapMirror或SnapVault 流程而導致命令失敗、請停用此程序。如需詳細資訊、請參閱適當的內容。

  7. 一旦恢復完成、請使用「儲存容錯移轉顯示」和「儲存容錯移轉顯示」命令來檢查容錯移轉和恢復狀態。

    只會顯示CFO集合體(根Aggregate和CFO型式資料集合體)。

  8. 執行安全金鑰管理程式內建同步:

    1. 執行「安全金鑰管理程式內建同步」命令、然後在出現提示時輸入密碼。

    2. 輸入「安全金鑰管理程式金鑰查詢」命令、即可查看內建金鑰管理程式中儲存的所有金鑰詳細檢視、並確認所有驗證金鑰的「RESured」欄位=「yes / true」。

      註 如果「RESTORED」欄位=「yes / true」以外的任何項目、請聯絡客戶支援部門。
    3. 等待10分鐘、讓金鑰在整個叢集之間同步。

  9. 將主控台纜線移至合作夥伴控制器。

  10. 使用「儲存容錯移轉還原-fromNode local」命令來歸還目標控制器。

  11. 使用「儲存容錯移轉show」命令、在報告完成三分鐘後、檢查恢復狀態。

    如果20分鐘後仍未完成還原、請聯絡客戶支援部門。

  12. 在clusterShell提示字元中、輸入net int show -is主目錄假命令、列出不在主控制器和連接埠上的邏輯介面。

    如果有任何介面列為「假」、請使用net int f還原 命令將這些介面還原回其主連接埠。

  13. 將主控台纜線移至目標控制器、然後執行「vrsion -v」命令來檢查ONTAP 版本。

  14. 如果您使用「儲存容錯移轉修改節點本機-自動恢復true」命令停用自動恢復。

  15. 如果先前已設定MSID、並在本程序開始時擷取、請重設MSID:

    1. 使用將資料驗證金鑰指派給FIPS磁碟機或SED storage encryption disk modify -disk disk_ID -data-key-id key_ID 命令。

      註 您可以使用 security key-manager key query -key-type NSE-AK 檢視金鑰ID的命令。
    2. 確認已使用指派驗證金鑰 storage encryption disk show 命令。

選項2:使用外部管理程式
  1. 將控制器開機至開機功能表。

  2. 選取選項11、 Configure node for external key management

  3. 在提示下輸入管理憑證資訊。

    註 管理憑證資訊完成後、控制器會返回開機功能表。
  4. 選取選項1、 Normal Boot

  5. 將主控台纜線移至合作夥伴控制器、然後使用儲存容錯移轉恢復-從節點本機-僅限CFO - Aggregate true local命令、將目標控制器儲存設備歸還。

    • 如果命令因磁碟故障而失敗、請實際移除故障磁碟、但將磁碟留在插槽中、直到收到更換磁碟為止。

    • 如果命令因為開啟的CIFS工作階段而失敗、請洽詢客戶如何結束CIFS工作階段。

      註 終止CIFS可能導致資料遺失。
    • 如果該命令因為合作夥伴「未就緒」而失敗、請等待5分鐘、讓NVMEM同步。

    • 如果由於NDMP、SnapMirror或SnapVault 流程而導致命令失敗、請停用此程序。如需詳細資訊、請參閱適當的內容。

  6. 等待3分鐘、然後使用儲存容錯移轉show命令檢查容錯移轉狀態。

  7. 在clusterShell提示符下、輸入「net int show -is-homefal」命令、列出不在主控制器和連接埠上的邏輯介面。

    如果有任何介面被列為「假」、請使用「net int f還原」命令將這些介面還原回其主連接埠。

  8. 將主控台纜線移至目標控制器、然後執行「vrsion -v」命令來檢查ONTAP 版本。

  9. 如果您使用「儲存容錯移轉修改節點本機-自動恢復true」命令停用自動恢復。

  10. 在clusterShell提示符下使用「shorage加密磁碟show」查看輸出。

  11. 使用「安全金鑰管理程式金鑰查詢」命令來顯示儲存在金鑰管理伺服器上的加密和驗證金鑰。

    • 如果「RESTORED」欄=「yes / true」、您就能完成更換程序。

    • 如果「金鑰管理程式類型」=「外部」、「還原」欄=「是/真」以外的任何項目、請使用安全金鑰管理程式外部還原命令來還原驗證金鑰的金鑰ID。

      註 如果命令失敗、請聯絡客戶支援部門。
    • 如果「金鑰管理程式類型」=「OnBoard」、「RESTORED」欄=「yes / true」以外的任何項目、請使用安全金鑰管理程式內建同步命令來重新同步金鑰管理程式類型。

      使用「安全金鑰管理程式金鑰查詢」命令來驗證所有驗證金鑰的「RESured」欄位=「yes / true」。

  12. 將主控台纜線連接至合作夥伴控制器。

  13. 使用儲存容錯移轉恢復-fromNode本機命令來歸還控制器。

  14. 如果您使用「儲存容錯移轉修改節點本機-自動恢復true」命令停用自動恢復。

  15. 如果先前已設定MSID、並在本程序開始時擷取、請重設MSID:

    1. 使用將資料驗證金鑰指派給FIPS磁碟機或SED storage encryption disk modify -disk disk_ID -data-key-id key_ID 命令。

      註 您可以使用 security key-manager key query -key-type NSE-AK 檢視金鑰ID的命令。
    2. 確認已使用指派驗證金鑰 storage encryption disk show 命令。

步驟7:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。請參閱 "產品退貨安培;更換" 頁面以取得更多資訊。