Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換 NVRAM - AFF A1K

貢獻者 netapp-jsnyder dougthomp netapp-driley

當非揮發性記憶體故障或需要升級時,請更換 AFF A1K 系統中的 NVRAM 。更換程序包括關閉受損的控制器,更換 NVRAM 模組或 NVRAM DIMM ,重新分配磁碟,以及將故障零件退回 NetApp 。

NVRAM 模組包含 NVRAM12 硬體和現場可更換的 DIMM 。您可以更換故障的NVRAM模組或NVRAM模組內的DIMM。

開始之前
  • 請確定您有可用的替換零件。您必須使用從 NetApp 收到的替換元件來更換故障的元件。

  • 確保儲存系統中的所有其他元件正常運作;如果沒有,請聯絡 "NetApp支援"

步驟1:關閉受損的控制器

使用下列其中一個選項來關閉或接管受損的控制器。

選項1:大多數系統

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息 cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時:

    cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用自動交還:

    1. 從健康控制器的控制台輸入以下命令:

      storage failover modify -node impaired_node_name -auto-giveback false

    2. 進入 `y`當您看到提示「您是否要停用自動回饋?」時

  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從健全的控制器接管或停止受損的控制器:

    storage failover takeover -ofnode impaired_node_name -halt true

    --halt true_ 參數會帶您進入 Loader 提示字元。

選項2:控制器位於MetroCluster 一個不二之處

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

  • 您必須確認已設定 MetroCluster 組態狀態,且節點處於啟用和正常狀態:

    metrocluster node show

步驟
  1. 如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh

    下列AutoSupport 資訊不顯示自動建立案例兩小時:

    cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用自動交還:

    1. 從健康控制器的控制台輸入以下命令:

      storage failover modify -node local -auto-giveback false

    2. 進入 `y`當您看到提示「您是否要停用自動回饋?」時

  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一節。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示(輸入系統密碼)

    從健全的控制器接管或停止受損的控制器:

    storage failover takeover -ofnode impaired_node_name -halt true

    --halt true_ 參數會帶您進入 Loader 提示字元。

步驟 2 :更換 NVRAM 模組或 NVRAM DIMM

使用下列適當選項更換 NVRAM 模組或 NVRAM DIMM 。

選項 1 :更換 NVRAM 模組

若要更換 NVRAM 模組、請將其置於機箱的插槽 4/5 中、然後依照特定步驟順序進行。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 從 PSU 上拔下電源線。

  3. 輕輕拉動托盤兩端的插針、然後向下旋轉托盤、將纜線管理托盤向下旋轉。

  4. 從機箱中卸下受損的 NVRAM 模組:

    1. 按下鎖定凸輪按鈕。

      CAM 按鈕會移出機箱。

    2. 向下轉動凸輪栓鎖、直到卡入定位為止。

    3. 將手指插入 CAM 拉桿開口處、然後將模組拉出機箱、即可將受損的 NVRAM 模組從機箱中移除。

      取下 NVRAM12 模組和 DIMM

    編號 1

    CAM 鎖定按鈕

    編號 2

    DIMM 鎖定彈片

  5. 將 NVRAM 模組放置在穩固的表面上。

  6. 從受損的 NVRAM 模組中逐一移除 DIMM 、然後將其安裝在替換的 NVRAM 模組中。

  7. 將替換的 NVRAM 模組安裝到機箱中:

    1. 將模組與插槽 4/5 中機箱開口的邊緣對齊。

    2. 將模組一路輕輕滑入插槽、然後將 CAM 栓鎖完全向上旋轉、將模組鎖定到位。

  8. 重新連接控制器。

  9. 將纜線管理承載器向上旋轉至關閉位置。

選項 2 :更換 NVRAM DIMM

若要更換 NVRAM 模組中的 NVRAM DIMM 、您必須先移除 NVRAM 模組、然後更換目標 DIMM 。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 從 PSU 上拔下電源線。

  3. 輕輕拉動托盤兩端的插針、然後向下旋轉托盤、將纜線管理托盤向下旋轉。

  4. 從機箱中卸下目標 NVRAM 模組。

    卸下 NVRAM 12 模組和 DIMM

    編號 1

    CAM 鎖定按鈕

    編號 2

    DIMM 鎖定彈片

  5. 將 NVRAM 模組放置在穩固的表面上。

  6. 找到 NVRAM 模組內要更換的 DIMM 。

    註 請參閱 NVRAM 模組側邊的 FRU 對應標籤、以判斷 DIMM 插槽 1 和 2 的位置。
  7. 按下 DIMM 鎖定彈片並將 DIMM 從插槽中取出、以卸下 DIMM 。

  8. 將DIMM對齊插槽、然後將DIMM輕推入插槽、直到鎖定彈片鎖定到位、即可安裝替換DIMM。

  9. 將 NVRAM 模組安裝至機箱:

    1. 將模組輕輕滑入插槽、直到凸輪閂鎖開始與 I/O 凸輪銷接合、然後將凸輪閂鎖完全向上旋轉、將模組鎖定到位。

  10. 重新連接控制器。

  11. 將纜線管理承載器向上旋轉至關閉位置。

步驟 3 :重新啟動控制器

更換 FRU 後,必須將電源線重新插入 PSU 來重新啟動控制器模組。

步驟
  1. 將電源線重新插入 PSU。

    系統將開始重新開機、通常會進入載入程式提示。

  2. 在載入程式提示字元中輸入 _bye 。

  3. 將功能受損的控制器恢復正常運作,只需歸還其儲存設備 storage failover giveback -ofnode _impaired_node_name:。

  4. 如果已停用自動恢復功能、請重新啟用: storage failover modify -node local -auto-giveback true

  5. 如果啟用 AutoSupport 、則還原 / 恢復自動建立個案: system node autosupport invoke -node * -type all -message MAINT=END

步驟4:重新指派磁碟

您必須在開機控制器時確認系統 ID 變更、然後確認變更已實作。

警告 只有在更換 NVRAM 模組時才需要重新指派磁碟、而且不適用於 NVRAM DIMM 更換。
步驟
  1. 如果控制器處於維護模式(顯示 *> 提示)、請結束維護模式、並前往載入程式提示: _halt _

  2. 在控制器的載入器提示字元中、啟動控制器、並在系統 ID 不相符而提示覆寫系統 ID 時輸入 y

  3. 等待恢復 …​ 此訊息會顯示在控制器主控台上、並顯示更換模組、然後從健全的控制器確認已自動指派新的合作夥伴系統 ID : storage 容錯移轉 show

    在命令輸出中、您應該會看到一則訊息、指出受損控制器上的系統ID已變更、顯示正確的舊ID和新ID。在下列範例中、node2已完成更換、新的系統ID為151759706。

    node1:> storage failover show
                                        Takeover
    Node              Partner           Possible     State Description
    ------------      ------------      --------     -------------------------------------
    node1             node2             false        System ID changed on partner (Old:
                                                      151759755, New: 151759706), In takeover
    node2             node1             -            Waiting for giveback (HA mailboxes)
  4. 退回控制器:

    1. 從健全的控制器中、歸還更換過的控制器儲存設備: storage 容錯移轉恢復恢復 -ofnode_node_name

      控制器會恢復其儲存設備並完成開機。

      如果系統因為系統 ID 不相符而提示您置換系統 ID 、您應該輸入 y

      註 如果被否決、您可以考慮覆寫否決。

    如需詳細資訊、請參閱 "手動恢復命令" 取代否決的主題。

    1. 完成恢復後、確認 HA 配對是否正常、而且可以接管: storage 容錯移轉 show

      「儲存容錯移轉show」命令的輸出不應包含在合作夥伴訊息中變更的系統ID。

  5. 驗證是否已正確分配磁碟:「torage disk show -所有權」

    屬於控制器的磁碟應顯示新的系統 ID 。在下列範例中、node1擁有的磁碟現在顯示新的系統ID:151759706:

    node1:> storage disk show -ownership
    
    Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
    ----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
    1.0.0  aggr0_1  node1 node1  -        151759706  151759706  -       151759706 Pool0
    1.0.1  aggr0_1  node1 node1           151759706  151759706  -       151759706 Pool0
    .
    .
    .
  6. 如果系統為 MetroCluster 組態、請監控控制器的狀態: MetroCluster 節點 show_

    更換後、需要幾分鐘時間才能恢復正常狀態、此時每個控制器都會顯示已設定的狀態、並啟用DR鏡射和正常模式。MetroCluster命令輸出會 metrocluster node show -fields node-systemid 顯示受損系統 ID 、直到 MetroCluster 組態恢復正常狀態為止。

  7. 如果控制器是MetroCluster 以支援功能為基礎的組態、請MetroCluster 視所用的情況而定、確認如果原始擁有者是災難站台上的控制器、DR主ID欄位會顯示磁碟的原始擁有者。

    如果下列兩項條件均為真、則必須執行此動作:

  8. 如果您的系統是 MetroCluster 組態、請確認每個控制器都已設定: MetroCluster 節點顯示 - 欄位組態狀態 _

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  9. 驗證每個控制器是否存在預期的磁碟區:「vol. show -node-name」

  10. 將功能受損的控制器恢復正常運作,只需歸還其儲存設備 storage failover giveback -ofnode impaired_node_name:。

  11. 如果已停用自動恢復功能、請重新啟用: storage failover modify -node local -auto-giveback true

  12. 如果啟用 AutoSupport 、則還原 / 恢復自動建立個案: system node autosupport invoke -node * -type all -message MAINT=END

步驟5:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。