更換NVRAM模組和/或NVRAM DIMM AFF - REVA900
NVRAM模組由NVRAM11和DIMM組成。您可以更換故障的NVRAM模組或NVRAM模組內的DIMM。若要更換故障的NVRAM模組、您必須將其從機箱中取出、將DIMM移至更換模組、然後將替換的NVRAM模組安裝到機箱中。
若要更換和NVRAM DIMM、您必須從機箱中移除NVRAM模組、更換模組中故障的DIMM、然後重新安裝NVRAM模組。
由於系統ID是從NVRAM模組衍生而來、因此如果更換模組、則屬於系統的磁碟會重新指派至新的系統ID。
-
所有磁碟櫃都必須正常運作。
-
如果您的系統是HA配對、則合作夥伴控制器必須能夠接管與要更換的NVRAM模組相關的控制器。
-
本程序使用下列術語:
-
受損的控制器是您要執行維護的控制器。
-
健全的控制器是受損控制器的HA合作夥伴。
-
-
此程序包括將磁碟自動重新指派給與新NVRAM模組相關聯的控制器模組的步驟。您必須依照程序中的指示重新指派磁碟。在恢復之前完成磁碟重新指派可能會造成問題。
-
您必須使用從供應商處收到的替換FRU元件來更換故障元件。
-
在此程序中、您無法變更任何磁碟或磁碟櫃。
步驟1:關閉受損的控制器
使用下列其中一個選項來關閉或接管受損的控制器。
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。
-
如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息
cluster kernel-service show
。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"。
-
如果啟用 AutoSupport 、請叫用 AutoSupport 訊息來隱藏自動建立個案:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
下列AutoSupport 資訊不顯示自動建立案例兩小時:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
停用健康控制器主控台的自動恢復:
storage failover modify -node local -auto-giveback false
當您看到_是否要停用自動恢復?_時、請輸入「y」。 -
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
前往下一步。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示
從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」
當受損的控制器顯示正在等待恢復…時、請按Ctrl-C、然後回應「y」。
如果您的系統採用雙節點MetroCluster 的功能、請勿使用此程序。 |
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"。
-
如果您使用MetroCluster 的是功能不全的組態、則必須確認MetroCluster 已設定「功能不全」狀態、且節點處於啟用且正常的狀態(「MetroCluster 功能不全」)。
-
如果啟用了此功能、請叫用下列訊息來抑制自動建立案例:「System Node現象叫用節點*-type all -Message MAn=number_of_hs_Downh」AutoSupport AutoSupport AutoSupport
下列AutoSupport 資訊不顯示自動建立案例兩小時的訊息:「cluster1:>系統節點AutoSupport 、叫用節點-輸入ALL -Message MAn=2h」
-
停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」
-
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
前往下一步。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示(輸入系統密碼)
從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」
當受損的控制器顯示正在等待恢復…時、請按Ctrl-C、然後回應「y」。
步驟2:更換NVRAM模組
若要裝回NVRAM模組、請將其置於機箱的插槽6中、然後依照特定的步驟順序進行。
-
如果您尚未接地、請正確接地。
-
從機箱中移除目標NVRAM模組:
-
按下帶有字母和編號的CAM按鈕。
CAM按鈕會從機箱移出。
-
向下轉動CAM栓鎖、直到其處於水平位置。
NVRAM模組會從機箱中鬆脫、然後移出幾英吋。
-
拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。
動畫-更換NVRAM模組
帶有字母和編號的CAM栓鎖
CAM栓鎖完全解除鎖定
-
-
將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。
護蓋鎖定按鈕
DIMM和DIMM彈出卡舌
-
從舊的NVRAM模組中一次移除一個DIMM、然後將其安裝到替換的NVRAM模組中。
-
合上模組的護蓋。
-
將替換的NVRAM模組安裝到機箱:
-
將模組對齊插槽6中機箱開孔的邊緣。
-
將模組輕推入插槽、直到有字母和編號的CAM栓開始與I/O CAM銷接合、然後將CAM栓完全推入、將模組鎖定到位。
-
步驟3:更換NVRAM DIMM
若要更換NVRAM模組中的NVRAM DIMM、您必須移除NVRAM模組、開啟模組、然後更換目標DIMM。
-
如果您尚未接地、請正確接地。
-
從機箱中移除目標NVRAM模組:
-
按下帶有字母和編號的CAM按鈕。
CAM按鈕會從機箱移出。
-
向下轉動CAM栓鎖、直到其處於水平位置。
NVRAM模組會從機箱中鬆脫、然後移出幾英吋。
-
拉動模組面兩側的拉片、將NVRAM模組從機箱中取出。
動畫-更換NVRAM DIMM
帶有字母和編號的CAM栓鎖
CAM栓鎖完全解除鎖定
-
-
將NVRAM模組設定在穩固的表面上、向下按護蓋上的藍色鎖定按鈕、將護蓋從NVRAM模組中取出、然後按住藍色按鈕、將護蓋從NVRAM模組中滑出。
護蓋鎖定按鈕
DIMM和DIMM彈出卡舌
-
找到NVRAM模組內要更換的DIMM、然後按下DIMM鎖定彈片並將DIMM從插槽中提出來將其卸下。
-
將DIMM對齊插槽、然後將DIMM輕推入插槽、直到鎖定彈片鎖定到位、即可安裝替換DIMM。
-
合上模組的護蓋。
-
將NVRAM模組安裝至機箱:
-
將模組對齊插槽6中機箱開孔的邊緣。
-
將模組輕推入插槽、直到有字母和編號的CAM栓開始與I/O CAM銷接合、然後將CAM栓完全推入、將模組鎖定到位。
-
步驟 4 :重新啟動控制器
更換FRU之後、您必須重新啟動控制器模組。
-
若要ONTAP 從載入程式提示字元開機、請輸入「bye」。
步驟5:重新指派磁碟
您必須在開機更換控制器時確認系統ID變更、然後驗證變更是否已實作。
只有在更換 NVRAM 模組時才需要重新指派磁碟、而且不適用於 NVRAM DIMM 更換。 |
-
如果更換的控制器處於維護模式(顯示
*>
提示)、結束維護模式、然後前往載入程式提示:halt
-
在更換控制器的載入器提示中、啟動控制器、如果系統ID不相符、系統提示您覆寫系統ID、請輸入y。
-
等待等待恢復…訊息會顯示在控制器的主控台上、並顯示更換模組、然後從健全的控制器確認已自動指派新的合作夥伴系統ID:
storage failover show
在命令輸出中、您應該會看到一則訊息、指出受損控制器上的系統ID已變更、顯示正確的舊ID和新ID。在下列範例中、node2已完成更換、新的系統ID為151759706。
node1:> storage failover show Takeover Node Partner Possible State Description ------------ ------------ -------- ------------------------------------- node1 node2 false System ID changed on partner (Old: 151759755, New: 151759706), In takeover node2 node1 - Waiting for giveback (HA mailboxes)
-
退回控制器:
-
從健全的控制器中、歸還更換的控制器儲存設備:「torage容錯移轉恢復-ofnode替 用節點名稱」
更換的控制器會恢復儲存設備、並完成開機。
如果系統ID不相符、系統提示您覆寫系統ID、請輸入「y」。
如果被否決、您可以考慮覆寫否決。
如需詳細資訊、請參閱 "手動恢復命令" 取代否決的主題。
-
完成恢復後、請確認HA配對正常、而且可以接管:「顯示容錯移轉」
「儲存容錯移轉show」命令的輸出不應包含在合作夥伴訊息中變更的系統ID。
-
-
驗證是否已正確分配磁碟:「torage disk show -所有權」
屬於替換控制器的磁碟應顯示新的系統ID。在下列範例中、node1擁有的磁碟現在顯示新的系統ID:151759706:
node1:> storage disk show -ownership Disk Aggregate Home Owner DR Home Home ID Owner ID DR Home ID Reserver Pool ----- ------ ----- ------ -------- ------- ------- ------- --------- --- 1.0.0 aggr0_1 node1 node1 - 151759706 151759706 - 151759706 Pool0 1.0.1 aggr0_1 node1 node1 151759706 151759706 - 151759706 Pool0 . . .
-
如果系統採用MetroCluster 的是一套不全功能的組態、請監控控制器的狀態:MetroCluster 「不只是顯示節點」
更換後、需要幾分鐘時間才能恢復正常狀態、此時每個控制器都會顯示已設定的狀態、並啟用DR鏡射和正常模式。MetroCluster「停止節點show -Fields node-SystemID」命令輸出會顯示舊的系統ID、直到該組態恢復正常狀態為止。MetroCluster MetroCluster
-
如果控制器是MetroCluster 以支援功能為基礎的組態、請MetroCluster 視所用的情況而定、確認如果原始擁有者是災難站台上的控制器、DR主ID欄位會顯示磁碟的原始擁有者。
如果下列兩項條件均為真、則必須執行此動作:
-
此功能組態處於切換狀態。MetroCluster
-
替換控制器是災難站台上磁碟的目前擁有者。
-
-
如果您的系統使用MetroCluster 的是E驗 證組態、請確認每個控制器都已設定:「MetroCluster E節點 顯示-欄位組態狀態」
node1_siteA::> metrocluster node show -fields configuration-state dr-group-id cluster node configuration-state ----------- ---------------------- -------------- ------------------- 1 node1_siteA node1mcc-001 configured 1 node1_siteA node1mcc-002 configured 1 node1_siteB node1mcc-003 configured 1 node1_siteB node1mcc-004 configured 4 entries were displayed.
-
驗證每個控制器是否存在預期的磁碟區:「vol. show -node-name」
-
如果已啟用儲存加密、則必須還原功能。
-
如果您在重新開機時停用自動接管、請從健全的控制器啟用:「torage容錯移轉修改節點置換節點名稱-onreboottrue」
步驟6:將故障零件歸還給NetApp
如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。