更換NVDIMM AFF - NVME A800
當系統登錄快閃存壽命即將結束、或辨識出的NVDIMM一般狀況不正常時、您必須更換控制器模組中的NVDIMM;否則會造成系統恐慌。
系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。
您必須使用從供應商處收到的替換FRU元件來更換故障元件。
步驟1:關閉受損的控制器
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。
-
如果您使用NetApp儲存加密、則必須依照《NetApp ONTAP 加密電源指南》_的「將SED恢復為未受保護模式」一節中的指示、重設MSID。
-
如果您使用SAN系統、則必須檢查受損控制器SCSI刀鋒的事件訊息(「事件記錄顯示」)。
每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "使用CLI進行系統管理總覽"。
-
如果您使用MetroCluster 的是功能不全的組態、則必須確認MetroCluster 已設定「功能不全」狀態、且節點處於啟用且正常的狀態(「MetroCluster 功能不全」)。
-
如果啟用了此功能、請叫用下列訊息來抑制自動建立案例:「System Node現象叫用節點*-type all -Message MAn=number_of_hs_Downh」AutoSupport AutoSupport AutoSupport
下列AutoSupport 資訊不顯示自動建立案例兩小時的訊息:「cluster1:>系統節點AutoSupport 、叫用節點-輸入ALL -Message MAn=2h」
-
停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」
-
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
移至「移除控制器模組」。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示(輸入系統密碼)
從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」
當受損的控制器顯示正在等待恢復…時、請按Ctrl-C、然後回應「y」。
步驟2:移除控制器模組
更換控制器模組或更換控制器模組內部的元件時、您必須從機箱中移除控制器模組。
-
如果您尚未接地、請正確接地。
-
從來源拔下控制器模組電源供應器。
-
釋放電源線固定器、然後從電源供應器拔下纜線。
-
解開將纜線綁定至纜線管理裝置的掛勾和迴圈帶、然後從控制器模組拔下系統纜線、SFP和QSFP模組(如有需要)、並追蹤纜線的連接位置。
將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。
-
從控制器模組中取出纜線管理裝置、然後將其放在一旁。
-
向下按兩個鎖定栓、然後同時向下轉動兩個鎖條。
控制器模組會稍微移出機箱。
鎖定鎖定
鎖定銷
-
將控制器模組滑出機箱。
將控制器模組滑出機箱時、請確定您支援控制器模組的底部。
-
將控制器模組放在穩固、平坦的表面上、然後打開通風管:
-
將通風管側邊的鎖定彈片往控制器模組中央壓下。
-
將通風管滑向風扇模組、然後將其向上旋轉至完全開啟的位置。
-
通風管鎖定翼片 |
將通風管滑向風扇模組 |
將通風管朝風扇模組轉動 |
步驟3:更換NVDIMM
若要更換NVDIMM、您必須使用通風管頂端的NVDIMM對應標籤、或使用NVDIMM旁的LED來定位NVDIMM、然後依照特定步驟順序加以更換。
|
當您停止系統時、NVDIMM LED會在減少內容時閃爍。完成轉出後、LED會關閉。 |
-
如果您要移除或移動NVDIMM、請解除鎖定擴充卡上的鎖定栓、然後移除適用的擴充卡。
通風管蓋
提升板2和NVDIMM 11
-
請注意NVDIMM在插槽中的方向、以便將NVDIMM以適當的方向插入替換控制器模組。
-
將NVDIMM從插槽中退出、方法是緩慢地將NVDIMM兩側的兩個NVDIMM彈出彈片分開、然後將NVDIMM從插槽中滑出並放在一邊。
小心拿住NVDIMM的邊緣、避免對NVDIMM電路板上的元件施加壓力。 -
從防靜電包裝袋中取出更換的NVDIMM、拿住NVDIMM的邊角、然後將其對準插槽。
NVDIMM插針的槽口應與插槽的卡舌對齊。
-
找到要安裝NVDIMM的插槽。
-
將NVDIMM正面插入插槽。
NVDIMM可緊密裝入插槽、但應能輕鬆放入。如果沒有、請重新將NVDIMM與插槽對齊、然後重新插入。
目視檢查NVDIMM、確認其已平均對齊並完全插入插槽。 -
小心但穩固地推入NVDIMM頂端邊緣、直到彈出彈片卡入NVDIMM末端的槽口。
-
重新安裝從控制器模組中卸下的所有擴充卡。
-
關閉通風管。
步驟4:重新安裝控制器模組並啟動系統
在控制器模組中更換FRU之後、您必須重新安裝控制器模組、然後重新啟動。
-
如果您尚未這麼做、請關閉通風管:
-
將通風管向下旋轉至控制器模組。
-
將通風管滑向提升板、直到鎖定彈片卡入定位。
-
檢查通風管、確定其已正確放置並鎖定到位。
鎖定彈片
滑入柱塞
-
-
將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。
在指示之前、請勿將控制器模組完全插入機箱。 -
視需要重新安裝系統。
如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。
-
將電源線插入電源供應器、重新安裝電源線鎖環、然後將電源供應器連接至電源。
-
完成控制器模組的重新安裝:
-
將控制器模組穩固地推入機箱、直到它與中間板完全接入。
控制器模組完全就位時、鎖定鎖條會上升。
將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。
控制器模組一旦完全插入機箱、就會開始開機。準備好中斷開機程序。
-
向上轉動鎖定栓、將其傾斜、使其從鎖定銷中取出、然後將其放低至鎖定位置。
-
如果您尚未重新安裝纜線管理裝置、請重新安裝。
-
按下「Ctrl-C」來中斷正常開機程序。
-
步驟4:執行診斷
更換系統中的元件之後、您應該對該元件執行診斷測試。
您的系統必須處於載入器提示狀態、才能開始診斷。
診斷程序中的所有命令都是由要更換元件的控制器發出。
-
如果要服務的控制器未出現在載入程式提示下、請重新啟動控制器:「ystem nodem halt -node_name」(系統節點停止節點節點節點名稱)
發出命令之後、您應該等到系統在載入程式提示字元停止。
-
在載入程式提示字元下、存取專為系統層級診斷所設計的特殊驅動程式、以正常運作:「boot_diags'(boot_diags')
-
從顯示的功能表中選取*掃描系統*、即可執行診斷測試。
-
從顯示的功能表中選取*測試記憶體*。
-
從顯示的功能表中選取* NVDIMM Test*。
-
根據上述步驟的結果繼續進行:
-
如果測試失敗、請修正故障、然後重新執行測試。
-
如果測試報告無故障、請從功能表中選取重新開機、以重新啟動系統。
-
步驟5:將故障零件歸還給NetApp
如套件隨附的RMA指示所述、將故障零件退回NetApp。請參閱 "產品退貨安培;更換" 頁面以取得更多資訊。