更換 DIMM - AFF A20 , AFF A30 和 AFF A50
當儲存系統遇到錯誤時、您必須更換控制器中的 DIMM 、例如根據健全狀況監視器警示或不可修正的 ECC 錯誤(可修正的錯誤修正碼)過多、通常是由於單一 DIMM 故障而導致、導致儲存系統無法開機 ONTAP 。
-
儲存系統中的所有其他元件都必須正常運作;否則,您必須先聯絡 "NetApp支援",才能繼續執行此程序。
-
您必須使用您從供應商處收到的替換 FRU 元件來更換故障的 FRU 元件。
如有需要,您可以開啟儲存系統位置(藍色) LED ,以協助實際定位受影響的儲存系統。使用 SSH 登入 BMC ,然後輸入 `system location-led on`命令。
儲存系統有三個位置 LED :一個在操作員顯示面板上,一個在每個控制器上。位置LED會持續亮起30分鐘。
您可以輸入命令將其關閉 system location-led off
。如果您不確定 LED 是否亮起或熄滅,可以輸入命令來檢查其狀態 system location-led show
。
步驟1:關閉受損的控制器
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。
-
如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息
cluster kernel-service show
。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"。
-
如果啟用 AutoSupport 、請叫用 AutoSupport 訊息來隱藏自動建立個案:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
下列AutoSupport 資訊不顯示自動建立案例兩小時:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
停用健康控制器主控台的自動恢復:
storage failover modify -node local -auto-giveback false
當您看到_是否要停用自動恢復?_時、請輸入「y」。 -
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
前往下一步。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示
從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」
當受損的控制器顯示正在等待恢復…時、請按Ctrl-C、然後回應「y」。
步驟2:移除控制器
更換控制器或更換控制器內部的元件時,您必須從機箱中移除控制器。
儲存系統中的所有其他元件都必須正常運作;否則,您必須先聯絡 "NetApp支援",才能繼續執行此程序。
-
在受損的控制器上,請確定 NV LED 已關閉。
當 NV LED 熄滅時,即表示已完成減損,可安全移除受損的控制器。
如果 NV LED 閃爍(綠色),則表示正在減少目標。您必須等待 NV LED 關閉。不過,如果持續閃爍超過五分鐘,請先聯絡 "NetApp支援",再繼續執行此程序。 NV LED 位於控制器上的 NV 圖示旁。
控制器上的 NV 圖示和 LED |
-
如果您尚未接地、請正確接地。
-
斷開受損控制器的電源:
電源供應器( PSU )沒有電源開關。 如果您要中斷連線 .. 然後… AC PSU
-
打開電源線固定器。
-
從 PSU 拔下電源線,並將其放在一邊。
DC PSU
-
旋下 D-sub DC 電源線接頭上的兩個拇指螺絲。
-
從 PSU 拔下電源線,並將其放在一邊。
-
-
從受損的控制器拔下所有纜線。
追蹤纜線的連接位置。
-
移除受損的控制器:
下圖顯示移除控制器時控制器控點的操作(從控制器左側):
在控制器的兩端,將垂直鎖定彈片向外推,以鬆開把手。
-
朝自己的方向拉動把手,將控制器從中板上取下。
拉動時,把手會從控制器伸出,然後感覺到阻力,請繼續拉動。
-
將控制器滑出機箱,同時支撐控制器的底部,並將其放置在平坦穩定的表面上。
如有需要,請將把手垂直轉動(在彈片旁),將其移出。
-
-
逆時針轉動指旋螺絲以鬆開控制器護蓋,然後打開護蓋。
步驟3:更換DIMM
若要更換 DIMM ,請在控制器內找到故障 DIMM ,然後依照特定步驟順序進行。
-
如果您尚未接地、請正確接地。
-
找到控制器上的 DIMM ,並找出故障 DIMM 。
請參閱 "NetApp Hardware Universe"控制器上蓋的或 FRU 對應圖,以瞭解確切的 DIMM 位置。 -
移除故障 DIMM :
DIMM 插槽編號和位置。
視您的儲存系統機型而定,您將擁有兩個或四個 DIMM 。 -
請注意插槽中 DIMM 的方向,以便您可以使用相同的方向插入替換 DIMM 。
-
緩慢地推開 DIMM 插槽兩端的兩個 DIMM 彈出卡舌,以退出故障 DIMM 。
小心拿住DIMM的邊角或邊緣、避免對DIMM電路板元件造成壓力。 將 DIMM 從插槽中取出。
推出式彈片仍保持在開啟位置。
-
-
安裝更換的 DIMM :
-
從防靜電包裝袋中取出備用DIMM。
-
確定連接器上的 DIMM 彈出彈片處於開啟位置。
-
拿住 DIMM 的邊角,然後將 DIMM 平直插入插槽。
DIMM底部插針之間的槽口應與插槽中的卡舌對齊。
正確插入時、DIMM應可輕鬆插入、但應緊密插入插槽中。如果沒有、請重新插入DIMM。
-
目視檢查DIMM、確認其對齊並完全插入插槽。
-
小心地向下推DIMM頂端邊緣、但穩固地推入、直到彈出彈片卡入DIMM兩端的槽口為止。
-
步驟4:重新安裝控制器
將控制器重新安裝到機箱中,然後重新啟動。
下圖顯示重新安裝控制器時控制器控點(從控制器左側)的操作,並可作為控制器重新安裝步驟的其餘部分參考。
如果您在維修控制器時將控制器把手直立(在彈片旁邊)移出,請將其向下旋轉至水平位置。 |
|
按下把手,將控制器重新插入機箱的一半,然後在指示下推動,直到控制器完全就位。 |
|
將把手旋轉至直立位置,並使用鎖定彈片鎖定定位。 |
-
合上控制器護蓋,然後順時針旋轉指旋螺絲,直到旋緊為止。
-
將控制器插入機箱的一半。
將控制器背面與機箱中的開口對齊,然後使用把手輕推控制器。
在接到指示之前,請勿將控制器完全插入機箱。 -
將主控台纜線連接到控制器的主控台連接埠和筆記型電腦,以便在控制器重新開機時,筆記型電腦接收主控台訊息。
-
將控制器完全插入機箱:
-
用力推把手,直到控制器與中板接觸並完全就位為止。
將控制器滑入機箱時請勿過度施力,否則可能會損壞連接器。 -
向上旋轉控制器把手,並使用彈片鎖定定位。
一旦控制器完全安裝在機箱中,就會開始開機。
-
-
按 CTRL-C 中止自動開機,讓控制器進入 Loader 提示。
-
在控制器上設定時間和日期:
確保您處於控制器的 Loader 提示符下。
-
在控制器上顯示日期和時間:
show date
時間和日期預設為 GMT 。您可以選擇以當地時間和 24 小時模式顯示。 -
設定目前 GMT 時間:
set time hh:mm:ss
您可以從健全的節點取得目前的 GMT :
date -u
-
設定 GMT 的目前日期:
set date mm/dd/yyyy
您可以從健全節點取得目前的 GMT :
date -u
-
-
視需要重新定位控制器。
-
將電源線重新連接至電源供應器( PSU )。
電源恢復至PSU後、狀態LED應為綠色。
如果您正在重新連線 … 然後… AC PSU
-
將電源線插入 PSU 。
-
使用電源線固定器固定電源線。
DC PSU
-
將 D-sub DC 電源線接頭插入 PSU 。
-
鎖緊兩顆指旋螺絲,將 D-sub DC 電源線接頭固定至 PSU 。
-
步驟5:將故障零件歸還給NetApp
如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。