Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換DIMM AFF - 32

貢獻者

當儲存系統遇到錯誤時、您必須更換控制器中的 DIMM 、例如根據健全狀況監視器警示或不可修正的 ECC 錯誤(可修正的錯誤修正碼)過多、通常是由於單一 DIMM 故障而導致、導致儲存系統無法開機 ONTAP 。

系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

您必須使用從供應商處收到的替換FRU元件來更換故障元件。

步驟1:關閉控制器

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息 cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用 AutoSupport 、請叫用 AutoSupport 訊息來隱藏自動建立個案: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用健康控制器主控台的自動恢復: storage failover modify -node local -auto-giveback false

    註 當您看到_是否要停用自動恢復?_時、請輸入「y」。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

步驟2:移除控制器模組

若要存取控制器模組內部的元件、您必須從機箱中移除控制器模組。

  1. 如果您尚未接地、請正確接地。

  2. 從電源拔下控制器模組的電源供應器。

  3. 解開將纜線綁定至纜線管理裝置的掛勾和迴圈帶、然後從控制器模組拔下系統纜線和SFP(如有需要)、並追蹤纜線的連接位置。

    卸下或安裝纜線管理臂

    將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。

  4. 從控制器模組的左側和右側移除纜線管理裝置、並將其放在一邊。

  5. 從機箱中取出控制器模組:

卸下控制器
  1. 將您的指夾插入控制器模組兩側的鎖定機制。

  2. 按下鎖定機制頂端的橘色彈片、直到它清除機箱上的鎖定銷為止。

    鎖定機制掛勾應幾乎垂直、且應遠離機箱插銷。

  3. 將控制器模組往您的方向輕拉幾英吋、以便抓住控制器模組的兩側。

  4. 用兩隻手將控制器模組從機箱中輕拉出、然後放在平穩的表面上。

步驟3:更換系統DIMM

更換系統DIMM時、需要透過相關的錯誤訊息來識別目標DIMM、使用通風管上的FRU對應來找出目標DIMM、然後更換DIMM。

  1. 將通風管旋轉至開啟位置。

  2. 找到控制器模組上的DIMM。

    DIMM 對應

    編號 1

    通風管

    編號 2

    • 系統DIMM插槽:2、4、7、9、13、15、 18、20

    • NVDIMM插槽:11.

      註 NVDIMM的外觀與系統DIMM大不相同。
  3. 請注意插槽中的DIMM方向、以便您以適當的方向插入替換的DIMM。

  4. 將DIMM從插槽中取出、方法是緩慢地將DIMM兩側的兩個DIMM彈出彈片分開、然後將DIMM從插槽中滑出。

    註 小心拿住DIMM的邊緣、避免對DIMM電路板上的元件施加壓力。
  5. 從防靜電包裝袋中取出備用DIMM、拿住DIMM的邊角、然後將其對準插槽。

    DIMM插針之間的槽口應與插槽中的卡舌對齊。

  6. 確定連接器上的DIMM彈出彈片處於開啟位置、然後將DIMM正面插入插槽。

    DIMM可緊密插入插槽、但應該很容易就能裝入。如果沒有、請重新將DIMM與插槽對齊、然後重新插入。

    註 目視檢查DIMM、確認其對齊並完全插入插槽。
  7. 在DIMM頂端邊緣小心地推入、但穩固地推入、直到彈出彈出彈片卡入DIMM兩端的槽口。

  8. 關閉通風管。

步驟4:安裝控制器模組

更換控制器模組中的元件之後、您必須將控制器模組重新安裝到機箱中。

  1. 如果您尚未這麼做、請關閉控制器模組後端的通風管、然後將護蓋重新安裝到PCIe卡上。

  2. 將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。

    安裝控制器
    註 在指示之前、請勿將控制器模組完全插入機箱。
  3. 僅連接管理連接埠和主控台連接埠、以便存取系統以執行下列各節中的工作。

    註 您將在本程序稍後將其餘纜線連接至控制器模組。
  4. 完成控制器模組的重新安裝:

    1. 確定鎖銷臂鎖定在延伸位置。

    2. 使用栓鎖臂、將控制器模組推入機箱支架、直到停止為止。

    3. 按住鎖定機制頂端的橘色彈片。

    4. 將控制器模組輕推入機箱支架、直到與機箱邊緣齊平為止。

      註 鎖定機制臂滑入機箱。

    控制器模組一旦完全插入機箱、就會開始開機。

    1. 釋放栓鎖、將控制器模組鎖定到位。

    2. 重新接上電源供應器。

    3. 如果您尚未重新安裝纜線管理裝置、請重新安裝。

步驟5:將控制器模組還原為運作狀態

您必須重新設計系統、歸還控制器模組、然後重新啟用自動恢復功能。

  1. 視需要重新安裝系統。

    如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。

  2. 將控制器恢復正常運作、方法是歸還儲存設備:「torage容錯移轉恢復-ofnode_disapped_node_name_」

  3. 如果停用自動還原、請重新啟用:「儲存容錯移轉修改節點本機-自動恢復true」

步驟6:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。