Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換 DIMM - AFX 1K

貢獻者 netapp-driley netapp-jsnyder

如果偵測到過多可修正或無法修正的記憶體錯誤,請更換 AFX 1K 儲存系統中的 DIMM。此類錯誤可能會阻止儲存系統啟動ONTAP。更換過程包括關閉受損的控制器、將其移除、更換 DIMM、重新安裝控制器,然後將故障部件傳回NetApp。

開始之前
  • 確保您擁有從NetApp收到的替換元件。

  • 請務必使用您從 NetApp 收到的替換元件來更換故障的元件。

步驟1:關閉受損的控制器

關閉或接管受損的控制器。

要關閉受損控制器,您必須確定控制器的狀態,並在必要時執行控制器的儲存故障轉移接管,以便健康的控制器繼續從受損控制器儲存提供資料。

關於這項工作
  • 如果您的叢集具有四個以上的節點,則它必須達到法定人數。要查看有關節點的叢集信息,請使用 `cluster show`命令。有關 `cluster show`命令,請參閱"查看ONTAP叢集中的節點級詳細信息"

  • 如果叢集不處於法定人數,或任何控制器(受損控制器除外)的健康狀況或資格顯示為錯誤,則必須在關閉受損控制器之前修正該問題。看"將節點與叢集同步"

步驟
  1. 如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時:

    cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 從受損控制器的控制台停用自動交還:

    storage failover modify -node impaired-node -auto-giveback-of false

    註 當您看到「您想要停用自動回饋嗎?」時,請輸入 y
    1. 如果您執行的是ONTAP版本 9.17.1,且受損控制器無法啟動或已被接管,則必須在啟動受損控制器之前從正常控制器上斷開 HA 互連鏈路。這可以防止受損控制器執行自動交還。

      system ha interconnect link off -node healthy-node -link 0

      system ha interconnect link off -node healthy-node -link 1

    註 如果您執行的不是ONTAP版本 9.17.1,請跳過上述步驟並前往步驟 3。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    系統提示或密碼提示

    從健康控制器接管或停止受損控制器: storage failover takeover -ofnode impaired_node_name -halt true

    -halt true 參數將受損節點帶入 LOADER 提示符。

步驟2:移除控制器模組

更換控制器模組或更換控制器模組內的元件時、您必須從機箱中移除控制器模組。

  1. 檢查系統插槽 4/5 中的 NVRAM 狀態 LED 。控制器模組前面板上也有 NVRAM LED 。尋找 NV 圖示:

    NVRAM 注意與狀態 LED 位置圖

    編號 1

    NVRAM 狀態 LED

    編號 2

    NVRAM 注意 LED

    • 如果 NV LED 熄滅、請前往下一步。

    • 如果 NV LED 閃爍、請等待閃爍停止。如果持續閃爍超過 5 分鐘、請聯絡技術支援部門尋求協助。

  2. 如果您尚未接地、請正確接地。

  3. 用雙手抓住擋板兩側的開口並向自己方向拉,直到擋板從底盤框架上的球頭螺栓上鬆開,從而拆下擋板(如有必要)。

  4. 在裝置正面、將手指勾入鎖定凸輪的孔中、壓緊凸輪桿上的彈片、然後輕輕地同時將兩個鎖條牢牢地朝您的方向旋轉。

    控制器模組會稍微移出機箱。

    控制器移除圖形

    編號 1

    鎖定凸輪栓鎖

  5. 將控制器模組滑出機箱、然後放在平坦穩定的表面上。

    將控制器模組滑出機箱時、請務必支撐控制器模組的底部。

步驟3:更換DIMM

當系統報告該 DIMM 的永久性故障狀況時、您必須更換 DIMM 。

  1. 如果您尚未接地、請正確接地。

  2. 打開控制器頂端的控制器通風管。

    1. 將手指插入通風管遠端的凹處。

    2. 提起通風管、並將其向上旋轉至最遠的位置。

  3. 找到控制器模組上的 DIMM 、並識別要更換的 DIMM 。

    使用控制器通風管上的 FRU 對應圖來找出 DIMM 插槽。

  4. 緩慢地將DIMM兩側的兩個DIMM彈出彈片分開、然後將DIMM從插槽中滑出、藉此將DIMM從插槽中退出。

    重要 小心拿住DIMM的邊緣、避免對DIMM電路板上的元件施加壓力。
    更換 DIMM

    編號 1

    DIMM和DIMM彈出卡舌

  5. 從防靜電包裝袋中取出備用DIMM、拿住DIMM的邊角、然後將其對準插槽。

    DIMM插針之間的槽口應與插槽中的卡舌對齊。

  6. 確定連接器上的DIMM彈出彈片處於開啟位置、然後將DIMM正面插入插槽。

    DIMM可緊密插入插槽、但應該很容易就能裝入。如果沒有、請重新將DIMM與插槽對齊、然後重新插入。

    重要 目視檢查DIMM、確認其對齊並完全插入插槽。
  7. 在DIMM頂端邊緣小心地推入、但穩固地推入、直到彈出彈出彈片卡入DIMM兩端的槽口。

  8. 關閉控制器通風管。

步驟4:安裝控制器

重新安裝控制器模組並將其開機。

  1. 將通風管往下轉動、以確保通風管完全關閉。

    它必須與控制器模組金屬板齊平。

  2. 將控制器模組的末端與機箱中的開口對齊、然後將控制器模組滑入機箱、並將控制桿從系統正面旋轉。

  3. 一旦控制器模組停止滑動、請向內旋轉 CAM 把手、直到卡入風扇下方

    註 將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。

    一旦控制器模組完全插入機箱中、就會開始開機。

  4. 將錶圈與球頭螺栓對齊,然後輕輕將錶圈推入到位。

  5. 主控台訊息停止時、按 <enter> 。

    • 如果看到登入提示,請前往下一步。

    • 如果您沒有看到登入提示,請登入合作夥伴節點。

  6. 僅傳回具有 override-destination-checks 選項的根:

    storage failover giveback -ofnode impaired-node -only-root true -override -destination-checks true

    註 以下命令僅在診斷模式權限等級下可用。有關權限級別的更多信息,請參閱"了解ONTAP CLI 指令的權限級別"

    如果您遇到錯誤、請聯絡 "NetApp支援"

  7. 等待交還報告完成後 5 分鐘,然後檢查故障轉移和交還狀態:

    storage failover show`和 `storage failover show-giveback

    註 以下命令僅在診斷模式權限等級下可用。
  8. 如果 HA 互連鏈路已斷開,請將其恢復:

    system ha interconnect link on -node healthy-node -link 0

    system ha interconnect link on -node healthy-node -link 1

  9. 如果自動恢復已停用、請重新啟用:

    storage failover modify -node local -auto-giveback-of true

  10. 將受損的控制器歸還其儲存設備、使其恢復正常運作:

    '容錯移轉還原-ofnode_disapped_node_name_'

  11. 如果啟用 AutoSupport ,則還原 / 恢復自動建立個案:

    system node autosupport invoke -node * -type all -message MAINT=END

步驟5:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。