本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換快取模組- FAS2600

貢獻者

當系統登錄單AutoSupport 一的故障資訊(ASUP)訊息、指出模組已離線時、您必須更換控制器模組中的快取模組、否則會導致效能降低。

  • 您必須使用從供應商處收到的替換FRU元件來更換故障元件。

步驟1:關閉受損的控制器

根據儲存系統硬體組態的不同、您可以使用不同的程序來關閉或接管受損的控制器。

關於這項工作

如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格與健全狀況、則您必須先修正問題、再關閉受損的控制器。

您可能需要先清除快取模組的內容、然後再進行更換。

  1. 雖然快取模組上的資料已加密、但您可能想要清除受損快取模組中的任何資料、並確認快取模組沒有資料:

    1. 清除快取模組上的資料: system controller flash-cache secure-erase run -node node name localhost -device-id device_number

      附註 執行 system controller flash-cache show 如果您不知道快閃快取裝置ID、則命令。
    2. 確認資料已從快取模組中清除: system controller flash-cache secure-erase show

  2. 如果受損的控制器是HA配對的一部分、請從健全控制器的主控台停用自動恢復功能:「torage容錯移轉修改節點本機-自動恢復錯誤」

  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示(輸入系統密碼)

    接管或停止受損的控制器:

    • 對於HA配對、請從健全的控制器接管受損的控制器:「儲存容錯移轉接管-節點_受損節點_節點名稱_」

      當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

    • 對於獨立式系統:「System Node halt disbized_node_name

  4. 如果系統機箱中只有一個控制器模組、請關閉電源供應器、然後從電源插座拔下受損控制器的電源線。

步驟2:移除控制器模組

若要存取控制器內部的元件、您必須先從系統中移除控制器模組、然後移除控制器模組上的護蓋。

  1. 如果您尚未接地、請正確接地。

  2. 解開將纜線綁定至纜線管理裝置的掛勾和迴圈帶、然後從控制器模組拔下系統纜線和SFP(如有需要)、並追蹤纜線的連接位置。

    將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。

  3. 從控制器模組的左側和右側移除纜線管理裝置、並將其放在一邊。

    DRW 25xx纜線管理ARM 功能
  4. 壓下CAM把手上的栓鎖直到釋放為止、完全打開CAM把把、以從中間板釋放控制器模組、然後用兩隻手將控制器模組從機箱中拉出。

    DRW 2240 x開啟CAM栓鎖
  5. 翻轉控制器模組、將其放置在平穩的表面上。

  6. 滑入藍色彈片以釋放護蓋、然後將護蓋向上旋轉並開啟、即可開啟護蓋。

    DRw 2600開啟PCM機箱蓋

步驟3:更換快取模組

若要更換控制器標籤上的快取模組(稱為「M.2 PCIe卡」)、請找出控制器內的插槽、然後依照特定的步驟順序進行。

您的儲存系統必須符合特定條件、視您的情況而定:

  • 它必須具備適用於您所安裝之快取模組的作業系統。

  • 它必須支援快取容量。

  • 儲存系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

    1. 找到控制器模組後端的快取模組、然後將其移除。

      1. 按下釋放卡舌。

      2. 移除散熱片。

      DRW 2600 fcache重新製動畫Gif
    2. 將快取模組從外殼中直接拉出。

    3. 將快取模組的邊緣與外殼的插槽對齊、然後將其輕推入插槽。

    4. 驗證快取模組是否已完全正確插入插槽。

      如有必要、請移除快取模組並將其重新插回插槽。

    5. 重新拔插並向下推散熱片、以啟用快取模組外殼上的鎖定按鈕。

    6. 視需要關閉控制器模組護蓋。

步驟4:重新安裝控制器模組

更換控制器模組中的元件之後、請將其重新安裝到機箱中。

  1. 如果您尚未更換控制器模組的護蓋、請將其裝回。

  2. 將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。

    附註 在指示之前、請勿將控制器模組完全插入機箱。
  3. 視需要重新安裝系統。

    如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。

  4. 完成控制器模組的重新安裝:

    如果您的系統處於…​ 然後執行下列步驟…​

    HA配對

    控制器模組一旦完全插入機箱、就會開始開機。準備好中斷開機程序。

    1. 將CAM握把置於開啟位置時、將控制器模組穩固推入、直到它與中間背板接觸並完全就位、然後將CAM握把關閉至鎖定位置。

      附註 將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。

      控制器一旦安裝在機箱中、就會開始開機。

    2. 如果您尚未重新安裝纜線管理裝置、請重新安裝。

    3. 使用掛勾和迴圈固定帶將纜線綁定至纜線管理裝置。

    4. 當您看到「Press Ctrl-C for Boot Menu」(按Ctrl-C進入開機功能表)訊息時、請按「Ctrl-C」中斷開機程序。

      附註 如果您錯過提示、且控制器模組開機ONTAP 至畫面、請輸入「halt」、然後在載入程式提示字元輸入「boot_ONTAP」、並在出現提示時按「Ctrl-C」、然後開機至維護模式。
    5. 從顯示的功能表中選取要開機至維護模式的選項。

    獨立組態

    1. 將CAM握把置於開啟位置時、將控制器模組穩固推入、直到它與中間背板接觸並完全就位、然後將CAM握把關閉至鎖定位置。

      附註 將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。
    2. 如果您尚未重新安裝纜線管理裝置、請重新安裝。

    3. 使用掛勾和迴圈固定帶將纜線綁定至纜線管理裝置。

    4. 重新連接電源供應器和電源的電源線、開啟電源以啟動開機程序、然後在看到「Press Ctrl-C for Boot Menu(按Ctrl-C啟動選單)」訊息後按「Ctrl-C」。

      附註 如果您錯過提示、且控制器模組開機ONTAP 至畫面、請輸入「halt」、然後在載入程式提示字元輸入「boot_ONTAP」、並在出現提示時按「Ctrl-C」、然後開機至維護模式。
    5. 從開機功能表中、選取維護模式選項。

步驟5:執行系統層級診斷

安裝新的快取模組之後、您應該執行診斷。

您的系統必須處於載入器提示狀態、才能啟動系統層級診斷。

診斷程序中的所有命令都是由要更換元件的控制器發出。

  1. 如果要維修的控制器未出現載入程式提示、請執行下列步驟:

    1. 從顯示的功能表中選取「維護模式」選項。

    2. 控制器開機至維護模式後、停止控制器:「halt(停止)」

      發出命令之後、您應該等到系統在載入程式提示字元停止。

    附註 在開機過程中、您可以安全地回應「y」提示:
  2. 在載入程式提示字元下、存取專為系統層級診斷所設計的特殊驅動程式、以正常運作:「boot_diags'(boot_diags')

    在開機過程中、您可以安全地回應提示「y」、直到出現「維護模式」提示(*>)為止。

  3. 對快取模組執行診斷:「ldiag設備執行-devfcache」

  4. 確認更換快取模組後、沒有發生硬體問題:「ldiag設備狀態-devfcache -long -state ffailed」

    如果沒有測試失敗、系統層級的診斷會返回提示、或列出測試元件所導致的故障完整狀態。

  5. 根據上述步驟的結果繼續進行:

如果系統層級的診斷測試…​ 然後…​

已完成、沒有任何故障

  1. 清除狀態記錄:「ldiag」裝置的清除狀態

  2. 確認記錄已清除:「ldiag設備狀態」

    畫面會顯示下列預設回應:

    SLDIAG:沒有記錄訊息。

  3. 退出維護模式:「halt」

    控制器會顯示載入器提示。

  4. 從載入程式提示字元「bye」開機控制器

  5. 使控制器恢復正常運作:

    如果您的控制器是HA配對、請執行「回饋」:「儲存容錯移轉回傳回-ofnode_replace_node_name_」

    *附註:*如果停用自動恢復功能、請使用「儲存容錯移轉修改」命令重新啟用。

    如果您的控制器處於獨立組態、請繼續下一步。無需採取任何行動。

    您已完成系統層級的診斷。

導致某些測試失敗

判斷問題的原因:

  1. 退出維護模式:「halt」

    發出命令後、請等待系統在載入程式提示字元停止。

  2. 根據機箱中的控制器模組數量、關閉或離開電源供應器:

    • 如果機箱中有兩個控制器模組、請讓電源供應器保持開啟狀態、以便為其他控制器模組提供電力。

    • 如果機箱中有一個控制器模組、請關閉電源供應器、然後從電源插座拔下它們。

  3. 確認您已注意到執行系統層級診斷所需的所有考量事項、纜線是否穩固連接、以及硬體元件是否已正確安裝在儲存系統中。

  4. 引導您正在維修的控制器模組、並在系統提示您進入「Boot(開機)」功能表時按「Ctrl-C」中斷開機:

    • 如果機箱中有兩個控制器模組、請將您要維修的控制器模組完全裝入機箱。

      控制器模組完全就位時會開機。

    • 如果機箱中有一個控制器模組、請連接電源供應器、然後將其開啟。

  5. 從功能表中選取開機至維護模式。

  6. 輸入以下命令退出維護模式:「halt(停止)」

    發出命令後、請等待系統在載入程式提示字元停止。

  7. 重新執行系統層級的診斷測試。

步驟6:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。請參閱 "產品退貨安培;更換" 頁面以取得更多資訊。