Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換PCIe卡AFF - REC800

貢獻者 Copilot dougthomp

當AFF C800系統中的 I/O 模組發生故障、需要升級以支援更高的效能或附加功能時,請更換或新增該 I/O 模組。更換過程包括關閉控制器、更換故障的 I/O 模組、重新啟動控制器,以及將故障零件退回NetApp。

開始之前
  • 您必須備有NetApp的新零件或替換零件。

  • 請確定儲存系統中的所有其他元件都正常運作;如果沒有,請聯絡技術支援部門。

  • 您可以將此程序用於ONTAP 系統支援的所有版本的功能。

  • 系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

步驟1:關閉受損的控制器

關閉或接管受損的控制器。

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息 cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :

    system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    下列AutoSupport 資訊不顯示自動建立案例兩小時:

    cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用自動交還:

    1. 從健康控制器的控制台輸入以下命令:

      storage failover modify -node impaired_node_name -auto-giveback false

    2. 進入 `y`當您看到提示「您是否要停用自動回饋?」時

  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從健全的控制器接管或停止受損的控制器:

    storage failover takeover -ofnode impaired_node_name -halt true

    --halt true_ 參數會帶您進入 Loader 提示字元。

步驟2:移除控制器模組

更換控制器模組或更換控制器模組內部的元件時、您必須從機箱中移除控制器模組。

步驟
  1. 如果您尚未接地、請正確接地。

  2. 請用拇指推動每個磁碟機,直到您感覺到正向停止為止,以確保機箱中的所有磁碟機都穩固地安裝在中間背板上。

    影片 - 確認駕駛座椅
    將驅動器安裝到位
  3. 根據系統狀態檢查控制器驅動器:

    1. 在運作正常的控制器上,檢查是否有任何處於降級狀態、故障狀態或兩者兼具的狀態:

      storage aggregate show -raidstatus !*normal*
      • 如果命令返回 `There are no entries matching your query.`繼續進入下一個子步驟,檢查是否有缺少的驅動器。

      • 如果該命令返回任何其他結果,請從兩個控制器收集AutoSupport數據,並聯絡NetApp支援部門以取得進一步協助。

        system node autosupport invoke -node * -type all -message '<message_name>'
    2. 檢查檔案系統或備用磁碟機是否有缺失磁碟機問題:

      event log show -severity * -node * -message-name *disk.missing*
      • 如果命令返回 `There are no entries matching your query.`繼續進入下一步

      • 如果該命令返回任何其他結果,請從兩個控制器收集AutoSupport數據,並聯絡NetApp支援部門以取得進一步協助。

        system node autosupport invoke -node * -type all -message '<message_name>'
  4. 移除電源線固定器,然後從電源上拔下電源線。

  5. 鬆開線纜管理裝置上的魔鬼氈綁帶。從控制器模組上拔下系統電纜和 SFP/QSFP 模組(如果需要)。記下每條電纜的位置。

    將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。

  6. 從控制器模組中取出纜線管理裝置、然後將其放在一旁。

  7. 向下按兩個鎖定栓、然後同時向下轉動兩個鎖條。

    控制器模組會稍微移出機箱。

    卸下控制器模組

    編號 1

    鎖定鎖定

    編號 2

    鎖定銷

  8. 將控制器模組滑出機箱、然後放在穩固的平面上。

    托住控制器模組的底部,將其從機箱中滑出。

步驟 3:更換 PCIe 卡

更換 PCIe 卡時,請先移除目標轉接卡上 PCIe 卡埠的線纜和所有 QSFP 和 SFP,然後從控制器模組上移除轉接卡,移除並更換 PCIe 卡,再將轉接卡和所有 QSFP 和 SFP 重新安裝到連接埠上,最後重新連接連接埠線。

步驟
  1. 確定您要更換的插卡是否來自提升板1、或是來自提升板2或3。

    • 如果您要更換提升板1中的100GbE PCIe卡、請執行步驟2 - 3和步驟6 - 7。

    • 如果您要從擴充卡2或3更換PCIe卡、請執行步驟4至7。

  2. 從控制器模組中移除擴充卡1:

    1. 移除PCIe卡中的QSFP模組。

    2. 向上轉動提升板左側的提升板鎖定栓、並朝風扇模組方向轉動。

      提升板會從控制器模組稍微向上提升。

    3. 向上提起提升板、將其移向風扇、使提升板上的金屬片邊緣脫離控制器模組邊緣、將提升板從控制器模組中提出、然後將其放置在穩固的平面上。

      更換提升板 1 中的 PCI 卡

    編號 1

    通風管

    編號 2

    提升板鎖定鎖定

    編號 3

    插卡鎖定支架

    編號 4.

    擴充卡1(左擴充卡)、插槽1中有100GbE PCIe卡。

  3. 從擴充卡1移除PCIe卡:

    1. 轉動擴充卡、以便存取PCIe卡。

    2. 按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。

    3. 從擴充卡中取出PCIe卡。

  4. 從控制器模組中移除PCIe擴充卡:

    1. 移除PCIe卡中的任何SFP或QSFP模組。

    2. 向上轉動提升板左側的提升板鎖定栓、並朝風扇模組方向轉動。

      提升板會從控制器模組稍微向上提升。

    3. 向上提起提升板、將其移向風扇、使提升板上的金屬片邊緣脫離控制器模組邊緣、將提升板從控制器模組中提出、然後將其放置在穩固的平面上。

      將 PCI 卡 2 至 5 裝回中間和右側擴充卡

    編號 1

    通風管

    編號 2

    擴充卡2(中間擴充卡)或3(右側擴充卡)鎖定栓

    編號 3

    插卡鎖定支架

    編號 4.

    提升板2或3上的側板

    編號 5.

    擴充卡2或3中的PCIe卡

  5. 從擴充卡中取出PCIe卡:

    1. 轉動擴充卡、以便存取PCIe卡。

    2. 按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。

    3. 將側邊面板從擴充卡上轉開。

    4. 從擴充卡中取出PCIe卡。

  6. 將PCIe卡安裝到提升板的同一個插槽中:

    1. 將擴充卡與擴充卡中的插槽對齊、然後將其正面滑入擴充卡的插槽。

      註 請確定插卡完全且正面地插入擴充卡插槽。
    2. 若為擴充卡2或3、請關閉側邊面板。

    3. 將鎖定栓轉到定位、直到卡入鎖定位置為止。

  7. 將擴充卡安裝至控制器模組:

    1. 將擴充卡的邊緣對齊控制器模組的底部金屬板。

    2. 沿控制器模組的插腳引導擴充卡、然後將擴充卡降低至控制器模組。

    3. 向下轉動鎖定栓、然後將其卡入鎖定位置。

      鎖定時、鎖定栓會與擴充卡的頂端齊平、而擴充卡則會正面置於控制器模組中。

    4. 重新插入從PCIe卡中移除的任何SFP模組。

步驟4:重新安裝控制器模組

重新安裝控制器模組、然後重新啟動。

步驟
  1. 將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。

    註 在指示之前、請勿將控制器模組完全插入機箱。
  2. 視需要重新安裝系統。

    如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。

  3. 完成控制器模組的重新安裝:

    1. 將控制器模組穩固地推入機箱、直到它與中間板完全接入。

      控制器模組完全就位時、鎖定鎖條會上升。

    註 將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。
    1. 向上轉動鎖定栓、將其傾斜、使其從鎖定銷中取出、然後將其放低至鎖定位置。

    2. 將電源線插入電源供應器,重新安裝電源線鎖環,然後將電源供應器連接至電源。

      控制器模組會在電源恢復後立即開始開機。準備好中斷開機程序。

    3. 如果您尚未重新安裝纜線管理裝置、請重新安裝。

  4. 將受損的控制器歸還其儲存設備、使其恢復正常運作:

    storage failover giveback -ofnode impaired_node_name

  5. 如果自動恢復已停用、請重新啟用:

    storage failover modify -node local -auto-giveback true

  6. 如果啟用 AutoSupport ,則還原 / 恢復自動建立個案:

    system node autosupport invoke -node * -type all -message MAINT=END

步驟5:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。