更換PCIe卡AFF - REC800
當AFF C800系統中的 I/O 模組發生故障、需要升級以支援更高的效能或附加功能時,請更換或新增該 I/O 模組。更換過程包括關閉控制器、更換故障的 I/O 模組、重新啟動控制器,以及將故障零件退回NetApp。
-
您必須備有NetApp的新零件或替換零件。
-
請確定儲存系統中的所有其他元件都正常運作;如果沒有,請聯絡技術支援部門。
-
您可以將此程序用於ONTAP 系統支援的所有版本的功能。
-
系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。
步驟1:關閉受損的控制器
關閉或接管受損的控制器。
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。
-
如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息
cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"。
-
如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h下列AutoSupport 資訊不顯示自動建立案例兩小時:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h -
停用自動交還:
-
從健康控制器的控制台輸入以下命令:
storage failover modify -node impaired_node_name -auto-giveback false -
進入 `y`當您看到提示「您是否要停用自動回饋?」時
-
-
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
前往下一步。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示
從健全的控制器接管或停止受損的控制器:
storage failover takeover -ofnode impaired_node_name -halt true--halt true_ 參數會帶您進入 Loader 提示字元。
步驟2:移除控制器模組
更換控制器模組或更換控制器模組內部的元件時、您必須從機箱中移除控制器模組。
-
如果您尚未接地、請正確接地。
-
請用拇指推動每個磁碟機,直到您感覺到正向停止為止,以確保機箱中的所有磁碟機都穩固地安裝在中間背板上。
影片 - 確認駕駛座椅 -
根據系統狀態檢查控制器驅動器:
-
在運作正常的控制器上,檢查是否有任何處於降級狀態、故障狀態或兩者兼具的狀態:
storage aggregate show -raidstatus !*normal*-
如果命令返回 `There are no entries matching your query.`繼續進入下一個子步驟,檢查是否有缺少的驅動器。。
-
如果該命令返回任何其他結果,請從兩個控制器收集AutoSupport數據,並聯絡NetApp支援部門以取得進一步協助。
system node autosupport invoke -node * -type all -message '<message_name>'
-
-
event log show -severity * -node * -message-name *disk.missing*-
如果命令返回 `There are no entries matching your query.`繼續進入下一步。
-
如果該命令返回任何其他結果,請從兩個控制器收集AutoSupport數據,並聯絡NetApp支援部門以取得進一步協助。
system node autosupport invoke -node * -type all -message '<message_name>'
-
-
-
鬆開線纜管理裝置上的魔鬼氈綁帶。從控制器模組上拔下系統電纜和 SFP/QSFP 模組(如果需要)。記下每條電纜的位置。
將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。
-
從控制器模組中取出纜線管理裝置、然後將其放在一旁。
-
向下按兩個鎖定栓、然後同時向下轉動兩個鎖條。
控制器模組會稍微移出機箱。

鎖定鎖定

鎖定銷
-
將控制器模組滑出機箱、然後放在穩固的平面上。
托住控制器模組的底部,將其從機箱中滑出。
步驟 3:更換 PCIe 卡
更換 PCIe 卡時,請先移除目標轉接卡上 PCIe 卡埠的線纜和所有 QSFP 和 SFP,然後從控制器模組上移除轉接卡,移除並更換 PCIe 卡,再將轉接卡和所有 QSFP 和 SFP 重新安裝到連接埠上,最後重新連接連接埠線。
-
確定您要更換的插卡是否來自提升板1、或是來自提升板2或3。
-
如果您要更換提升板1中的100GbE PCIe卡、請執行步驟2 - 3和步驟6 - 7。
-
如果您要從擴充卡2或3更換PCIe卡、請執行步驟4至7。
-
-
從控制器模組中移除擴充卡1:
-
移除PCIe卡中的QSFP模組。
-
向上轉動提升板左側的提升板鎖定栓、並朝風扇模組方向轉動。
提升板會從控制器模組稍微向上提升。
-
向上提起提升板、將其移向風扇、使提升板上的金屬片邊緣脫離控制器模組邊緣、將提升板從控制器模組中提出、然後將其放置在穩固的平面上。

通風管

提升板鎖定鎖定

插卡鎖定支架

擴充卡1(左擴充卡)、插槽1中有100GbE PCIe卡。
-
-
從擴充卡1移除PCIe卡:
-
轉動擴充卡、以便存取PCIe卡。
-
按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。
-
從擴充卡中取出PCIe卡。
-
-
從控制器模組中移除PCIe擴充卡:
-
移除PCIe卡中的任何SFP或QSFP模組。
-
向上轉動提升板左側的提升板鎖定栓、並朝風扇模組方向轉動。
提升板會從控制器模組稍微向上提升。
-
向上提起提升板、將其移向風扇、使提升板上的金屬片邊緣脫離控制器模組邊緣、將提升板從控制器模組中提出、然後將其放置在穩固的平面上。

通風管

擴充卡2(中間擴充卡)或3(右側擴充卡)鎖定栓

插卡鎖定支架

提升板2或3上的側板

擴充卡2或3中的PCIe卡
-
-
從擴充卡中取出PCIe卡:
-
轉動擴充卡、以便存取PCIe卡。
-
按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。
-
將側邊面板從擴充卡上轉開。
-
從擴充卡中取出PCIe卡。
-
-
將PCIe卡安裝到提升板的同一個插槽中:
-
將擴充卡與擴充卡中的插槽對齊、然後將其正面滑入擴充卡的插槽。
請確定插卡完全且正面地插入擴充卡插槽。 -
若為擴充卡2或3、請關閉側邊面板。
-
將鎖定栓轉到定位、直到卡入鎖定位置為止。
-
-
將擴充卡安裝至控制器模組:
-
將擴充卡的邊緣對齊控制器模組的底部金屬板。
-
沿控制器模組的插腳引導擴充卡、然後將擴充卡降低至控制器模組。
-
向下轉動鎖定栓、然後將其卡入鎖定位置。
鎖定時、鎖定栓會與擴充卡的頂端齊平、而擴充卡則會正面置於控制器模組中。
-
重新插入從PCIe卡中移除的任何SFP模組。
-
步驟4:重新安裝控制器模組
重新安裝控制器模組、然後重新啟動。
-
將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。
在指示之前、請勿將控制器模組完全插入機箱。 -
視需要重新安裝系統。
如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。
-
完成控制器模組的重新安裝:
-
將控制器模組穩固地推入機箱、直到它與中間板完全接入。
控制器模組完全就位時、鎖定鎖條會上升。
將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。 -
向上轉動鎖定栓、將其傾斜、使其從鎖定銷中取出、然後將其放低至鎖定位置。
-
將電源線插入電源供應器,重新安裝電源線鎖環,然後將電源供應器連接至電源。
控制器模組會在電源恢復後立即開始開機。準備好中斷開機程序。
-
如果您尚未重新安裝纜線管理裝置、請重新安裝。
-
-
將受損的控制器歸還其儲存設備、使其恢復正常運作:
storage failover giveback -ofnode impaired_node_name。 -
如果自動恢復已停用、請重新啟用:
storage failover modify -node local -auto-giveback true。 -
如果啟用 AutoSupport ,則還原 / 恢復自動建立個案:
system node autosupport invoke -node * -type all -message MAINT=END。
步驟5:將故障零件歸還給NetApp
如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。