更換PCIe或夾層卡AFF - VA400
若要更換PCIe或夾層卡、您必須從插卡上拔下纜線和任何SFP和QSFP模組、更換故障的PCIe或夾層卡、然後重新插接插卡。
-
您可以將此程序用於ONTAP 系統支援的所有版本的功能
-
系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。
步驟1:關閉受損的控制器
根據儲存系統硬體組態的不同、您可以使用不同的程序來關閉或接管受損的控制器。
接管並停止故障控制器,以便正常控制器繼續從故障控制器的儲存提供資料。為此,您需要在 AutoSupport 中停用自動建立案例功能、停用自動復原功能,並將故障控制器置於 LOADER 提示字元。LOADER 提示字元是安全的停止狀態,您可以從中更換 FRU。
-
如果您有 SAN 系統,則必須檢查故障控制器 SCSI 刀鋒的事件訊息
cluster kernel-service show。 `cluster kernel-service show`命令(從 priv 進階模式)會顯示節點名稱、"仲裁狀態"該節點的可用度狀態、以及該節點的作業狀態。每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。
-
如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"。
-
如果啟用了「支援」功能、請叫用下列消息來禁止自動建立個案AutoSupport AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h下列AutoSupport 資訊不顯示自動建立案例兩小時:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h -
停用自動交還:
-
從健康控制器的控制台輸入以下命令:
storage failover modify -node impaired_node_name -auto-giveback false -
進入 `y`當您看到提示「您是否要停用自動回饋?」時
-
-
將受損的控制器移至載入器提示:
如果受損的控制器正在顯示… 然後… 載入程式提示
前往下一步。
正在等待恢復…
按Ctrl-C、然後在出現提示時回應「y」。
系統提示或密碼提示
從健全的控制器接管或停止受損的控制器:
storage failover takeover -ofnode impaired_node_name -halt true--halt true_ 參數會帶您進入 Loader 提示字元。
若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。
-
您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。
-
檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」
-
視是否發生自動切換而定、請根據下表繼續進行:
如果控制器受損… 然後… 已自動切換
繼續下一步。
尚未自動切換
從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」
尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決
請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。
-
從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。
controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。
-
使用MetroCluster flexoperationshow命令確認作業已完成。
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: - -
使用「shorage Aggregate show」命令來檢查集合體的狀態。
controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。
mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。
-
在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:
mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: - -
在受損的控制器模組上、拔下電源供應器。
步驟2:移除控制器模組
若要存取控制器模組內部的元件、您必須從機箱中移除控制器模組。
-
如果您尚未接地、請正確接地。
-
釋放電源線固定器、然後從電源供應器拔下纜線。
-
解開將纜線綁定至纜線管理裝置的掛勾和迴圈帶、然後從控制器模組拔下系統纜線和SFP(如有需要)、並追蹤纜線的連接位置。
將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。
-
從控制器模組中取出纜線管理裝置、然後將其放在一旁。
-
向下按兩個鎖定栓、然後同時向下轉動兩個鎖條。
控制器模組會稍微移出機箱。

鎖定鎖條

控制器稍微移出機箱
-
將控制器模組滑出機箱。
將控制器模組滑出機箱時、請確定您支援控制器模組的底部。
-
將控制器模組放在穩固的平面上。
步驟3:更換PCIe卡
若要更換PCIe卡、您必須找到故障的PCIe卡、從控制器模組中移除包含該卡的擴充卡、裝回該卡、然後在控制器模組中重新安裝PCIe擴充卡。

|
提升板鎖定鎖定 |
|
PCI 卡鎖定閂鎖 |
|
PCI 鎖定板 |
|
PCI 卡 |
-
卸下內含要更換之插卡的擴充卡:
-
按下通風管兩側的鎖定彈片、將通風管滑向控制器模組背面、然後將其旋轉至完全開啟的位置、以開啟通風管。
-
移除PCIe卡中的任何SFP或QSFP模組。
-
向上轉動提升板左側的提升板鎖定栓、並朝通風管方向轉動。
提升板會從控制器模組稍微向上提升。
-
垂直向上提起擴充卡、並將其放在穩固的平面上、
-
-
從擴充卡中取出PCIe卡:
-
轉動擴充卡、以便存取PCIe卡。
-
按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。
-
僅適用於提升板2和3、請將側邊面板向上轉動。
-
將PCIe卡從擴充卡上卸下、方法是輕推支架、然後將其從插槽中垂直提起。
-
-
將插卡對齊插槽、將插卡壓入插槽、然後合上擴充卡上的側邊面板(如果有)、將替換的PCIe卡安裝到擴充卡中。
將插卡插入插槽時、請務必將插卡正確對齊、並對插卡施壓。PCIe卡必須完全且平均地置於插槽中。
如果您要在底部插槽中安裝插卡、但看不到插卡插槽、請取出頂端插卡、以便看到插卡插槽、安裝插卡、然後重新安裝從頂端插槽中取出的插卡。 -
重新安裝擴充卡:
-
將擴充卡與擴充卡插槽側邊的插腳對齊、將擴充卡向下壓到插腳上。
-
將擴充卡正面推入主機板上的插槽。
-
向下轉動鎖銷、使其與提升板上的金屬板齊平。
-
步驟4:更換夾層卡
夾層卡位於提升卡編號3(插槽4和5)下。您必須移除該擴充卡、才能存取夾層卡、更換夾層卡、然後重新安裝3號擴充卡。如需詳細資訊、請參閱控制器模組上的FRU對應。
您可以使用下列動畫、圖例或書面步驟來更換夾層卡。
|
PCI 擴充卡 |
|
轉接器指旋螺絲 |
|
擴充卡 |
-
移除第3號擴充卡(插槽4和5):
-
按下通風管兩側的鎖定彈片、將通風管滑向控制器模組背面、然後將其旋轉至完全開啟的位置、以開啟通風管。
-
移除PCIe卡中的任何SFP或QSFP模組。
-
向上轉動提升板左側的提升板鎖定栓、並朝通風管方向轉動。
提升板會從控制器模組稍微向上提升。
-
將擴充卡向上提起、然後將其放在穩固的平面上。
-
-
更換夾層卡:
-
從卡中取出所有QSFP或SFP模組。
-
旋鬆夾層卡上的指旋螺絲、然後將插卡從插槽中直接輕拉出、並放在一旁。
-
將替換的夾層卡對準插槽和導引腳、然後將插卡輕推入插槽。
-
鎖緊夾層卡上的指旋螺絲。
NOTE: Fully tighten the mezzanine card thumbscrews. Loose thumbscrews may prevent ports e0e through e0h from being detected, cause the LED to flash continuously, and result in "unsupported cable" errors in the logs.
-
-
重新安裝擴充卡:
-
將擴充卡與擴充卡插槽側邊的插腳對齊、將擴充卡向下壓到插腳上。
-
將擴充卡正面推入主機板上的插槽。
-
向下轉動鎖銷、使其與提升板上的金屬板齊平。
-
步驟5:安裝控制器模組
在控制器模組中更換元件之後、您必須將控制器模組重新安裝到機箱中、然後將其開機至維護模式。
-
如果您尚未這麼做、請關閉通風管。
-
將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。
在指示之前、請勿將控制器模組完全插入機箱。 -
視需要重新安裝系統。
如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。
-
完成控制器模組的安裝:
-
使用鎖定鎖條、將控制器模組穩固地推入機箱、直到其與中間背板接入並完全就位。
控制器模組完全就位時、鎖定鎖條會上升。
將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。 -
將鎖定鎖條向上轉動、將鎖定鎖條向內傾、使其脫離鎖定插銷、將控制器推入到底、然後將鎖定鎖條向下推入鎖定位置、以將控制器模組完全裝入機箱。
-
將電源線插入電源供應器,重新安裝電源線鎖環,然後將電源供應器連接至電源。
控制器模組會在電源恢復後立即開始開機。準備好中斷開機程序。
-
如果您尚未重新安裝纜線管理裝置、請重新安裝。
-
中斷正常開機程序、然後按「Ctrl-C」開機至載入器。
如果系統在開機功能表停止、請選取開機至載入器選項。 -
在載入程式提示下、輸入「bye」重新初始化PCIe卡和其他元件、然後讓控制器重新開機。
-
-
將控制器恢復正常運作、方法是歸還儲存設備:「torage容錯移轉恢復-ofnode_disapped_node_name_」
-
如果停用自動還原、請重新啟用:「儲存容錯移轉修改節點本機-自動恢復true」
步驟6:將控制器模組還原為運作狀態
若要還原控制器、您必須重新啟動系統、歸還控制器模組、然後重新啟用自動還原。
-
視需要重新安裝系統。
如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。
-
將控制器恢復正常運作、方法是歸還儲存設備:「torage容錯移轉恢復-ofnode_disapped_node_name_」
-
如果停用自動還原、請重新啟用:「儲存容錯移轉修改節點本機-自動恢復true」
步驟7:在雙節點MetroCluster 的不二組態中切換回集合體
此工作僅適用於雙節點MetroCluster 的不完整組態。
-
驗證所有節點是否都處於「啟用」狀態:MetroCluster 「顯示節點」
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed. -
確認所有SVM上的重新同步已完成:MetroCluster 「Svserver show」
-
驗證修復作業所執行的任何自動LIF移轉是否已成功完成:「MetroCluster 還原檢查LIF show」
-
從存續叢集中的任何節點使用「MetroCluster 還原」命令執行切換。
-
確認切換作業已完成:MetroCluster 「不顯示」
當叢集處於「等待切換」狀態時、切換回復作業仍在執行中:
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
當叢集處於「正常」狀態時、即可完成切換作業:
cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
如果切換需要很長時間才能完成、您可以使用「MetroCluster show config-repl複 寫res同步 狀態show」命令來檢查進行中的基準狀態。
-
重新建立任何SnapMirror或SnapVault 不完整的組態。
步驟8:將故障零件歸還給NetApp
如套件隨附的RMA指示所述、將故障零件退回NetApp。如 "零件退貨與更換"需詳細資訊、請參閱頁面。