Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

更換PCIe或夾層卡AFF - VA400

貢獻者

若要更換PCIe或夾層卡、您必須從插卡上拔下纜線和任何SFP和QSFP模組、更換故障的PCIe或夾層卡、然後重新插接插卡。

  • 您可以將此程序用於ONTAP 系統支援的所有版本的功能

  • 系統中的所有其他元件都必須正常運作;否則、您必須聯絡技術支援部門。

步驟1:關閉受損的控制器

根據儲存系統硬體組態的不同、您可以使用不同的程序來關閉或接管受損的控制器。

選項1:大多數組態

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時接管控制器、以便健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您使用NetApp儲存加密、則必須依照中的指示重設MSID "將SED恢復為無保護模式"

  • 如果您有SAN系統、則必須檢查事件訊息 cluster kernel-service show(用於控制器SCSI刀鋒伺服器)。。 cluster kernel-service show 命令會顯示節點名稱、該節點的仲裁狀態、該節點的可用度狀態、以及該節點的作業狀態。

    每個SCSI刀鋒處理序都應與叢集中的其他節點處於仲裁狀態。任何問題都必須先解決、才能繼續進行更換。

  • 如果叢集有兩個以上的節點、則叢集必須處於仲裁狀態。如果叢集未達到法定人數、或健全的控制器顯示為「假」、表示符合資格和健全狀況、則您必須在關閉受損的控制器之前修正問題;請參閱 "將節點與叢集同步"

步驟
  1. 如果啟用了此功能、請叫用下列訊息來抑制自動建立案例:「System Node現象叫用節點*-type all -Message MAn=number_of_hs_Downh」AutoSupport AutoSupport AutoSupport

    下列AutoSupport 資訊不顯示自動建立案例兩小時: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 停用健全控制器主控台的自動恢復功能:「torage容錯移轉修改–節點本機-自動恢復錯誤」

    註 當您看到_是否要停用自動恢復?_時、請輸入「y」。
  3. 將受損的控制器移至載入器提示:

    如果受損的控制器正在顯示…​ 然後…​

    載入程式提示

    前往下一步。

    正在等待恢復…​

    按Ctrl-C、然後在出現提示時回應「y」。

    系統提示或密碼提示

    從正常控制器接管或停止受損的控制器:「torage容錯移轉接管-節點_受損節點_節點名稱_」

    當受損的控制器顯示正在等待恢復…​時、請按Ctrl-C、然後回應「y」。

選項2:控制器位於雙節點MetroCluster 的不二

若要關閉受損的控制器、您必須判斷控制器的狀態、並在必要時切換控制器、使健全的控制器繼續從受損的控制器儲存設備提供資料。

關於這項工作
  • 如果您使用NetApp儲存加密、則必須依照的「將FIPS磁碟機或SED恢復為未受保護模式」一節中的指示、重設MSID "使用CLI進行NetApp加密總覽"

  • 您必須在本程序結束時保持電源供應器開啟、才能為健全的控制器提供電力。

步驟
  1. 檢查MetroCluster 「不正常」狀態、判斷受損的控制器是否已自動切換至「正常」控制器MetroCluster :「不正常」

  2. 視是否發生自動切換而定、請根據下表繼續進行:

    如果控制器受損…​ 然後…​

    已自動切換

    繼續下一步。

    尚未自動切換

    從健全的控制器執行計畫性的切換作業MetroCluster :「『交換切換’」

    尚未自動切換、您嘗試使用MetroCluster 「還原切換」命令進行切換、切換遭到否決

    請檢閱否決訊息、如有可能、請解決此問題、然後再試一次。如果您無法解決問題、請聯絡技術支援部門。

  3. 從MetroCluster 存續的叢集執行「f恢復 階段Aggregate」命令、以重新同步資料集合體。

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    如果治療被否決、您可以選擇MetroCluster 使用「-overre-etoes」參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  4. 使用MetroCluster flexoperationshow命令確認作業已完成。

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. 使用「shorage Aggregate show」命令來檢查集合體的狀態。

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. 使用「MetroCluster f恢復 階段根集合體」命令來修復根集合體。

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    如果修復被否決、您可以選擇使用MetroCluster -overrover-etoes參數重新發出「還原」命令。如果您使用此選用參數、系統將會置換任何軟質否決、以防止修復作業。

  7. 在MetroCluster 目的地叢集上使用「停止作業show」命令、確認修復作業已完成:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. 在受損的控制器模組上、拔下電源供應器。

步驟2:移除控制器模組

若要存取控制器模組內部的元件、您必須從機箱中移除控制器模組。

  1. 如果您尚未接地、請正確接地。

  2. 釋放電源線固定器、然後從電源供應器拔下纜線。

  3. 解開將纜線綁定至纜線管理裝置的掛勾和迴圈帶、然後從控制器模組拔下系統纜線和SFP(如有需要)、並追蹤纜線的連接位置。

    將纜線留在纜線管理裝置中、以便在重新安裝纜線管理裝置時、整理好纜線。

  4. 從控制器模組中取出纜線管理裝置、然後將其放在一旁。

  5. 向下按兩個鎖定栓、然後同時向下轉動兩個鎖條。

    控制器模組會稍微移出機箱。

    DRW A400移除控制器

    編號 1

    鎖定鎖條

    編號 2

    控制器稍微移出機箱

  6. 將控制器模組滑出機箱。

    將控制器模組滑出機箱時、請確定您支援控制器模組的底部。

  7. 將控制器模組放在穩固的平面上。

步驟3:更換PCIe卡

若要更換PCIe卡、您必須找到故障的PCIe卡、從控制器模組中移除包含該卡的擴充卡、裝回該卡、然後在控制器模組中重新安裝PCIe擴充卡。

編號 1

提升板鎖定鎖定

編號 2

PCI 卡鎖定閂鎖

編號 3

PCI 鎖定板

編號 4.

PCI 卡

  1. 卸下內含要更換之插卡的擴充卡:

    1. 按下通風管兩側的鎖定彈片、將通風管滑向控制器模組背面、然後將其旋轉至完全開啟的位置、以開啟通風管。

    2. 移除PCIe卡中的任何SFP或QSFP模組。

    3. 向上轉動提升板左側的提升板鎖定栓、並朝通風管方向轉動。

      提升板會從控制器模組稍微向上提升。

    4. 垂直向上提起擴充卡、並將其放在穩固的平面上、

  2. 從擴充卡中取出PCIe卡:

    1. 轉動擴充卡、以便存取PCIe卡。

    2. 按下PCIe擴充卡側邊的鎖定支架、然後將其旋轉至開啟位置。

    3. 僅適用於提升板2和3、請將側邊面板向上轉動。

    4. 將PCIe卡從擴充卡上卸下、方法是輕推支架、然後將其從插槽中垂直提起。

  3. 將插卡對齊插槽、將插卡壓入插槽、然後合上擴充卡上的側邊面板(如果有)、將替換的PCIe卡安裝到擴充卡中。

    將插卡插入插槽時、請務必將插卡正確對齊、並對插卡施壓。PCIe卡必須完全且平均地置於插槽中。

    註 如果您要在底部插槽中安裝插卡、但看不到插卡插槽、請取出頂端插卡、以便看到插卡插槽、安裝插卡、然後重新安裝從頂端插槽中取出的插卡。
  4. 重新安裝擴充卡:

    1. 將擴充卡與擴充卡插槽側邊的插腳對齊、將擴充卡向下壓到插腳上。

    2. 將擴充卡正面推入主機板上的插槽。

    3. 向下轉動鎖銷、使其與提升板上的金屬板齊平。

步驟4:更換夾層卡

夾層卡位於提升卡編號3(插槽4和5)下。您必須移除該擴充卡、才能存取夾層卡、更換夾層卡、然後重新安裝3號擴充卡。如需詳細資訊、請參閱控制器模組上的FRU對應。

您可以使用下列動畫、圖例或書面步驟來更換夾層卡。

動畫-更換夾層卡
DRW A400更換夾層卡

編號 1

PCI 擴充卡

編號 2

轉接器指旋螺絲

編號 3

擴充卡

  1. 移除第3號擴充卡(插槽4和5):

    1. 按下通風管兩側的鎖定彈片、將通風管滑向控制器模組背面、然後將其旋轉至完全開啟的位置、以開啟通風管。

    2. 移除PCIe卡中的任何SFP或QSFP模組。

    3. 向上轉動提升板左側的提升板鎖定栓、並朝通風管方向轉動。

      提升板會從控制器模組稍微向上提升。

    4. 將擴充卡向上提起、然後將其放在穩固的平面上。

  2. 更換夾層卡:

    1. 從卡中取出所有QSFP或SFP模組。

    2. 旋鬆夾層卡上的指旋螺絲、然後將插卡從插槽中直接輕拉出、並放在一旁。

    3. 將替換的夾層卡對準插槽和導引腳、然後將插卡輕推入插槽。

    4. 鎖緊夾層卡上的指旋螺絲。

  3. 重新安裝擴充卡:

    1. 將擴充卡與擴充卡插槽側邊的插腳對齊、將擴充卡向下壓到插腳上。

    2. 將擴充卡正面推入主機板上的插槽。

    3. 向下轉動鎖銷、使其與提升板上的金屬板齊平。

步驟5:安裝控制器模組

在控制器模組中更換元件之後、您必須將控制器模組重新安裝到機箱中、然後將其開機至維護模式。

  1. 如果您尚未這麼做、請關閉通風管。

  2. 將控制器模組的一端與機箱的開口對齊、然後將控制器模組輕推至系統的一半。

    註 在指示之前、請勿將控制器模組完全插入機箱。
  3. 視需要重新安裝系統。

    如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。

  4. 完成控制器模組的安裝:

    1. 將電源線插入電源供應器、重新安裝電源線鎖環、然後將電源供應器連接至電源。

    2. 使用鎖定鎖條、將控制器模組穩固地推入機箱、直到其與中間背板接入並完全就位。

      控制器模組完全就位時、鎖定鎖條會上升。

      註 將控制器模組滑入機箱時、請勿過度施力、以免損壞連接器。

    控制器模組一旦完全插入機箱、就會開始開機。準備好中斷開機程序。

    1. 將鎖定鎖條向上轉動、將鎖定鎖條向內傾、使其脫離鎖定插銷、將控制器推入到底、然後將鎖定鎖條向下推入鎖定位置、以將控制器模組完全裝入機箱。

    2. 如果您尚未重新安裝纜線管理裝置、請重新安裝。

    3. 中斷正常開機程序、然後按「Ctrl-C」開機至載入器。

      註 如果系統在開機功能表停止、請選取開機至載入器選項。
    4. 在載入程式提示下、輸入「bye」重新初始化PCIe卡和其他元件、然後讓控制器重新開機。

  5. 將控制器恢復正常運作、方法是歸還儲存設備:「torage容錯移轉恢復-ofnode_disapped_node_name_」

  6. 如果停用自動還原、請重新啟用:「儲存容錯移轉修改節點本機-自動恢復true」

步驟6:將控制器模組還原為運作狀態

若要還原控制器、您必須重新啟動系統、歸還控制器模組、然後重新啟用自動還原。

  1. 視需要重新安裝系統。

    如果您移除媒體轉換器(QSFP或SFP)、請記得在使用光纖纜線時重新安裝。

  2. 將控制器恢復正常運作、方法是歸還儲存設備:「torage容錯移轉恢復-ofnode_disapped_node_name_」

  3. 如果停用自動還原、請重新啟用:「儲存容錯移轉修改節點本機-自動恢復true」

步驟7:在雙節點MetroCluster 的不二組態中切換回集合體

完成雙節點MetroCluster 的故障恢復組態中的FRU更換之後、您就可以執行MetroCluster 還原還原作業。這會將組態恢復至正常運作狀態、使先前受損站台上的同步來源儲存虛擬機器(SVM)現在處於作用中狀態、並從本機磁碟集區提供資料。

此工作僅適用於雙節點MetroCluster 的不完整組態。

步驟
  1. 驗證所有節點是否都處於「啟用」狀態:MetroCluster 「顯示節點」

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. 確認所有SVM上的重新同步已完成:MetroCluster 「Svserver show」

  3. 驗證修復作業所執行的任何自動LIF移轉是否已成功完成:「MetroCluster 還原檢查LIF show」

  4. 從存續叢集中的任何節點使用「MetroCluster 還原」命令執行切換。

  5. 確認切換作業已完成:MetroCluster 「不顯示」

    當叢集處於「等待切換」狀態時、切換回復作業仍在執行中:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    當叢集處於「正常」狀態時、即可完成切換作業:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    如果切換需要很長時間才能完成、您可以使用「MetroCluster show config-repl複 寫res同步 狀態show」命令來檢查進行中的基準狀態。

  6. 重新建立任何SnapMirror或SnapVault 不完整的組態。

步驟8:將故障零件歸還給NetApp

如套件隨附的RMA指示所述、將故障零件退回NetApp。請參閱 "產品退貨安培;更換" 頁面以取得更多資訊。