退役斷開連接的電網節點
您可能需要停用目前未連接到電網的節點(健康狀況未知或管理關閉的節點)。
-
您已獲得所有先決條件物品。
-
您已確保沒有處於活動狀態的資料修復作業。看"檢查資料修復作業" 。
-
您已確認網格中任何地方均未進行儲存節點復原。如果是,您必須等到作為復原的一部分執行的任何 Cassandra 重建完成。然後您可以繼續進行退役。
-
您已確保在節點退役程序運行時不會運行其他維護程序,除非節點退役程序暫停。
-
您想要退役的已斷開節點的「可能退役」欄位包含綠色複選標記。
-
您有配置密碼。
您可以透過尋找藍色的「未知」圖示來識別斷開連接的節點
或灰色的“管理關閉”圖標
在*健康*欄位中。
在停用任何斷開連接的節點之前,請注意以下事項:
-
此過程主要用於刪除單一斷開的節點。如果您的電網包含多個斷開連接的節點,軟體會要求您同時將它們全部停用,這會增加意外結果的可能性。
如果一次停用多個斷開連接的儲存節點,則可能會發生資料遺失。看"斷開連接的儲存節點的注意事項" 。 在包含基於軟體的純元資料節點的網格中停用儲存節點時請務必小心。如果您停用所有配置為儲存物件和元資料的節點,則儲存物件的能力將從網格中刪除。看"儲存節點的類型"有關僅元資料儲存節點的詳細資訊。 -
如果無法刪除斷開連線的節點(例如,ADC 仲裁所需的儲存節點),則無法刪除其他已中斷連線的節點。
-
除非您要停用存檔節點(必須斷開連接),否則請嘗試將任何斷開連接的網格節點重新連線或還原它們。
看"網格節點復原程序"以取得說明。
-
如果您無法恢復斷開連接的網格節點,並且想要在斷開連接時將其退役,請選取該節點的核取方塊。
如果您的電網包含多個斷開連接的節點,軟體會要求您同時將它們全部停用,這會增加意外結果的可能性。 選擇一次退役多個斷開連接的網格節點時要小心,特別是當您選擇多個斷開連接的儲存節點時。如果您有多個無法恢復的斷開連接的儲存節點,請聯絡技術支援以確定最佳的措施。 -
輸入配置密碼。
*開始退役*按鈕已啟用。
-
點選*開始退役*。
出現一條警告,表示您選擇了一個斷開連接的節點,並且如果該節點具有物件的唯一副本,則物件資料將遺失。
-
查看節點列表,然後按一下「確定」。
退役程序開始,並顯示每個節點的進度。在此過程中,將產生一個包含電網配置變更的新復原包。
-
一旦新的恢復包可用,請點擊連結或選擇*維護*>*系統*>*恢復包*以訪問恢復包頁面。然後,下載 `.zip`文件。
請參閱說明"下載恢復包"。
盡快下載恢復包,以確保在退役過程中出現問題時可以恢復電網。 復原包檔案必須是安全的,因為它包含可用於從StorageGRID系統取得資料的加密金鑰和密碼。 -
定期監控退役頁面,以確保所有選定的節點都已成功退役。
儲存節點可能需要幾天或幾週的時間才能退役。當所有任務完成後,節點選擇清單將重新顯示並顯示成功訊息。如果您停用了已中斷連線的儲存節點,則會顯示一則訊息訊息,表示修復作業已啟動。
-
在節點作為退役過程的一部分自動關閉後,刪除與退役節點關聯的任何剩餘虛擬機器或其他資源。
在節點自動關閉之前請勿執行此步驟。 -
如果您要退役儲存節點,請監控在退役過程中自動啟動的*複製資料*和*清除編碼 (EC) 資料*修復作業的狀態。
-
若要取得重複修復的估計完成百分比,請新增 `show-replicated-repair-status`修復資料命令的選項。
repair-data show-replicated-repair-status -
要確定修復是否完成:
-
選擇 NODES > 正在修復的儲存節點 > ILM。
-
查看評估部分中的屬性。修復完成後,Awaiting - All 屬性指示 0 個物件。
-
-
要更詳細監控修復情況:
-
選擇*支援* > 工具 > 網格拓撲。
-
選擇 grid > Storage Node being repaired > LDR > Data Store。
-
盡可能結合使用以下屬性來確定複製修復是否完整。
Cassandra 可能存在不一致,並且無法追蹤失敗的修復。 -
嘗試修復 (XRPA):使用此屬性來追蹤重複修復的進度。每次儲存節點嘗試修復高風險物件時,此屬性都會增加。當此屬性在比當前掃描週期(由*掃描週期-估計*屬性提供)更長的時間內沒有增加時,表示 ILM 掃描未在任何節點上發現需要修復的高風險物件。
高風險物體是指有完全失去風險的物體。這不包括不滿足其 ILM 配置的物件。 -
掃描週期-估計值(XSCM):使用此屬性估計何時將策略變更套用至先前攝取的物件。如果「嘗試修復」屬性在比目前掃描週期更長的時間內沒有增加,則很可能進行了重複修復。請注意,掃描週期可能會變更。 掃描週期-估計值 (XSCM) 屬性適用於整個網格,並且是所有節點掃描週期的最大值。您可以查詢網格的*掃描週期-估計*屬性歷史記錄來決定適當的時間範圍。
-
-
要監控擦除編碼資料的修復並重試任何可能失敗的請求:
-
確定擦除編碼資料修復的狀態:
-
選擇 SUPPORT > Tools > Metrics 來查看目前作業的預計完成時間和完成百分比。然後,在 Grafana 部分中選擇 EC Overview。查看*Grid EC 作業預計完成時間*和*Grid EC 作業完成百分比*儀表板。
-
使用此命令查看特定 `repair-data`手術:
repair-data show-ec-repair-status --repair-id repair ID -
使用此命令列出所有修復:
repair-data show-ec-repair-status
輸出列出訊息,包括
repair ID,適用於所有之前和目前正在進行的維修。 -
-
如果輸出顯示修復操作失敗,請使用 `--repair-id`選項來重試修復。
此指令使用修復 ID 6949309319275667690 重試失敗的節點修復:
repair-data start-ec-node-repair --repair-id 6949309319275667690此指令使用修復 ID 6949309319275667690 重試失敗的磁碟區修復:
repair-data start-ec-volume-repair --repair-id 6949309319275667690
一旦斷開連接的節點退役並且所有資料修復工作都已完成,您就可以根據需要退役任何連接的網格節點。
然後,在完成退役程序後完成以下步驟:
-
確保已退役的網格節點的磁碟機已清除。使用市售的資料擦除工具或服務永久安全地從磁碟機中刪除資料。
-
如果您停用了裝置節點,且裝置上的資料使用節點加密進行保護,請使用StorageGRID設備安裝程式清除金鑰管理伺服器設定(清除 KMS)。如果要將設備新增至另一個網格,則必須清除 KMS 配置。有關說明,請參閱 "維護模式下監控節點加密"。