取消委任中斷連線的網格節點
您可能需要取消委任目前未連線至網格的節點(健全狀況為未知或管理性關閉的節點)。
-
您已取得所有必要項目。
-
您已確保沒有任何資料修復工作處於作用中狀態。請參閱。 "檢查資料修復工作"
-
您已確認儲存節點還原在網格中的任何位置均未進行。如果是、您必須等到恢復完成時執行任何Cassandra重新建置。然後您可以繼續解除委任。
-
您已確保在節點取消委任程序執行期間不會執行其他維護程序、除非節點取消委任程序暫停。
-
您要取消委任的中斷節點的*可能取消委任*欄會包含綠色核取符號。
-
您有資源配置通關密碼。
您可以在 Health 欄中尋找藍色的未知圖示或灰色的管理性關閉圖示
、來識別中斷連線的節點
。
在解除委任任何中斷連線的節點之前、請注意下列事項:
-
此程序主要用於移除單一中斷連線的節點。如果您的網格包含多個中斷連線的節點、則軟體會要求您同時取消委任所有節點、進而增加意外結果的可能性。
如果您一次取消委任多個中斷連線的儲存節點、可能會導致資料遺失。請參閱。 "中斷連線儲存節點的考量事項" 在包含僅軟體中繼資料節點的網格中取消委任儲存節點時、請務必謹慎。如果您取消委任所有設定為儲存物件和中繼資料的節點、則儲存物件的能力會從網格中移除。如需僅中繼資料儲存節點的詳細資訊、請參閱"儲存節點類型"。 -
如果無法移除中斷連線的節點(例如、 ADC 仲裁所需的儲存節點)、則無法移除其他中斷連線的節點。
-
除非您正在解除委任歸檔節點(必須中斷連線)、否則請嘗試將任何中斷連線的網格節點恢復上線或恢復。
如需相關指示、請參閱 "網格節點還原程序" 。
-
如果您無法恢復已中斷連線的網格節點、而且想要在中斷連線時將其取消委任、請選取該節點的核取方塊。
如果您的網格包含多個中斷連線的節點、則軟體會要求您同時取消委任所有節點、進而增加意外結果的可能性。 選擇一次取消委任多個中斷連線的網格節點時、請務必小心、尤其是當您選擇多個中斷連線的儲存節點時。如果您有多個無法恢復的已中斷連線儲存節點、請聯絡技術支援部門、以決定最佳的行動方針。 -
輸入資源配置通關密碼。
「開始取消委任」按鈕已啟用。
-
按一下*開始取消委任*。
此時會出現一則警告、指出您已選取中斷連線的節點、而且如果節點只有物件複本、該物件資料將會遺失。
-
檢閱節點清單、然後按一下「確定」。
退役程序開始,並顯示每個節點的進度。在此過程中,將產生一個包含電網配置變更的新復原包。
-
一旦新的恢復包可用,請點擊連結或選擇*維護*>*系統*>*恢復包*以訪問恢復包頁面。然後,下載 `.zip`文件。
請參閱說明"下載恢復包"。
盡快下載恢復包,以確保在退役過程中出現問題時可以恢復電網。 復原包檔案必須是安全的,因為它包含可用於從StorageGRID系統取得資料的加密金鑰和密碼。 -
定期監控「取消委任」頁面、確保所有選取的節點都能順利停用。
儲存節點可能需要數天或數週的時間才能取消委任。當所有工作都完成時、會重新顯示節點選擇清單、並顯示成功訊息。如果您停用中斷連線的儲存節點、會出現一則資訊訊息、指出修復工作已啟動。
-
當節點在取消委任程序中自動關機之後、請移除任何其他與停用節點相關的虛擬機器或其他資源。
在節點自動關機之前、請勿執行此步驟。 -
如果您要解除委任儲存節點、請監控在解除委任程序期間自動啟動的*複寫資料*和*銷毀編碼(EC)資料*修復工作狀態。
-
若要取得複寫修復的估計完成百分比、請將選項新增 `show-replicated-repair-status`至 repair 資料命令。
repair-data show-replicated-repair-status -
若要判斷維修是否完成:
-
選擇 節點 > 正在修復的儲存節點 > ILM。
-
檢閱「評估」區段中的屬性。當修復完成時、「等待-全部」屬性會指出0個物件。
-
-
若要更詳細地監控維修:
-
選擇*節點*。
-
選擇*網格名稱_*>* ILM *。
-
將遊標放在 ILM 佇列圖上,查看 掃描速率(物件/秒) 屬性的值,該值是網格中物件被掃描並排隊等待 ILM 的速率。
-
在 ILM 佇列部分中,查看以下屬性:
-
* 掃描週期 - 預估 * :完成所有物件完整 ILM 掃描的預估時間。
全面掃描並不能保證 ILM 已套用於所有物件。
-
嘗試修復:針對被視為高風險的複製資料嘗試的物件修復操作的總數。高風險對像是任何僅剩一個副本的對象,無論是由 ILM 策略指定的還是由於副本遺失造成的。每次儲存節點嘗試修復高風險物件時,此計數都會增加。如果電網變得繁忙,則優先進行高風險的 ILM 修復。
如果修復後複製失敗,則相同物件修復可能會再次增加。 + 當您監控儲存節點磁碟區復原的進度時,這些屬性非常有用。如果嘗試修復的次數停止增加並且完整掃描已完成,則修復可能已完成。
-
-
或者,提交 Prometheus 查詢
storagegrid_ilm_scan_period_estimated_minutes`和 `storagegrid_ilm_repairs_attempted。
-
若要監控銷毀編碼資料的修復、然後重試任何可能失敗的要求:
-
判斷銷毀編碼資料修復的狀態:
-
選擇「支援」>「工具」>「指標」來查看目前作業的預計完成時間和完成百分比。然後,在 Grafana 部分中選擇 EC Overview。查看*Grid EC 作業預計完成時間*和*Grid EC 作業完成百分比*儀表板。
-
使用此命令查看特定作業的狀態
repair-data:repair-data show-ec-repair-status --repair-id repair ID -
使用此命令列出所有修復:
repair-data show-ec-repair-status
輸出會列出所有先前和目前正在執行的修復的資訊、包括
repair ID。 -
-
如果輸出顯示修復作業失敗、請使用 `--repair-id`選項重試修復。
此命令會使用修復ID 6949309319275667690、重試失敗的節點修復:
repair-data start-ec-node-repair --repair-id 6949309319275667690此命令會使用修復ID 6949309319275667690重試失敗的Volume修復:
repair-data start-ec-volume-repair --repair-id 6949309319275667690
一旦中斷連線的節點已停用、而且所有資料修復工作都已完成、您就可以視需要取消委任任何已連線的網格節點。
然後在完成取消委任程序後、完成下列步驟:
-
請確保已淘汰的網格節點磁碟機已清除。使用市售的資料抹除工具或服務、永久且安全地移除磁碟機中的資料。
-
如果您停用了某個應用裝置節點、但設備上的資料是使用節點加密來保護、請使用StorageGRID 此應用裝置安裝程式來清除金鑰管理伺服器組態(清除KMS)。如果您要將應用裝置新增至其他網格、則必須清除KMS組態。有關說明,請參閱 "在維護模式中監控節點加密"。