監控修復資料作業

10/01/2025

PDF

您可以使用以下方式監控修復作業的狀態 `repair-data`命令列中的腳本。

這些包括您手動啟動的作業，或StorageGRID作為退役程序的一部分自動啟動的作業。

如果您正在執行磁碟區復原作業，"在網格管理器中監控進度並查看這些作業的歷史記錄"反而。

監控狀態 `repair-data`根據您是否使用*複製資料*、*擦除編碼 (EC) 資料*或兩者來指派作業。

複製數據

若要取得重複修復的估計完成百分比，請新增 `show-replicated-repair-status`修復資料命令的選項。

repair-data show-replicated-repair-status
要確定修復是否完成：
1. 選擇 NODES > 正在修復的儲存節點 > ILM。
2. 查看評估部分中的屬性。修復完成後，Awaiting - All 屬性指示 0 個物件。
要更詳細監控修復情況：
1. 選擇*支援* > 工具 > 網格拓撲。
2. 選擇 grid > Storage Node being repaired > LDR > Data Store。
3. 盡可能結合使用以下屬性來確定複製修復是否完整。
  
  Cassandra 可能存在不一致，並且無法追蹤失敗的修復。
  - 嘗試修復 (XRPA)：使用此屬性來追蹤重複修復的進度。每次儲存節點嘗試修復高風險物件時，此屬性都會增加。當此屬性在比當前掃描週期（由*掃描週期-估計*屬性提供）更長的時間內沒有增加時，表示 ILM 掃描未在任何節點上發現需要修復的高風險物件。
    
    高風險物體是指有完全失去風險的物體。這不包括不滿足其 ILM 配置的物件。
  - 掃描週期－估計值（XSCM）：使用此屬性估計何時將策略變更套用至先前攝取的物件。如果「嘗試修復」屬性在比目前掃描週期更長的時間內沒有增加，則很可能進行了重複修復。請注意，掃描週期可能會變更。 掃描週期－估計值 (XSCM) 屬性適用於整個網格，並且是所有節點掃描週期的最大值。您可以查詢網格的*掃描週期－估計*屬性歷史記錄來決定適當的時間範圍。

清除編碼 (EC) 數據

要監控擦除編碼資料的修復並重試任何可能失敗的請求：

確定擦除編碼資料修復的狀態：
- 選擇 SUPPORT > Tools > Metrics 來查看目前作業的預計完成時間和完成百分比。然後，在 Grafana 部分中選擇 EC Overview。查看*Grid EC 作業預計完成時間*和*Grid EC 作業完成百分比*儀表板。
- 使用此命令查看特定 `repair-data`手術：
  
  repair-data show-ec-repair-status --repair-id repair ID
- 使用此命令列出所有修復：
  
  repair-data show-ec-repair-status
輸出列出訊息，包括 repair ID，適用於所有之前和目前正在進行的維修。
如果輸出顯示修復操作失敗，請使用 `--repair-id`選項來重試修復。

此指令使用修復 ID 6949309319275667690 重試失敗的節點修復：

repair-data start-ec-node-repair --repair-id 6949309319275667690

此指令使用修復 ID 6949309319275667690 重試失敗的磁碟區修復：

repair-data start-ec-volume-repair --repair-id 6949309319275667690

監控修復資料作業

Creating your file...