Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

新增儲存節點後、重新平衡以銷毀編碼的資料

貢獻者

新增儲存節點之後、您可以使用 EC 重新平衡程序、在現有和新的儲存節點之間重新分配銷毀編碼片段。

開始之前
  • 您已完成新增儲存節點的擴充步驟。

  • 您已檢閱 "重新平衡銷毀編碼資料的考量事項"

  • 您瞭解複寫的物件資料將不會透過此程序移動、而且在決定移除編碼資料的位置時、EC重新平衡程序不會考慮每個儲存節點上的複寫資料使用量。

  • 您擁有 Passwords.txt 檔案:

執行此程序時會發生什麼情況

開始程序之前、請注意下列事項:

  • 如果一或多個磁碟區離線(未掛載)、或是它們在線上(掛載)但處於錯誤狀態、則 EC 重新平衡程序將不會啟動。

  • EC重新平衡程序會暫時保留大量的儲存空間。儲存警示可能會觸發、但會在重新平衡完成時解決。如果保留空間不足、EC重新平衡程序將會失敗。無論程序失敗或成功、在EC重新平衡程序完成時、都會釋出儲存保留。

  • 如果磁碟區離線、或在 EC 重新平衡進行期間發生錯誤、重新平衡程序會部分結束、不會遺失資料。當所有磁碟區都在線上且無錯誤時、 EC 重新平衡程序可在終止時恢復。

  • 當執行 EC 重新平衡程序時、 ILM 作業和 S3 及 Swift 用戶端作業的效能可能會受到影響。

    註 若要上傳物件(或物件零件)、S3和Swift API作業可能會在EC重新平衡程序期間失敗、但需要24小時以上才能完成。如果適用的 ILM 規則在擷取上使用平衡或嚴格的放置方式、則長時間的放置作業將會失敗。將報告下列錯誤: 500 Internal Server Error
步驟
  1. [[ree_object_storage ]檢閱您計畫重新平衡之站台的目前物件儲存詳細資料。

    1. 選擇*節點*。

    2. 選取站台的第一個儲存節點。

    3. 選擇* Storage*(儲存設備)選項卡。

    4. 將游標放在「已使用的儲存空間 - 物件資料」圖表上、即可查看儲存節點上目前的複寫資料量和銷毀編碼資料量。

    5. 重複這些步驟、即可檢視站台上的其他儲存節點。

  2. 登入主要管理節點:

    1. 輸入下列命令: ssh admin@primary_Admin_Node_IP

    2. 輸入中所列的密碼 Passwords.txt 檔案:

    3. 輸入下列命令以切換至root: su -

    4. 輸入中所列的密碼 Passwords.txt 檔案:

      當您以root登入時、提示會從變更 $#

  3. 開始以下程序:

    rebalance-data start --site "site-name"

    適用於 "site-name"`下,指定您新增儲存節點或節點的第一個站台。封閉 `site-name 在報價中。

    EC重新平衡程序隨即開始、並傳回工作ID。

  4. 複製工作ID。

  5. 監控EC重新平衡程序的狀態。

    • 若要檢視單一EC重新平衡程序的狀態:

      rebalance-data status --job-id job-id

      適用於 `job-id`下,指定開始程序時傳回的ID。

    • 若要檢視目前EC重新平衡程序的狀態、以及任何先前完成的程序:

      rebalance-data status

    註

    若要取得有關reBalance-data命令的說明:

    rebalance-data --help

  6. 根據傳回的狀態執行其他步驟:

    • 如果狀態為 In progress、EC重新平衡作業仍在執行中。您應該定期監控程序、直到程序完成為止。

      若要檢視目前工作的預估完成時間和完成百分比:

      1. 選取*支援*>*工具*>*指標*。

      2. 在 Grafana 區段中選取 * EC Overview * 。

      3. 請參閱* Grid EC工作預估完成時間*和* Grid EC工作百分比已完成*儀表板。

    • 如果狀態為 Success(可選) 檢閱物件儲存 以查看網站的更新詳細資料。

      在站台的儲存節點之間、銷毀編碼的資料現在應該更為平衡。

    提示

    如果出現下列訊息、請再次執行 EC 重新平衡程序、直到所有刪除編碼的資料重新平衡為止:

    The moves in this rebalance job have been limited. To rebalance additional data, start EC rebalance again for the same site.

    • 如果狀態為 Failure

      1. 確認站台上的所有儲存節點均已連線至網格。

      2. 檢查並解決可能影響這些儲存節點的任何警示。

      3. 重新啟動 EC 重新平衡程序:

        rebalance-data start –-job-id job-id

      4. 如果EC重新平衡程序的狀態仍然存在 `Failure`請聯絡技術支援部門。

  7. 如果EC重新平衡程序產生過多負載(例如、擷取作業會受到影響)、請暫停程序。

    rebalance-data pause --job-id job-id

  8. 如果您需要終止EC重新平衡程序(例如、您可以執行StorageGRID 更新版的程式碼)、請輸入下列命令:

    rebalance-data terminate --job-id job-id

    註 當您終止EC重新平衡程序時、任何已移動的資料片段都會保留在新位置。資料不會移回原始位置。
  9. 如果您在多個站台使用銷毀編碼、請針對所有其他受影響的站台執行此程序。