Skip to main content
Uma versão mais recente deste produto está disponível.
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Rebalancear os dados codificados por apagamento após adicionar nós de storage

Colaboradores

Depois de adicionar nós de storage, use o procedimento de rebalancear para redistribuir fragmentos codificados por apagamento entre os nós de storage atuais e novos.

Antes de começar
  • Você concluiu as etapas de expansão para adicionar os novos nós de storage.

  • Você revisou o "considerações para rebalanceamento de dados codificados por apagamento".

  • Você entende que os dados de objeto replicados não serão movidos por este procedimento e que o procedimento de rebalancear EC não considera o uso de dados replicados em cada nó de storage ao determinar onde mover dados codificados por apagamento.

  • Você tem o Passwords.txt arquivo.

O que acontece quando este procedimento é executado

Antes de iniciar o procedimento, tome nota do seguinte:

  • O procedimento de reequilíbrio EC não será iniciado se um ou mais volumes estiverem offline (desmontados) ou se estiverem online (montados), mas em estado de erro.

  • O procedimento de reequilíbrio CE reserva temporariamente uma grande quantidade de armazenamento. Os alertas de storage podem ser acionados, mas serão resolvidos quando o rebalancear for concluído. Se não houver armazenamento suficiente para a reserva, o procedimento de reequilíbrio CE falhará. As reservas de armazenamento são liberadas quando o procedimento de reequilíbrio CE for concluído, independentemente de o procedimento ter falhado ou ter êxito.

  • Se um volume ficar offline ou sofrer um erro enquanto um reequilíbrio EC estiver em processo, o processo de reequilíbrio será concluído parcialmente sem perda de dados. O procedimento de reequilíbrio CE pode ser retomado no ponto em que termina quando todos os volumes estão online sem erros.

  • Quando o procedimento de reequilíbrio EC está em execução, o desempenho das operações ILM e das operações dos clientes S3 e Swift pode ser afetado.

    Observação As operações S3 e Swift API para carregar objetos (ou partes de objetos) podem falhar durante o procedimento de rebalanceamento EC se precisarem de mais de 24 horas para serem concluídas. As OPERAÇÕES PUT de longa duração falharão se a regra ILM aplicável usar um posicionamento equilibrado ou rigoroso na ingestão. O seguinte erro será comunicado: 500 Internal Server Error.
Passos
  1. Revise os detalhes de armazenamento de objetos atuais para o site que você planeja reequilibrar.

    1. Selecione NODES.

    2. Selecione o primeiro nó de storage no local.

    3. Selecione a guia armazenamento.

    4. Posicione o cursor sobre o gráfico Storage Used - Object Data (armazenamento usado - dados de objetos) para ver a quantidade atual de dados replicados e dados codificados por apagamento no Storage Node.

    5. Repita estas etapas para exibir os outros nós de storage no local.

  2. Faça login no nó de administração principal:

    1. Introduza o seguinte comando: ssh admin@primary_Admin_Node_IP

    2. Introduza a palavra-passe listada no Passwords.txt ficheiro.

    3. Digite o seguinte comando para mudar para root: su -

    4. Introduza a palavra-passe listada no Passwords.txt ficheiro.

      Quando você estiver conetado como root, o prompt mudará de $ para #.

  3. Inicie o procedimento:

    rebalance-data start --site "site-name"

    Para "site-name", especifique o primeiro local em que você adicionou novos nós ou nós de storage. Inclua site-name em citações.

    O procedimento de reequilíbrio EC é iniciado e um ID de tarefa é retornado.

  4. Copie a ID do trabalho.

  5. Acompanhar o estado do procedimento de reequilíbrio CE.

    • Para visualizar o estado de um procedimento único de reequilíbrio CE:

      rebalance-data status --job-id job-id

      Para job-id, especifique o ID que foi retornado quando você iniciou o procedimento.

    • Para visualizar o estado do atual procedimento de reequilíbrio CE e de quaisquer procedimentos concluídos anteriormente:

      rebalance-data status

    Observação

    Para obter ajuda sobre o comando rebalanceamento-data:

    rebalance-data --help

  6. Execute etapas adicionais, com base no status retornado:

    • Se o estado indicar In progress, a operação de reequilíbrio CE continua a funcionar. Você deve monitorar periodicamente o procedimento até que ele seja concluído.

      Para visualizar o tempo estimado até à conclusão e a percentagem de conclusão do trabalho atual:

      1. Selecione SUPPORT > Tools > Metrics.

      2. Selecione Visão geral da EC na seção Grafana.

      3. Veja os painéis Grid EC Job tempo estimado para conclusão e Grid EC Job percentage Completed.

    • Se o status for Success, opcionalmente revise o armazenamento de objetos para ver os detalhes atualizados do site.

      Agora, os dados codificados por apagamento devem ser mais equilibrados entre os nós de storage no local.

    Dica

    Se a seguinte mensagem for exibida, execute o procedimento de rebalanceamento EC até que todos os dados codificados de apagamento sejam rebalanceados:

    The moves in this rebalance job have been limited. To rebalance additional data, start EC rebalance again for the same site.

    • Se o estado for Failure:

      1. Confirme se todos os nós de storage no local estão conetados à grade.

      2. Verifique e resolva quaisquer alertas que possam estar afetando esses nós de storage.

      3. Reiniciar o procedimento EC Rebalanceance

        rebalance-data start –-job-id job-id

      4. Se o estado do procedimento de reequilíbrio CE persistir Failure, contactar o suporte técnico.

  7. Se o procedimento de reequilíbrio EC estiver gerando muita carga (por exemplo, as operações de ingestão são afetadas), interrompa o procedimento.

    rebalance-data pause --job-id job-id

  8. Se você precisar encerrar o procedimento de rebalanceamento EC (por exemplo, para que você possa executar uma atualização de software StorageGRID), digite o seguinte:

    rebalance-data terminate --job-id job-id

    Observação Quando você encerrar um procedimento de rebalanceamento do EC, todos os fragmentos de dados que já foram movidos permanecem no novo local. Os dados não são movidos de volta para o local original.
  9. Se você estiver usando codificação de apagamento em mais de um site, execute este procedimento para todos os outros sites afetados.