Rebalancear os dados codificados por apagamento após adicionar nós de storage
Depois de adicionar nós de storage, use o procedimento de rebalancear para redistribuir fragmentos codificados por apagamento entre os nós de storage atuais e novos.
-
Você concluiu as etapas de expansão para adicionar os novos nós de storage.
-
Você revisou o "considerações para rebalanceamento de dados codificados por apagamento".
-
Você entende que os dados de objeto replicados não serão movidos por este procedimento e que o procedimento de rebalancear EC não considera o uso de dados replicados em cada nó de storage ao determinar onde mover dados codificados por apagamento.
-
Você tem o
Passwords.txt
arquivo.
Antes de iniciar o procedimento, tome nota do seguinte:
-
O procedimento de reequilíbrio EC não será iniciado se um ou mais volumes estiverem offline (desmontados) ou se estiverem online (montados), mas em estado de erro.
-
O procedimento de reequilíbrio CE reserva temporariamente uma grande quantidade de armazenamento. Os alertas de storage podem ser acionados, mas serão resolvidos quando o rebalancear for concluído. Se não houver armazenamento suficiente para a reserva, o procedimento de reequilíbrio CE falhará. As reservas de armazenamento são liberadas quando o procedimento de reequilíbrio CE for concluído, independentemente de o procedimento ter falhado ou ter êxito.
-
Se um volume ficar offline ou sofrer um erro enquanto um reequilíbrio EC estiver em processo, o processo de reequilíbrio será concluído parcialmente sem perda de dados. O procedimento de reequilíbrio CE pode ser retomado no ponto em que termina quando todos os volumes estão online sem erros.
-
Quando o procedimento de reequilíbrio EC está em execução, o desempenho das operações ILM e das operações dos clientes S3 e Swift pode ser afetado.
As operações S3 e Swift API para carregar objetos (ou partes de objetos) podem falhar durante o procedimento de rebalanceamento EC se precisarem de mais de 24 horas para serem concluídas. As OPERAÇÕES PUT de longa duração falharão se a regra ILM aplicável usar um posicionamento equilibrado ou rigoroso na ingestão. O seguinte erro será comunicado: 500 Internal Server Error
.
-
Revise os detalhes de armazenamento de objetos atuais para o site que você planeja reequilibrar.
-
Selecione NODES.
-
Selecione o primeiro nó de storage no local.
-
Selecione a guia armazenamento.
-
Posicione o cursor sobre o gráfico Storage Used - Object Data (armazenamento usado - dados de objetos) para ver a quantidade atual de dados replicados e dados codificados por apagamento no Storage Node.
-
Repita estas etapas para exibir os outros nós de storage no local.
-
-
Faça login no nó de administração principal:
-
Introduza o seguinte comando:
ssh admin@primary_Admin_Node_IP
-
Introduza a palavra-passe listada no
Passwords.txt
ficheiro. -
Digite o seguinte comando para mudar para root:
su -
-
Introduza a palavra-passe listada no
Passwords.txt
ficheiro.Quando você estiver conetado como root, o prompt mudará de
$
para#
.
-
-
Inicie o procedimento:
rebalance-data start --site "site-name"
Para
"site-name"
, especifique o primeiro local em que você adicionou novos nós ou nós de storage. Incluasite-name
em citações.O procedimento de reequilíbrio EC é iniciado e um ID de tarefa é retornado.
-
Copie a ID do trabalho.
-
Acompanhar o estado do procedimento de reequilíbrio CE.
-
Para visualizar o estado de um procedimento único de reequilíbrio CE:
rebalance-data status --job-id job-id
Para
job-id
, especifique o ID que foi retornado quando você iniciou o procedimento. -
Para visualizar o estado do atual procedimento de reequilíbrio CE e de quaisquer procedimentos concluídos anteriormente:
rebalance-data status
Para obter ajuda sobre o comando rebalanceamento-data:
rebalance-data --help
-
-
Execute etapas adicionais, com base no status retornado:
-
Se o estado indicar
In progress
, a operação de reequilíbrio CE continua a funcionar. Você deve monitorar periodicamente o procedimento até que ele seja concluído.Para visualizar o tempo estimado até à conclusão e a percentagem de conclusão do trabalho atual:
-
Selecione SUPPORT > Tools > Metrics.
-
Selecione Visão geral da EC na seção Grafana.
-
Veja os painéis Grid EC Job tempo estimado para conclusão e Grid EC Job percentage Completed.
-
-
Se o status for
Success
, opcionalmente revise o armazenamento de objetos para ver os detalhes atualizados do site.Agora, os dados codificados por apagamento devem ser mais equilibrados entre os nós de storage no local.
Se a seguinte mensagem for exibida, execute o procedimento de rebalanceamento EC até que todos os dados codificados de apagamento sejam rebalanceados:
The moves in this rebalance job have been limited. To rebalance additional data, start EC rebalance again for the same site.
-
Se o estado for
Failure
:-
Confirme se todos os nós de storage no local estão conetados à grade.
-
Verifique e resolva quaisquer alertas que possam estar afetando esses nós de storage.
-
Reiniciar o procedimento EC Rebalanceance
rebalance-data start –-job-id job-id
-
Se o estado do procedimento de reequilíbrio CE persistir
Failure
, contactar o suporte técnico.
-
-
-
Se o procedimento de reequilíbrio EC estiver gerando muita carga (por exemplo, as operações de ingestão são afetadas), interrompa o procedimento.
rebalance-data pause --job-id job-id
-
Se você precisar encerrar o procedimento de rebalanceamento EC (por exemplo, para que você possa executar uma atualização de software StorageGRID), digite o seguinte:
rebalance-data terminate --job-id job-id
Quando você encerrar um procedimento de rebalanceamento do EC, todos os fragmentos de dados que já foram movidos permanecem no novo local. Os dados não são movidos de volta para o local original. -
Se você estiver usando codificação de apagamento em mais de um site, execute este procedimento para todos os outros sites afetados.