Responder a um evento de desempenho dinâmico causado por uma falha de disco
Você pode usar o Unified Manager para investigar um evento de desempenho causado por cargas de trabalho que utilizam excessivamente um agregado. Você também pode usar o Unified Manager para verificar a integridade do agregado e ver se eventos de integridade recentes detectados no agregado contribuíram para o evento de desempenho.
-
Você deve ter a função de Operador, Administrador de Aplicativos ou Administrador de Armazenamento.
-
Deve haver eventos de performance novos, reconhecidos ou obsoletos.
-
Exiba a página Detalhes do evento para visualizar informações sobre o evento.
-
Leia a Descrição, que descreve as cargas de trabalho envolvidas no evento e o componente do cluster em contenção.
Há vários volumes de vítimas cuja latência foi impactada pelo componente do cluster em contenção. O agregado, que está no meio de uma reconstrução RAID para substituir o disco com falha por um disco reserva, é o componente do cluster em disputa. Em Componente em Contenção, o ícone Agregado é destacado em vermelho e o nome do agregado é exibido entre parênteses.
-
No gráfico Utilização da carga de trabalho, selecione Cargas de trabalho intensas.
-
Passe o cursor sobre o gráfico para visualizar as principais cargas de trabalho agressivas que estão afetando o componente.
As principais cargas de trabalho com maior pico de utilização desde que o evento foi detectado são exibidas na parte superior do gráfico. Uma das principais cargas de trabalho é a carga de trabalho definida pelo sistema Disk Health, que indica uma reconstrução RAID. Uma reconstrução é o processo interno envolvido na reconstrução do agregado com o disco sobressalente. A carga de trabalho do Disk Health, juntamente com outras cargas de trabalho no agregado, provavelmente causou a contenção no agregado e o evento associado.
-
Após confirmar que a atividade da carga de trabalho do Disk Health causou o evento, aguarde aproximadamente 30 minutos para que a reconstrução seja concluída e para que o Unified Manager analise o evento e detecte se o agregado ainda está em contenção.
-
Atualize os Detalhes do evento.
Após a conclusão da reconstrução do RAID, verifique se o Estado está obsoleto, indicando que o evento foi resolvido.
-
No gráfico Utilização da carga de trabalho, selecione Cargas de trabalho intensas para visualizar as cargas de trabalho agregadas por pico de utilização.
-
Na área Ações sugeridas, clique no botão Analisar carga de trabalho para a carga de trabalho principal.
-
Na página Análise de carga de trabalho, defina o Intervalo de tempo para exibir as últimas 24 horas (1 dia) de dados para o volume selecionado.
Na Linha do Tempo do Evento, um ponto vermelho (
) indica quando ocorreu o evento de falha do disco.
-
No gráfico Utilização de Nós e Agregados, oculte a linha das estatísticas de Nós para que apenas a linha Agregados permaneça.
-
Compare os dados neste gráfico com os dados no momento do evento no gráfico Latência.
No momento do evento, a Utilização Agregada mostra uma alta quantidade de atividade de leitura e gravação, causada pelos processos de reconstrução do RAID, o que aumentou a latência do volume selecionado. Algumas horas após o evento, tanto as leituras quanto as gravações e a latência diminuíram, confirmando que o agregado não está mais em disputa.