Skip to main content
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Analise problemas de latência no Workload Factory para EDA

Colaboradores netapp-sineadd

Visualize os eventos de latência detectados e use ferramentas de análise automatizadas para identificar as causas principais e resolver gargalos de desempenho em seus volumes FSx para ONTAP.

Antes de começar

Você deve ter "monitoramento de latência configurado" antes de poder visualizar e analisar eventos de latência.

Visualizar eventos de latência

A tabela de eventos de latência fornece uma visão centralizada de todos os eventos de aviso e críticos detectados nas últimas 72 horas.

Sobre esta tarefa
  • Apenas a violação mais recente para cada volume é exibida. Se um volume sofrer múltiplas violações, apenas o evento mais recente será exibido.

  • Os eventos são removidos automaticamente após 72 horas.

  • São exibidos no máximo 200 eventos. Os eventos mais antigos são removidos à medida que novos eventos são adicionados.

  • Os eventos são exibidos mesmo que nenhum link esteja associado ao sistema de arquivos. Um link é necessário para visualizar detalhes básicos de análise e executar a análise do agente de IA.

Passos
  1. Faça login usando um dos seguintes métodos: "experiências de console".

  2. Selecione o menu O ícone do menu hambúrguer e depois selecione EDA.

  3. Selecione a guia Latência.

  4. Analise as informações de cada evento na tabela de eventos de latência.

  5. Para visualizar os detalhes de um evento de latência, selecione o evento na coluna Gravidade. Isso abrirá um painel de análise de latência para esse evento.

  6. Para classificar a tabela, selecione qualquer cabeçalho de coluna. Por padrão, os eventos críticos são exibidos primeiro, classificados por horário, seguidos pelos eventos de aviso, também classificados por horário.

  7. Para descartar um ou mais eventos, ao lado de cada evento selecione O ícone do menu de açõesDescartar.

  8. Para adicionar colunas à tabela, selecione O ícone da coluna, escolha as colunas e selecione Aplicar.

  9. Para analisar as tendências de latência ao longo do tempo, selecione um evento para abrir o painel de análise de latência. Use a guia Ao longo do tempo para visualizar o gráfico de latência interativo. Veja "Analisar tendências de latência" para mais detalhes.

Analisar um evento de latência

A análise básica ajuda você a identificar rapidamente a causa raiz dos problemas de latência sem investigação manual.

Painel de análise de latência

Selecione um evento de latência na coluna Gravidade para abrir o painel de análise de latência desse evento. O painel inclui guias que fornecem diferentes visualizações do evento de latência:

  • Visão geral: Exibe os resultados da análise básica mostrando qual componente está causando a latência

  • Ao longo do tempo: Exibe um gráfico de latência interativo com dados históricos

Guia Visão geral

A aba Visão geral exibe os resultados da análise básica automatizada, identificando qual componente está causando a latência.

Se um ARN de modelo do Amazon Bedrock estiver configurado, a guia Visão geral também inclui uma opção para executar análise de agente de IA para cenários de dados e clusters. Se o Bedrock não estiver configurado, a guia exibe um link para a página de configuração de cargas de trabalho de armazenamento do sistema de arquivos específico onde você pode configurar o acesso ao Bedrock.

Aba ao longo do tempo

A guia Ao longo do tempo exibe um gráfico de latência interativo mostrando as métricas de latência do CloudWatch ao longo do tempo para o volume afetado. O gráfico mostra a latência de leitura ou gravação, dependendo de qual tipo de alarme acionou o evento. Você pode selecionar diferentes intervalos de tempo (1H, 3H, 12H, 24H, 72H) para visualizar o comportamento da latência em diferentes períodos.

Para obter instruções detalhadas sobre como usar o gráfico, consulte "Analisar tendências de latência".

Passos

  1. Na aba Latência, localize o evento que deseja analisar.

  2. Na coluna Gravidade, selecione um evento de latência para abrir um painel de análise para esse evento.

    Se nenhum link estiver associado ao sistema de arquivos, uma mensagem será exibida solicitando que você associe um link ao sistema de arquivos afetado. Selecione a mensagem para ser redirecionado para a página de configuração de link para esse sistema de arquivos.

  3. Consulte a aba Visão geral para entender os resultados básicos da análise e identificar a origem da latência.

  4. Opcionalmente, selecione a guia Ao longo do tempo para visualizar as tendências de latência do volume afetado.

  5. Se a fonte de latência exigir uma investigação mais aprofundada (cenários de dados ou clusters), execute uma análise com agente de IA.

Executar análise de agente de IA

A análise por agentes de IA proporciona uma investigação mais aprofundada para determinar a causa raiz específica e as possíveis medidas de remediação.

Antes de começar

Configure o ARN do modelo Amazon Bedrock nas configurações do Workload Factory, consulte "Requisitos básicos do GenAI".

Sobre esta tarefa

Ao executar a análise do agente de IA, o sistema atualiza automaticamente os dados básicos de análise e os utiliza como entrada para o agente de IA.

Passos
  1. Na aba Latência, localize o evento que deseja analisar.

  2. Na coluna Gravidade, selecione um evento de latência para abrir um painel de análise para esse evento.

    Se nenhum link estiver associado ao sistema de arquivos, uma mensagem será exibida solicitando que você associe um link ao sistema de arquivos afetado. Selecione a mensagem para ser redirecionado para a página de configuração de link para esse sistema de arquivos.

  3. Consulte a aba Visão geral para entender os resultados básicos da análise e identificar a origem da latência.

  4. Se a fonte de latência for identificada como dados ou cluster, selecione Analisar para executar a análise do agente de IA.

  5. Revise os resultados da análise do agente de IA, incluindo:

    • Explicação da possível causa raiz

    • Lista de clientes EC2 afetados

    • Etapas de remediação recomendadas

  6. Implemente as etapas de correção recomendadas para resolver o problema de latência.

  7. Após a correção, monitore a tabela de eventos de latência para verificar se o problema foi resolvido.

Melhores práticas

Considere estas recomendações ao analisar problemas de latência:

  • Monitore tendências: analise regularmente a tabela de eventos de latência para identificar padrões ou problemas recorrentes que possam indicar problemas de configuração subjacentes.

  • Use a análise de agentes de IA estrategicamente: Execute a análise de agentes de IA para cenários de dados e clusters onde a análise básica a recomenda. A análise de agentes de IA fornece insights mais profundos para problemas de desempenho complexos que exigem solução de problemas detalhada.

  • Revisar eventos rejeitados: revise periodicamente por que os eventos foram rejeitados para identificar oportunidades de ajuste de limites ou melhorias na infraestrutura.

Para obter as melhores práticas sobre como analisar tendências de latência, consulte "Interpretação de gráficos".