Analisar logs de erros no Workload Factory
Utilize o analisador inteligente de logs de erros para interpretar automaticamente os logs de erros dos bancos de dados Microsoft SQL Server e Oracle, permitindo identificar e resolver problemas rapidamente. A análise baseada em IA da Agentic requer integração com o Amazon Bedrock.
Sobre esta tarefa
A análise e a correção de logs de erros ajudam a manter a integridade e o desempenho das instâncias do SQL Server e dos bancos de dados Oracle. Interpretar registros de erros de forma eficaz exige análise cuidadosa e conhecimento especializado. O monitoramento manual, a detecção de erros e a análise da causa raiz consomem muito tempo e são propensos a erros. Esses desafios podem atrasar a resolução de problemas, aumentar o tempo de inatividade e causar ineficiências operacionais. O analisador inteligente de logs de erros resolve esses desafios com os seguintes benefícios principais:
-
Agrupamento inteligente: consolida erros de forma inteligente por exclusividade, gravidade e categoria e simplifica o processo de solução de problemas para resoluções mais rápidas e eficazes.
-
Investigação orientada por IA: utiliza IA para analisar erros proativamente, fornecendo insights claros e práticos para acelerar a identificação de problemas sem exigir conhecimento profundo.
-
Enriquecimento de erros: aprimora registros de erros com referências externas, oferecendo clareza contextual para melhorar a compreensão e a tomada de decisões.
-
Correção de melhores práticas: fornece recomendações de correção personalizadas para cargas de trabalho do SQL Server em execução no FSx para ONTAP, capacitando usuários de todos os níveis de habilidade a resolver problemas com confiança.
Sempre que você usa o analisador de log de erros, você mantém controle total sobre seu ambiente enquanto se beneficia da análise avançada de IA.
Para usar o analisador de log de erros, você precisa ativar o Amazon Bedrock, selecionar o modelo que o Workload Factory usa, criar um endpoint privado para se conectar ao Amazon Bedrock, adicionar permissões e criar uma licença corporativa.
Privacidade e segurança de dados
O recurso garante privacidade e segurança dos dados com as seguintes medidas:
Os dados de log e agregações permanecem na sua conta da AWS, comunicados via endpoint VPC privado (Amazon Bedrock), garantindo que não haja exposição pública na Internet.
Os dados do cliente não são usados para treinar ou melhorar modelos. O Amazon Bedrock processa logs em tempo real, mas não treina seus dados. Os resultados são armazenados no seu ambiente apenas para referência. Para mais detalhes, consulte o"Documentação de proteção de dados da Amazon Bedrock" .
Antes de começar
Para usar o analisador de log de erros, você deve atender aos seguintes pré-requisitos:
-
Você deve "Conceder permissões de visualização, planejamento e análise" Na sua conta da AWS, crie um novo host de banco de dados no Workload Factory.
-
"Registrar recursos"na Workload Factory.
-
Os seguintes pré-requisitos também devem ser atendidos. Você será solicitado a concluir esses pré-requisitos como parte das etapas para analisar erros de log.
-
Ativação do Amazon Bedrock
O Amazon Bedrock é necessário para que o agente de IA em execução no host SQL Server ou Oracle do Workload Factory possa se conectar perfeitamente ao Bedrock e obter insights baseados em IA para os logs de erros identificados.
-
Networking
O endpoint VPC do Amazon Bedrock garante a comunicação privada do seu host SQL Server ou Oracle com as APIs do Amazon Bedrock e elimina a exposição pública na internet. Certifique-se de que o endpoint da VPC do Amazon Bedrock esteja associado à sub-rede do host do SQL Server ou do Oracle (exemplo: vpce-050cb2f33a1380ffd).
-
Permissões do AWS IAM
As seguintes permissões são necessárias para a função de perfil da instância EC2 associada ao host SQL Server ou Oracle e para as credenciais da AWS associadas ao Workload Factory.
-
Função de perfil de instância EC2 com permissão "bedrock:InvokeModel"
Essa permissão permite que a instância EC2 no host SQL Server ou Oracle correspondente invoque modelos Bedrock para investigação proativa de erros e orientação de correção. Este perfil também garante acesso seguro à IA para insights personalizados.
-
Credenciais da AWS associadas ao Workload Factory: permissões "bedrock:GetFoundationModelAvailability" e "bedrock:ListInferenceProfiles"
Essas permissões verificam a disponibilidade e a configuração do modelo na região do host do SQL Server ou do Oracle e garantem um desempenho confiável e específico da região.
-
-
Permissão de usuário Oracle
A seguinte permissão concede acesso de leitura a alertas de diagnóstico estendidos, permitindo a extração de detalhes de erros/rastreamento de logs para detecção e correção de padrões com auxílio de IA:
V$DIAG_ALERT_EXT. Essa permissão é necessária apenas para bancos de dados Oracle.
-
Analisar logs de erros
Use o console do Workload Factory para analisar logs de erros do SQL Server.
-
Inicie sessão utilizando uma das "experiências de console".
-
No bloco bancos de dados, selecione ir para inventário de bancos de dados.
-
No menu Bancos de dados, selecione Inventário.
-
No inventário, selecione Microsoft SQL Server ou Oracle como o tipo de mecanismo de banco de dados.
-
Na guia Instâncias, localize a instância específica do SQL Server ou o banco de dados Oracle que deseja analisar e selecione Investigar erros no menu.
-
Na aba Investigação de erros, complete os seguintes pré-requisitos conforme descrito no console:
-
Base rochosa da Amazônia
-
Rede: endpoint privado para Amazon Bedrock
-
Permissões para a função de perfil de instância do EC2
-
Credenciais associadas ao Gerenciamento de Banco de Dados de Carga de Trabalho (wlmdb)
-
-
Quando os pré-requisitos forem atendidos, selecione Investigar agora para usar o analisador de log de erros para obter insights sobre seus logs de erros do SQL Server.
Após a verificação, os erros são exibidos no console, fornecendo uma visão abrangente dos problemas detectados pelo analisador de log de erros inteligente.
-
Utilize filtros para refinar os erros exibidos com base em critérios como gravidade, período e código de erro, ou por tags relacionadas à infraestrutura, como computação, armazenamento, rede e segurança.
-
Revise as informações detalhadas do erro, incluindo a mensagem de erro original, a explicação baseada em IA e as etapas de correção sugeridas para resolver os erros.