Skip to main content
Uma versão mais recente deste produto está disponível.
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Referência de alertas

Colaboradores

A tabela a seguir lista todos os alertas padrão do StorageGRID. Conforme necessário, você pode criar regras de alerta personalizadas para se adequar à sua abordagem de gerenciamento de sistema.

Veja informações sobre as métricas do Prometheus comumente usadas para saber mais sobre as métricas usadas em alguns desses alertas.

Nome do alerta Descrição e ações recomendadas

A bateria do aparelho expirou

A bateria do controlador de armazenamento do aparelho expirou.

  1. Substitua a bateria. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

A bateria do aparelho falhou

A bateria do controlador de armazenamento do aparelho falhou.

  1. Substitua a bateria. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

A bateria do aparelho não tem capacidade programada suficiente

A bateria do controlador de armazenamento do aparelho não tem capacidade de aprendizagem suficiente.

  1. Substitua a bateria. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

A bateria do aparelho está quase a expirar

A bateria do controlador de armazenamento do aparelho está prestes a expirar.

  1. Substitua a bateria em breve. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

Bateria do aparelho removida

A bateria do controlador de armazenamento do aparelho está em falta.

  1. Instale uma bateria. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

Bateria do aparelho demasiado quente

A bateria do controlador de armazenamento do aparelho está sobreaquecida.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Investigue possíveis razões para o aumento de temperatura, como uma falha da ventoinha ou do sistema de ar condicionado, ventilação e aquecimento (HVAC).

  3. Se este alerta persistir, contacte a assistência técnica.

Erro de comunicação do Appliance BMC

A comunicação com o controlador de gestão do rodapé (BMC) foi perdida.

  1. Confirme se o BMC está a funcionar normalmente. Selecione nós e, em seguida, selecione a guia hardware para o nó do dispositivo. Localize o campo IP do controlador de computação BMC e navegue até esse IP.

  2. Tente restaurar as comunicações BMC colocando o nó no modo de manutenção e, em seguida, desligando e voltando a ligar o aparelho. Consulte as instruções de instalação e manutenção do seu aparelho.

  3. Se este alerta persistir, contacte a assistência técnica.

Falha no dispositivo de backup do cache do dispositivo

Um dispositivo de backup de cache persistente falhou.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Entre em Contato com o suporte técnico.

Dispositivo de backup de cache de dispositivo capacidade insuficiente

Não há capacidade insuficiente do dispositivo de backup em cache.Contate o suporte técnico.

Dispositivo de backup protegido contra gravação em cache do dispositivo

Um dispositivo de backup em cache está protegido contra gravação.Contate o suporte técnico.

Incompatibilidade do tamanho da memória cache do dispositivo

Os dois controladores do dispositivo têm tamanhos de cache diferentes.Contacte o suporte técnico.

Temperatura do chassi do controlador de computação do dispositivo muito alta

A temperatura do controlador de computação em um dispositivo StorageGRID excedeu um limite nominal.

  1. Verifique os componentes do hardware quanto a condições de sobreaquecimento e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Temperatura da CPU do controlador de computação do dispositivo muito alta

A temperatura da CPU no controlador de computação em um dispositivo StorageGRID excedeu um limite nominal.

  1. Verifique os componentes do hardware quanto a condições de sobreaquecimento e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

O controlador de computação do dispositivo precisa de atenção

Uma falha de hardware foi detetada no controlador de computação de um dispositivo StorageGRID.

  1. Verifique se há erros nos componentes de hardware e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

A fonte de Alimentação A do controlador de computação do dispositivo tem um problema

A fonte de Alimentação A no controlador de computação tem um problema.este alerta pode indicar que a fonte de alimentação falhou ou que tem um problema de fornecimento de energia.

  1. Verifique se há erros nos componentes de hardware e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

A fonte de alimentação B do controlador de computação do dispositivo tem um problema

A fonte de alimentação B no controlador de computação tem um problema.este alerta pode indicar que a fonte de alimentação falhou ou que tem um problema de fornecimento de energia.

  1. Verifique se há erros nos componentes de hardware e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

O serviço de monitor de hardware de computação do dispositivo parou

O serviço que monitora o status do hardware de storage parou de relatar dados.

  1. Verifique o estado do serviço de estado do sistema eos na base-os.

  2. Se o serviço estiver parado ou em estado de erro, reinicie o serviço.

  3. Se este alerta persistir, contacte a assistência técnica.

Detectada avaria no canal de fibra do dispositivo

Há um problema com a conexão Fibre Channel entre as controladoras de storage e computação no dispositivo.

  1. Verifique se há erros nos componentes de hardware (nós Appliance node hardware). Se o estatuto de qualquer um dos componentes não for "nominal", tomar as seguintes medidas:

    1. Verifique se os cabos Fibre Channel entre os controladores estão completamente conetados.

    2. Certifique-se de que os cabos Fibre Channel não apresentam dobras excessivas.

    3. Confirme se os módulos SFP estão devidamente encaixados.

Nota: se este problema persistir, o sistema StorageGRID poderá tornar a ligação problemática offline automaticamente.

  1. Se necessário, substitua os componentes. Consulte as instruções de instalação e manutenção do seu aparelho.

Falha na porta HBA Fibre Channel do dispositivo

Uma porta HBA Fibre Channel está falhando ou falhou.Contate o suporte técnico.

O cache flash do dispositivo não é ideal

As unidades usadas para o cache SSD não são ideais.

  1. Substitua as unidades de cache SSD. Consulte as instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

Recipiente da bateria/interligação do aparelho removido

O depósito da bateria/interligação está em falta.

  1. Substitua a bateria. As etapas para remover e substituir uma bateria estão incluídas no procedimento de substituição de um controlador de armazenamento nas instruções de instalação e manutenção do aparelho.

  2. Se este alerta persistir, contacte a assistência técnica.

Porta LACP do aparelho em falta

Uma porta em um dispositivo StorageGRID não está participando da ligação LACP.

  1. Verifique a configuração do interrutor. Certifique-se de que a interface está configurada no grupo de agregação de links correto.

  2. Se este alerta persistir, contacte a assistência técnica.

A fonte de alimentação geral do aparelho está degradada

A alimentação de um aparelho StorageGRID desviou-se da tensão de funcionamento recomendada.

  1. Verifique o estado das fontes de alimentação A e B para determinar qual fonte de alimentação está a funcionar de forma anormal e siga as ações recomendadas:

    • Se você tiver um SG100, SG1000 ou SG6000, use o BMC.

    • Se você tiver um SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Falha do controlador de storage do dispositivo A

O controlador de storage A em um dispositivo StorageGRID falhou.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Falha no controlador B de storage do dispositivo

O controlador de storage B em um dispositivo StorageGRID falhou.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Falha na unidade do controlador de armazenamento do dispositivo

Uma ou mais unidades em um dispositivo StorageGRID falhou ou não é ideal.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Problema de hardware do controlador de storage do dispositivo

O software SANtricity está relatando "precisa de atenção" para um componente em um dispositivo StorageGRID.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Falha na fonte de alimentação do controlador de armazenamento do dispositivo

A fonte de Alimentação A num aparelho StorageGRID desviou-se da tensão de funcionamento recomendada.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Falha na fonte de alimentação B do controlador de armazenamento do dispositivo

A fonte de alimentação B num aparelho StorageGRID desviou-se da tensão de funcionamento recomendada.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

O serviço de monitor de hardware de armazenamento do dispositivo parou

O serviço que monitora o status do hardware de storage parou de relatar dados.

  1. Verifique o estado do serviço de estado do sistema eos na base-os.

  2. Se o serviço estiver parado ou em estado de erro, reinicie o serviço.

  3. Se este alerta persistir, contacte a assistência técnica.

Prateleiras de storage do dispositivo degradadas

O status de um dos componentes na prateleira de armazenamento de um dispositivo de armazenamento é degradado.

  1. Use o Gerenciador de sistema do SANtricity para verificar os componentes de hardware e siga as ações recomendadas.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho:

Temperatura do aparelho excedida

A temperatura nominal ou máxima para o controlador de armazenamento do aparelho foi excedida.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Investigue possíveis razões para o aumento de temperatura, como uma falha da ventoinha ou do sistema de ar condicionado, ventilação e aquecimento (HVAC).

  3. Se este alerta persistir, contacte a assistência técnica.

Sensor de temperatura do aparelho removido

Um sensor de temperatura foi removido. Entre em Contato com o suporte técnico.

Erro de auto-compactador Cassandra

O compactador automático Cassandra apresentou um erro. O compactador automático Cassandra existe em todos os nós de armazenamento e gerencia o tamanho do banco de dados Cassandra para substituir e excluir cargas de trabalho pesadas. Embora essa condição persista, certas cargas de trabalho sofrerão um consumo inesperadamente alto de metadados.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Entre em Contato com o suporte técnico.

Métricas do compactador automático Cassandra desatualizadas

As métricas que descrevem o compactador automático Cassandra estão desatualizadas. O compactador automático Cassandra existe em todos os nós de storage e gerencia o tamanho do banco de dados Cassandra para substituir e excluir cargas de trabalho pesadas. Embora esse alerta persista, certas cargas de trabalho sofrerão um consumo inesperadamente alto de metadados.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Entre em Contato com o suporte técnico.

Erro de comunicação Cassandra

Os nós que executam o serviço Cassandra estão tendo problemas para se comunicar uns com os outros. Este alerta indica que algo está interferindo nas comunicações nó-a-nó. Pode haver um problema de rede ou o serviço Cassandra pode estar inativo em um ou mais nós de storage.

  1. Determine se há outro alerta afetando um ou mais nós de storage. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Verifique se há um problema de rede que possa estar afetando um ou mais nós de storage.

  3. Selecione Support > Tools > Grid Topology.

  4. Para cada nó de armazenamento no seu sistema, selecione SSM Serviços. Assegurar-se de que o estatuto do serviço Cassandra é ""em execução".".

  5. Se o Cassandra não estiver em execução, siga as etapas para iniciar ou reiniciar um serviço nas instruções de recuperação e manutenção.

  6. Se todas as instâncias do serviço Cassandra estiverem em execução e o alerta não for resolvido, entre em Contato com o suporte técnico.

Cassandra compactions sobrecarregado

O processo de compactação Cassandra está sobrecarregado. Se o processo de compactação estiver sobrecarregado, o desempenho de leitura pode ser degradado e a RAM pode ser usada. O serviço Cassandra também pode ficar sem resposta ou falhar.

  1. Reinicie o serviço Cassandra seguindo as etapas para reiniciar um serviço nas instruções de recuperação e manutenção.

  2. Se este alerta persistir, contacte a assistência técnica.

Métricas de reparo do Cassandra desatualizadas

As métricas que descrevem os trabalhos de reparo do Cassandra estão desatualizadas. Se essa condição persistir por mais de 48 horas, as consultas de clientes, como listas de intervalos, podem mostrar dados excluídos.

  1. Reinicie o nó. No Gerenciador de Grade, vá para nós, selecione o nó e selecione a guia tarefas.

  2. Se este alerta persistir, contacte a assistência técnica.

O progresso do reparo do Cassandra lento

O progresso dos reparos do banco de dados Cassandra é lento. Quando os reparos do banco de dados são lentos, as operações de consistência de dados Cassandra são impedidas. Se essa condição persistir por mais de 48 horas, as consultas de clientes, como listas de intervalos, podem mostrar dados excluídos.

  1. Confirme se todos os nós de storage estão online e não há alertas relacionados à rede.

  2. Monitore esse alerta por até 2 dias para ver se o problema resolve por conta própria.

  3. Se as reparações da base de dados continuarem a prosseguir lentamente, contacte a assistência técnica.

O serviço de reparação Cassandra não está disponível

O serviço de reparo Cassandra não está disponível. O serviço de reparo Cassandra existe em todos os nós de armazenamento e fornece funções de reparo críticas para o banco de dados Cassandra. Se essa condição persistir por mais de 48 horas, as consultas de clientes, como listas de intervalos, podem mostrar dados excluídos.

  1. Selecione Support > Tools > Grid Topology.

  2. Para cada nó de armazenamento no seu sistema, selecione SSM Serviços. Certifique-se de que o status do serviço Cassandra Reaper é "em execução".

  3. Se o Cassandra Reaper não estiver em execução, siga as etapas para iniciar ou reiniciar um serviço nas instruções de recuperação e manutenção.

  4. Se todas as instâncias do serviço Cassandra Reaper estiverem em execução e o alerta não for resolvido, entre em Contato com o suporte técnico.

Erro de conetividade do Cloud Storage Pool

A verificação de integridade dos pools de armazenamento em nuvem detetou um ou mais erros novos.

  1. Vá para a seção Cloud Storage Pools da página Storage Pools.

  2. Observe a coluna último erro para determinar qual pool de armazenamento em nuvem tem um erro.

  3. Consulte as instruções para gerenciar objetos com gerenciamento do ciclo de vida das informações.

A concessão DHCP expirou

A concessão DHCP numa interface de rede expirou.se a concessão DHCP expirou, siga as ações recomendadas:

  1. Certifique-se de que existe conetividade entre este nó e o servidor DHCP na interface afetada.

  2. Certifique-se de que existem endereços IP disponíveis para atribuir na sub-rede afetada no servidor DHCP.

  3. Certifique-se de que existe uma reserva permanente para o endereço IP configurado no servidor DHCP. Ou use a ferramenta StorageGRID Change IP para atribuir um endereço IP estático fora do pool de endereços DHCP. Consulte as instruções de recuperação e manutenção.

A concessão DHCP expira em breve

A concessão DHCP em uma interface de rede está expirando em breve. Para evitar que a concessão DHCP expire, siga as ações recomendadas:

  1. Certifique-se de que existe conetividade entre este nó e o servidor DHCP na interface afetada.

  2. Certifique-se de que existem endereços IP disponíveis para atribuir na sub-rede afetada no servidor DHCP.

  3. Certifique-se de que existe uma reserva permanente para o endereço IP configurado no servidor DHCP. Ou use a ferramenta StorageGRID Change IP para atribuir um endereço IP estático fora do pool de endereços DHCP. Consulte as instruções de recuperação e manutenção.

Servidor DHCP indisponível

O servidor DHCP não está disponível.o nó StorageGRID não consegue contactar o servidor DHCP. A concessão DHCP para o endereço IP do nó não pode ser validada.

  1. Certifique-se de que existe conetividade entre este nó e o servidor DHCP na interface afetada.

  2. Certifique-se de que existem endereços IP disponíveis para atribuir na sub-rede afetada no servidor DHCP.

  3. Certifique-se de que existe uma reserva permanente para o endereço IP configurado no servidor DHCP. Ou use a ferramenta StorageGRID Change IP para atribuir um endereço IP estático fora do pool de endereços DHCP. Consulte as instruções de recuperação e manutenção.

A e/S do disco é muito lenta

E/S de disco muito lento pode estar impactando o desempenho do StorageGRID.

  1. Se o problema estiver relacionado a um nó de dispositivo de armazenamento, use o Gerenciador de sistema SANtricity para verificar se há unidades com defeito, unidades com falhas previstas ou reparos em andamento. Verifique também o status dos links Fibre Channel ou SAS entre a computação do dispositivo e os controladores de storage para ver se há algum link inativo ou mostrando taxas de erro excessivas.

  2. Examine o sistema de armazenamento que hospeda os volumes deste nó para determinar e corrigir a causa raiz da e/S lenta

  3. Se este alerta persistir, contacte a assistência técnica.

Observação Os nós afetados podem desativar os serviços e reinicializar-se para evitar afetar o desempenho geral da grade. Quando a condição subjacente for limpa e esses nós detetarem o desempenho normal de e/S, eles retornarão ao serviço completo automaticamente.

Falha na notificação por e-mail

Não foi possível enviar a notificação por e-mail de um alerta.este alerta é acionado quando uma notificação por e-mail de alerta falhar ou um e-mail de teste (enviado da página Alertas Configuração de e-mail) não pode ser entregue.

  1. Inicie sessão no Grid Manager a partir do Admin Node listado na coluna Site/nó do alerta.

  2. Vá para a página Alertas Configuração de e-mail, verifique as configurações e altere-as, se necessário.

  3. Clique em Enviar e-mail de teste e verifique a caixa de entrada de um destinatário de teste para o e-mail. Uma nova instância desse alerta pode ser acionada se o e-mail de teste não puder ser enviado.

  4. Se o e-mail de teste não puder ser enviado, confirme se o servidor de e-mail está online.

  5. Se o servidor estiver funcionando, selecione suporte Ferramentas Logs e colete o log para o nó Admin. Especifique um período de tempo que seja de 15 minutos antes e depois da hora do alerta.

  6. Extraia o arquivo baixado e revise o conteúdo do prometheus.log (_/GID<gid><time_stamp>/<site_node>/<time_stamp>/metrics/prometheus.log).

  7. Se não conseguir resolver o problema, contacte o suporte técnico.

Expiração de certificados configurados na página certificados de cliente

Um ou mais certificados configurados na página certificados de cliente estão prestes a expirar.

  1. Selecione Configuração > Controle de Acesso > certificados de Cliente.

  2. Selecione um certificado que expirará em breve.

  3. Selecione Editar para carregar ou gerar um novo certificado.

  4. Repita estas etapas para cada certificado que expirará em breve.

Expiração do certificado de ponto final do balanceador de carga

Um ou mais certificados de endpoint do balanceador de carga estão prestes a expirar.

  1. Selecione Configuration > Network Settings > Load Balancer Endpoints.

  2. Selecione um endpoint que tenha um certificado que expirará em breve.

  3. Selecione Editar endpoint para carregar ou gerar um novo certificado.

  4. Repita essas etapas para cada ponto final que tenha um certificado expirado ou que expirará em breve.

Para obter mais informações sobre como gerenciar pontos de extremidade do balanceador de carga, consulte as instruções de administração do StorageGRID.

Expiração do certificado do servidor para a interface de gerenciamento

O certificado do servidor usado para a interface de gerenciamento está prestes a expirar.

  1. Selecione Configuração > Configurações de rede > certificados de servidor.

  2. Na seção certificado do servidor de interface de gerenciamento, carregue um novo certificado.

Expiração do certificado do servidor para os Endpoints da API Storage

O certificado do servidor usado para acessar endpoints da API de armazenamento está prestes a expirar.

  1. Selecione Configuração > Configurações de rede > certificados de servidor.

  2. Na seção Object Storage API Service Endpoints Server Certificate (certificado do servidor de Endpoints), faça o upload de um novo certificado.

Incompatibilidade da MTU da rede da grelha

A configuração da unidade de transmissão máxima (MTU) para a interface de rede de Grade (eth0) difere significativamente entre nós na grade. As diferenças nas configurações de MTU podem indicar que algumas, mas não todas, redes eth0 são configuradas para quadros jumbo. Uma incompatibilidade de tamanho da MTU superior a 1000 pode causar problemas de desempenho da rede.

Alto uso de heap Java

Uma alta porcentagem de espaço de heap Java está sendo usada. Se o heap Java ficar cheio, os serviços de metadados podem ficar indisponíveis e as solicitações do cliente podem falhar.

  1. Reveja a atividade do ILM no Dashboard. Esse alerta pode ser resolvido por conta própria quando a carga de trabalho do ILM diminui.

  2. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  3. Se este alerta persistir, contacte a assistência técnica.

Alta latência para consultas de metadados

O tempo médio para consultas de metadados do Cassandra é muito longo. Um aumento na latência de consulta pode ser causado por uma alteração de hardware, como a substituição de um disco ou uma alteração de carga de trabalho, como um aumento súbito de ingerências.

  1. Determine se houve alterações de hardware ou carga de trabalho em torno do tempo em que a latência da consulta aumentou.

  2. Se não conseguir resolver o problema, contacte o suporte técnico.

Falha na sincronização da federação de identidade

Não é possível sincronizar grupos federados e usuários da origem da identidade.

  1. Confirme se o servidor LDAP configurado está online e disponível.

  2. Revise as configurações na página Federação de identidade. Confirme se todos os valores são atuais. Consulte ""Configurando uma fonte de identidade federada"" nas instruções de administração do StorageGRID.

  3. Clique em Test Connection para validar as configurações do servidor LDAP.

  4. Se não conseguir resolver o problema, contacte o suporte técnico.

Colocação de ILM inalcançável

Uma instrução de colocação em uma regra ILM não pode ser alcançada para determinados objetos. Este alerta indica que um nó exigido por uma instrução de colocação não está disponível ou que uma regra ILM está mal configurada. Por exemplo, uma regra pode especificar mais cópias replicadas do que há nós de storage.

  1. Certifique-se de que todos os nós estejam online.

  2. Se todos os nós estiverem on-line, revise as instruções de posicionamento em todas as regras ILM usadas na política ILM ativa. Confirme se existem instruções válidas para todos os objetos. Consulte as instruções para gerenciar objetos com gerenciamento do ciclo de vida das informações.

  3. Conforme necessário, atualize as configurações das regras e ative uma nova política.

    Observação Pode demorar até 1 dia para que o alerta seja apagado.
  4. Se o problema persistir, entre em Contato com o suporte técnico.

Observação Esse alerta pode aparecer durante uma atualização e pode persistir por 1 dia após a atualização ser concluída com êxito. Quando esse alerta é acionado por uma atualização, ele será apagado por conta própria.

Período de digitalização ILM demasiado longo

O tempo necessário para digitalizar, avaliar objetos e aplicar ILM é muito longo.se o tempo estimado para concluir uma varredura ILM completa de todos os objetos for muito longo (consulte período de digitalização - estimado no Dashboard), a política ILM ativa pode não ser aplicada a objetos recém-ingeridos. As alterações à política ILM podem não ser aplicadas a objetos existentes.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Confirme se todos os nós de storage estão online.

  3. Reduza temporariamente a quantidade de tráfego do cliente. Por exemplo, no Gerenciador de Grade, selecione Configuração Configurações de rede classificação de tráfego e crie uma política que limite a largura de banda ou o número de solicitações.

  4. Se a e/S de disco ou a CPU estiverem sobrecarregadas, tente reduzir a carga ou aumentar o recurso.

  5. Se necessário, atualize as regras do ILM para usar o posicionamento síncrono (padrão para regras criadas após o StorageGRID 11,3).

  6. Se este alerta persistir, contacte a assistência técnica.

Taxa de digitalização ILM baixa

A taxa de digitalização ILM está definida para menos de 100 objetos/segundo. Este alerta indica que alguém alterou a taxa de digitalização ILM para o seu sistema para menos de 100 objetos/segundo (predefinição: 400 objetos/segundo). A política ILM ativa pode não ser aplicada a objetos recém-ingeridos. As alterações subsequentes à política ILM não serão aplicadas a objetos existentes.

  1. Determine se foi efetuada uma alteração temporária à taxa de digitalização ILM como parte de uma investigação de suporte em curso.

  2. Entre em Contato com o suporte técnico.

Importante Nunca altere a taxa de digitalização ILM sem contactar o suporte técnico.

Expiração do certificado CA de KMS

O certificado de autoridade de certificação (CA) usado para assinar o certificado do servidor de gerenciamento de chaves (KMS) está prestes a expirar.

  1. Usando o software KMS, atualize o certificado da CA para o servidor de gerenciamento de chaves.

  2. No Gerenciador de Grade, selecione Configuração Configurações do sistema servidor de gerenciamento de chaves.

  3. Selecione o KMS que tem um aviso de status de certificado.

  4. Selecione Editar.

  5. Selecione Next para ir para a Etapa 2 (carregar certificado do servidor).

  6. Selecione Procurar para carregar o novo certificado.

  7. Selecione Guardar.

Expiração do certificado do cliente KMS

O certificado de cliente para um servidor de gerenciamento de chaves está prestes a expirar.

  1. No Gerenciador de Grade, selecione Configuração Configurações do sistema servidor de gerenciamento de chaves.

  2. Selecione o KMS que tem um aviso de status de certificado.

  3. Selecione Editar.

  4. Selecione Next para ir para a Etapa 3 (carregar certificados de cliente).

  5. Selecione Procurar para carregar o novo certificado.

  6. Selecione Procurar para carregar a nova chave privada.

  7. Selecione Guardar.

Falha ao carregar a configuração DE KMS

A configuração para o servidor de gerenciamento de chaves existe, mas não foi possível carregar.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Se este alerta persistir, contacte a assistência técnica.

Erro de conetividade DE KMS

Um nó de dispositivo não pôde se conetar ao servidor de gerenciamento de chaves para seu site.

  1. No Gerenciador de Grade, selecione Configuração Configurações do sistema servidor de gerenciamento de chaves.

  2. Confirme se as entradas da porta e do nome do host estão corretas.

  3. Confirme se o certificado do servidor, o certificado do cliente e a chave privada do certificado do cliente estão corretos e não expiraram.

  4. Certifique-se de que as definições da firewall permitem que o nó do dispositivo comunique com o KMS especificado.

  5. Corrija quaisquer problemas de rede ou DNS.

  6. Se precisar de assistência ou este alerta persistir, contacte o suporte técnico.

Nome da chave de encriptação KMS não encontrado

O servidor de gerenciamento de chaves configurado não possui uma chave de criptografia que corresponda ao nome fornecido.

  1. Confirme se o KMS atribuído ao site está usando o nome correto para a chave de criptografia e quaisquer versões anteriores.

  2. Se precisar de assistência ou este alerta persistir, contacte o suporte técnico.

Falha na rotação da chave de CRIPTOGRAFIA KMS

Todos os volumes de appliance foram descriptografados, mas um ou mais volumes não puderam girar para a chave mais recente.Contate o suporte técnico.

KMS não está configurado

Não existe nenhum servidor de gerenciamento de chaves para este site.

  1. No Gerenciador de Grade, selecione Configuração Configurações do sistema servidor de gerenciamento de chaves.

  2. Adicione um KMS para este site ou adicione um KMS padrão.

A chave KMS falhou ao desencriptar um volume de aparelho

Um ou mais volumes em um dispositivo com criptografia de nó ativada não puderam ser descriptografados com a chave KMS atual.

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Certifique-se de que o servidor de gerenciamento de chaves (KMS) tenha a chave de criptografia configurada e quaisquer versões anteriores de chaves.

  3. Se precisar de assistência ou este alerta persistir, contacte o suporte técnico.

Expiração do certificado do servidor DE KMS

O certificado do servidor usado pelo KMS (Key Management Server) está prestes a expirar.

  1. Usando o software KMS, atualize o certificado do servidor para o servidor de gerenciamento de chaves.

  2. Se precisar de assistência ou este alerta persistir, contacte o suporte técnico.

Fila de auditoria grande

A fila de discos para mensagens de auditoria está cheia.

  1. Verifique a carga no sistema - se houve um número significativo de transações, o alerta deve resolver-se ao longo do tempo, e você pode ignorar o alerta.

  2. Se o alerta persistir e aumentar a gravidade, veja um gráfico do tamanho da fila. Se o número estiver aumentando constantemente ao longo de horas ou dias, a carga de auditoria provavelmente excedeu a capacidade de auditoria do sistema.

  3. Reduza a taxa de operação do cliente ou diminua o número de mensagens de auditoria registradas alterando o nível de auditoria para gravações do cliente e leituras do cliente para erro ou Desativado (Configuração Monitoramento Auditoria).

Baixa capacidade de disco de log de auditoria

O espaço disponível para logs de auditoria é baixo.

  1. Monitore esse alerta para ver se o problema resolve sozinho e o espaço em disco se torna disponível novamente.

  2. Contacte o suporte técnico se o espaço disponível continuar a diminuir.

Baixa memória disponível do nó

A quantidade de RAM disponível em um nó é baixa. A RAM baixa disponível pode indicar uma alteração na carga de trabalho ou um vazamento de memória com um ou mais nós.

  1. Monitore esse alerta para ver se o problema resolve por conta própria.

  2. Se a memória disponível descer abaixo do limite de alerta principal, contacte o suporte técnico.

Baixo espaço livre para piscina de armazenamento

A quantidade de espaço disponível para armazenar dados de objetos em um pool de armazenamento é baixa.

  1. Selecione ILM > Storage Pools.

  2. Selecione o pool de armazenamento listado no alerta e selecione Exibir detalhes.

  3. Determine onde a capacidade de armazenamento adicional é necessária. Você pode adicionar nós de storage a cada local no pool de storage ou adicionar volumes de storage (LUNs) a um ou mais nós de storage existentes.

  4. Execute um procedimento de expansão para aumentar a capacidade de armazenamento.

Baixa memória do nó instalada

A quantidade de memória instalada em um nó é baixa. Aumente a quantidade de RAM disponível para a máquina virtual ou host Linux. Verifique o valor de limite do alerta principal para determinar o requisito mínimo padrão para um nó StorageGRID. Consulte as instruções de instalação da sua plataforma:

Baixo armazenamento de metadados

O espaço disponível para armazenar metadados de objetos é baixo.Alerta crítico

  1. Pare de ingerir objetos.

  2. Adicione imediatamente nós de storage em um procedimento de expansão.

Alerta principal

Adicione imediatamente nós de storage em um procedimento de expansão.

Menor alerta

  1. Monitore a taxa na qual o espaço de metadados de objetos está sendo usado. Selecione nós Storage Node Storage e veja o gráfico Storage Used - Object Metadata.

  2. Adicione nós de storage em um procedimento de expansão o mais rápido possível.

Depois que novos nós de storage são adicionados, o sistema reequilibra automaticamente os metadados de objetos em todos os nós de storage e o alarme é apagado.

Baixa capacidade de disco de métricas

O espaço disponível para o banco de dados de métricas é baixo.

  1. Monitore esse alerta para ver se o problema resolve sozinho e o espaço em disco se torna disponível novamente.

  2. Contacte o suporte técnico se o espaço disponível continuar a diminuir.

Baixo armazenamento de dados de objetos

O espaço disponível para armazenar dados de objetos é baixo.execute um procedimento de expansão. Você pode adicionar volumes de storage (LUNs) aos nós de storage existentes ou adicionar novos nós de storage.

Baixa capacidade de disco raiz

O espaço disponível para o disco raiz é baixo.

  1. Monitore esse alerta para ver se o problema resolve sozinho e o espaço em disco se torna disponível novamente.

  2. Contacte o suporte técnico se o espaço disponível continuar a diminuir.

Baixa capacidade de dados do sistema

O espaço disponível para os dados do sistema StorageGRID no sistema de arquivos /var/local é baixo.

  1. Monitore esse alerta para ver se o problema resolve sozinho e o espaço em disco se torna disponível novamente.

  2. Contacte o suporte técnico se o espaço disponível continuar a diminuir.

Erro de conetividade de rede do nó

Ocorreram erros durante a transferência de dados entre nodes.Network erros de conetividade podem ser apagados sem intervenção manual. Entre em Contato com o suporte técnico se os erros não forem claros.

Erro de quadro de receção de rede do nó

Uma alta porcentagem dos quadros de rede recebidos por um nó teve erros. Esse alerta pode indicar um problema de hardware, como um cabo com defeito ou um transcetor com falha em qualquer extremidade da conexão Ethernet.

  1. Se você estiver usando um dispositivo, tente substituir cada transcetor SFP ou SFP28 e cabo, um de cada vez, para ver se o alerta é apagado.

  2. Se este alerta persistir, contacte a assistência técnica.

Nó não sincronizado com o servidor NTP

A hora do nó não está sincronizada com o servidor NTP (Network Time Protocol).

  1. Verifique se você especificou pelo menos quatro servidores NTP externos, cada um fornecendo uma referência estrato 3 ou melhor.

  2. Verifique se todos os servidores NTP estão operando normalmente.

  3. Verifique as conexões com os servidores NTP. Certifique-se de que eles não estão bloqueados por um firewall.

Nó não bloqueado com servidor NTP

O nó não está bloqueado para um servidor NTP (Network Time Protocol).

  1. Verifique se você especificou pelo menos quatro servidores NTP externos, cada um fornecendo uma referência estrato 3 ou melhor.

  2. Verifique se todos os servidores NTP estão operando normalmente.

  3. Verifique as conexões com os servidores NTP. Certifique-se de que eles não estão bloqueados por um firewall.

Rede do nó que não é do dispositivo inativa

Um ou mais dispositivos de rede estão inativos ou desconetados. Este alerta indica que uma interface de rede (eth) para um nó instalado em uma máquina virtual ou host Linux não está acessível.

Entre em Contato com o suporte técnico.

Objetos perdidos

Um ou mais objetos foram perdidos da grade.este alerta pode indicar que os dados foram perdidos permanentemente e não podem ser recuperados.

  1. Investigue este alerta imediatamente. Talvez seja necessário tomar medidas para evitar mais perda de dados. Você também pode restaurar um objeto perdido se você executar uma ação de prompt.

  2. Quando o problema subjacente for resolvido, reinicie o contador:

    1. Selecione Support > Tools > Grid Topology.

    2. Para o nó de armazenamento que levantou o alerta, selecione site grid node LDR Data Store Configuration Main.

    3. Selecione Redefinir contagem de objetos perdidos e clique em aplicar alterações.

Serviços de plataforma indisponíveis

Poucos nós de storage com o serviço RSM estão em execução ou disponíveis em um local.Certifique-se de que a maioria dos nós de storage que têm o serviço RSM no local afetado esteja em execução e em um estado não-erro.

Consulte ""solução de problemas de serviços de plataforma" nas instruções para administrar o StorageGRID.

Link do utilitário de serviços para baixo na porta de rede Admin 1

A porta Admin Network 1 do aparelho está inativa ou desconetada.

  1. Verifique o cabo e a conexão física à porta Admin Network 1.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

Link do utilitário de serviços para baixo na rede de administração (ou rede de cliente)

A interface do dispositivo para a rede de administração (eth1) ou a rede de cliente (eth2) está inativa ou desligada.

  1. Verifique os cabos, SFPs e conexões físicas à rede StorageGRID.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

O utilitário de serviços está conetado na porta de rede 1, 2, 3 ou 4

A porta de rede 1, 2, 3 ou 4 do aparelho está inativa ou desligada.

  1. Verifique os cabos, SFPs e conexões físicas à rede StorageGRID.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

Conectividade de storage do dispositivo de serviços degradada

Um dos dois SSDs em um dispositivo de serviços falhou ou está fora de sincronização com o outro. A funcionalidade do outro. Não é afetada, mas você deve resolver o problema imediatamente. Se ambas as unidades falharem, o aparelho deixará de funcionar.

  1. No Gerenciador de Grade, selecione nós Services Appliance e, em seguida, selecione a guia hardware.

  2. Reveja a mensagem no campo Storage RAID Mode (modo RAID de armazenamento*).

  3. Se a mensagem mostrar o andamento de uma operação de ressincronização, aguarde a conclusão da operação e confirme se o alerta foi resolvido. Uma mensagem de ressincronização significa que o SSD foi substituído recentemente ou que está sendo ressincronizado por outro motivo.

  4. Se a mensagem indicar que um dos SSDs falhou, substitua a unidade com falha o mais rápido possível.

    Para obter instruções sobre como substituir uma unidade em um dispositivo de serviços, consulte o guia de instalação e manutenção dos aparelhos SG100 e SG1000.

Link do dispositivo de armazenamento na porta Admin Network 1

A porta Admin Network 1 do aparelho está inativa ou desconetada.

  1. Verifique o cabo e a conexão física à porta Admin Network 1.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

Link do dispositivo de armazenamento na rede Admin (ou rede do cliente)

A interface do dispositivo para a rede de administração (eth1) ou a rede de cliente (eth2) está inativa ou desligada.

  1. Verifique os cabos, SFPs e conexões físicas à rede StorageGRID.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

Ligação do dispositivo de armazenamento na porta de rede 1, 2, 3 ou 4

A porta de rede 1, 2, 3 ou 4 do aparelho está inativa ou desligada.

  1. Verifique os cabos, SFPs e conexões físicas à rede StorageGRID.

  2. Solucione quaisquer problemas de conexão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

  3. Se esta porta estiver desconetada de propósito, desative esta regra. No Gerenciador de Grade, selecione Alertas regras de alerta, selecione a regra e clique em Editar regra. Em seguida, desmarque a caixa de seleção Enabled.

Conectividade de storage do dispositivo de storage degradada

Há um problema com uma ou mais conexões entre o controlador de computação e o controlador de storage.

  1. Vá ao aparelho para verificar as luzes indicadoras da porta.

  2. Se as luzes de uma porta estiverem apagadas, confirme se o cabo está conetado corretamente. Conforme necessário, substitua o cabo.

  3. Aguarde até cinco minutos.

    Observação Se for necessário substituir um segundo cabo, não o desligue durante, pelo menos, 5 minutos. Caso contrário, o volume raiz pode se tornar somente leitura, o que requer uma reinicialização de hardware.
  4. No Gerenciador de Grade, selecione nós. Em seguida, selecione a guia hardware do nó que teve o problema. Verifique se a condição de alerta foi resolvida.

Dispositivo de armazenamento inacessível

Não é possível aceder a um dispositivo de armazenamento. Este alerta indica que não é possível montar ou aceder a um volume devido a um problema com um dispositivo de armazenamento subjacente.

  1. Verifique o status de todos os dispositivos de armazenamento usados para o nó:

    • Se o nó estiver instalado em uma máquina virtual ou em um host Linux, siga as instruções para que seu sistema operacional execute diagnósticos de hardware ou execute uma verificação do sistema de arquivos.

    • Se o nó estiver instalado em um dispositivo SG100, SG1000 ou SG6000, use o BMC.

    • Se o nó estiver instalado em um dispositivo SG5600 ou SG5700, use o Gerenciador de sistema do SANtricity.

  2. Se necessário, substituir o órgão. Consulte as instruções de instalação e manutenção do hardware do seu aparelho.

Uso de cota de locatário alto

Uma alta porcentagem de espaço de cota de locatário está sendo usada. Se um inquilino exceder sua cota, novos ingerências são rejeitados.

Observação Esta regra de alerta é desativada por padrão porque pode gerar muitas notificações.
  1. No Gerenciador de Grade, selecione tenants.

  2. Classifique a tabela por quota de utilização.

  3. Selecione um locatário cuja utilização da cota seja próxima de 100%.

  4. Faça um ou ambos os procedimentos a seguir:

    • Selecione Editar para aumentar a cota de armazenamento do locatário.

    • Notificar o locatário de que a utilização da cota é alta.

Não é possível comunicar com o nó

Um ou mais serviços não respondem, ou o nó não pode ser alcançado. Este alerta indica que um nó está desconetado por um motivo desconhecido. Por exemplo, um serviço no nó pode ser interrompido ou o nó pode ter perdido sua conexão de rede devido a uma falha de energia ou interrupção inesperada.

Monitore esse alerta para ver se o problema resolve por conta própria. Se o problema persistir:

  1. Determine se há outro alerta afetando esse nó. Esse alerta pode ser resolvido quando você resolver o outro alerta.

  2. Confirme se todos os serviços neste nó estão em execução. Se um serviço for interrompido, tente iniciá-lo. Consulte as instruções de recuperação e manutenção.

  3. Certifique-se de que o host do nó esteja ligado. Se não estiver, inicie o host.

    Observação Se mais de um host for desligado, consulte as instruções de recuperação e manutenção.
  4. Determine se há um problema de conetividade de rede entre este nó e o nó Admin.

  5. Se não conseguir resolver o alerta, contacte o suporte técnico.

Reinicialização inesperada do nó

Um nó reinicializou inesperadamente nas últimas 24 horas.

  1. Monitorize este alerta. O alerta será apagado após 24 horas. No entanto, se o nó reiniciar inesperadamente novamente, este alerta será acionado novamente.

  2. Se você não conseguir resolver o alerta, pode haver uma falha de hardware. Entre em Contato com o suporte técnico.

Objeto corrompido não identificado detetado

Um arquivo foi encontrado no storage de objetos replicado que não pôde ser identificado como um objeto replicado.

  1. Determine se há algum problema com o storage subjacente em um nó de storage. Por exemplo, execute diagnósticos de hardware ou execute uma verificação do sistema de arquivos.

  2. Depois de resolver quaisquer problemas de armazenamento, execute a verificação de primeiro plano para determinar se os objetos estão em falta e substituí-los, se possível.

  3. Monitorize este alerta. O alerta será apagado após 24 horas, mas será acionado novamente se o problema não tiver sido corrigido.

  4. Se não conseguir resolver o alerta, contacte o suporte técnico.

Informações relacionadas