Referência de alarmes (sistema legado)
A tabela a seguir lista todos os alarmes padrão herdados. Se um alarme for acionado, você pode procurar o código de alarme nesta tabela para encontrar as ações recomendadas.
Embora o sistema de alarme antigo continue a ser suportado, o sistema de alerta oferece benefícios significativos e é mais fácil de usar. |
Código | Nome | Serviço | Ação recomendada | ||
---|---|---|---|---|---|
ABRL |
Relés Atributo disponíveis |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Restaure a conetividade a um serviço (um serviço ADC) executando um serviço de relé de atributos o mais rápido possível. Se não houver relés de atributos conetados, o nó de grade não poderá relatar valores de atributo ao serviço NMS. Assim, o serviço NMS não pode mais monitorar o status do serviço ou atualizar atributos para o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
ACMS |
Serviços de metadados disponíveis |
BARC, BLDR, BCMN |
Um alarme é acionado quando um serviço LDR ou ARC perde a ligação a um serviço DDS. Se isso ocorrer, as transações de ingestão ou recuperação não podem ser processadas. Se a indisponibilidade dos serviços DDS for apenas um breve problema transitório, as transações podem ser atrasadas. Verifique e restaure as ligações a um serviço DDS para apagar este alarme e devolver o serviço à funcionalidade completa. |
||
ATUA |
Status de serviço do Cloud Tiering |
ARCO |
Disponível apenas para nós de arquivamento com um tipo de destino de disposição em camadas na nuvem - Simple Storage Service (S3). Se o atributo ACTS para o nó de arquivo estiver definido como somente leitura ativado ou leitura-escrita Desativado, você deverá definir o atributo como leitura-escrita habilitado. Se um alarme principal for acionado devido a uma falha de autenticação, verifique as credenciais associadas ao intervalo de destino e atualize os valores, se necessário. Se um alarme principal for acionado devido a qualquer outro motivo, contacte o suporte técnico. |
||
ADCA |
Estado ADC |
ADC |
Se um alarme for acionado, selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ADC > Overview > Main e ADC > Alarmes > Main para determinar a causa do alarme. Se o problema persistir, entre em Contato com o suporte técnico. |
||
ADCE |
Estado ADC |
ADC |
Se o valor do Estado ADC for Standby, continue monitorando o serviço e, se o problema persistir, entre em Contato com o suporte técnico. Se o valor de ADC State for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AITE |
Recuperar Estado |
BARC |
Disponível apenas para nós de arquivo com um tipo de destino do Tivoli Storage Manager (TSM). Se o valor de Retrieve State estiver aguardando o Target, verifique o servidor de middleware TSM e certifique-se de que ele está funcionando corretamente. Se o nó de arquivo tiver sido adicionado ao sistema StorageGRID, certifique-se de que a ligação do nó de arquivo ao sistema de armazenamento de arquivos externo visado está configurada corretamente. Se o valor do Estado de recuperação de Arquivo for Offline, tente atualizar o estado para Online. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ARC > Retrieve > Configuration > Main, selecione Archive Retrieve State > Online e clique em Apply Changes. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AITU |
Recuperar Estado |
BARC |
Se o valor de Retrieve Status for Target Error, verifique se há erros no sistema de armazenamento de arquivos externo de destino. Se o valor de Archive Retrieve Status (Estado de recuperação de arquivo) for Session Lost (perda de sessão), verifique o sistema de armazenamento de arquivo externo alvo para garantir que está online e a funcionar corretamente. Verifique a conexão de rede com o destino. Se o valor do Estado de recuperação de Arquivo for erro desconhecido, contacte o suporte técnico. |
||
ALIS |
Sessões Atributo inbound |
ADC |
Se o número de sessões de atributo de entrada em um relay de atributo crescer muito grande, pode ser uma indicação de que o sistema StorageGRID ficou desequilibrado. Em condições normais, as sessões de atributos devem ser distribuídas uniformemente entre os serviços ADC. Um desequilíbrio pode levar a problemas de desempenho. Se o problema persistir, entre em Contato com o suporte técnico. |
||
ALOS |
Sessões de Atributo de saída |
ADC |
O serviço ADC tem um alto número de sessões de atributos e está se tornando sobrecarregado. Se este alarme for acionado, contacte a assistência técnica. |
||
ALUR |
Repositórios Atributo inalcançáveis |
ADC |
Verifique a conetividade de rede com o serviço NMS para garantir que o serviço possa entrar em Contato com o repositório de atributos. Se este alarme for acionado e a conetividade de rede estiver boa, contacte o suporte técnico. |
||
AMQS |
Mensagens de auditoria enfileiradas |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Se as mensagens de auditoria não puderem ser encaminhadas imediatamente para um reencaminhamento ou repositório de auditoria, as mensagens serão armazenadas em uma fila de discos. Se a fila de discos ficar cheia, podem ocorrer interrupções. Para permitir que você responda a tempo para evitar uma interrupção, os alarmes AMQS são acionados quando o número de mensagens na fila de discos atinge os seguintes limites:
Se um alarme AMQS for acionado, verifique a carga no sistema - se houver um número significativo de transações, o alarme deve resolver-se ao longo do tempo. Neste caso, pode ignorar o alarme. Se o alarme persistir e aumentar a gravidade, visualize um gráfico do tamanho da fila. Se o número estiver aumentando constantemente ao longo de horas ou dias, a carga de auditoria provavelmente excedeu a capacidade de auditoria do sistema. Reduza a taxa de operação do cliente ou diminua o número de mensagens de auditoria registradas alterando o nível de auditoria para erro ou Desativado. "Configurar mensagens de auditoria e destinos de log"Consulte . |
||
AOTE |
Estado da loja |
BARC |
Disponível apenas para nós de arquivo com um tipo de destino do Tivoli Storage Manager (TSM). Se o valor do Estado de armazenamento estiver a aguardar o destino, verifique o sistema de armazenamento de arquivos externo e certifique-se de que está a funcionar corretamente. Se o nó de arquivo tiver sido adicionado ao sistema StorageGRID, certifique-se de que a ligação do nó de arquivo ao sistema de armazenamento de arquivos externo visado está configurada corretamente. Se o valor de Estado da loja estiver offline, verifique o valor de Estado da loja. Corrija quaisquer problemas antes de mover o estado da loja de volta para Online. |
||
AOTU |
Estado da loja |
BARC |
Se o valor de Status da Loja for sessão perdida, verifique se o sistema de armazenamento de arquivos externo está conetado e on-line. Se o valor de Target Error (erro de destino), verifique se há erros no sistema de armazenamento de arquivos externo. Se o valor do Status da Loja for erro desconhecido, entre em Contato com o suporte técnico. |
||
APMS |
Conetividade Multipath de armazenamento |
SSM |
Se o alarme de estado de multipath aparecer como ""degradado""" (selecione SUPPORT > Tools > Grid topology, selecione site > grid node > SSM > Events), faça o seguinte:
|
||
ARCE |
ESTADO do ARCO |
ARCO |
O serviço ARC tem um estado de espera até que todos os componentes ARC (replicação, armazenamento, recuperação, destino) tenham iniciado. Ele então faz a transição para Online. Se o valor do estado ARC não passar de Standby para Online, verifique o estado dos componentes ARC. Se o valor de ARC State for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AROQ |
Objetos em fila de espera |
ARCO |
Este alarme pode ser acionado se o dispositivo de armazenamento amovível estiver a funcionar lentamente devido a problemas com o sistema de armazenamento de arquivos externo visado ou se encontrar vários erros de leitura. Verifique se há erros no sistema de armazenamento de arquivos externo e verifique se ele está funcionando corretamente. Em alguns casos, esse erro pode ocorrer como resultado de uma alta taxa de solicitações de dados. Monitore o número de objetos enfileirados à medida que a atividade do sistema diminui. |
||
ARRF |
Falhas de solicitação |
ARCO |
Se uma recuperação do sistema de armazenamento de arquivos externo visado falhar, o nó de arquivo tentará novamente a recuperação, pois a falha pode ser devido a um problema transitório. No entanto, se os dados do objeto estiverem corrompidos ou tiverem sido marcados como estando permanentemente indisponíveis, a recuperação não falhará. Em vez disso, o nó de arquivo tenta continuamente a recuperação e o valor para falhas de solicitação continua a aumentar. Este alarme pode indicar que o suporte de armazenamento que contém os dados solicitados está corrompido. Verifique o sistema de armazenamento de arquivos externo para diagnosticar ainda mais o problema. Se você determinar que os dados do objeto não estão mais no arquivo, o objeto terá que ser removido do sistema StorageGRID. Para obter mais informações, entre em Contato com o suporte técnico. Assim que o problema que acionou este alarme for resolvido, reponha a contagem de avarias. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ARC > Retrieve > Configuration > Main, selecione Reset Request Failure Count e clique em Apply Changes. |
||
ARRV |
Falhas de verificação |
ARCO |
Para diagnosticar e corrigir esse problema, entre em Contato com o suporte técnico. Assim que o problema que acionou este alarme for resolvido, reponha a contagem de avarias. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ARC > Retrieve > Configuration > Main, selecione Reset Verification Failure Count e clique em Apply Changes. |
||
ARVF |
Falhas de armazenamento |
ARCO |
Este alarme pode ocorrer como resultado de erros com o sistema de armazenamento de arquivos externo visado. Verifique se há erros no sistema de armazenamento de arquivos externo e verifique se ele está funcionando corretamente. Assim que o problema que acionou este alarme for resolvido, reponha a contagem de avarias. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ARC > Retrieve > Configuration > Main, selecione Reset Store Failure Count e clique em Apply Changes. |
||
ASXP |
Compartilhamentos de auditoria |
AMS |
Um alarme é acionado se o valor de compartilhamentos de auditoria for desconhecido. Este alarme pode indicar um problema com a instalação ou configuração do nó Admin. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AUMA |
Estado AMS |
AMS |
Se o valor do Status AMS for DB Connectivity Error (erro de conetividade de banco de dados), reinicie o nó da grade. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AUME |
Estado AMS |
AMS |
Se o valor do estado AMS for em espera, continue a monitorizar o sistema StorageGRID. Se o problema persistir, entre em Contato com o suporte técnico. Se o valor do Estado AMS for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
AUXS |
Estado exportação Auditoria |
AMS |
Se um alarme for acionado, corrija o problema subjacente e reinicie o serviço AMS. Se o problema persistir, entre em Contato com o suporte técnico. |
||
BADD |
Falha na contagem de unidades do controlador de armazenamento |
SSM |
Este alarme é acionado quando uma ou mais unidades de um dispositivo StorageGRID falharam ou não são ideais. Substitua as unidades conforme necessário. |
||
BASF |
Identificadores de Objeto disponíveis |
CMN |
Quando um sistema StorageGRID é provisionado, o serviço CMN recebe um número fixo de identificadores de objeto. Este alarme é acionado quando o sistema StorageGRID começa a esgotar o seu fornecimento de identificadores de objetos. Para alocar mais identificadores, entre em Contato com o suporte técnico. |
||
GRAVES |
Estado Alocação bloco Identificador |
CMN |
Por padrão, um alarme é acionado quando os identificadores de objeto não podem ser alocados porque o quórum de ADC não pode ser alcançado. A alocação de bloco de identificador no serviço CMN requer um quorum (50% mais 1) dos serviços ADC para estar on-line e conetado. Se o quórum não estiver disponível, o serviço CMN não poderá alocar novos blocos de identificador até que o quórum ADC seja restabelecido. Se o quórum de ADC for perdido, geralmente não há impactos imediato no sistema StorageGRID (os clientes ainda podem ingerir e recuperar conteúdo), já que aproximadamente um mês de fornecimento de identificadores são armazenados em cache em outro lugar na grade; no entanto, se a condição continuar, o sistema StorageGRID perderá a capacidade de ingerir novo conteúdo. Se um alarme for acionado, investigue o motivo da perda do quórum de ADC (por exemplo, pode ser uma falha de rede ou nó de armazenamento) e tome medidas corretivas. Se o problema persistir, entre em Contato com o suporte técnico. |
||
BRDT |
Temperatura do chassi do controlador de computação |
SSM |
Um alarme é acionado se a temperatura do controlador de computação em um dispositivo StorageGRID exceder um limite nominal. Verifique os componentes do hardware e problemas ambientais quanto a condições de sobreaquecimento. Se necessário, substituir o órgão. |
||
BTOF |
Desvio |
BADC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Um alarme é acionado se o tempo de serviço (segundos) diferir significativamente do tempo do sistema operacional. Em condições normais, o serviço deve ressincronizar-se. Se o tempo de serviço se afastar demasiado do tempo do sistema operativo, as operações do sistema podem ser afetadas. Confirme se a fonte de hora do sistema StorageGRID está correta. Se o problema persistir, entre em Contato com o suporte técnico. |
||
BTSE |
Estado do relógio |
BADC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Um alarme é acionado se a hora do serviço não for sincronizada com a hora rastreada pelo sistema operacional. Em condições normais, o serviço deve ressincronizar-se. Se o tempo se desviar muito longe do tempo do sistema operacional, as operações do sistema podem ser afetadas. Confirme se a fonte de hora do sistema StorageGRID está correta. Se o problema persistir, entre em Contato com o suporte técnico. |
||
CAHP |
Porcentagem de uso do Java Heap |
DDS |
Um alarme é acionado se o Java não conseguir executar a coleta de lixo a uma taxa que permita espaço de heap suficiente para o sistema funcionar corretamente. Um alarme pode indicar uma carga de trabalho do usuário que excede os recursos disponíveis no sistema para o armazenamento de metadados DDS. Verifique a atividade do ILM no painel ou selecione SUPPORT > Tools > Grid topology e, em seguida, selecione site > grid node > DDS > Resources > Overview > Main. Se o problema persistir, entre em Contato com o suporte técnico. |
||
CASA |
Estado do armazenamento de dados |
DDS |
Um alarme é acionado se o armazenamento de metadados do Cassandra ficar indisponível. Verifique o status de Cassandra:
Esse alarme também pode indicar que o armazenamento de metadados (banco de dados Cassandra) para um nó de armazenamento requer reconstrução. Consulte informações sobre como solucionar problemas do alarme Serviços: Status - Cassandra (SVST) no "Solucionar problemas de metadados". Se o problema persistir, entre em Contato com o suporte técnico. |
||
CASO |
Estado do armazenamento de dados |
DDS |
Este alarme é acionado durante a instalação ou expansão para indicar que um novo armazenamento de dados está a aderir à grelha. |
||
CCNA |
Hardware de computação |
SSM |
Esse alarme é acionado se o status do hardware do controlador de computação em um dispositivo StorageGRID precisar de atenção. |
||
CDLP |
Espaço usado (porcentagem) |
DDS |
Este alarme é acionado quando o espaço efetivo de metadados (CEMS) atinge 70% cheio (alarme menor), 90% cheio (alarme principal) e 100% cheio (alarme crítico). Se este alarme atingir o limite de 90%, é apresentado um aviso no painel de instrumentos do Gestor de grelhas. Você deve executar um procedimento de expansão para adicionar novos nós de storage o mais rápido possível. "Expanda sua grade"Consulte . Se esse alarme atingir o limite de 100%, você deve parar de ingerir objetos e adicionar nós de storage imediatamente. O Cassandra requer uma certa quantidade de espaço para realizar operações essenciais, como compactação e reparo. Essas operações serão impactadas se os metadados de objetos usarem mais de 100% do espaço permitido. Resultados indesejáveis podem ocorrer. Nota: Entre em Contato com o suporte técnico se você não conseguir adicionar nós de storage. Após a adição de novos nós de storage, o sistema reequilibra automaticamente os metadados de objetos em todos os nós de storage e o alarme é apagado. Consulte também informações sobre como solucionar problemas do alerta de armazenamento de metadados baixos no "Solucionar problemas de metadados". Se o problema persistir, entre em Contato com o suporte técnico. |
||
CMNA |
Estado CMN |
CMN |
Se o valor do Status do CMN for erro, selecione SUPPORT > Tools > Grid topoly e, em seguida, selecione site > grid node > CMN > Overview > Main e CMN > Alarmes > Main para determinar a causa do erro e solucionar o problema. Um alarme é acionado e o valor de Status do CMN é no Online CMN durante uma atualização de hardware do nó Admin primário quando as CMNs são comutadas (o valor do estado antigo do CMN é Standby e o novo é Online). Se o problema persistir, entre em Contato com o suporte técnico. |
||
CPRC |
Capacidade restante |
NMS |
Um alarme é acionado se a capacidade restante (número de conexões disponíveis que podem ser abertas para o banco de dados NMS) ficar abaixo da gravidade do alarme configurada. Se um alarme for acionado, contacte a assistência técnica. |
||
CPSA |
Fonte de Alimentação A do controlador de computação |
SSM |
Um alarme é acionado se houver um problema com a fonte de Alimentação A no controlador de computação para um dispositivo StorageGRID. Se necessário, substituir o órgão. |
||
CPSB |
Fonte de alimentação B do controlador de computação |
SSM |
Um alarme é acionado se houver um problema com a fonte de alimentação B no controlador de computação para um dispositivo StorageGRID. Se necessário, substituir o órgão. |
||
CPUT |
Temperatura da CPU do controlador de computação |
SSM |
Um alarme é acionado se a temperatura da CPU no controlador de computação em um dispositivo StorageGRID exceder um limite nominal. Se o nó de armazenamento for um dispositivo StorageGRID, o sistema StorageGRID indica que o controlador precisa de atenção. Verifique os componentes de hardware e problemas de ambiente quanto a condições de sobreaquecimento. Se necessário, substituir o órgão. |
||
DNST |
Estado DNS |
SSM |
Após a conclusão da instalação, um alarme DNST é acionado no serviço SSM. Depois que o DNS é configurado e as novas informações do servidor atingem todos os nós da grade, o alarme é cancelado. |
||
ECCD |
Fragmentos corrompidos detetados |
LDR |
Um alarme é acionado quando o processo de verificação em segundo plano deteta um fragmento codificado de apagamento corrompido. Se um fragmento corrompido for detetado, uma tentativa é feita para reconstruir o fragmento. Redefina os fragmentos corrompidos detetados e copie os atributos perdidos para zero e monitorize-os para ver se as contagens aumentam novamente. Se as contagens aumentarem, pode haver um problema com o armazenamento subjacente do nó de armazenamento. Uma cópia de dados de objeto codificado de apagamento não é considerada ausente até que o número de fragmentos perdidos ou corrompidos viole a tolerância de falhas do código de apagamento; portanto, é possível ter fragmento corrompido e ainda ser capaz de recuperar o objeto. Se o problema persistir, entre em Contato com o suporte técnico. |
||
ECST |
Estado de verificação |
LDR |
Este alarme indica o estado atual do processo de verificação em segundo plano para apagar dados de objetos codificados neste nó de armazenamento. Um alarme principal é acionado se houver um erro no processo de verificação em segundo plano. |
||
FOPN |
Abra descritores de arquivo |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
FOPN pode tornar-se grande durante a atividade de pico. Se não diminuir durante períodos de atividade lenta, entre em Contato com o suporte técnico. |
||
HSTE |
Estado HTTP |
ERRO |
Consulte ações recomendadas para HSTU. |
||
HSTU |
Estado HTTP |
ERRO |
HSTE e HSTU estão relacionados a HTTP para todo o tráfego LDR, incluindo S3, Swift, e outro tráfego StorageGRID interno. Um alarme indica que ocorreu uma das seguintes situações:
O atributo Auto-Start HTTP é ativado por padrão. Se essa configuração for alterada, o HTTP poderá permanecer offline após uma reinicialização. Se necessário, aguarde que o serviço LDR seja reiniciado. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione Storage Node > LDR > Configuration. Se o HTTP estiver offline, coloque-o online. Verifique se o atributo Auto-Start HTTP está ativado. Se o HTTP permanecer offline, entre em Contato com o suporte técnico. |
||
HTAS |
Auto-Iniciar HTTP |
LDR |
Especifica se os serviços HTTP devem ser iniciados automaticamente na inicialização. Esta é uma opção de configuração especificada pelo usuário. |
||
IRSU |
Estado de replicação de entrada |
BLDR, BARC |
Um alarme indica que a replicação de entrada foi desativada. Confirme as configurações: Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > LDR > Replication > Configuration > Main. |
||
LATA |
Latência média |
NMS |
Verifique se há problemas de conetividade. Verifique a atividade do sistema para confirmar que existe um aumento na atividade do sistema. Um aumento na atividade do sistema resultará em um aumento para atribuir a atividade de dados. Essa atividade aumentada resultará em um atraso no processamento de dados de atributos. Esta pode ser uma atividade normal do sistema e irá diminuir. Verifique se existem vários alarmes. Um aumento nos tempos médios de latência pode ser indicado por um número excessivo de alarmes acionados. Se o problema persistir, entre em Contato com o suporte técnico. |
||
LDRE |
Estado LDR |
LDR |
Se o valor do Estado LDR for Standby (em espera), continue a monitorizar a situação e, se o problema persistir, contacte o suporte técnico. Se o valor de LDR State for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
PERDIDO |
Objetos perdidos |
DDS, LDR |
Acionado quando o sistema StorageGRID não consegue recuperar uma cópia do objeto solicitado de qualquer lugar do sistema. Antes de um alarme PERDIDO (objetos perdidos) ser acionado, o sistema tenta recuperar e substituir um objeto em falta de outro local do sistema. Objetos perdidos representam uma perda de dados. O atributo objetos perdidos é incrementado sempre que o número de locais para um objeto cai para zero sem o serviço DDS propositadamente purgando o conteúdo para satisfazer a política ILM. Investigue imediatamente os alarmes PERDIDOS (LOST Object). Se o problema persistir, entre em Contato com o suporte técnico. |
||
MCEP |
Validade do certificado de Interface de Gestão |
CMN |
Acionado quando o certificado usado para acessar a interface de gerenciamento está prestes a expirar.
|
||
MINQ |
Notificações de e-mail na fila |
NMS |
Verifique as conexões de rede dos servidores que hospedam o serviço NMS e o servidor de e-mail externo. Confirme também se a configuração do servidor de e-mail está correta. |
||
MIN |
Estado das notificações por e-mail |
BNMS |
Um alarme menor é acionado se o serviço NMS não conseguir se conetar ao servidor de e-mail. Verifique as conexões de rede dos servidores que hospedam o serviço NMS e o servidor de e-mail externo. Confirme também se a configuração do servidor de e-mail está correta. |
||
SAUDADES |
Estado do motor da interface NMS |
BNMS |
Um alarme é acionado se o mecanismo de interface NMS no Admin Node que reúne e gera conteúdo da interface for desconetado do sistema. Verifique o Gerenciador do servidor para determinar se o aplicativo individual do servidor está inativo. |
||
NANG |
Configuração de negociação automática de rede |
SSM |
Verifique a configuração do adaptador de rede. A configuração deve corresponder às preferências dos roteadores e switches de rede. Uma definição incorreta pode ter um impactos grave no desempenho do sistema. |
||
NDUP |
Configuração Duplex de rede |
SSM |
Verifique a configuração do adaptador de rede. A configuração deve corresponder às preferências dos roteadores e switches de rede. Uma definição incorreta pode ter um impactos grave no desempenho do sistema. |
||
NLNK |
Detecção de ligação de rede |
SSM |
Verifique as conexões do cabo de rede na porta e no switch. Verifique as configurações do roteador, do switch e do adaptador de rede. Reinicie o servidor. Se o problema persistir, entre em Contato com o suporte técnico. |
||
NRER |
Receber erros |
SSM |
As seguintes causas podem ser os alarmes NRER:
Consulte as informações sobre como solucionar problemas do alarme Network Receive Error (NRER) em "Solucionar problemas de rede, hardware e plataforma". |
||
NRLY |
Relés de auditoria disponíveis |
BADC, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Se os relés de auditoria não estiverem conetados aos serviços ADC, os eventos de auditoria não poderão ser relatados. Eles estão em fila de espera e indisponíveis para os usuários até que a conexão seja restaurada. Restaure a conetividade a um serviço ADC o mais rápido possível. Se o problema persistir, entre em Contato com o suporte técnico. |
||
NSCA |
Estado NMS |
NMS |
Se o valor de Status do NMS for DB Connectivity Error (erro de conetividade de banco de dados), reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
NSCE |
Estado NMS |
NMS |
Se o valor do estado NMS for Standby (espera), continue a monitorização e, se o problema persistir, contacte o suporte técnico. Se o valor de Estado NMS for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
VELOCIDADE MÁXIMA |
Velocidade |
SSM |
Isso pode ser causado por problemas de conetividade de rede ou compatibilidade de driver. Se o problema persistir, entre em Contato com o suporte técnico. |
||
NTBR |
Livre Tablespace |
NMS |
Se um alarme for acionado, verifique a rapidez com que a utilização da base de dados foi alterada. Uma queda súbita (ao contrário de uma mudança gradual ao longo do tempo) indica uma condição de erro. Se o problema persistir, entre em Contato com o suporte técnico. Ajustar o limite de alarme permite que você gerencie proativamente quando o armazenamento adicional precisa ser alocado. Se o espaço disponível atingir um limite baixo (consulte o limiar de alarme), contacte o suporte técnico para alterar a alocação da base de dados. |
||
NTER |
Transmitir erros |
SSM |
Esses erros podem ser apagados sem serem reiniciados manualmente. Se eles não limparem, verifique o hardware de rede. Verifique se o hardware e o driver do adaptador estão corretamente instalados e configurados para funcionar com seus roteadores e switches de rede. Quando o problema subjacente for resolvido, reinicie o contador. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > SSM > Resources > Configuration > Main, selecione Reset Transmit Error Count e clique em Apply Changes. |
||
NTFQ |
Desvio de frequência NTP |
SSM |
Se o desvio de frequência exceder o limite configurado, é provável que haja um problema de hardware com o relógio local. Se o problema persistir, contacte o suporte técnico para agendar uma substituição. |
||
NTLK |
Bloqueio NTP |
SSM |
Se o daemon NTP não estiver bloqueado para uma fonte de tempo externa, verifique a conetividade de rede com as fontes de tempo externas designadas, sua disponibilidade e sua estabilidade. |
||
NTOF |
Desvio horário NTP |
SSM |
Se o desvio de tempo exceder o limite configurado, é provável que haja um problema de hardware com o oscilador do relógio local. Se o problema persistir, contacte o suporte técnico para agendar uma substituição. |
||
NTSJ |
Jitter de fonte de tempo escolhido |
SSM |
Este valor indica a confiabilidade e estabilidade da fonte de tempo que o NTP no servidor local está usando como referência. Se um alarme for acionado, pode ser uma indicação de que o oscilador da fonte de tempo está com defeito ou que há um problema com o link WAN para a fonte de tempo. |
||
NTSU |
Estado NTP |
SSM |
Se o valor do Status NTP não estiver em execução, entre em Contato com o suporte técnico. |
||
OPST |
Estado geral da alimentação |
SSM |
Um alarme é acionado se a alimentação de um aparelho StorageGRID se desviar da tensão de funcionamento recomendada. Verifique o estado da fonte de Alimentação A ou B para determinar qual fonte de alimentação está a funcionar de forma anormal. Se necessário, substitua a fonte de alimentação. |
||
OQRT |
Objetos em quarentena |
LDR |
Depois que os objetos são restaurados automaticamente pelo sistema StorageGRID, os objetos em quarentena podem ser removidos do diretório de quarentena.
Os objetos em quarentena são removidos e a contagem é redefinida para zero. |
||
ORSU |
Estado replicação saída |
BLDR, BARC |
Um alarme indica que a replicação de saída não é possível: O armazenamento está em um estado em que os objetos não podem ser recuperados. Um alarme é acionado se a replicação de saída for desativada manualmente. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > LDR > Replication > Configuration. Um alarme é acionado se o serviço LDR não estiver disponível para replicação. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > LDR > Storage. |
||
OSLF |
Status do compartimento |
SSM |
Um alarme é acionado se o status de um dos componentes na prateleira de armazenamento de um dispositivo de armazenamento for degradado. Os componentes da prateleira de armazenamento incluem IOMs, ventiladores, fontes de alimentação e gavetas de unidade.se este alarme for acionado, consulte as instruções de manutenção do seu aparelho. |
||
PMEM |
Utilização da memória de serviço (percentagem) |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Pode ter um valor de mais de Y% de RAM, onde Y representa a porcentagem de memória que está sendo usada pelo servidor. Valores abaixo de 80% são normais. Mais de 90% é considerado um problema. Se o uso de memória for alto para um único serviço, monitore a situação e investigue. Se o problema persistir, entre em Contato com o suporte técnico. |
||
PSAS |
Estado da fonte de alimentação A. |
SSM |
Um alarme é acionado se a fonte de Alimentação A num aparelho StorageGRID se desviar da tensão de funcionamento recomendada. Se necessário, substitua a fonte de alimentação A. |
||
PSB |
Estado da fonte de alimentação B. |
SSM |
Um alarme é acionado se a fonte de alimentação B num aparelho StorageGRID se desviar da tensão de funcionamento recomendada. Se necessário, substitua a fonte de alimentação B.. |
||
RDTE |
Estado do Tivoli Storage Manager |
BARC |
Disponível apenas para nós de arquivamento com um tipo de destino do Tivoli Storage Manager (TSM). Se o valor do estado do Tivoli Storage Manager estiver offline, verifique o status do Tivoli Storage Manager e resolva quaisquer problemas. Coloque o componente novamente online. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > ARC > Target > Configuration > Main, selecione Tivoli Storage Manager State > Online e clique em Apply Changes. |
||
RDTU |
Status do Tivoli Storage Manager |
BARC |
Disponível apenas para nós de arquivamento com um tipo de destino do Tivoli Storage Manager (TSM). Se o valor do status do Gerenciador de armazenamento Tivoli for erro de configuração e o nó de arquivo tiver sido adicionado ao sistema StorageGRID, verifique se o servidor de middleware TSM está configurado corretamente. Se o valor do status do Gerenciador de armazenamento Tivoli for falha de conexão ou falha de conexão, tente novamente, verifique a configuração de rede no servidor middleware TSM e a conexão de rede entre o servidor de middleware TSM e o sistema StorageGRID. Se o valor do status do Gerenciador de armazenamento Tivoli for Falha de autenticação ou Falha de autenticação, reconetando, o sistema StorageGRID poderá se conetar ao servidor middleware TSM, mas não poderá autenticar a conexão. Verifique se o servidor de middleware TSM está configurado com o usuário, senha e permissões corretos e reinicie o serviço. Se o valor do status do Tivoli Storage Manager for Falha da sessão, uma sessão estabelecida foi perdida inesperadamente. Verifique a conexão de rede entre o servidor middleware TSM e o sistema StorageGRID. Verifique se há erros no servidor middleware. Se o valor do status do Tivoli Storage Manager for erro desconhecido, entre em Contato com o suporte técnico. |
||
RIRF |
Replicações de entrada — falhou |
BLDR, BARC |
Um alarme Inbound replicações — Falha pode ocorrer durante períodos de alta carga ou interrupções temporárias da rede. Após a redução da atividade do sistema, este alarme deve ser apagado. Se a contagem de replicações falhadas continuar a aumentar, procure problemas de rede e verifique se os serviços LDR e ARC de origem e destino estão online e disponíveis. Para repor a contagem, selecione support > Tools > Grid topoly e, em seguida, selecione site > grid node > LDR > Replication > Configuration > Main. Selecione Redefinir contagem de falhas de replicação de entrada e clique em aplicar alterações. |
||
RIRQ |
Replicações de entrada — na fila |
BLDR, BARC |
Os alarmes podem ocorrer durante períodos de alta carga ou interrupção temporária da rede. Após a redução da atividade do sistema, este alarme deve ser apagado. Se a contagem de repetições em fila continuar a aumentar, procure problemas de rede e verifique se os serviços LDR e ARC de origem e destino estão online e disponíveis. |
||
RORQ |
Repetições de saída — em fila |
BLDR, BARC |
A fila de replicação de saída contém dados de objeto que estão sendo copiados para satisfazer as regras e objetos ILM solicitados pelos clientes. Um alarme pode ocorrer como resultado de uma sobrecarga do sistema. Aguarde para ver se o alarme é apagado quando a atividade do sistema diminui. Se o alarme voltar a ocorrer, adicione capacidade adicionando nós de storage. |
||
SAVP |
Espaço utilizável total (percentagem) |
LDR |
Se o espaço utilizável atingir um limite baixo, as opções incluem a expansão do sistema StorageGRID ou a movimentação de dados de objetos para arquivamento por meio de um nó de arquivamento. |
||
SCAS |
Estado |
CMN |
Se o valor de Status para a tarefa de grade ativa for erro, procure a mensagem de tarefa de grade. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > CMN > Grid Tasks > Overview > Main. A mensagem de tarefa de grade exibe informações sobre o erro (por exemplo, "'verificação falhou no nó 12130011'"). Depois de investigar e corrigir o problema, reinicie a tarefa de grade. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > CMN > Grid Tasks > Configuration > Main e selecione Actions > Run. Se o valor de Status para uma tarefa de grade que está sendo interrompida for erro, tente terminar novamente a tarefa de grade. Se o problema persistir, entre em Contato com o suporte técnico. |
||
SCEP |
Validade do certificado de Endpoints do Serviço de API de armazenamento |
CMN |
Acionado quando o certificado usado para acessar endpoints de API de armazenamento está prestes a expirar.
|
||
SCHR |
Estado |
CMN |
Se o valor de Status para a tarefa de grade histórica for abortado, investigue o motivo e execute a tarefa novamente, se necessário. Se o problema persistir, entre em Contato com o suporte técnico. |
||
SCSA |
Controlador de armazenamento A |
SSM |
Um alarme é acionado se houver um problema com o controlador de armazenamento A em um dispositivo StorageGRID. Se necessário, substituir o órgão. |
||
SCSB |
Controlador de armazenamento B |
SSM |
Um alarme é acionado se houver um problema com o controlador de armazenamento B em um dispositivo StorageGRID. Se necessário, substituir o órgão. Alguns modelos de aparelhos não têm um controlador de armazenamento B.. |
||
SHLH |
Saúde |
LDR |
Se o valor de integridade para um armazenamento de objetos for erro, verifique e corrija:
|
||
SLSA |
Média de carga da CPU |
SSM |
Quanto maior for o valor, mais ocupado o sistema. Se a média de carga da CPU persistir em um valor alto, o número de transações no sistema deve ser investigado para determinar se isso se deve a uma carga pesada no momento. Veja um gráfico da média de carga da CPU: Selecione SUPPORT > Tools > Grid topoly. Em seguida, selecione site > grid node > SSM > Resources > Reports > Charts. Se a carga no sistema não for pesada e o problema persistir, contacte a assistência técnica. |
||
SMST |
Estado do monitor de registo |
SSM |
Se o valor do Estado do Monitor de Registos não estiver ligado durante um período de tempo persistente, contacte o suporte técnico. |
||
SMTT |
Total de eventos |
SSM |
Se o valor de Eventos totais for maior que zero, verifique se existem eventos conhecidos (como falhas de rede) que podem ser a causa. A menos que esses erros tenham sido apagados (ou seja, a contagem foi redefinida para 0), os alarmes de Total de Eventos podem ser acionados. Quando um problema for resolvido, reponha o contador para apagar o alarme. Selecione NÓS > site > grid node > Eventos > Redefinir contagens de eventos.
Se o valor de Total de Eventos for zero ou o número aumentar e o problema persistir, contacte o suporte técnico. |
||
SNST |
Estado |
CMN |
Um alarme indica que há um problema ao armazenar os pacotes de tarefas da grade. Se o valor de Status for erro de Checkpoint ou Quórum não atingido, confirme que a maioria dos serviços ADC está conetada ao sistema StorageGRID (50% mais um) e aguarde alguns minutos. Se o problema persistir, entre em Contato com o suporte técnico. |
||
SOSS |
Estado do sistema operativo de armazenamento |
SSM |
Um alarme é acionado se o SANtricity os indicar que há um problema de "precisa de atenção" com um componente em um dispositivo StorageGRID. Selecione NODES. Em seguida, selecione nó de armazenamento do dispositivo > hardware. Role para baixo para ver o status de cada componente. No SANtricity os, verifique outros componentes do dispositivo para isolar o problema. |
||
SSMA |
Estado SSM |
SSM |
Se o valor de Status SSM for erro, selecione SUPPORT > Tools > Grid topoly e, em seguida, selecione site > grid node > SSM > Overview > Main e SSM > Overview > Alarmes para determinar a causa do alarme. Se o problema persistir, entre em Contato com o suporte técnico. |
||
SSME |
Estado SSM |
SSM |
Se o valor do estado SSM for Standby (em espera), continue a monitorização e, se o problema persistir, contacte a assistência técnica. Se o valor do estado SSM for Offline, reinicie o serviço. Se o problema persistir, entre em Contato com o suporte técnico. |
||
SSTS |
Estado de armazenamento |
ERRO |
Se o valor do Status do armazenamento for espaço utilizável insuficiente, não haverá mais armazenamento disponível no nó de armazenamento e os ingeries de dados serão redirecionados para outro nó de armazenamento disponível. As solicitações de recuperação podem continuar a ser entregues a partir deste nó de grade. Armazenamento adicional deve ser adicionado. Ele não está impactando a funcionalidade do usuário final, mas o alarme persiste até que o armazenamento adicional seja adicionado. Se o valor de Status do armazenamento for volume(s) indisponível(s), uma parte do armazenamento não estará disponível. O armazenamento e a recuperação destes volumes não são possíveis. Verifique o volume's Health (Saúde do volume) para obter mais informações: Selecione SUPPORT > Tools (SUPORTE* > Ferramentas* > Grid topology). Em seguida, selecione site > grid node > LDR > Storage > Overview > Main. O volume's Health (Saúde do volume) está listado em Object Stores. Se o valor do Status do armazenamento for erro, entre em Contato com o suporte técnico. |
||
SVST |
Estado |
SSM |
Este alarme é apagado quando outros alarmes relacionados a um serviço que não está em execução são resolvidos. Acompanhe os alarmes de serviço de origem para restaurar a operação. Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > SSM > Serviços > Visão geral > Principal. Quando o status de um serviço é mostrado como não em execução, seu estado é administrativamente inativo. O status do serviço pode ser listado como não em execução pelos seguintes motivos:
Se um serviço estiver listado como não em execução, reinicie o serviço ( Esse alarme também pode indicar que o armazenamento de metadados (banco de dados Cassandra) para um nó de armazenamento requer reconstrução. Se o problema persistir, entre em Contato com o suporte técnico. |
||
TMEM |
Memória instalada |
SSM |
Os nós executados com menos de 24 GiB de memória instalada podem levar a problemas de performance e instabilidade do sistema. A quantidade de memória instalada no sistema deve ser aumentada para pelo menos 24 GiB. |
||
TPOP |
Operações pendentes |
ADC |
Uma fila de mensagens pode indicar que o serviço ADC está sobrecarregado. Poucos serviços ADC podem ser conetados ao sistema StorageGRID. Em uma grande implantação, o serviço ADC pode exigir a adição de recursos computacionais, ou o sistema pode exigir serviços ADC adicionais. |
||
UMEM |
Memória disponível |
SSM |
Se a RAM disponível ficar baixa, determine se este é um problema de hardware ou software. Se não for um problema de hardware ou se a memória disponível for inferior a 50 MB (o limite de alarme predefinido), contacte o suporte técnico. |
||
VMFI |
Entradas disponíveis |
SSM |
Esta é uma indicação de que é necessário um armazenamento adicional. Entre em Contato com o suporte técnico. |
||
VMFR |
Espaço disponível |
SSM |
Se o valor de espaço disponível ficar muito baixo (consulte limiares de alarme), ele precisa ser investigado se há arquivos de log crescendo fora de proporção, ou objetos ocupando muito espaço em disco (veja limiares de alarme) que precisam ser reduzidos ou excluídos. Se o problema persistir, entre em Contato com o suporte técnico. |
||
VMST |
Estado |
SSM |
Um alarme é acionado se o valor de Status para o volume montado for desconhecido. Um valor desconhecido ou Offline pode indicar que o volume não pode ser montado ou acessado devido a um problema com o dispositivo de armazenamento subjacente. |
||
VPRI |
Prioridade de verificação |
BLDR, BARC |
Por padrão, o valor da prioridade de verificação é adaptável. Se a prioridade de verificação estiver definida como alta, um alarme é acionado porque a verificação do armazenamento pode retardar as operações normais do serviço. |
||
VSTU |
Estado Verificação Objeto |
ERRO |
Selecione SUPPORT > Tools > Grid topology. Em seguida, selecione site > grid node > LDR > Storage > Overview > Main. Verifique se existem sinais de erros no sistema operativo ou no sistema de ficheiros. Se o valor do Status de Verificação de Objeto for erro desconhecido, ele geralmente indica um problema de hardware ou sistema de arquivos de baixo nível (erro de e/S) que impede que a tarefa de Verificação de armazenamento acesse conteúdo armazenado. Entre em Contato com o suporte técnico. |
||
XAMS |
Repositórios de auditoria inalcançáveis |
BADC, BARC, BCLB, BCMN, BLDR, BNMS |
Verifique a conetividade de rede ao servidor que hospeda o nó Admin. Se o problema persistir, entre em Contato com o suporte técnico. |