Skip to main content
Data Infrastructure Insights
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Solução de problemas do coletor de dados SVM do ONTAP

Colaboradores netapp-alavoie

O Workload Security usa coletores de dados para coletar dados de acesso de arquivos e usuários de dispositivos. Aqui você pode encontrar dicas para solucionar problemas com este coletor.

Consulte "Configurando o SVM Collector"a página para obter instruções sobre como configurar este coletor.

No caso de um erro, você pode clicar em mais detalhes na coluna Status da página coletores de dados instalados para obter detalhes sobre o erro.

Erro do Coletor de Segurança da carga de trabalho mais Detail Link

Problemas conhecidos e suas resoluções são descritos abaixo.

  • Problema:* Data Collector é executado por algum tempo e pára após um tempo aleatório, falhando com: "Mensagem de erro: O conetor está em estado de erro. Nome do serviço: Auditoria. Motivo da falha: Servidor fpolicy externo sobrecarregado."

Experimente: a taxa de eventos do ONTAP foi muito maior do que a caixa Agente pode lidar. Daí a conexão foi terminada.

Verifique o tráfego de pico no CloudSecure quando a desconexão aconteceu. Isso pode ser verificado na página CloudSecure > Activity Forensics > All Activity.

Se o tráfego agregado de pico for maior do que o que a caixa de agente pode lidar, consulte a página Verificador de taxa de eventos sobre como dimensionar a implantação do coletor em uma caixa de agente.

Se o Agente tiver sido instalado na caixa Agente antes de 4 de março de 2021, execute os seguintes comandos na caixa Agente:

echo 'net.core.rmem_max=8388608' >> /etc/sysctl.conf
echo 'net.ipv4.tcp_rmem = 4096 2097152 8388608' >> /etc/sysctl.conf
sysctl -p

Reinicie o coletor a partir da IU após o redimensionamento.

Problema: Collector relata mensagem de erro: "Nenhum endereço IP local encontrado no conetor que pode alcançar as interfaces de dados do SVM". Tente isto: isto é provavelmente devido a um problema de rede no lado do ONTAP. Siga estes passos:

  1. Certifique-se de que não haja firewalls na biblioteca de dados do SVM ou na biblioteca de gerenciamento que estejam bloqueando a conexão do SVM.

  2. Ao adicionar um SVM por meio de um IP de gerenciamento de cluster, certifique-se de que as informações de dados e de gerenciamento do SVM sejam pingáveis na VM do agente. Em caso de problemas, verifique o gateway, a máscara de rede e as rotas para o lif.

    Você também pode tentar fazer login no cluster via ssh usando o IP de gerenciamento de cluster e fazer ping no IP do agente. Certifique-se de que o IP do agente pode ser pisado:

    network ping -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail

    Se não for possível fazer o ping, verifique se as configurações de rede no ONTAP estão corretas, para que a máquina do agente possa ser digitalizada.

  3. Se você tentou se conetar via IP de cluster e não estiver funcionando, tente se conetar diretamente via SVM IP. Consulte acima as etapas para se conetar via SVM IP.

  4. Ao adicionar o coletor por meio de credenciais SVM IP e vsadmin, verifique se a função SVM LIF tem Data plus Mgmt ativada. Nesse caso, o ping para o SVM LIF funcionará, no entanto o SSH para o SVM LIF não funcionará. Em caso afirmativo, crie um LIF somente do SVM Mgmt e tente se conetar por meio desse LIF somente de gerenciamento da SVM.

  5. Se ainda não estiver funcionando, crie um novo SVM LIF e tente se conetar por meio desse LIF. Certifique-se de que a máscara de sub-rede está corretamente definida.

  6. Depuração avançada:

    1. Inicie um rastreamento de pacote no ONTAP.

    2. Tente conetar um coletor de dados à SVM a partir da IU do CloudSecure.

    3. Aguarde até que o erro seja exibido. Pare o rastreamento de pacotes no ONTAP.

    4. Abra o rastreamento de pacotes do ONTAP. Está disponível neste local

       https://<cluster_mgmt_ip>/spi/<clustername>/etc/log/packet_traces/
      .. Certifique-se de que existe um SYN de ONTAP para a caixa Agente.
      .. Se não houver SYN do ONTAP, então é um problema com firewall no ONTAP.
      .. Abra o firewall no ONTAP, para que o ONTAP possa conetar a caixa de agente.
  7. Se ainda não estiver funcionando, consulte a equipe de rede para garantir que nenhum firewall externo esteja bloqueando a conexão do ONTAP à caixa Agente.

  8. Se nenhuma das opções acima resolver o problema, abra um caso com "Suporte à NetApp" para obter mais assistência.

Problema: mensagem: "Falha ao determinar o tipo de ONTAP para [hostname: <IP Address>. Motivo: Erro de conexão com o sistema de armazenamento <IP Address>: O host está inacessível (o host não pode ser acessado)" Tente isto:

  1. Verifique se o endereço de gerenciamento de IP do SVM correto ou o IP de gerenciamento de cluster foram fornecidos.

  2. SSH para o SVM ou cluster ao qual você pretende se conetar. Depois de conectar, verifique se o SVM ou o nome do cluster estão corretos.

Problema: mensagem de erro: "O conetor está no estado de erro. service.name: Auditoria. Motivo da falha: Servidor fpolicy externo encerrado." Tente isto:

  1. É mais provável que um firewall esteja bloqueando as portas necessárias na máquina do agente. Verifique se o intervalo de portas 35000-55000/tcp está aberto para que a máquina do agente se conete a partir do SVM. Certifique-se também de que não há firewalls ativados a partir da comunicação de bloqueio do lado do ONTAP para a máquina do agente.

  2. Digite o seguinte comando na caixa Agente e verifique se o intervalo de portas está aberto.

    sudo iptables-save | grep 3500*

    A saída da amostra deve parecer:

     -A IN_public_allow -p tcp -m tcp --dport 35000 -m conntrack -ctstate NEW -j ACCEPT
    . Faça login no SVM, insira os seguintes comandos e verifique se nenhum firewall está definido para bloquear a comunicação com o ONTAP.
    system services firewall show
    system services firewall policy show
  3. SSH para o SVM/Cluster que você deseja monitorar. Faça ping na caixa Agente a partir do SVM data lif (com suporte a protocolos CIFS, NFS) e certifique-se de que o ping esteja funcionando:

    network ping -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail

    Se não for possível fazer o ping, verifique se as configurações de rede no ONTAP estão corretas, para que a máquina do agente possa ser digitalizada.

  4. Se um único SVM for adicionado duas vezes a um locatário por meio de coletores de dados 2, esse erro será mostrado. Exclua um dos coletores de dados através da IU. Em seguida, reinicie o outro coletor de dados através da IU. Em seguida, o coletor de dados mostrará o status "EM EXECUÇÃO" e começará a receber eventos da SVM.

    Basicamente, em um locatário, 1 SVM deve ser adicionado apenas uma vez, via coletor de dados 1. 1 SVM não deve ser adicionado duas vezes por meio de coletores de dados 2.

  5. Nos casos em que o mesmo SVM foi adicionado em dois ambientes de segurança de workload (locatários) diferentes, o último sempre será bem-sucedido. O segundo coletor irá configurar o fpolicy com seu próprio endereço IP e expulsar o primeiro. Assim, o coletor no primeiro deixará de receber eventos e seu serviço de "auditoria" entrará em estado de erro. Para evitar isso, configure cada SVM em um único ambiente.

  6. Este erro também pode ocorrer se as políticas de serviço não estiverem configuradas corretamente. Com o ONTAP 9.8 ou posterior, para se conetar ao coletor de origem de dados, o serviço de cliente data-fpolicy é necessário junto com o serviço de dados data-nfs e/ou data-cifs. Além disso, o serviço cliente data-fpolicy deve estar associado às lif(s) de dados do SVM monitorado.

Problema: nenhum evento visto na página de atividades. Tente isto:

  1. Verifique se o coletor ONTAP está no estado "EM FUNCIONAMENTO". Se sim, certifique-se de que alguns eventos cifs estão sendo gerados nas VMs cliente cifs abrindo alguns arquivos.

  2. Se nenhuma atividade for vista, faça login no SVM e digite o seguinte comando.

    <SVM>event log show -source fpolicy

    Por favor, certifique-se de que não existem erros relacionados ao fpolicy.

  3. Se nenhuma atividade for vista, faça login no SVM. Introduza o seguinte comando:

    <SVM>fpolicy show

    Verifique se a política fpolicy nomeada com o prefixo "cloudsecure_" foi definida e o status está "ligado". Se não estiver definido, é provável que o Agente não consiga executar os comandos na SVM. Certifique-se de que todos os pré-requisitos, conforme descrito no início da página, foram seguidos.

Problema: o SVM Data Collector está no estado de erro e a mensagem de erro é "o agente falhou ao conetar-se ao coletor" Tente isto:

  1. Muito provavelmente, o Agente está sobrecarregado e não consegue se conetar aos coletores de origem de dados.

  2. Verifique quantos coletores de fonte de dados estão conetados ao Agente.

  3. Verifique também a taxa de fluxo de dados na página "todas as atividades" na IU.

  4. Se o número de atividades por segundo for significativamente alto, instale outro Agente e mova alguns dos coletores de origem de dados para o novo Agente.

Problema: o SVM Data Collector mostra uma mensagem de erro como "Falha no nó fpolicy.server.connectError: ao estabelecer uma conexão com o servidor FPolicy "12.195.15.146" ( motivo: "Selecionar limite de tempo")" Experimente: o firewall está habilitado no SVM/Cluster. Portanto, o mecanismo fpolicy não consegue se conetar ao servidor fpolicy. Os CLIs no ONTAP que podem ser usados para obter mais informações são:

event log show -source fpolicy which shows the error
event log show -source fpolicy -fields event,action,description which shows more details.

Problema: mensagem de erro: "O conetor está no estado de erro. Nome do serviço:auditoria. Motivo da falha: Nenhuma interface de dados válida (função: Dados, protocolos de dados: NFS ou CIFS ou ambos, status: Up) encontrada no SVM." Tente isto: Certifique-se de que existe uma interface operacional (tendo papel como protocolo de dados e dados como CIFS/NFS.

Problema: o coletor de dados entra em estado de erro e, em seguida, entra em ESTADO DE EXECUÇÃO após algum tempo, em seguida, volta para erro novamente. Este ciclo repete-se. Tente isto: isso normalmente acontece no seguinte cenário:

  1. Há vários coletores de dados adicionados.

  2. Os coletores de dados que mostram esse tipo de comportamento terão 1 SVM adicionados a esses coletores de dados. Ou seja, 2 ou mais coletores de dados estão conetados ao 1 SVM.

  3. Garantir que o coletor de dados do 1 se conecte apenas ao 1 SVM.

  4. Exclua os outros coletores de dados que estão conetados ao mesmo SVM.

Problema: o conetor está no estado de erro. Nome do serviço: Auditoria. Motivo da falha: Falha ao configurar (política no SVM svmname. Motivo: Valor inválido especificado para o elemento 'hares-to-include' dentro de 'fpolicy.policy.scope-moDIMY: "Federal" Tente isto: *os nomes de compartilhamento precisam ser dados sem aspas. Edite a configuração do ONTAP SVM DSC para corrigir os nomes de compartilhamento.

Incluir e excluir compartilhamentos não se destina a uma longa lista de nomes de compartilhamento. Use a filtragem por volume se você tiver um grande número de compartilhamentos para incluir ou excluir.

Problema: existem fpolíticas existentes no cluster que não são usadas. O que deve ser feito com eles antes da instalação do Workload Security? Tente isto: recomenda-se excluir todas as configurações de fpolicy não utilizadas existentes, mesmo que estejam no estado desconetado. A segurança da carga de trabalho criará fpolicy com o prefixo "cloudsecure_". Todas as outras configurações de fpolicy não utilizadas podem ser excluídas.

Comando CLI para mostrar a lista fpolicy:

 fpolicy show
Etapas para excluir configurações do fpolicy:
fpolicy disable -vserver <svmname> -policy-name <policy_name>
fpolicy policy scope delete -vserver <svmname> -policy-name <policy_name>
fpolicy policy delete -vserver <svmname> -policy-name <policy_name>
fpolicy policy event delete -vserver <svmname> -event-name <event_list>
fpolicy policy external-engine delete -vserver <svmname> -engine-name <engine_name>

|depois de ativar a segurança de carga de trabalho, o desempenho do ONTAP é afetado: A latência se torna esporadicamente alta, os IOPs se tornam esporadicamente baixos. |ao usar o ONTAP com segurança de workload, às vezes, problemas de latência podem ser vistos no ONTAP. Há uma série de razões possíveis para isso, como observado no seguinte: "1372994" "1415152", , "1438207", "1479704", "1354659". Todos esses problemas são corrigidos no ONTAP 9.13,1 e posterior; é altamente recomendável usar uma dessas versões posteriores.

Problema: Data Collector está em erro, mostra esta mensagem de erro. "Erro: O conetor está no estado de erro. Nome do serviço: Auditoria. Motivo da falha: Falha ao configurar a política no SVM.svm_test. Motivo: Valor ausente para o campo zapi: Eventos. * Experimente isto:*

  1. Comece com um novo SVM com apenas o serviço NFS configurado.

  2. Adicione um coletor de dados do ONTAP SVM na segurança de workload. O CIFS é configurado como um protocolo permitido para o SVM, ao mesmo tempo em que adiciona o coletor de dados ONTAP SVM na segurança de workload.

  3. Aguarde até que o coletor de dados no Workload Security mostre um erro.

  4. Como o servidor CIFS NÃO está configurado na SVM, esse erro, como mostrado à esquerda, é mostrado pela Segurança de workload.

  5. Edite o coletor de dados ONTAP SVM e desmarque o protocolo CIFS conforme permitido. Salve o coletor de dados. Ele começará a ser executado somente com o protocolo NFS ativado.

Problema: Data Collector mostra a mensagem de erro: "Erro: Falha ao determinar a integridade do coletor dentro de 2 tentativas, tente reiniciar o coletor novamente (Código de erro: AGENT008)". Tente isto:

  1. Na página coletores de dados, role para a direita do coletor de dados dando o erro e clique no menu 3 pontos. Selecione Edit. Introduza novamente a palavra-passe do coletor de dados. Salve o coletor de dados pressionando o botão Save. O Data Collector será reiniciado e o erro deve ser resolvido.

  2. A máquina Agent pode não ter espaço suficiente para CPU ou RAM, é por isso que os DSCs estão falhando. Verifique o número de coletores de dados que são adicionados ao Agente na máquina. Se for superior a 20 GB, aumente a capacidade de CPU e RAM da máquina Agent. Uma vez que a CPU e a RAM forem aumentadas, os DSCs entrarão em Initializing (Inicializar) e, em seguida, no estado Running (execução) automaticamente. Veja o guia de dimensionamento em "esta página".

Problema: o Data Collector está errando quando o modo SVM está selecionado. Tente isto: ao se conetar no modo SVM, se o IP de gerenciamento de cluster for usado para se conetar em vez do IP de gerenciamento SVM, a conexão falhará. Certifique-se de que o SVM IP correto seja usado.

Problema: Data Collector mostra uma mensagem de erro quando o recurso Acesso negado está ativado: "O conetor está no estado de erro. Nome do serviço: Auditoria. Motivo da falha: Falha ao configurar o fpolicy no SVM test_svm. Motivo: O usuário não está autorizado." Tente: o usuário pode estar perdendo as PERMISSÕES DE DESCANSO necessárias para o recurso Acesso negado. Siga as instruções em "esta página" para definir as permissões.

Reinicie o coletor assim que as permissões estiverem definidas.

Se você ainda estiver tendo problemas, entre em Contato com os links de suporte mencionados na página Ajuda > suporte.