Risoluzione dei problemi del Data Collector della SVM di ONTAP
Workload Security utilizza i data colleator per raccogliere i dati di accesso ai file e agli utenti dai dispositivi. Di seguito sono riportati alcuni suggerimenti per la risoluzione dei problemi relativi a questo raccoglitore.
Vedere la "Configurazione di SVM Collector" pagina per istruzioni sulla configurazione di questo raccoglitore.
Risoluzione dei problemi
I problemi noti e le relative risoluzioni sono descritti nella seguente tabella.
In caso di errore, fare clic su More Detail nella colonna Status per informazioni dettagliate sull'errore.
Problema: | Risoluzione: |
---|---|
Data Collector viene eseguito per un certo periodo di tempo e si arresta dopo un periodo di tempo casuale, con il messaggio di errore: "Messaggio di errore: Connettore in stato di errore. Nome del servizio: Audit. Motivo del guasto: Server fpolicy esterno sovraccarico." |
La percentuale di eventi di ONTAP era molto superiore a quella che la casella Agente è in grado di gestire. Di conseguenza, la connessione è stata interrotta. Controllare il picco di traffico in CloudSecure quando si è verificata la disconnessione. Questa opzione è disponibile nella pagina CloudSecure > Activity Forensics > All Activity. Se il picco di traffico aggregato è superiore a quello che Agent Box è in grado di gestire, fare riferimento alla pagina Event Rate Checker per informazioni su come dimensionare l'implementazione di Collector in un Agent Box. Se l'agente è stato installato nella casella Agent prima del 4 marzo 2021, eseguire i seguenti comandi nella casella Agent: ECHO 'net.core.rmem_max=8388608' >> /etc/sysctl.conf echo 'net.ipv4.tcp_rmem = 4096 2097152 8388608' >> /etc/sysctl.conf sysctl -p riavviare il raccoglitore dall'interfaccia utente dopo il ridimensionamento. |
"Collector riporta il messaggio di errore "Nessun indirizzo IP locale trovato sul connettore che può raggiungere le interfacce dati della SVM"." |
Questo è probabilmente dovuto a un problema di rete sul lato ONTAP. Attenersi alla seguente procedura: 1. Assicurarsi che non vi siano firewall sul file di dati SVM o sul file di gestione che bloccano la connessione da SVM. 2. Quando si aggiunge una SVM tramite un IP per la gestione del cluster, assicurarsi che i lif dei dati e i lif di gestione della SVM siano gestibili dalla VM dell'agente. In caso di problemi, controllare il gateway, la netmask e i percorsi per la lif. È anche possibile provare ad accedere al cluster tramite ssh utilizzando l'IP di gestione del cluster e ping dell'IP dell'agente. Assicurarsi che l'IP dell'agente sia ping: Network ping -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail se non è possibile eseguire il ping, assicurarsi che le impostazioni di rete in ONTAP siano corrette, in modo che il computer dell'agente sia ping. 3. Se hai provato a connetterti tramite IP cluster e non funziona, prova a connetterti direttamente tramite IP SVM. Vedere sopra per la procedura di connessione tramite SVM IP. 4. Aggiungendo il collector tramite SVM IP e le credenziali vsadmin, controllare se la LIF SVM ha il ruolo Data Plus Mgmt abilitato. In questo caso il ping alla LIF SVM funzionerà, tuttavia SSH alla LIF SVM non funzionerà. In caso affermativo, creare una LIF solo gestione SVM e provare a connettersi tramite questa LIF solo gestione SVM. 5. Se ancora non funziona, crea una nuova LIF e prova a connetterti tramite quella LIF. Assicurarsi che la subnet mask sia impostata correttamente. 6. Debug avanzato: A) avviare una traccia di pacchetto in ONTAP. b) provare a collegare un data collector alla SVM dall'interfaccia utente di CloudSecure. c) attendere che venga visualizzato l'errore. Arrestare la traccia del pacchetto in ONTAP. d) aprire la traccia del pacchetto da ONTAP. È disponibile in questa posizione https://<cluster_mgmt_ip>/spi/<clustername>/etc/log/packet_Traces/ e) assicurarsi che vi sia un SYN da ONTAP alla casella Agente. f) se non c'è alcun SYN da ONTAP, allora è un problema con il firewall in ONTAP. G) aprire il firewall in ONTAP, in modo che ONTAP sia in grado di connettere la casella Agente. 7. Se il problema persiste, consultare il team di rete per assicurarsi che nessun firewall esterno blocchi la connessione da ONTAP alla casella Agente. 8. Verificare che la porta 7 sia aperta. 9. Se nessuna delle soluzioni precedenti risolve il problema, aprire un caso con "Supporto NetApp" per ulteriore assistenza. |
Messaggio: "Impossibile determinare il tipo di ONTAP per [hostname: <IP Address>. Motivo: Errore di connessione al <IP Address> del sistema di storage: Host irraggiungibile (host irraggiungibile)" |
1. Verificare che sia stato fornito l'indirizzo di gestione IP SVM o l'IP di gestione cluster corretto. 2. SSH alla SVM o al cluster a cui si intende connettersi. Una volta stabilita la connessione, assicurarsi che il nome SVM o il nome del cluster sia corretto. |
Messaggio di errore: "Il connettore è in stato di errore. Service.name: Audit. Motivo del guasto: Server fpolicy esterno terminato." |
1. È molto probabile che un firewall blocchi le porte necessarie nel computer dell'agente. Verificare che l'intervallo di porte 35000-55000/tcp sia aperto affinché il computer dell'agente si connetta da SVM. Assicurarsi inoltre che non vi siano firewall abilitati dal lato ONTAP che bloccano la comunicazione con il computer dell'agente. 2. Digitare il seguente comando nella casella Agente e assicurarsi che l'intervallo di porte sia aperto. _Sudo iptables-Save |
grep 3500*_ l'output di esempio dovrebbe essere simile a: -A IN_public_allow -p tcp -m tcp --dport 35000 -m conntrack -ctstate NEW -j ACCEPT 3. Accedere a SVM, immettere i seguenti comandi e verificare che nessun firewall sia impostato per bloccare la comunicazione con ONTAP. System Services firewall show system Services firewall policy show "Controllare i comandi del firewall" sul lato ONTAP. 4. SSH all'SVM/cluster che si desidera monitorare. Eseguire il ping della casella Agent dal file di dati SVM (con il supporto dei protocolli CIFS e NFS) e assicurarsi che il ping funzioni: Ping di rete -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail se non è possibile eseguire il ping, assicurarsi che le impostazioni di rete in ONTAP siano corrette, in modo che il computer dell'agente possa eseguire il ping. 5.se una singola SVM viene aggiunta due volte a un tenant tramite 2 data collettori, viene visualizzato questo errore. Eliminare uno dei data collezionisti attraverso l'interfaccia utente. Quindi riavviare l'altro data collector tramite l'interfaccia utente. Il data collector mostrerà lo stato "IN ESECUZIONE" e inizierà a ricevere gli eventi da SVM. In sostanza, in un tenant, 1 SVM deve essere aggiunto una sola volta, tramite 1 data collector. 1 SVM non deve essere aggiunto due volte tramite 2 data collezioner. 6. Ad esempio, se la stessa SVM è stata aggiunta in due diversi ambienti di sicurezza dei workload (tenant), l'ultimo avrà sempre successo. Il secondo collector configurerà fpolicy con il proprio indirizzo IP e eseguirà il kick out del primo. In questo modo, il collector del primo interrompe la ricezione degli eventi e il servizio di "audit" entra in stato di errore. Per evitare questo problema, configurare ogni SVM in un singolo ambiente. 7. Questo errore può verificarsi anche se le politiche di servizio non sono configurate correttamente. Con ONTAP 9.8 o versione successiva, per connettersi al Data Source Collector, è necessario il servizio client data-fpolicy insieme al servizio dati data-nfs e/o data-cifs. Inoltre, il servizio data-fpolicy-client deve essere associato ai lif di dati per la SVM monitorata. |
Nessun evento visualizzato nella pagina delle attività. |
1. Controllare se ONTAP Collector è in stato "in ESECUZIONE". In caso affermativo, assicurarsi che alcuni eventi cifs vengano generati sulle macchine virtuali del client cifs aprendo alcuni file. 2. Se non viene rilevata alcuna attività, effettua l'accesso alla SVM e inserisci il seguente comando. <SVM> ftllog show -source fpolicy assicurarsi che non ci siano errori relativi a fpolicy. 3. Se non viene rilevata alcuna attività, effettua l'accesso alla SVM. Immettere il seguente comando <SVM> policy show controllare se la policy fpolicy denominata con il prefisso "cloudSecure_" è stata impostata e lo stato è "on". Se non impostato, molto probabilmente l'agente non è in grado di eseguire i comandi nella SVM. Assicurarsi di aver seguito tutti i prerequisiti descritti all'inizio della pagina. |
SVM Data Collector si trova in stato di errore e il messaggio di errore indica che l'agente non è riuscito a connettersi al collector. |
1. Molto probabilmente l'agente è sovraccarico e non è in grado di connettersi ai collettori di origine dati. 2. Verificare il numero di raccoglitori origine dati collegati all'agente. 3. Controllare anche la portata di dati nella pagina "All Activity" (tutte le attività) dell'interfaccia utente. 4. Se il numero di attività al secondo è molto elevato, installare un altro agente e spostare alcuni dei Data Source Collector nel nuovo agente. |
SVM Data Collector visualizza il messaggio di errore "fpolicy.server.connectError: Node failed to stabiling a Connection with the FPolicy server "12.195.15.146" ( Reason: "Select Timed out")" |
Il firewall è attivato in SVM/Cluster. Pertanto, il motore fpolicy non è in grado di connettersi al server fpolicy. I CLIS in ONTAP che possono essere utilizzati per ottenere ulteriori informazioni sono: Registro eventi show -source fpolicy che mostra il registro eventi di errore show -source fpolicy -fields event,action,description che mostra ulteriori dettagli. "Controllare i comandi del firewall" Sul lato ONTAP. |
Messaggio di errore: "Il connettore è in stato di errore. Nome del servizio:audit. Motivo del guasto: Nessuna interfaccia dati valida (ruolo: Dati, protocolli dati: NFS o CIFS o entrambi, stato: Up) trovata su SVM." |
Assicurarsi che sia presente un'interfaccia operativa (con ruolo di protocollo dati e dati come CIFS/NFS). |
Il data collector passa allo stato di errore, quindi PASSA ALLO stato DI ESECUZIONE dopo un certo periodo di tempo, quindi torna a Error. Questo ciclo si ripete. |
Ciò si verifica in genere nel seguente scenario: 1. Sono stati aggiunti più data colleziones. 2. Ai data collector che mostrano questo tipo di comportamento verranno aggiunte 1 SVM. Ciò significa che 2 o più data collezioner sono collegati a 1 SVM. 3. Assicurarsi che 1 Data Collector si connetta solo a 1 SVM. 4. Elimina gli altri collettori di dati connessi alla stessa SVM. |
Il connettore è in stato di errore. Nome del servizio: Audit. Motivo dell'errore: Configurazione non riuscita (policy su SVM svmname. Motivo: Valore non valido specificato per l'elemento 'shares-to-include' all'interno di 'fpolicy.policy.scope-modify: "Federal" |
I nomi delle condivisioni devono essere forniti senza virgolette. Modificare la configurazione DSC SVM ONTAP per correggere i nomi delle condivisioni. Include ed exclude share non è destinato a un lungo elenco di nomi di share. Utilizzare invece il filtraggio per volume se si dispone di un elevato numero di condivisioni da includere o escludere. |
Nel cluster sono presenti fpolicy inutilizzate. Cosa fare con quelli prima dell'installazione di workload Security? |
Si consiglia di eliminare tutte le impostazioni fpolicy inutilizzate esistenti anche se si trovano in stato disconnesso. Workload Security creerà fpolicy con il prefisso "cloudSecure_". Tutte le altre configurazioni fpolicy inutilizzate possono essere eliminate. Comando CLI per visualizzare l'elenco fpolicy: Fpolicy show passi per eliminare le configurazioni fpolicy: Fpolicy disable -vserver <svmname> -policy-name <policy_name> fpolicy policy policy policy scope delete -vserver <svmname> -policy-name <policy_name> fpolicy policy policy delete -vserver <svmname> <event_list> -policy-name <policy_name> <svmname> _fpolicy policy policy event delete -vserver <svmname> <engine_name> -nome-motore-esterno -server_vpolicy |
Dopo aver attivato la sicurezza dei workload, le performance di ONTAP ne risentono: La latenza diventa sporadicamente elevata, gli IOPS diventano sporadicamente bassi. |
Mentre si utilizza ONTAP con sicurezza del carico di lavoro, a volte i problemi di latenza possono essere riscontrati in ONTAP. Vi sono diverse ragioni possibili per questo, come indicato di seguito: "1372994", , "1415152", "1438207" "1479704" "1354659" . Tutti questi problemi sono stati risolti in ONTAP 9.13.1 e versioni successive; si consiglia vivamente di utilizzare una di queste versioni successive. |
Data Collector in error, visualizza questo messaggio di errore. "Errore: Il connettore è in stato di errore. Nome del servizio: Audit. Motivo dell'errore: Impossibile configurare il criterio su SVM svm_test. Motivo: Valore mancante per il campo zapi: Eventi. " |
Inizia con una nuova SVM con solo il servizio NFS configurato. Aggiungere un data collector SVM ONTAP in sicurezza del carico di lavoro. CIFS viene configurato come protocollo consentito per SVM mentre si aggiunge il Data Collector SVM ONTAP in sicurezza del carico di lavoro. Attendere che il Data Collector in workload Security visualizzi un errore. Poiché il server CIFS NON è configurato su SVM, questo errore, come mostrato a sinistra, viene visualizzato da workload Security. Modificare il data collector ONTAP SVM e deselezionare CIFS come protocollo consentito. Salvare il data collector. Verrà avviato solo con il protocollo NFS attivato. |
Data Collector visualizza il messaggio di errore: "Errore: Impossibile determinare lo stato di salute del raccoglitore entro 2 tentativi, provare a riavviare nuovamente il Collector (codice di errore: AGENT008)". |
1. Nella pagina Data Collector, scorrere a destra del data Collector indicando l'errore e fare clic sul menu 3 punti. Selezionare Edit. Immettere nuovamente la password del data collector. Salvare il data collector premendo il pulsante Save. Data Collector verrà riavviato e l'errore dovrebbe essere risolto. 2. Il computer dell'agente potrebbe non disporre di spazio sufficiente per CPU o RAM, motivo per cui i DSC non funzionano. Verificare il numero di Data Collector aggiunti all'Agente nel computer. Se è superiore a 20, aumentare la capacità della CPU e della RAM del computer dell'agente. Una volta aumentate la CPU e la RAM, i DSC entrano automaticamente in Inizializzazione e quindi in esecuzione. Consultare la guida alle dimensioni su "questa pagina". |
Il Data Collector genera un errore quando viene selezionata la modalità SVM. |
Se i problemi persistono, accedere ai collegamenti di supporto indicati nella pagina Guida > supporto.