Monitoraggio rilevamento anomalie
Rilevamento delle anomalie fornisce informazioni utili sui cambiamenti imprevisti nei modelli di dati sul tenant. Un'anomalia si verifica quando il modello del comportamento di un oggetto cambia, per esempio, se un oggetto sperimenta un certo livello di latenza ad un certo tempo il mercoledì, ma picchi di latenza sopra quel livello a quell'ora il mercoledì successivo, quel picco sarebbe considerato un'anomalia. Data Infrastructure Insights consente la creazione di monitor per avvisare in caso di anomalie in tal senso.
Il rilevamento delle anomalie è adatto per le metriche degli oggetti che mostrano un modello ricorrente e prevedibile. Quando queste metriche dell'oggetto superano o scendono al di sotto dei livelli previsti, Data Infrastructure Insights può generare un avviso per un'analisi tempestiva.
Cos'è il rilevamento delle anomalie?
Un'anomalia si verifica quando il valore medio di una metrica è un numero di deviazioni standard lontano dalla media ponderata di quella metrica per le settimane precedenti, con settimane recenti che hanno più peso rispetto alle settimane precedenti. Data Infrastructure Insights offre la possibilità di monitorare i dati e avvisare in caso di anomalie. È possibile impostare i livelli di rilevamento della "sensibilità". Ad esempio, una sensibilità maggiore è quando il valore medio è meno deviazioni standard dalla media, causando così la generazione di un maggior numero di avvisi. Al contrario, minore sensibilità = più deviazioni standard dalla media = meno avvisi.
Il monitoraggio del rilevamento delle anomalie differisce dal monitoraggio della soglia.
-
Il monitoraggio basato su soglia funziona quando si dispone di soglie predefinite per metriche specifiche. In altre parole, quando si ha una chiara comprensione di ciò che ci si aspetta (cioè all'interno di un intervallo normale).
-
Monitoraggio rilevamento anomalie utilizza algoritmi di apprendimento automatico per identificare gli outliers che si discostano dalla norma, per quando la definizione di "normale" non è chiara.
Quando è necessario il rilevamento delle anomalie?
Il monitoraggio del rilevamento delle anomalie può fornire avvisi utili per molte situazioni, tra cui:
-
Quando la definizione di normale non è chiara. Ad esempio, è possibile che le percentuali di errore SAN siano diverse in base alla porta. La segnalazione di un errore è rumorosa e non necessaria, ma un aumento improvviso o significativo potrebbe indicare un problema diffuso.
-
Dove ci sono cambiamenti nel tempo. Carichi di lavoro caratterizzati da stagionalità (ovvero, sono occupati o silenziosi in determinati momenti). Ciò potrebbe includere periodi di inattività imprevisti che potrebbero indicare un blocco del batch.
-
Lavorare con grandi quantità di dati quando la definizione e la regolazione manuale delle soglie non sono pratiche. Ad esempio, un tenant con un elevato numero di host e/o volumi con carichi di lavoro variabili. Ciascuno di essi può disporre di SLA diversi, pertanto è importante comprendere quelli che superano la norma.
Creazione di un monitor di rilevamento anomalie
Per segnalare eventuali anomalie, creare un monitor accedendo a osservabilità > Avvisi > +Monitor. Selezionare monitoraggio rilevamento anomalie come tipo di monitor.
Scegliere l'oggetto e la metrica da monitorare. È possibile impostare filtri e raggruppamenti come per altri tipi di monitor.
Quindi, impostare le condizioni per il monitor.
-
Attiva un avviso quando la metrica selezionata picchi sopra i limiti previsti, scende sotto quei limiti o entrambi.
-
Impostare la sensibilità su Medium, Low (vengono rilevate meno anomalie) o High (vengono rilevate più anomalie).
-
Determinare se il livello di avviso è critico o Avviso.
-
Facoltativamente, impostare un valore al di sotto del quale le anomalie sono ignorate. Questo può contribuire a ridurre il rumore. Questo valore viene visualizzato come una linea tratteggiata sul grafico campione.
Infine, è possibile configurare un metodo di recapito per gli avvisi (e-mail, webhook o entrambi), fornire al monitor una descrizione opzionale o azioni correttive e, se lo si desidera, aggiungere il monitor a un gruppo personalizzato.
Salvate il monitor con un nome significativo e avete finito.
Al momento della creazione, il monitor analizza i dati della settimana precedente per stabilire una linea di base iniziale. Il rilevamento delle anomalie diventa più accurato con il passare del tempo e con una maggiore cronologia.
Visualizzazione delle anomalie
In una pagina di destinazione di un avviso, gli avvisi attivati quando vengono rilevate anomalie mostrano una banda evidenziata nel grafico, dal momento in cui la metrica è aggiunta al di fuori dei limiti previsti al momento in cui si è spostata indietro all'interno di tali limiti.
Durante la visualizzazione di un grafico delle anomalie in una landing page degli avvisi, puoi scegliere le seguenti opzioni:
-
Trend settimanale: Confrontare i valori con la stessa ora, nello stesso giorno delle settimane precedenti, fino a 5 settimane precedenti.
-
Limiti di anomalia completi: Per impostazione predefinita, il grafico si concentra sul valore metrico in modo da poter analizzare meglio il comportamento metrico. Selezionare per visualizzare i limiti di anomalia completi (valore massimo, ecc.)
È inoltre possibile visualizzare gli oggetti che hanno contribuito all'anomalia selezionandoli nella visualizzazione esperto della pagina di destinazione. Il grafico mostra il comportamento degli oggetti selezionati.