Monitores de detección de anomalías
La detección de anomalías proporciona información sobre cambios inesperados en los patrones de datos de su inquilino. Una anomalía ocurre cuando el patrón de comportamiento de un objeto cambia, por ejemplo, si un objeto experimenta un cierto nivel de latencia en un momento determinado los miércoles, pero la latencia aumenta por encima de ese nivel en ese momento el miércoles siguiente, ese aumento se consideraría una anomalía. Data Infrastructure Insights permite la creación de monitores para alertar cuando ocurren anomalías como esta.
La detección de anomalías es adecuada para métricas de objetos que muestran un patrón recurrente y predecible. Cuando estas métricas de objetos superan o caen por debajo de sus niveles esperados, Data Infrastructure Insights puede generar una alerta para iniciar una investigación.
¿Qué es la detección de anomalías?
Se produce una anomalía cuando el valor medio de una métrica está a varias desviaciones estándar de la media ponderada de esa métrica durante las semanas anteriores, y las semanas recientes tienen más peso que las semanas anteriores. Data Infrastructure Insights proporciona la capacidad de monitorear datos y alertar cuando se detectan anomalías. Tiene la opción de establecer los niveles de "sensibilidad" de detección. Por ejemplo, una mayor sensibilidad sería cuando el valor medio tenga menos desviaciones estándar de la media, lo que provocaría que se generaran más alertas. Por el contrario, menor sensibilidad = más desviaciones estándar de la media = menos alertas.
La monitorización de detección de anomalías se diferencia de la monitorización de umbrales.
-
La supervisión basada en umbrales funciona cuando tienes umbrales predefinidos para métricas específicas. En otras palabras, cuando tienes una comprensión clara de lo que se espera (es decir, dentro de un rango normal).
-
El monitoreo de detección de anomalías utiliza algoritmos de aprendizaje automático para identificar valores atípicos que se desvían de la norma, cuando la definición de "normal" no está clara.
¿Cuándo necesitaría detección de anomalías?
La monitorización de detección de anomalías puede proporcionar alertas útiles para muchas situaciones, incluidas las siguientes:
-
Cuando la definición de normal no está clara. Por ejemplo, se pueden esperar tasas de error de SAN en cantidades variables según el puerto. Alertar sobre un error es ruidoso e innecesario, pero un aumento repentino o significativo podría indicar un problema generalizado.
-
Donde hay cambios a lo largo del tiempo. Cargas de trabajo que presentan estacionalidad (es decir, que están ocupadas o tranquilas en determinados momentos). Esto podría incluir períodos de silencio inesperados que podrían indicar un estancamiento del lote.
-
Trabajar con grandes cantidades de datos donde definir y ajustar umbrales manualmente no resulta práctico. Por ejemplo, un inquilino con una gran cantidad de hosts y/o volúmenes con cargas de trabajo variables. Cada uno puede tener diferentes SLA, por lo que es importante comprender cuáles superan la norma.
Creación de un monitor de detección de anomalías
Para alertar sobre anomalías, cree un monitor navegando a Observabilidad > Alertas > +Monitor. Seleccione Monitor de detección de anomalías como tipo de monitor.
Elija el objeto y la métrica que desea monitorear. Puede configurar filtros y agrupaciones como con otros tipos de monitores.
A continuación, configure las condiciones para el monitor.
-
Activa una alerta cuando la métrica seleccionada supera los límites previstos, cae por debajo de esos límites o ambas cosas.
-
Establezca la sensibilidad en Media, Baja (se detectan menos anomalías) o Alta (se detectan más anomalías).
-
Determinar si el nivel de alerta es Crítico o Advertencia.
-
Opcionalmente, establezca un valor por debajo del cual se ignorarán las anomalías. Esto puede ayudar a reducir el ruido. Este valor se muestra como una línea discontinua en el gráfico de muestra.
Por último, puede configurar un método de entrega para las alertas (correo electrónico, webhook o ambos), darle al monitor una descripción opcional o acciones correctivas y agregar el monitor a un grupo personalizado, si lo desea.
Guarde el monitor con un nombre significativo y listo.
Una vez creado, el monitor analiza los datos de la semana anterior para establecer una línea de base inicial. La detección de anomalías se vuelve más precisa a medida que pasa el tiempo y se acumula más historia.
|
Cuando se crea un monitor, DII analiza los datos existentes de la semana anterior para detectar picos o caídas de datos significativos; estos se consideran anomalías. Durante la primera semana después de la creación del monitor (la fase de "aprendizaje") existe la posibilidad de que haya un mayor "ruido" en las alertas. Para mitigar este ruido, solo los picos o caídas que duren más de 30 minutos se consideran anomalías y generan alertas. En la semana siguiente, a medida que se analicen más datos, el ruido generalmente se reducirá y un aumento o una caída significativa que dure cualquier período de tiempo se considerará una anomalía. |
Viendo las anomalías
En una página de inicio de alerta, las alertas que se activan cuando se detectan anomalías mostrarán una banda resaltada en el gráfico, desde el momento en que la métrica se disparó fuera de los límites previstos hasta cuando volvió a estar dentro de esos límites.
Al visualizar un gráfico de anomalías en una página de inicio de alerta, puede elegir las siguientes opciones:
-
Tendencia semanal: compara valores a la misma hora, mismo día en semanas anteriores, durante hasta 5 semanas anteriores.
-
Límites de anomalía completos: de forma predeterminada, el gráfico se centra en el valor de la métrica para que pueda analizar mejor el comportamiento de la métrica. Seleccione para mostrar los límites de anomalía completos (valor máximo, etc.)
También puedes ver los objetos que contribuyeron a la anomalía seleccionándolos en la sección de rendimiento de la página de destino. El gráfico mostrará el comportamiento de los objetos seleccionados.