Affichage et gestion des alertes des moniteurs
Data Infrastructure Insights affiche des alertes lorsque"seuils surveillés" sont dépassés.
|
Les moniteurs et les alertes sont disponibles dans Data Infrastructure Insights Standard Edition et versions ultérieures. |
Affichage et gestion des alertes
Pour afficher et gérer les alertes, procédez comme suit.
-
Accédez à la page Alertes > Toutes les alertes.
-
Une liste contenant jusqu'aux 1 000 alertes les plus récentes s'affiche. Vous pouvez trier cette liste sur n’importe quel champ en cliquant sur l’en-tête de colonne du champ. La liste affiche les informations suivantes. Notez que toutes ces colonnes ne sont pas affichées par défaut. Vous pouvez sélectionner les colonnes à afficher en cliquant sur l'icône « engrenage » :
-
ID d'alerte : ID d'alerte unique généré par le système
-
Heure de déclenchement : L'heure à laquelle le moniteur concerné a déclenché l'alerte
-
Gravité actuelle (onglet Alertes actives) : la gravité actuelle de l'alerte active
-
Gravité maximale (onglet Alertes résolues) ; la gravité maximale de l'alerte avant sa résolution
-
Moniteur : Le moniteur configuré pour déclencher l'alerte
-
Déclenché le : L'objet sur lequel le seuil surveillé a été dépassé
-
Statut : État d'alerte actuel, Nouveau ou En cours
-
Statut actif : Actif ou Résolu
-
Condition : La condition de seuil qui a déclenché l'alerte
-
Métrique : La métrique de l'objet sur laquelle le seuil surveillé a été dépassé
-
État du moniteur : État actuel du moniteur qui a déclenché l'alerte
-
A une action corrective : L'alerte a suggéré des actions correctives. Ouvrez la page d'alerte pour les afficher.
-
Vous pouvez gérer une alerte en cliquant sur le menu à droite de l'alerte et en choisissant l'une des options suivantes :
-
En cours pour indiquer que l'alerte fait l'objet d'une enquête ou doit rester ouverte
-
Ignorer pour supprimer l'alerte de la liste des alertes actives.
Vous pouvez gérer plusieurs alertes en sélectionnant la case à cocher à gauche de chaque alerte et en cliquant sur Modifier le statut des alertes sélectionnées.
Cliquer sur un ID d’alerte ouvre la page de détails de l’alerte.
Panneau de détails des alertes
Sélectionnez n’importe quelle ligne d’alerte pour ouvrir le panneau de détails de l’alerte. Le panneau de détails de l'alerte fournit des détails supplémentaires sur l'alerte, notamment un Résumé, une section Performances affichant des graphiques liés aux données de l'objet, tous les Actifs associés et les Commentaires saisis par les enquêteurs de l'alerte.
Alertes lorsque des données sont manquantes
Dans un système en temps réel tel que Data Infrastructure Insights, pour déclencher l'analyse d'un moniteur afin de décider si une alerte doit être générée, nous nous appuyons sur l'une des deux choses suivantes :
-
le prochain point de données à arriver
-
un minuteur à déclencher lorsqu'il n'y a pas de point de données et que vous avez attendu suffisamment longtemps
Comme c'est le cas avec une arrivée lente des données (ou aucune arrivée de données), le mécanisme de minuterie doit prendre le relais car le taux d'arrivée des données est insuffisant pour déclencher des alertes en « temps réel ». La question devient donc généralement : « Combien de temps dois-je attendre avant de fermer la fenêtre d’analyse et de regarder ce que j’ai ? » Si vous attendez trop longtemps, vous ne générez pas les alertes assez rapidement pour être utiles.
Si vous disposez d'un moniteur avec une fenêtre de 30 minutes qui détecte qu'une condition est violée par le dernier point de données avant une perte de données à long terme, une alerte sera générée car le moniteur n'a reçu aucune autre information à utiliser pour confirmer une récupération de la métrique ou pour signaler que la condition a persisté.
Alertes « actives en permanence »
Il est possible de configurer un moniteur de telle manière que la condition existe toujours sur l'objet surveillé, par exemple, IOPS > 1 ou latence > 0. Ceux-ci sont souvent créés comme moniteurs « de test » puis oubliés. Ces moniteurs créent des alertes qui restent ouvertes en permanence sur les objets constitutifs, ce qui peut entraîner des problèmes de stress et de stabilité du système au fil du temps.
Pour éviter cela, Data Infrastructure Insights fermera automatiquement toute alerte « active en permanence » après 7 jours. Notez que les conditions de surveillance sous-jacentes peuvent (probablement) continuer à exister, provoquant l'émission d'une nouvelle alerte presque immédiatement, mais cette fermeture des alertes « toujours actives » atténue une partie du stress du système qui peut autrement se produire.