Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Référence des alertes

Contributeurs

Cette référence répertorie les alertes par défaut qui apparaissent dans le Gestionnaire de grille. Les actions recommandées sont dans le message d'alerte que vous recevez.

Si nécessaire, vous pouvez créer des règles d'alerte personnalisées en fonction de votre approche de gestion du système.

Certaines des alertes par défaut utilisent "Metrics Prometheus".

Alertes de l'appliance

Nom de l'alerte Description

Batterie de l'appareil expirée

La batterie du contrôleur de stockage de l'appareil a expiré.

La batterie de l'appareil est défectueuse

La batterie du contrôleur de stockage de l'appareil est défectueuse.

La capacité de la batterie de l'appareil est insuffisante

La capacité de la batterie du contrôleur de stockage de l'appareil est insuffisante.

La batterie de l'appareil est presque déchargée

La batterie du contrôleur de stockage de l'appliance arrive à expiration.

Batterie de l'appareil retirée

La batterie du contrôleur de stockage de l'appareil est manquante.

Batterie de l'appareil trop chaude

La batterie du contrôleur de stockage de l'appareil est en surchauffe.

Erreur de communication du BMC de l'appliance

La communication avec le contrôleur de gestion de la carte mère (BMC) a été perdue.

Échec du périphérique de sauvegarde du cache de l'appliance

Échec d'un périphérique de sauvegarde de cache persistant.

Capacité insuffisante du périphérique de sauvegarde en cache de l'appliance

La capacité du périphérique de sauvegarde du cache est insuffisante.

Dispositif de sauvegarde cache de l'appliance protégé en écriture

Un périphérique de sauvegarde de cache est protégé en écriture.

La taille de la mémoire cache de l'appliance ne correspond pas

Le cache des deux contrôleurs de l'appliance est de différentes tailles.

La température du châssis du contrôleur de calcul de l'appliance est trop élevée

La température du contrôleur de calcul d'une appliance StorageGRID a dépassé le seuil nominal.

Température trop élevée du processeur du contrôleur de calcul de l'appliance

La température du processeur dans le contrôleur de calcul d'une appliance StorageGRID a dépassé le seuil nominal.

Le contrôleur de calcul de l'appliance doit faire attention

Une défaillance matérielle a été détectée dans le contrôleur de calcul d'une appliance StorageGRID.

L'alimentation A du contrôleur de calcul de l'appliance présente un problème

L'alimentation A du contrôleur de calcul présente un problème.

L'alimentation B du contrôleur de calcul de l'appliance présente un problème

L'alimentation B du contrôleur de calcul présente un problème.

Service de surveillance du matériel de calcul de l'appliance bloqué

Le service qui surveille l'état du matériel de stockage est bloqué.

Panne du lecteur DAS de l'appliance détectée

Un problème a été détecté au niveau d'un disque DAS (Direct-Attached Storage) dans l'appliance.

Reconstruction des disques DAS du dispositif

Un disque DAS (Direct-Attached Storage) est en cours de reconstruction. Ceci est attendu s'il a été récemment remplacé ou supprimé/réinséré.

Panne du ventilateur de l'appareil détectée

Un problème de ventilateur dans l'appareil a été détecté.

Panne Fibre Channel de l'appliance détectée

Un problème de liaison Fibre Channel a été détecté entre le contrôleur de stockage de l'appliance et le contrôleur de calcul

Défaillance du port HBA Fibre Channel de l'appliance

Un port HBA Fibre Channel est défectueux ou est défectueux.

Flash cache de l'appliance ne sont pas optimaux

Les disques utilisés pour la mise en cache SSD ne sont pas optimaux.

Interconnexion de l'appareil/boîtier de la batterie retiré

Le boîtier d'interconnexion/de batterie est manquant.

Port d'appliance LACP manquant

Aucun port d'une appliance StorageGRID ne participe au lien LACP.

Défaillance de la carte réseau de l'appareil détectée

Un problème de carte d'interface réseau (NIC) a été détecté sur le serveur.

L'alimentation générale de l'appareil est dégradée

La puissance d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée.

Avertissement critique sur les disques SSD de l'appliance

Un SSD d'appliance signale un avertissement critique.

Défaillance Du contrôleur de stockage De l'appliance

Le contrôleur de stockage A d'une appliance StorageGRID est en panne.

Défaillance du contrôleur B de stockage de l'appliance

Le contrôleur de stockage B d'une appliance StorageGRID est en panne.

Panne de disque du contrôleur de stockage de l'appliance

Un ou plusieurs disques d'une appliance StorageGRID sont défectueux ou non optimaux.

Problème matériel du contrôleur de stockage de l'appliance

Le logiciel SANtricity signale les besoins d'attention d'un composant d'une appliance StorageGRID.

Panne de l'alimentation Du contrôleur de stockage de l'appliance

L'alimentation A d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée.

Panne de l'alimentation B du contrôleur de stockage de l'appliance

L'alimentation B d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée.

Entretien du moniteur matériel de stockage de l'appliance bloqué

Le service qui surveille l'état du matériel de stockage est bloqué.

Dégradation des tiroirs de stockage de l'appliance

L'état de l'un des composants du tiroir de stockage d'une appliance de stockage est dégradé.

Température de l'appareil dépassée

La température nominale ou maximale du contrôleur de stockage de l'appareil a été dépassée.

Capteur de température de l'appareil retiré

Un capteur de température a été déposé.

Les E/S du disque sont très lentes

Les E/S de disque très lentes peuvent affecter les performances du grid.

Panne du ventilateur du dispositif de stockage détectée

Un problème de ventilateur dans le contrôleur de stockage d'un dispositif a été détecté.

Dégradation de la connectivité du stockage de l'appliance de stockage

Un problème se produit au niveau d'une ou plusieurs connexions entre le contrôleur de calcul et le contrôleur de stockage.

Périphérique de stockage inaccessible

Impossible d'accéder à un périphérique de stockage.

Alertes d'audit et syslog

Nom de l'alerte Description

Des journaux d'audit sont ajoutés à la file d'attente en mémoire

Le nœud ne peut pas envoyer de journaux au serveur syslog local et la file d'attente en mémoire est saturée.

Erreur de transfert du serveur syslog externe

Le nœud ne peut pas transférer les journaux au serveur syslog externe.

Grande file d'attente d'audit

La file d'attente des messages d'audit est pleine. Si cette condition n'est pas résolue, les opérations S3 ou Swift risquent d'échouer.

Des journaux sont ajoutés à la file d'attente sur disque

Le nœud ne peut pas transférer les journaux vers le serveur syslog externe et la file d'attente sur disque est saturée.

Alertes de compartiment

Nom de l'alerte Description

Le paramètre de cohérence du compartiment FabricPool n'est pas pris en charge

Un compartiment FabricPool utilise le niveau de cohérence disponible, qui n'est pas pris en charge.

Alertes Cassandra

Nom de l'alerte Description

Erreur du compacteur automatique Cassandra

Le compacteur automatique Cassandra a rencontré une erreur.

Indicateurs du compacteur automatique Cassandra obsolètes

Les mesures qui décrivent le compacteur automatique Cassandra sont obsolètes.

Erreur de communication Cassandra

Les nœuds qui exécutent le service Cassandra rencontrent des problèmes.

Compression Cassandra surchargée

Le processus de compactage Cassandra est surchargé.

Erreur d'écriture surdimensionnée Cassandra

Un processus StorageGRID interne a envoyé à Cassandra une demande d'écriture trop volumineuse.

Les metrics de réparation de Cassandra sont obsolètes

Les mesures qui décrivent les tâches de réparation de Cassandra sont obsolètes.

La progression de la réparation de Cassandra est lente

La progression des réparations des bases de données Cassandra est lente.

Le service de réparation Cassandra n'est pas disponible

Le service de réparation Cassandra n'est pas disponible.

La corruption des tables Cassandra

Cassandra a détecté une corruption de table. Cassandra redémarre automatiquement si elle détecte une corruption de la table.

Disponibilité de lecture améliorée désactivée

Lorsque l'amélioration de la disponibilité en lecture est désactivée, les requêtes GET et HEAD peuvent échouer lorsque les nœuds de stockage ne sont pas disponibles.

Alertes de pool de stockage cloud

Nom de l'alerte Description

Erreur de connectivité de Cloud Storage Pool

Le contrôle de l'état des pools de stockage cloud a détecté une ou plusieurs nouvelles erreurs.

Alertes de réplication intergrid

Nom de l'alerte Description

Défaillance permanente de la réplication entre les grilles

Une erreur de réplication inter-grille s'est produite et nécessite une intervention de l'utilisateur pour la résoudre.

Ressources de réplication intergrid indisponibles

Les demandes de réplication multigrille sont en attente car une ressource n'est pas disponible.

Alertes DHCP

Nom de l'alerte Description

Bail DHCP expiré

Le bail DHCP sur une interface réseau a expiré.

La location DHCP expire bientôt

Le bail DHCP sur une interface réseau expire bientôt.

Serveur DHCP indisponible

Le serveur DHCP n'est pas disponible.

Alertes de débogage et de suivi

Nom de l'alerte Description

Impact sur les performances de débogage

Lorsque le mode débogage est activé, les performances du système peuvent être affectées négativement.

Configuration de trace activée

Lorsque la configuration de trace est activée, les performances du système peuvent être affectées de façon négative.

Alertes par e-mail et AutoSupport

Nom de l'alerte Description

Échec de l'envoi du message AutoSupport

L'envoi du message AutoSupport le plus récent a échoué.

Échec de la notification par e-mail

Impossible d'envoyer la notification par e-mail pour une alerte.

Alertes de code d'effacement (EC)

Nom de l'alerte Description

Défaillance du rééquilibrage EC

La procédure de rééquilibrage EC a échoué ou a été arrêtée.

Échec de réparation EC

Une tâche de réparation pour les données EC a échoué ou a été arrêtée.

Réparation EC bloquée

Un travail de réparation pour les données EC est bloqué.

Expiration des alertes de certificats

Nom de l'alerte Description

Expiration du certificat client

Un ou plusieurs certificats client sont sur le point d'expirer.

Expiration du certificat de serveur global pour S3 et Swift

Le certificat de serveur global pour S3 et Swift est sur le point d'expirer.

Expiration du certificat de point final de l'équilibreur de charge

Un ou plusieurs certificats de noeud final de l'équilibreur de charge vont expirer.

Expiration du certificat de serveur pour l'interface de gestion

Le certificat de serveur utilisé pour l'interface de gestion est sur le point d'expirer.

Expiration du certificat d'autorité de certification syslog externe

Le certificat d'autorité de certification (CA) utilisé pour signer le certificat de serveur syslog externe est sur le point d'expirer.

Expiration du certificat du client syslog externe

Le certificat client d'un serveur syslog externe est sur le point d'expirer.

Expiration du certificat du serveur syslog externe

Le certificat de serveur présenté par le serveur syslog externe arrive à expiration.

Alertes réseau Grid

Nom de l'alerte Description

Non-concordance de MTU du réseau de grid

Le paramètre MTU de l'interface réseau Grid (eth0) diffère de manière significative sur tous les nœuds de la grille.

Alertes de fédération du grid

Nom de l'alerte Description

Expiration du certificat de fédération GRID

Un ou plusieurs certificats de fédération de grille sont sur le point d'expirer.

Échec de la connexion de fédération de grille

La connexion de fédération de grille entre la grille locale et la grille distante ne fonctionne pas.

Alertes d'utilisation élevée ou de latence élevée

Nom de l'alerte Description

Utilisation du segment de mémoire Java élevée

Un pourcentage élevé d'espace de tas Java est utilisé.

Latence élevée pour les requêtes de métadonnées

La durée moyenne des requêtes de métadonnées Cassandra est trop longue.

Alertes de fédération des identités

Nom de l'alerte Description

Échec de synchronisation de la fédération d'identités

Impossible de synchroniser des groupes fédérés et des utilisateurs à partir du référentiel d'identité.

Échec de la synchronisation de la fédération des identités pour un locataire

Impossible de synchroniser les groupes fédérés et les utilisateurs à partir du référentiel d'identité configuré par un locataire.

Alertes de gestion du cycle de vie des informations (ILM)

Nom de l'alerte Description

Placement ILM impossible à atteindre

Aucune instruction de placement dans une règle ILM ne peut être obtenue pour certains objets.

Analyse ILM trop longue

Le temps nécessaire à l'analyse, à l'évaluation et à l'application des règles ILM aux objets est trop long.

Taux d'analyse ILM faible

La vitesse d'analyse ILM est définie sur moins de 100 objets/seconde.

Alertes du serveur de gestion des clés (KMS

Nom de l'alerte Description

Expiration du certificat CA KMS

Le certificat de l'autorité de certification (CA) utilisé pour signer le certificat du serveur de gestion des clés (KMS) est sur le point d'expirer.

Expiration du certificat client KMS

Le certificat client d'un serveur de gestion des clés est sur le point d'expirer

Echec du chargement de la configuration DES KMS

La configuration du serveur de gestion des clés existe mais n'a pas pu être chargée.

Erreur de connectivité KMS

Un nœud d'appliance n'a pas pu se connecter au serveur de gestion des clés de son site.

Nom de la clé de cryptage KMS introuvable

Le serveur de gestion des clés configuré ne dispose pas d'une clé de chiffrement correspondant au nom fourni.

Echec de la rotation de la clé de chiffrement KMS

Tous les volumes de l'appliance ont été décryptés avec succès, mais un ou plusieurs volumes n'ont pas pu tourner vers la clé la plus récente.

LES KMS ne sont pas configurés

Aucun serveur de gestion des clés n'existe pour ce site.

La clé KMS n'a pas réussi à décrypter un volume d'appliance

Impossible de décrypter un ou plusieurs volumes sur une appliance dont le chiffrement de nœud est activé avec la clé KMS actuelle.

Expiration du certificat du serveur KMS

Le certificat de serveur utilisé par le serveur de gestion des clés (KMS) est sur le point d'expirer.

Alertes de décalage d'horloge locale

Nom de l'alerte Description

Décalage horaire grand horloge locale

Le décalage entre l'horloge locale et l'heure NTP (Network Time Protocol) est trop important.

Alertes de mémoire insuffisante ou d'espace insuffisant

Nom de l'alerte Description

Capacité du disque du journal d'audit faible

L'espace disponible pour les journaux d'audit est faible. Si cette condition n'est pas résolue, les opérations S3 ou Swift risquent d'échouer.

Mémoire de nœud faible disponibilité

La quantité de RAM disponible sur un nœud est faible.

Faible espace libre pour le pool de stockage

L'espace disponible pour le stockage des données d'objet dans le nœud de stockage est faible.

Mémoire insuffisante sur les nœuds installés

La quantité de mémoire installée sur un nœud est faible.

Faibles capacités de stockage de métadonnées

L'espace disponible pour le stockage des métadonnées d'objet est faible.

Capacité disque de metrics faible

L'espace disponible pour la base de données de metrics est faible.

Faible stockage des données objet

L'espace disponible pour le stockage des données d'objet est faible.

Remplacement du filigrane en lecture seule faible

Le remplacement du filigrane en lecture seule progressif du volume de stockage est inférieur au seuil minimal optimisé pour un nœud de stockage.

Capacité du disque racine faible

L'espace disponible sur le disque racine est faible.

Faible capacité des données système

L'espace disponible pour les données système StorageGRID sur le point de montage /var/local est faible.

Petit répertoire tmp espace libre

L'espace disponible dans le répertoire /tmp est faible.

Alertes de réseau de nœuds ou de nœuds

Nom de l'alerte Description

Échec de la configuration du pare-feu

Impossible d'appliquer la configuration du pare-feu.

Erreur de connectivité réseau du nœud

Des erreurs se sont produites lors du transfert des données entre les nœuds.

Erreur de trame de réception du réseau du nœud

Un pourcentage élevé des trames réseau reçues par un nœud a rencontré des erreurs.

Nœud non synchronisé avec le serveur NTP

Le nœud n'est pas synchronisé avec le serveur NTP (Network Time Protocol).

Nœud non verrouillé avec le serveur NTP

Le nœud n'est pas verrouillé sur un serveur NTP (Network Time Protocol).

Réseau de nœuds non appliances arrêté

Un ou plusieurs périphériques réseau sont en panne ou déconnectés.

Liaison de l'appliance de services vers le réseau d'administration

L'interface de l'appliance vers le réseau d'administration (eth1) est en panne ou déconnectée.

Interruption de la liaison de l'appliance de services sur le port réseau d'administration 1

Le port réseau Admin 1 de l'appliance est arrêté ou déconnecté.

Liaison de l'appliance de services vers le réseau client

L'interface de l'appliance vers le réseau client (eth2) est en panne ou déconnectée.

Liaison de l'appliance de services vers le bas sur le port réseau 1

Le port réseau 1 de l'appliance est en panne ou déconnecté.

La liaison de l'appliance de services est inactive sur le port réseau 2

Le port réseau 2 de l'appliance est en panne ou déconnecté.

La liaison de l'appliance de services est inactive sur le port réseau 3

Le port réseau 3 de l'appliance est en panne ou déconnecté.

La liaison de l'appliance de services est inactive sur le port réseau 4

Le port réseau 4 de l'appliance est en panne ou déconnecté.

Liaison de l'appliance de stockage indisponible sur le réseau d'administration

L'interface de l'appliance vers le réseau d'administration (eth1) est en panne ou déconnectée.

Liaison du dispositif de stockage inactive sur le port réseau d'administration 1

Le port réseau Admin 1 de l'appliance est arrêté ou déconnecté.

La liaison de l'appliance de stockage sur le réseau client est inactive

L'interface de l'appliance vers le réseau client (eth2) est en panne ou déconnectée.

La liaison de l'appliance de stockage est inactive sur le port réseau 1

Le port réseau 1 de l'appliance est en panne ou déconnecté.

La liaison de l'appliance de stockage est inactive sur le port réseau 2

Le port réseau 2 de l'appliance est en panne ou déconnecté.

La liaison du dispositif de stockage est inactive sur le port réseau 3

Le port réseau 3 de l'appliance est en panne ou déconnecté.

La liaison du dispositif de stockage est inactive sur le port réseau 4

Le port réseau 4 de l'appliance est en panne ou déconnecté.

Le nœud de stockage n'est pas dans l'état de stockage souhaité

Le service LDR d'un nœud de stockage ne peut pas passer à l'état souhaité en raison d'une erreur interne ou d'un problème lié au volume

Impossible de communiquer avec le nœud

Un ou plusieurs services ne répondent pas ou le nœud ne peut pas être atteint.

Redémarrage de nœud inattendu

Un nœud a été redémarré de manière inattendue au cours des 24 dernières heures.

Alertes sur les objets

Nom de l'alerte Description

Échec de la vérification de l'existence de l'objet

Le travail de vérification de l'existence de l'objet a échoué.

La vérification de l'existence d'objet est bloquée

Le travail de vérification de l'existence de l'objet est bloqué.

Objets perdus

Un ou plusieurs objets ont été perdus de la grille.

S3 PLACEZ la taille de l'objet trop grande

Un client tente une opération PUT Object qui dépasse les limites de taille S3.

Objet corrompu non identifié détecté

Un fichier a été trouvé dans le stockage objet répliqué qui n'a pas pu être identifié en tant qu'objet répliqué.

Alertes de services de plateforme

Nom de l'alerte Description

Services de plateforme non disponibles

Trop peu de nœuds de stockage avec le service RSM sont en cours d'exécution ou disponibles sur un site.

Alertes de volume de stockage

Nom de l'alerte Description

Le volume de stockage nécessite votre attention

Un volume de stockage est hors ligne et nécessite votre attention.

Le volume de stockage doit être restauré

Un volume de stockage a été restauré et doit être restauré.

Volume de stockage hors ligne

Un volume de stockage est hors ligne depuis plus de 5 minutes, probablement parce que le nœud a redémarré pendant l'étape de formatage du volume.

La restauration de volume n'a pas pu démarrer la réparation des données répliquées

La réparation des données répliquées pour un volume réparé n'a pas pu être démarrée automatiquement.

Alertes des services StorageGRID

Nom de l'alerte Description

service nginx utilisant la configuration de sauvegarde

La configuration du service nginx n'est pas valide. La configuration précédente est maintenant utilisée.

le service nginx-gw utilise la configuration de sauvegarde

La configuration du service nginx-gw n'est pas valide. La configuration précédente est maintenant utilisée.

Service SSH utilisant la configuration de sauvegarde

La configuration du service SSH n'est pas valide. La configuration précédente est maintenant utilisée.

Alertes aux locataires

Nom de l'alerte Description

Utilisation élevée du quota par les locataires

Un pourcentage élevé de l'espace de quota est utilisé. Cette règle est désactivée par défaut car elle peut entraîner un trop grand nombre de notifications.