Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Référence des alertes

Cette référence répertorie les alertes par défaut qui apparaissent dans le gestionnaire de grille. Les actions recommandées sont dans le message d’alerte que vous recevez.

Selon vos besoins, vous pouvez créer des règles d’alerte personnalisées adaptées à votre approche de gestion du système.

Certaines des alertes par défaut utilisent"Métriques Prometheus" .

Alertes sur les appareils électroménagers

Nom de l'alerte Description

La batterie de l'appareil est expirée

La batterie du contrôleur de stockage de l'appareil est épuisée.

La batterie de l'appareil est défectueuse

La batterie du contrôleur de stockage de l'appareil est défectueuse.

La batterie de l'appareil a une capacité d'apprentissage insuffisante

La batterie du contrôleur de stockage de l'appareil a une capacité d'apprentissage insuffisante.

Batterie d'appareil presque expirée

La batterie du contrôleur de stockage de l'appareil est sur le point d'expirer.

Batterie de l'appareil retirée

La batterie du contrôleur de stockage de l'appareil est manquante.

La batterie de l'appareil est trop chaude

La batterie du contrôleur de stockage de l'appareil est surchauffée.

Erreur de communication du BMC de l'appareil

La communication avec le contrôleur de gestion de la carte mère (BMC) a été perdue.

Défaut du périphérique de démarrage de l'appareil détecté

Un problème a été détecté avec le périphérique de démarrage de l'appareil.

Échec du périphérique de sauvegarde du cache de l'appareil

Un périphérique de sauvegarde de cache persistant est tombé en panne.

Capacité insuffisante du périphérique de sauvegarde du cache de l'appareil

La capacité du périphérique de sauvegarde du cache est insuffisante.

Dispositif de sauvegarde du cache de l'appareil protégé en écriture

Un périphérique de sauvegarde de cache est protégé en écriture.

Incompatibilité de taille de mémoire cache de l'appareil

Les deux contrôleurs de l'appareil ont des tailles de cache différentes.

Défaut de batterie CMOS de l'appareil

Un problème a été détecté avec la batterie CMOS de l'appareil.

La température du châssis du contrôleur de calcul de l'appareil est trop élevée

La température du contrôleur de calcul d'un dispositif StorageGRID a dépassé un seuil nominal.

La température du processeur du contrôleur de calcul de l'appareil est trop élevée

La température du processeur dans le contrôleur de calcul d'un dispositif StorageGRID a dépassé un seuil nominal.

Le contrôleur de calcul de l'appareil nécessite une attention particulière

Une panne matérielle a été détectée dans le contrôleur de calcul d'un dispositif StorageGRID .

L'alimentation du contrôleur de calcul de l'appareil A présente un problème

L'alimentation A du contrôleur de calcul présente un problème.

L'alimentation B du contrôleur de calcul de l'appareil présente un problème

L'alimentation B du contrôleur de calcul présente un problème.

Le service de surveillance du matériel informatique de l'appareil est bloqué

Le service qui surveille l’état du matériel de stockage est bloqué.

Le lecteur DAS de l'appareil dépasse la limite de données écrites par jour

Une quantité excessive de données est écrite sur un lecteur chaque jour, ce qui peut annuler sa garantie.

Défaut détecté sur le lecteur DAS de l'appareil

Un problème a été détecté avec un lecteur de stockage à connexion directe (DAS) dans l'appareil.

Voyant de localisation du lecteur DAS de l'appareil allumé

Le voyant de localisation de lecteur pour un ou plusieurs lecteurs de stockage à connexion directe (DAS) dans un nœud de stockage d'appliance est allumé.

Reconstruction du lecteur DAS de l'appareil

Un lecteur de stockage à connexion directe (DAS) est en cours de reconstruction. Ceci est attendu s'il a été récemment remplacé ou retiré/réinséré.

Défaut du ventilateur de l'appareil détecté

Un problème avec un bloc ventilateur de l'appareil a été détecté.

Défaut de l'appareil Fibre Channel détecté

Un problème de liaison Fibre Channel a été détecté entre le contrôleur de stockage de l'appliance et le contrôleur de calcul

Défaillance du port HBA Fibre Channel de l'appareil

Un port HBA Fibre Channel est défaillant ou a échoué.

Les lecteurs de cache flash de l'appareil ne sont pas optimaux

Les disques utilisés pour le cache SSD ne sont pas optimaux.

Boîtier d'interconnexion/de batterie de l'appareil retiré

Le boîtier d'interconnexion/batterie est manquant.

Port LACP de l'appareil manquant

Un port sur un dispositif StorageGRID ne participe pas à la liaison LACP.

Défaut de carte réseau de l'appareil détecté

Un problème avec une carte d'interface réseau (NIC) dans l'appareil a été détecté.

Alimentation électrique globale de l'appareil dégradée

La puissance d'un appareil StorageGRID s'écarte de la tension de fonctionnement recommandée.

Avertissement critique du SSD de l'appareil

Un SSD d'appareil signale un avertissement critique.

Défaillance du contrôleur de stockage de l'appareil A

Le contrôleur de stockage A d’un dispositif StorageGRID est tombé en panne.

Défaillance du contrôleur de stockage de l'appareil B

Le contrôleur de stockage B d’un dispositif StorageGRID est en panne.

Panne du lecteur du contrôleur de stockage de l'appareil

Un ou plusieurs disques d'un dispositif StorageGRID sont en panne ou ne sont pas optimaux.

Problème matériel du contrôleur de stockage de l'appareil

Le logiciel SANtricity signale « Nécessite une attention particulière » pour un composant d'un dispositif StorageGRID .

Panne d'alimentation du contrôleur de stockage de l'appareil

L'alimentation A d'un dispositif StorageGRID s'écarte de la tension de fonctionnement recommandée.

Panne d'alimentation du contrôleur de stockage de l'appareil B

L'alimentation B d'un dispositif StorageGRID s'écarte de la tension de fonctionnement recommandée.

Le service de surveillance du matériel de stockage des appareils est bloqué

Le service qui surveille l’état du matériel de stockage est bloqué.

Étagères de rangement des appareils dégradées

L'état de l'un des composants de l'étagère de stockage d'un dispositif de stockage est dégradé.

Température de l'appareil dépassée

La température nominale ou maximale du contrôleur de stockage de l'appareil a été dépassée.

Capteur de température de l'appareil retiré

Un capteur de température a été retiré.

Erreur de démarrage sécurisé UEFI de l'appareil

Un appareil n’a pas été démarré en toute sécurité.

Les E/S du disque sont très lentes

Des E/S de disque très lentes peuvent avoir un impact sur les performances de la grille.

Défaut de ventilateur de l'appareil de stockage détecté

Un problème avec une unité de ventilation dans le contrôleur de stockage d'un appareil a été détecté.

Connectivité de stockage dégradée

Il y a un problème avec une ou plusieurs connexions entre le contrôleur de calcul et le contrôleur de stockage.

Périphérique de stockage inaccessible

Impossible d'accéder à un périphérique de stockage.

Alertes d'audit et de syslog

Nom de l'alerte Description

Les journaux d'audit sont ajoutés à la file d'attente en mémoire

Le nœud ne peut pas envoyer de journaux au serveur syslog local et la file d'attente en mémoire se remplit.

Erreur de transfert du serveur syslog externe

Le nœud ne peut pas transférer les journaux vers le serveur syslog externe.

Grande file d'attente d'audit

La file d'attente du disque pour les messages d'audit est pleine. Si cette condition n’est pas résolue, les opérations S3 ou Swift peuvent échouer.

Les journaux sont ajoutés à la file d'attente sur disque

Le nœud ne peut pas transférer les journaux vers le serveur syslog externe et la file d'attente sur disque se remplit.

Alertes de seau

Nom de l'alerte Description

Le bucket FabricPool a un paramètre de cohérence de bucket non pris en charge

Un bucket FabricPool utilise le niveau de cohérence Disponible ou Site fort, qui n'est pas pris en charge.

Le bucket FabricPool a un paramètre de contrôle de version non pris en charge

Un bucket FabricPool a le contrôle de version ou le verrouillage d'objet S3 activé, qui ne sont pas pris en charge.

Alertes Cassandra

Nom de l'alerte Description

Erreur du compacteur automatique Cassandra

Le compacteur automatique Cassandra a rencontré une erreur.

Les mesures du compacteur automatique Cassandra sont obsolètes

Les métriques qui décrivent l'auto-compacteur Cassandra sont obsolètes.

Erreur de communication Cassandra

Les nœuds qui exécutent le service Cassandra ont des difficultés à communiquer entre eux.

Les compactions de Cassandra sont surchargées

Le processus de compactage de Cassandra est surchargé.

Erreur d'écriture surdimensionnée de Cassandra

Un processus StorageGRID interne a envoyé une demande d’écriture à Cassandra qui était trop volumineuse.

Les mesures de réparation de Cassandra sont obsolètes

Les métriques qui décrivent les travaux de réparation de Cassandra sont obsolètes.

La réparation de Cassandra progresse lentement

La progression des réparations de la base de données Cassandra est lente.

Service de réparation Cassandra non disponible

Le service de réparation Cassandra n'est pas disponible.

Corruption de la table Cassandra

Cassandra a détecté une corruption de table. Cassandra redémarre automatiquement s'il détecte une corruption de table.

Alertes du pool de stockage cloud

Nom de l'alerte Description

Erreur de connectivité du pool de stockage cloud

Le contrôle d’intégrité des pools de stockage cloud a détecté une ou plusieurs nouvelles erreurs.

Expiration de la certification d'entité finale IAM Roles Anywhere

Le certificat d’entité finale IAM Roles Anywhere est sur le point d’expirer.

Alertes de réplication inter-réseaux

Nom de l'alerte Description

Échec permanent de la réplication inter-réseau

Une erreur de réplication inter-grille s'est produite et nécessite l'intervention de l'utilisateur pour être résolue.

Ressources de réplication inter-réseaux indisponibles

Les demandes de réplication inter-grille sont en attente car une ressource n'est pas disponible.

Alertes DHCP

Nom de l'alerte Description

Le bail DHCP a expiré

Le bail DHCP sur une interface réseau a expiré.

Le bail DHCP expire bientôt

Le bail DHCP sur une interface réseau expire bientôt.

Serveur DHCP indisponible

Le serveur DHCP n'est pas disponible.

Alertes de débogage et de traçage

Nom de l'alerte Description

Impact sur les performances de débogage

Lorsque le mode de débogage est activé, les performances du système peuvent être affectées négativement.

Configuration de trace activée

Lorsque la configuration de trace est activée, les performances du système peuvent être affectées négativement.

Alertes par e-mail et AutoSupport

Nom de l'alerte Description

Échec de l'envoi du message AutoSupport

Le message AutoSupport le plus récent n'a pas pu être envoyé.

Échec de la résolution du nom de domaine

Le nœud StorageGRID n'a pas pu résoudre les noms de domaine.

Échec de la notification par e-mail

La notification par e-mail d'une alerte n'a pas pu être envoyée.

SNMP informe les erreurs

Erreurs lors de l'envoi de notifications d'information SNMP à une destination d'interruption.

Connexion SSH ou console détectée

Au cours des dernières 24 heures, un utilisateur s'est connecté avec la console Web ou SSH.

Alertes de codage d'effacement (EC)

Nom de l'alerte Description

Échec du rééquilibrage de l'EC

La procédure de rééquilibrage de la CE a échoué ou a été arrêtée.

Échec de la réparation de l'EC

Une tâche de réparation des données EC a échoué ou a été arrêtée.

Réparation de l'EC bloquée

Une tâche de réparation des données EC est bloquée.

Erreur de vérification des fragments codés par effacement

Les fragments codés par effacement ne peuvent plus être vérifiés. Les fragments corrompus peuvent ne pas être réparés.

Alertes d'expiration des certificats

Nom de l'alerte Description

Expiration du certificat CA du proxy administrateur

Un ou plusieurs certificats du groupe CA du serveur proxy d'administration sont sur le point d'expirer.

Expiration du certificat client

Un ou plusieurs certificats clients sont sur le point d’expirer.

Expiration du certificat de serveur global pour S3 et Swift

Le certificat de serveur global pour S3 et Swift est sur le point d’expirer.

Expiration du certificat du point de terminaison de l'équilibreur de charge

Un ou plusieurs certificats de point de terminaison d’équilibrage de charge sont sur le point d’expirer.

Expiration du certificat du serveur pour l'interface de gestion

Le certificat du serveur utilisé pour l'interface de gestion est sur le point d'expirer.

Expiration du certificat CA syslog externe

Le certificat de l'autorité de certification (CA) utilisé pour signer le certificat du serveur syslog externe est sur le point d'expirer.

Expiration du certificat client syslog externe

Le certificat client d’un serveur syslog externe est sur le point d’expirer.

Expiration du certificat du serveur syslog externe

Le certificat du serveur présenté par le serveur syslog externe est sur le point d'expirer.

Alertes du réseau Grid

Nom de l'alerte Description

Inadéquation du MTU du réseau de grille

Le paramètre MTU pour l'interface du réseau de grille (eth0) diffère considérablement selon les nœuds de la grille.

Alertes de la fédération du réseau

Nom de l'alerte Description

Expiration du certificat de fédération de réseau

Un ou plusieurs certificats de fédération de grille sont sur le point d’expirer.

Échec de la connexion à la fédération de réseau

La connexion de fédération de réseau entre le réseau local et le réseau distant ne fonctionne pas.

Alertes d'utilisation élevée ou de latence élevée

Nom de l'alerte Description

Utilisation élevée du tas Java

Un pourcentage élevé de l'espace du tas Java est utilisé.

Latence élevée pour les requêtes de métadonnées

Le temps moyen des requêtes de métadonnées Cassandra est trop long.

Alertes de fédération d'identité

Nom de l'alerte Description

Échec de la synchronisation de la fédération d'identité

Impossible de synchroniser les groupes fédérés et les utilisateurs à partir de la source d'identité.

Échec de la synchronisation de la fédération d'identité pour un locataire

Impossible de synchroniser les groupes fédérés et les utilisateurs à partir de la source d’identité configurée par un locataire.

Alertes de gestion du cycle de vie de l'information (ILM)

Nom de l'alerte Description

Placement ILM irréalisable

Une instruction de placement dans une règle ILM ne peut pas être réalisée pour certains objets.

Taux de balayage ILM faible

Le taux de numérisation ILM est défini sur moins de 100 objets/seconde.

Alertes du serveur de gestion des clés (KMS)

Nom de l'alerte Description

Expiration du certificat KMS CA

Le certificat de l’autorité de certification (CA) utilisé pour signer le certificat du serveur de gestion de clés (KMS) est sur le point d’expirer.

Expiration du certificat client KMS

Le certificat client d'un serveur de gestion de clés est sur le point d'expirer

Échec du chargement de la configuration KMS

La configuration du serveur de gestion des clés existe mais n'a pas pu être chargée.

Erreur de connectivité KMS

Un nœud d’appareil n’a pas pu se connecter au serveur de gestion des clés de son site.

Nom de la clé de chiffrement KMS introuvable

Le serveur de gestion de clés configuré ne dispose pas de clé de chiffrement correspondant au nom fourni.

Échec de la rotation de la clé de chiffrement KMS

Tous les volumes de l'appareil ont été déchiffrés avec succès, mais un ou plusieurs volumes n'ont pas pu pivoter vers la dernière clé.

KMS n'est pas configuré

Aucun serveur de gestion de clés n'existe pour ce site.

La clé KMS n'a pas réussi à déchiffrer un volume d'appareil

Un ou plusieurs volumes sur un appareil avec chiffrement de nœud activé n'ont pas pu être déchiffrés avec la clé KMS actuelle.

Expiration du certificat du serveur KMS

Le certificat de serveur utilisé par le serveur de gestion des clés (KMS) est sur le point d'expirer.

Échec de connectivité du serveur KMS

Un nœud d’appareil n’a pas pu se connecter à un ou plusieurs serveurs du cluster de serveurs de gestion de clés pour son site.

Alertes de l'équilibreur de charge

Nom de l'alerte Description

Connexions d'équilibrage de charge sans demande élevée

Un pourcentage élevé de connexions aux points de terminaison de l'équilibreur de charge se sont déconnectées sans exécuter de requêtes.

Alertes de décalage d'horloge locale

Nom de l'alerte Description

Grand décalage horaire de l'horloge locale

Le décalage entre l'horloge locale et l'heure du protocole NTP (Network Time Protocol) est trop important.

Alertes de faible mémoire ou d'espace insuffisant

Nom de l'alerte Description

Faible capacité du disque du journal d'audit

L'espace disponible pour les journaux d'audit est faible. Si cette condition n’est pas résolue, les opérations S3 ou Swift peuvent échouer.

Faible mémoire de nœud disponible

La quantité de RAM disponible sur un nœud est faible.

Faible espace libre pour le pool de stockage

L'espace disponible pour stocker les données d'objet dans le nœud de stockage est faible.

Faible mémoire de nœud installée

La quantité de mémoire installée sur un nœud est faible.

Stockage de métadonnées faibles

L'espace disponible pour stocker les métadonnées des objets est faible.

Faible capacité de disque métrique

L'espace disponible pour la base de données des métriques est faible.

Faible stockage de données d'objets

L'espace disponible pour stocker les données des objets est faible.

Remplacement du filigrane en lecture seule

Le remplacement du filigrane en lecture seule du volume de stockage est inférieur au filigrane optimisé minimum pour un nœud de stockage.

Faible capacité du disque racine

L'espace disponible sur le disque racine est faible.

Faible capacité de données du système

L'espace disponible pour /var/local est faible. Si cette condition n’est pas résolue, les opérations S3 ou Swift peuvent échouer.

Espace libre dans le répertoire tmp faible

L'espace disponible dans le répertoire /tmp est faible.

Alertes de nœud ou de réseau de nœuds

Nom de l'alerte Description

Utilisation de réception du réseau d'administration

L'utilisation de réception sur le réseau d'administration est élevée.

Utilisation de la transmission du réseau administrateur

L'utilisation de la transmission sur le réseau d'administration est élevée.

Échec de la configuration du pare-feu

Échec de l'application de la configuration du pare-feu.

Points de terminaison de l'interface de gestion en mode de secours

Tous les points de terminaison de l’interface de gestion reviennent depuis trop longtemps aux ports par défaut.

Erreur de connectivité du réseau de nœuds

Des erreurs se sont produites lors du transfert de données entre les nœuds.

Erreur de trame de réception du réseau de nœuds

Un pourcentage élevé de trames réseau reçues par un nœud comportaient des erreurs.

Le nœud n'est pas synchronisé avec le serveur NTP

Le nœud n'est pas synchronisé avec le serveur de protocole de temps réseau (NTP).

Nœud non verrouillé avec le serveur NTP

Le nœud n'est pas verrouillé sur un serveur de protocole de temps réseau (NTP).

Réseau de nœuds non-appareils en panne

Un ou plusieurs périphériques réseau sont en panne ou déconnectés.

Liaison de l'appareil de services en panne sur le réseau d'administration

L'interface de l'appareil avec le réseau d'administration (eth1) est en panne ou déconnectée.

Liaison de l'appareil de services interrompue sur le port 1 du réseau d'administration

Le port réseau administrateur 1 de l'appareil est en panne ou déconnecté.

Liaison de l'appareil de services en panne sur le réseau client

L'interface de l'appareil avec le réseau client (eth2) est en panne ou déconnectée.

Liaison de l'appareil de services interrompue sur le port réseau 1

Le port réseau 1 de l'appareil est hors service ou déconnecté.

Liaison de l'appareil de services interrompue sur le port réseau 2

Le port réseau 2 de l'appareil est hors service ou déconnecté.

Liaison de l'appareil de services interrompue sur le port réseau 3

Le port réseau 3 de l'appareil est hors service ou déconnecté.

Liaison de l'appareil de services interrompue sur le port réseau 4

Le port réseau 4 de l'appareil est hors service ou déconnecté.

Liaison du dispositif de stockage interrompue sur le réseau d'administration

L'interface de l'appareil avec le réseau d'administration (eth1) est en panne ou déconnectée.

Liaison du dispositif de stockage interrompue sur le port 1 du réseau administrateur

Le port réseau administrateur 1 de l'appareil est en panne ou déconnecté.

Liaison du dispositif de stockage interrompue sur le réseau client

L'interface de l'appareil avec le réseau client (eth2) est en panne ou déconnectée.

Liaison du dispositif de stockage interrompue sur le port réseau 1

Le port réseau 1 de l'appareil est hors service ou déconnecté.

Liaison du dispositif de stockage interrompue sur le port réseau 2

Le port réseau 2 de l'appareil est hors service ou déconnecté.

Liaison du dispositif de stockage interrompue sur le port réseau 3

Le port réseau 3 de l'appareil est hors service ou déconnecté.

Liaison du dispositif de stockage interrompue sur le port réseau 4

Le port réseau 4 de l'appareil est hors service ou déconnecté.

Le nœud de stockage n'est pas dans l'état de stockage souhaité

Le service LDR sur un nœud de stockage ne peut pas passer à l'état souhaité en raison d'une erreur interne ou d'un problème lié au volume

Utilisation de la connexion TCP

Le nombre de connexions TCP sur ce nœud approche le nombre maximum pouvant être suivi.

Impossible de communiquer avec le nœud

Un ou plusieurs services ne répondent pas ou le nœud ne peut pas être atteint.

Redémarrage inattendu du nœud

Un nœud a redémarré de manière inattendue au cours des dernières 24 heures.

Alertes d'objets

Nom de l'alerte Description

La vérification de l'existence de l'objet a échoué

La tâche de vérification de l’existence de l’objet a échoué.

Vérification de l'existence de l'objet bloquée

Le travail de vérification de l'existence de l'objet est bloqué.

Objets perdus

Un ou plusieurs objets ont été perdus de la grille.

S3 PUT taille de l'objet trop grande

Un client tente une opération PUT Object qui dépasse les limites de taille S3.

Objet corrompu non identifié détecté

Un fichier a été trouvé dans le stockage d’objets répliqués qui n’a pas pu être identifié comme un objet répliqué.

Alertes des services de la plateforme

Nom de l'alerte Description

Faible capacité des demandes en attente des services de la plateforme

Le nombre de demandes de services de plateforme en attente approche de sa capacité.

Services de plateforme indisponibles

Trop peu de nœuds de stockage avec le service RSM sont en cours d'exécution ou disponibles sur un site.

Alertes de volume de stockage

Nom de l'alerte Description

Le volume de stockage nécessite une attention particulière

Un volume de stockage est hors ligne et nécessite une attention particulière.

Le volume de stockage doit être restauré

Un volume de stockage a été récupéré et doit être restauré.

Volume de stockage hors ligne

Un volume de stockage est hors ligne depuis plus de 5 minutes.

Tentative de remontage du volume de stockage

Un volume de stockage était hors ligne et a déclenché un remontage automatique. Cela pourrait indiquer un problème de lecteur ou des erreurs de système de fichiers.

La restauration du volume n'a pas réussi à démarrer la réparation des données répliquées

La réparation des données répliquées pour un volume réparé n'a pas pu être démarrée automatiquement.

Alertes des services StorageGRID

Nom de l'alerte Description

service nginx utilisant la configuration de sauvegarde

La configuration du service nginx n'est pas valide. La configuration précédente est désormais utilisée.

service nginx-gw utilisant la configuration de sauvegarde

La configuration du service nginx-gw n'est pas valide. La configuration précédente est désormais utilisée.

Redémarrage requis pour désactiver FIPS

La politique de sécurité ne nécessite pas le mode FIPS, mais le module de sécurité cryptographique NetApp est activé.

Redémarrage requis pour activer FIPS

La politique de sécurité nécessite le mode FIPS, mais le module de sécurité cryptographique NetApp est désactivé.

Service SSH utilisant la configuration de sauvegarde

La configuration du service SSH n'est pas valide. La configuration précédente est désormais utilisée.

Alertes locataires

Nom de l'alerte Description

Utilisation élevée des quotas des locataires

Un pourcentage élevé d'espace de quota est utilisé. Cette règle est désactivée par défaut car elle pourrait entraîner trop de notifications.