Référence des alertes
Cette référence répertorie les alertes par défaut qui apparaissent dans le Gestionnaire de grille. Les actions recommandées sont dans le message d'alerte que vous recevez.
Si nécessaire, vous pouvez créer des règles d'alerte personnalisées en fonction de votre approche de gestion du système.
Certaines des alertes par défaut utilisent "Metrics Prometheus".
Alertes de l'appliance
Nom de l'alerte | Description |
---|---|
Batterie de l'appareil expirée |
La batterie du contrôleur de stockage de l'appareil a expiré. |
La batterie de l'appareil est défectueuse |
La batterie du contrôleur de stockage de l'appareil est défectueuse. |
La capacité de la batterie de l'appareil est insuffisante |
La capacité de la batterie du contrôleur de stockage de l'appareil est insuffisante. |
La batterie de l'appareil est presque déchargée |
La batterie du contrôleur de stockage de l'appliance arrive à expiration. |
Batterie de l'appareil retirée |
La batterie du contrôleur de stockage de l'appareil est manquante. |
Batterie de l'appareil trop chaude |
La batterie du contrôleur de stockage de l'appareil est en surchauffe. |
Erreur de communication du BMC de l'appliance |
La communication avec le contrôleur de gestion de la carte mère (BMC) a été perdue. |
Échec du périphérique de sauvegarde du cache de l'appliance |
Échec d'un périphérique de sauvegarde de cache persistant. |
Capacité insuffisante du périphérique de sauvegarde en cache de l'appliance |
La capacité du périphérique de sauvegarde du cache est insuffisante. |
Dispositif de sauvegarde cache de l'appliance protégé en écriture |
Un périphérique de sauvegarde de cache est protégé en écriture. |
La taille de la mémoire cache de l'appliance ne correspond pas |
Le cache des deux contrôleurs de l'appliance est de différentes tailles. |
La température du châssis du contrôleur de calcul de l'appliance est trop élevée |
La température du contrôleur de calcul d'une appliance StorageGRID a dépassé le seuil nominal. |
Température trop élevée du processeur du contrôleur de calcul de l'appliance |
La température du processeur dans le contrôleur de calcul d'une appliance StorageGRID a dépassé le seuil nominal. |
Le contrôleur de calcul de l'appliance doit faire attention |
Une défaillance matérielle a été détectée dans le contrôleur de calcul d'une appliance StorageGRID. |
L'alimentation A du contrôleur de calcul de l'appliance présente un problème |
L'alimentation A du contrôleur de calcul présente un problème. |
L'alimentation B du contrôleur de calcul de l'appliance présente un problème |
L'alimentation B du contrôleur de calcul présente un problème. |
Service de surveillance du matériel de calcul de l'appliance bloqué |
Le service qui surveille l'état du matériel de stockage est bloqué. |
Panne du lecteur DAS de l'appliance détectée |
Un problème a été détecté au niveau d'un disque DAS (Direct-Attached Storage) dans l'appliance. |
Reconstruction des disques DAS du dispositif |
Un disque DAS (Direct-Attached Storage) est en cours de reconstruction. Ceci est attendu s'il a été récemment remplacé ou supprimé/réinséré. |
Panne du ventilateur de l'appareil détectée |
Un problème de ventilateur dans l'appareil a été détecté. |
Panne Fibre Channel de l'appliance détectée |
Un problème de liaison Fibre Channel a été détecté entre le contrôleur de stockage de l'appliance et le contrôleur de calcul |
Défaillance du port HBA Fibre Channel de l'appliance |
Un port HBA Fibre Channel est défectueux ou est défectueux. |
Flash cache de l'appliance ne sont pas optimaux |
Les disques utilisés pour la mise en cache SSD ne sont pas optimaux. |
Interconnexion de l'appareil/boîtier de la batterie retiré |
Le boîtier d'interconnexion/de batterie est manquant. |
Port d'appliance LACP manquant |
Aucun port d'une appliance StorageGRID ne participe au lien LACP. |
Défaillance de la carte réseau de l'appareil détectée |
Un problème de carte d'interface réseau (NIC) a été détecté sur le serveur. |
L'alimentation générale de l'appareil est dégradée |
La puissance d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée. |
Avertissement critique sur les disques SSD de l'appliance |
Un SSD d'appliance signale un avertissement critique. |
Défaillance Du contrôleur de stockage De l'appliance |
Le contrôleur de stockage A d'une appliance StorageGRID est en panne. |
Défaillance du contrôleur B de stockage de l'appliance |
Le contrôleur de stockage B d'une appliance StorageGRID est en panne. |
Panne de disque du contrôleur de stockage de l'appliance |
Un ou plusieurs disques d'une appliance StorageGRID sont défectueux ou non optimaux. |
Problème matériel du contrôleur de stockage de l'appliance |
Le logiciel SANtricity signale les besoins d'attention d'un composant d'une appliance StorageGRID. |
Panne de l'alimentation Du contrôleur de stockage de l'appliance |
L'alimentation A d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée. |
Panne de l'alimentation B du contrôleur de stockage de l'appliance |
L'alimentation B d'un dispositif StorageGRID s'est déviée de la tension de fonctionnement recommandée. |
Entretien du moniteur matériel de stockage de l'appliance bloqué |
Le service qui surveille l'état du matériel de stockage est bloqué. |
Dégradation des tiroirs de stockage de l'appliance |
L'état de l'un des composants du tiroir de stockage d'une appliance de stockage est dégradé. |
Température de l'appareil dépassée |
La température nominale ou maximale du contrôleur de stockage de l'appareil a été dépassée. |
Capteur de température de l'appareil retiré |
Un capteur de température a été déposé. |
Les E/S du disque sont très lentes |
Les E/S de disque très lentes peuvent affecter les performances du grid. |
Panne du ventilateur du dispositif de stockage détectée |
Un problème de ventilateur dans le contrôleur de stockage d'un dispositif a été détecté. |
Dégradation de la connectivité du stockage de l'appliance de stockage |
Un problème se produit au niveau d'une ou plusieurs connexions entre le contrôleur de calcul et le contrôleur de stockage. |
Périphérique de stockage inaccessible |
Impossible d'accéder à un périphérique de stockage. |
Alertes d'audit et syslog
Nom de l'alerte | Description |
---|---|
Des journaux d'audit sont ajoutés à la file d'attente en mémoire |
Le nœud ne peut pas envoyer de journaux au serveur syslog local et la file d'attente en mémoire est saturée. |
Erreur de transfert du serveur syslog externe |
Le nœud ne peut pas transférer les journaux au serveur syslog externe. |
Grande file d'attente d'audit |
La file d'attente des messages d'audit est pleine. Si cette condition n'est pas résolue, les opérations S3 ou Swift risquent d'échouer. |
Des journaux sont ajoutés à la file d'attente sur disque |
Le nœud ne peut pas transférer les journaux vers le serveur syslog externe et la file d'attente sur disque est saturée. |
Alertes de compartiment
Nom de l'alerte | Description |
---|---|
Le paramètre de cohérence du compartiment FabricPool n'est pas pris en charge |
Un compartiment FabricPool utilise le niveau de cohérence disponible, qui n'est pas pris en charge. |
Alertes Cassandra
Nom de l'alerte | Description |
---|---|
Erreur du compacteur automatique Cassandra |
Le compacteur automatique Cassandra a rencontré une erreur. |
Indicateurs du compacteur automatique Cassandra obsolètes |
Les mesures qui décrivent le compacteur automatique Cassandra sont obsolètes. |
Erreur de communication Cassandra |
Les nœuds qui exécutent le service Cassandra rencontrent des problèmes. |
Compression Cassandra surchargée |
Le processus de compactage Cassandra est surchargé. |
Erreur d'écriture surdimensionnée Cassandra |
Un processus StorageGRID interne a envoyé à Cassandra une demande d'écriture trop volumineuse. |
Les metrics de réparation de Cassandra sont obsolètes |
Les mesures qui décrivent les tâches de réparation de Cassandra sont obsolètes. |
La progression de la réparation de Cassandra est lente |
La progression des réparations des bases de données Cassandra est lente. |
Le service de réparation Cassandra n'est pas disponible |
Le service de réparation Cassandra n'est pas disponible. |
La corruption des tables Cassandra |
Cassandra a détecté une corruption de table. Cassandra redémarre automatiquement si elle détecte une corruption de la table. |
Disponibilité de lecture améliorée désactivée |
Lorsque l'amélioration de la disponibilité en lecture est désactivée, les requêtes GET et HEAD peuvent échouer lorsque les nœuds de stockage ne sont pas disponibles. |
Alertes de pool de stockage cloud
Nom de l'alerte | Description |
---|---|
Erreur de connectivité de Cloud Storage Pool |
Le contrôle de l'état des pools de stockage cloud a détecté une ou plusieurs nouvelles erreurs. |
Alertes de réplication intergrid
Nom de l'alerte | Description |
---|---|
Défaillance permanente de la réplication entre les grilles |
Une erreur de réplication inter-grille s'est produite et nécessite une intervention de l'utilisateur pour la résoudre. |
Ressources de réplication intergrid indisponibles |
Les demandes de réplication multigrille sont en attente car une ressource n'est pas disponible. |
Alertes DHCP
Nom de l'alerte | Description |
---|---|
Bail DHCP expiré |
Le bail DHCP sur une interface réseau a expiré. |
La location DHCP expire bientôt |
Le bail DHCP sur une interface réseau expire bientôt. |
Serveur DHCP indisponible |
Le serveur DHCP n'est pas disponible. |
Alertes de débogage et de suivi
Nom de l'alerte | Description |
---|---|
Impact sur les performances de débogage |
Lorsque le mode débogage est activé, les performances du système peuvent être affectées négativement. |
Configuration de trace activée |
Lorsque la configuration de trace est activée, les performances du système peuvent être affectées de façon négative. |
Alertes par e-mail et AutoSupport
Nom de l'alerte | Description |
---|---|
Échec de l'envoi du message AutoSupport |
L'envoi du message AutoSupport le plus récent a échoué. |
Échec de la notification par e-mail |
Impossible d'envoyer la notification par e-mail pour une alerte. |
Alertes de code d'effacement (EC)
Nom de l'alerte | Description |
---|---|
Défaillance du rééquilibrage EC |
La procédure de rééquilibrage EC a échoué ou a été arrêtée. |
Échec de réparation EC |
Une tâche de réparation pour les données EC a échoué ou a été arrêtée. |
Réparation EC bloquée |
Un travail de réparation pour les données EC est bloqué. |
Expiration des alertes de certificats
Nom de l'alerte | Description |
---|---|
Expiration du certificat client |
Un ou plusieurs certificats client sont sur le point d'expirer. |
Expiration du certificat de serveur global pour S3 et Swift |
Le certificat de serveur global pour S3 et Swift est sur le point d'expirer. |
Expiration du certificat de point final de l'équilibreur de charge |
Un ou plusieurs certificats de noeud final de l'équilibreur de charge vont expirer. |
Expiration du certificat de serveur pour l'interface de gestion |
Le certificat de serveur utilisé pour l'interface de gestion est sur le point d'expirer. |
Expiration du certificat d'autorité de certification syslog externe |
Le certificat d'autorité de certification (CA) utilisé pour signer le certificat de serveur syslog externe est sur le point d'expirer. |
Expiration du certificat du client syslog externe |
Le certificat client d'un serveur syslog externe est sur le point d'expirer. |
Expiration du certificat du serveur syslog externe |
Le certificat de serveur présenté par le serveur syslog externe arrive à expiration. |
Alertes réseau Grid
Nom de l'alerte | Description |
---|---|
Non-concordance de MTU du réseau de grid |
Le paramètre MTU de l'interface réseau Grid (eth0) diffère de manière significative sur tous les nœuds de la grille. |
Alertes de fédération du grid
Nom de l'alerte | Description |
---|---|
Expiration du certificat de fédération GRID |
Un ou plusieurs certificats de fédération de grille sont sur le point d'expirer. |
Échec de la connexion de fédération de grille |
La connexion de fédération de grille entre la grille locale et la grille distante ne fonctionne pas. |
Alertes d'utilisation élevée ou de latence élevée
Nom de l'alerte | Description |
---|---|
Utilisation du segment de mémoire Java élevée |
Un pourcentage élevé d'espace de tas Java est utilisé. |
Latence élevée pour les requêtes de métadonnées |
La durée moyenne des requêtes de métadonnées Cassandra est trop longue. |
Alertes de fédération des identités
Nom de l'alerte | Description |
---|---|
Échec de synchronisation de la fédération d'identités |
Impossible de synchroniser des groupes fédérés et des utilisateurs à partir du référentiel d'identité. |
Échec de la synchronisation de la fédération des identités pour un locataire |
Impossible de synchroniser les groupes fédérés et les utilisateurs à partir du référentiel d'identité configuré par un locataire. |
Alertes de gestion du cycle de vie des informations (ILM)
Nom de l'alerte | Description |
---|---|
Placement ILM impossible à atteindre |
Aucune instruction de placement dans une règle ILM ne peut être obtenue pour certains objets. |
Analyse ILM trop longue |
Le temps nécessaire à l'analyse, à l'évaluation et à l'application des règles ILM aux objets est trop long. |
Taux d'analyse ILM faible |
La vitesse d'analyse ILM est définie sur moins de 100 objets/seconde. |
Alertes du serveur de gestion des clés (KMS
Nom de l'alerte | Description |
---|---|
Expiration du certificat CA KMS |
Le certificat de l'autorité de certification (CA) utilisé pour signer le certificat du serveur de gestion des clés (KMS) est sur le point d'expirer. |
Expiration du certificat client KMS |
Le certificat client d'un serveur de gestion des clés est sur le point d'expirer |
Echec du chargement de la configuration DES KMS |
La configuration du serveur de gestion des clés existe mais n'a pas pu être chargée. |
Erreur de connectivité KMS |
Un nœud d'appliance n'a pas pu se connecter au serveur de gestion des clés de son site. |
Nom de la clé de cryptage KMS introuvable |
Le serveur de gestion des clés configuré ne dispose pas d'une clé de chiffrement correspondant au nom fourni. |
Echec de la rotation de la clé de chiffrement KMS |
Tous les volumes de l'appliance ont été décryptés avec succès, mais un ou plusieurs volumes n'ont pas pu tourner vers la clé la plus récente. |
LES KMS ne sont pas configurés |
Aucun serveur de gestion des clés n'existe pour ce site. |
La clé KMS n'a pas réussi à décrypter un volume d'appliance |
Impossible de décrypter un ou plusieurs volumes sur une appliance dont le chiffrement de nœud est activé avec la clé KMS actuelle. |
Expiration du certificat du serveur KMS |
Le certificat de serveur utilisé par le serveur de gestion des clés (KMS) est sur le point d'expirer. |
Alertes de décalage d'horloge locale
Nom de l'alerte | Description |
---|---|
Décalage horaire grand horloge locale |
Le décalage entre l'horloge locale et l'heure NTP (Network Time Protocol) est trop important. |
Alertes de mémoire insuffisante ou d'espace insuffisant
Nom de l'alerte | Description |
---|---|
Capacité du disque du journal d'audit faible |
L'espace disponible pour les journaux d'audit est faible. Si cette condition n'est pas résolue, les opérations S3 ou Swift risquent d'échouer. |
Mémoire de nœud faible disponibilité |
La quantité de RAM disponible sur un nœud est faible. |
Faible espace libre pour le pool de stockage |
L'espace disponible pour le stockage des données d'objet dans le nœud de stockage est faible. |
Mémoire insuffisante sur les nœuds installés |
La quantité de mémoire installée sur un nœud est faible. |
Faibles capacités de stockage de métadonnées |
L'espace disponible pour le stockage des métadonnées d'objet est faible. |
Capacité disque de metrics faible |
L'espace disponible pour la base de données de metrics est faible. |
Faible stockage des données objet |
L'espace disponible pour le stockage des données d'objet est faible. |
Remplacement du filigrane en lecture seule faible |
Le remplacement du filigrane en lecture seule progressif du volume de stockage est inférieur au seuil minimal optimisé pour un nœud de stockage. |
Capacité du disque racine faible |
L'espace disponible sur le disque racine est faible. |
Faible capacité des données système |
L'espace disponible pour les données système StorageGRID sur le point de montage /var/local est faible. |
Petit répertoire tmp espace libre |
L'espace disponible dans le répertoire /tmp est faible. |
Alertes de réseau de nœuds ou de nœuds
Nom de l'alerte | Description |
---|---|
Échec de la configuration du pare-feu |
Impossible d'appliquer la configuration du pare-feu. |
Erreur de connectivité réseau du nœud |
Des erreurs se sont produites lors du transfert des données entre les nœuds. |
Erreur de trame de réception du réseau du nœud |
Un pourcentage élevé des trames réseau reçues par un nœud a rencontré des erreurs. |
Nœud non synchronisé avec le serveur NTP |
Le nœud n'est pas synchronisé avec le serveur NTP (Network Time Protocol). |
Nœud non verrouillé avec le serveur NTP |
Le nœud n'est pas verrouillé sur un serveur NTP (Network Time Protocol). |
Réseau de nœuds non appliances arrêté |
Un ou plusieurs périphériques réseau sont en panne ou déconnectés. |
Liaison de l'appliance de services vers le réseau d'administration |
L'interface de l'appliance vers le réseau d'administration (eth1) est en panne ou déconnectée. |
Interruption de la liaison de l'appliance de services sur le port réseau d'administration 1 |
Le port réseau Admin 1 de l'appliance est arrêté ou déconnecté. |
Liaison de l'appliance de services vers le réseau client |
L'interface de l'appliance vers le réseau client (eth2) est en panne ou déconnectée. |
Liaison de l'appliance de services vers le bas sur le port réseau 1 |
Le port réseau 1 de l'appliance est en panne ou déconnecté. |
La liaison de l'appliance de services est inactive sur le port réseau 2 |
Le port réseau 2 de l'appliance est en panne ou déconnecté. |
La liaison de l'appliance de services est inactive sur le port réseau 3 |
Le port réseau 3 de l'appliance est en panne ou déconnecté. |
La liaison de l'appliance de services est inactive sur le port réseau 4 |
Le port réseau 4 de l'appliance est en panne ou déconnecté. |
Liaison de l'appliance de stockage indisponible sur le réseau d'administration |
L'interface de l'appliance vers le réseau d'administration (eth1) est en panne ou déconnectée. |
Liaison du dispositif de stockage inactive sur le port réseau d'administration 1 |
Le port réseau Admin 1 de l'appliance est arrêté ou déconnecté. |
La liaison de l'appliance de stockage sur le réseau client est inactive |
L'interface de l'appliance vers le réseau client (eth2) est en panne ou déconnectée. |
La liaison de l'appliance de stockage est inactive sur le port réseau 1 |
Le port réseau 1 de l'appliance est en panne ou déconnecté. |
La liaison de l'appliance de stockage est inactive sur le port réseau 2 |
Le port réseau 2 de l'appliance est en panne ou déconnecté. |
La liaison du dispositif de stockage est inactive sur le port réseau 3 |
Le port réseau 3 de l'appliance est en panne ou déconnecté. |
La liaison du dispositif de stockage est inactive sur le port réseau 4 |
Le port réseau 4 de l'appliance est en panne ou déconnecté. |
Le nœud de stockage n'est pas dans l'état de stockage souhaité |
Le service LDR d'un nœud de stockage ne peut pas passer à l'état souhaité en raison d'une erreur interne ou d'un problème lié au volume |
Impossible de communiquer avec le nœud |
Un ou plusieurs services ne répondent pas ou le nœud ne peut pas être atteint. |
Redémarrage de nœud inattendu |
Un nœud a été redémarré de manière inattendue au cours des 24 dernières heures. |
Alertes sur les objets
Nom de l'alerte | Description |
---|---|
Échec de la vérification de l'existence de l'objet |
Le travail de vérification de l'existence de l'objet a échoué. |
La vérification de l'existence d'objet est bloquée |
Le travail de vérification de l'existence de l'objet est bloqué. |
Objets perdus |
Un ou plusieurs objets ont été perdus de la grille. |
S3 PLACEZ la taille de l'objet trop grande |
Un client tente une opération PUT Object qui dépasse les limites de taille S3. |
Objet corrompu non identifié détecté |
Un fichier a été trouvé dans le stockage objet répliqué qui n'a pas pu être identifié en tant qu'objet répliqué. |
Alertes de services de plateforme
Nom de l'alerte | Description |
---|---|
Services de plateforme non disponibles |
Trop peu de nœuds de stockage avec le service RSM sont en cours d'exécution ou disponibles sur un site. |
Alertes de volume de stockage
Nom de l'alerte | Description |
---|---|
Le volume de stockage nécessite votre attention |
Un volume de stockage est hors ligne et nécessite votre attention. |
Le volume de stockage doit être restauré |
Un volume de stockage a été restauré et doit être restauré. |
Volume de stockage hors ligne |
Un volume de stockage est hors ligne depuis plus de 5 minutes, probablement parce que le nœud a redémarré pendant l'étape de formatage du volume. |
La restauration de volume n'a pas pu démarrer la réparation des données répliquées |
La réparation des données répliquées pour un volume réparé n'a pas pu être démarrée automatiquement. |
Alertes des services StorageGRID
Nom de l'alerte | Description |
---|---|
service nginx utilisant la configuration de sauvegarde |
La configuration du service nginx n'est pas valide. La configuration précédente est maintenant utilisée. |
le service nginx-gw utilise la configuration de sauvegarde |
La configuration du service nginx-gw n'est pas valide. La configuration précédente est maintenant utilisée. |
Service SSH utilisant la configuration de sauvegarde |
La configuration du service SSH n'est pas valide. La configuration précédente est maintenant utilisée. |
Alertes aux locataires
Nom de l'alerte | Description |
---|---|
Utilisation élevée du quota par les locataires |
Un pourcentage élevé de l'espace de quota est utilisé. Cette règle est désactivée par défaut car elle peut entraîner un trop grand nombre de notifications. |