Référence des alarmes (système hérité)
Le tableau suivant répertorie toutes les alarmes par défaut héritées. Si une alarme est déclenchée, vous pouvez rechercher le code d'alarme dans ce tableau pour trouver les actions recommandées.
Bien que le système d'alarme existant continue d'être pris en charge, le système d'alerte offre des avantages significatifs et est plus facile à utiliser. |
Code | Nom | Service | Action recommandée | ||
---|---|---|---|---|---|
ABRL |
Relais d'attribut disponibles |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Rétablir la connectivité à un service (un service ADC) exécutant un service de relais d'attribut dès que possible. S'il n'y a pas de relais d'attribut connectés, le nœud de la grille ne peut pas signaler les valeurs d'attribut au service NMS. Ainsi, le service NMS ne peut plus surveiller l'état du service ou mettre à jour les attributs du service. Si le problème persiste, contactez le support technique. |
||
ACMS |
Services de métadonnées disponibles |
BARC, BLDR, BCMN |
Une alarme se déclenche lorsqu'un service LDR ou ARC perd la connexion à un service DDS. Dans ce cas, les transactions d'entrée ou de récupération ne peuvent pas être traitées. Si l'indisponibilité des services DDS n'est qu'un bref problème transitoire, les transactions peuvent être retardées. Vérifiez et restaurez les connexions à un service DDS pour effacer cette alarme et rétablir la fonctionnalité complète du service. |
||
ACTES |
État du service NetApp Cloud Tiering |
ARC |
Disponible uniquement pour les nœuds d'archivage avec un type de Tiering cloud cible : simple Storage Service (S3). Si l'attribut ACT pour le nœud d'archivage est défini sur lecture seule activée ou lecture-écriture désactivée, vous devez définir l'attribut sur lecture-écriture activée. Si une alarme majeure est déclenchée en raison d'un échec de l'authentification, vérifiez les informations d'identification associées au compartiment de destination et mettez à jour les valeurs, si nécessaire. Si une alarme majeure est déclenchée pour une autre raison, contactez le support technique. |
||
ADCA |
État ADC |
ADC |
Si une alarme est déclenchée, sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node ADC Présentation main et ADC alarmes main pour déterminer la cause de l'alarme. Si le problème persiste, contactez le support technique. |
||
ADCE |
État ADC |
ADC |
Si la valeur de l'état ADC est Veille, continuez à surveiller le service et si le problème persiste, contactez l'assistance technique. Si la valeur de l'état ADC est hors ligne, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
AITE |
État de récupération |
BARC |
Disponible uniquement pour les nœuds d'archivage avec un type cible de Tivoli Storage Manager (TSM). Si la valeur de Retrieve State est en attente de la cible, vérifiez le serveur middleware TSM et assurez-vous qu'il fonctionne correctement. Si le nœud d'archivage vient d'être ajouté au système StorageGRID, assurez-vous que la connexion du nœud d'archivage au système de stockage d'archives externe cible est correctement configurée. Si la valeur de l'état de récupération d'archives est hors ligne, essayez de mettre à jour l'état en ligne. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid noeud ARC Retrieve Configuration main, sélectionnez Archive Retrieve State Online, puis cliquez sur Apply Changes. Si le problème persiste, contactez le support technique. |
||
AITU |
État de récupération |
BARC |
Si la valeur de l'état de récupération est erreur cible, recherchez des erreurs dans le système de stockage d'archives externes ciblé. Si la valeur de l'état de récupération d'archives est session perdue, vérifiez le système de stockage d'archives externes ciblé pour vous assurer qu'il est en ligne et qu'il fonctionne correctement. Vérifiez la connexion réseau avec la cible. Si la valeur de l'état de récupération d'archives est erreur inconnue, contactez le support technique. |
||
ALIS |
Sessions d'attribut entrant |
ADC |
Si le nombre de sessions d'attribut entrantes sur un relais d'attribut augmente trop important, cela peut indiquer que le système StorageGRID est devenu déséquilibré. Dans des conditions normales, les sessions d'attribut doivent être réparties de manière uniforme entre les services ADC. Un déséquilibre peut entraîner des problèmes de performances. Si le problème persiste, contactez le support technique. |
||
ALOS |
Sessions d'attribut sortant |
ADC |
Le service ADC a un nombre élevé de sessions d'attribut et est en train de devenir surchargé. Si cette alarme se déclenche, contactez le support technique. |
||
ALUR |
Référentiels d'attributs inaccessibles |
ADC |
Vérifiez la connectivité réseau avec le service NMS pour vous assurer que le service peut contacter le référentiel d'attributs. Si cette alarme se déclenche et que la connectivité réseau est correcte, contactez le support technique. |
||
AMQS |
Messages d'audit en file d'attente |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Si les messages d'audit ne peuvent pas être immédiatement transférés à un relais d'audit ou à un référentiel, ils sont stockés dans une file d'attente de disque. Si la file d'attente des disques est saturée, des pannes peuvent se produire. Pour vous permettre de répondre dans le temps afin d'éviter une panne, des alarmes AMQS sont déclenchées lorsque le nombre de messages dans la file d'attente du disque atteint les seuils suivants :
Si une alarme AMQS est déclenchée, vérifiez la charge sur le système --s'il y a eu un nombre important de transactions, l'alarme doit se résoudre au fil du temps. Dans ce cas, vous pouvez ignorer l'alarme. Si l'alarme persiste et augmente la gravité, affichez un graphique de la taille de la file d'attente. Si ce chiffre augmente régulièrement au fil des heures ou des jours, la charge d'audit a probablement dépassé la capacité d'audit du système. Réduisez le taux de fonctionnement du client ou diminuez le nombre de messages d'audit consignés en changeant le niveau d'audit sur erreur ou Désactivé. Voir Configurez les messages d'audit et les destinations des journaux. |
||
AOTE |
État du magasin |
BARC |
Disponible uniquement pour les nœuds d'archivage avec un type cible de Tivoli Storage Manager (TSM). Si la valeur de l'état du magasin attend la cible, vérifiez le système de stockage d'archives externe et assurez-vous qu'il fonctionne correctement. Si le nœud d'archivage vient d'être ajouté au système StorageGRID, assurez-vous que la connexion du nœud d'archivage au système de stockage d'archives externe cible est correctement configurée. Si la valeur de l'état du magasin est hors ligne, vérifiez la valeur de l'état du magasin. Corrigez tout problème avant de remettre l'état du magasin en ligne. |
||
AOTU |
État du magasin |
BARC |
Si la valeur Etat de stockage est session perdue, vérifiez que le système de stockage d'archives externe est connecté et en ligne. Si la valeur erreur cible est définie, recherchez des erreurs dans le système de stockage d'archives externe. Si la valeur de l'état du stockage est erreur inconnue, contactez le support technique. |
||
APMS |
Connectivité multivoie du stockage |
SSM |
Si l'alarme d'état multichemin apparaît en tant que « `Degraded' (sélectionnez SUPPORT Outils topologie de grille, puis sélectionnez site grid node SSM Events), procédez comme suit :
|
||
ARCE |
État DE L'ARC |
ARC |
Le service ARC dispose d'un état de veille jusqu'à ce que tous les composants ARC (réplication, stockage, récupération, cible) aient démarré. Il passe ensuite en ligne. Si la valeur de l'état ARC ne passe pas du mode Veille au mode en ligne, vérifier l'état des composants ARC. Si la valeur de l'état ARC est hors ligne, redémarrer le service. Si le problème persiste, contactez le support technique. |
||
AROQ |
Objets mis en file d'attente |
ARC |
Cette alarme peut être déclenchée si le périphérique de stockage amovible fonctionne lentement en raison de problèmes avec le système de stockage d'archives externes ciblé ou si plusieurs erreurs de lecture sont détectées. Vérifiez que le système de stockage d'archives externe ne présente pas d'erreurs et assurez-vous qu'il fonctionne correctement. Dans certains cas, cette erreur peut survenir en raison d'un taux élevé de demandes de données. Surveillez le nombre d'objets mis en file d'attente lorsque l'activité du système diminue. |
||
ARRF |
Échecs de demande |
ARC |
Si une récupération à partir du système de stockage d'archives externe cible échoue, le nœud d'archivage retente l'extraction car la défaillance peut être due à un problème transitoire. Cependant, si les données de l'objet sont corrompues ou si elles ont été marquées comme étant définitivement indisponibles, la récupération n'échoue pas. En revanche, le nœud d'archivage tente continuellement la récupération et la valeur des échecs de demande continue d'augmenter. Cette alarme peut indiquer que le support de stockage contenant les données demandées est corrompu. Vérifiez le système de stockage d'archives externe pour diagnostiquer le problème. Si vous déterminez que les données d'objet ne sont plus dans l'archive, l'objet devra être supprimé du système StorageGRID. Pour plus d'informations, contactez le support technique. Une fois le problème qui a déclenché cette alarme résolu, réinitialisez le nombre de défaillances. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node ARC Retrieve Configuration main, sélectionnez Réinitialiser le nombre d'échecs de la demande et cliquez sur appliquer les modifications. |
||
ARRV |
Échecs de vérification |
ARC |
Pour diagnostiquer et corriger ce problème, contactez le support technique. Une fois le problème qui a déclenché cette alarme résolu, réinitialisez le nombre de défaillances. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node ARC Retrieve Configuration main, sélectionnez Réinitialiser le nombre d'échecs de vérification et cliquez sur appliquer les changements. |
||
ARVF |
Échecs de stockage |
ARC |
Cette alarme peut survenir en raison d'erreurs avec le système de stockage d'archives externes ciblé. Vérifiez que le système de stockage d'archives externe ne présente pas d'erreurs et assurez-vous qu'il fonctionne correctement. Une fois le problème qui a déclenché cette alarme résolu, réinitialisez le nombre de défaillances. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node ARC Retrieve Configuration main, sélectionnez Réinitialiser le nombre d'échecs du stockage et cliquez sur appliquer les modifications. |
||
ASXP |
Partages d'audit |
AMS |
Une alarme est déclenchée si la valeur des partages d'audit est inconnue. Cette alarme peut indiquer un problème d'installation ou de configuration du nœud d'administration. Si le problème persiste, contactez le support technique. |
||
AUMA |
Statut AMS |
AMS |
Si la valeur de l'état AMS est erreur de connectivité DB, redémarrez le nœud de la grille. Si le problème persiste, contactez le support technique. |
||
AUME |
État AMS |
AMS |
Si la valeur de l'état AMS est Veille, continuez à surveiller le système StorageGRID. Si le problème persiste, contactez le support technique. Si la valeur de l'état AMS est hors ligne, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
AUXS |
Audit de l'état d'exportation |
AMS |
Si une alarme se déclenche, corrigez le problème sous-jacent, puis redémarrez le service AMS. Si le problème persiste, contactez le support technique. |
||
BADD |
Nombre de disques défaillants du contrôleur de stockage |
SSM |
Cette alarme se déclenche lorsqu'un ou plusieurs disques d'une appliance StorageGRID sont défectueux ou non optimaux. Remplacez les disques si nécessaire. |
||
BASF |
Identificateurs d'objet disponibles |
CMN |
Lorsqu'un système StorageGRID est provisionné, le service CMN reçoit un nombre fixe d'identifiants d'objets. Cette alarme se déclenche lorsque le système StorageGRID commence à épuiser sa fourniture d'identifiants d'objets. Pour attribuer davantage d'identifiants, contactez le support technique. |
||
BASSES |
Identificateur de l'état d'allocation de bloc |
CMN |
Par défaut, une alarme est déclenchée lorsque les identificateurs d'objet ne peuvent pas être attribués car le quorum ADC ne peut pas être atteint. L'allocation de bloc d'identificateur sur le service CMN requiert un quorum (50 % + 1) des services ADC pour être connectés et en ligne. Si le quorum n'est pas disponible, le service CMN ne peut pas allouer de nouveaux blocs d'identification tant que le quorum ADC n'est pas rétabli. En cas de perte du quorum ADC, il n'y a généralement aucun impact immédiat sur le système StorageGRID (les clients peuvent toujours récupérer et récupérer le contenu), car la quantité d'identifiants d'un mois environ est mise en cache ailleurs dans le réseau ; Cependant, si la condition persiste, le système StorageGRID perdra la possibilité d'ingérer un nouveau contenu. Si une alarme est déclenchée, recherchez la raison de la perte du quorum ADC (par exemple, il peut s'agir d'une défaillance du réseau ou du nœud de stockage) et prenez des mesures correctives. Si le problème persiste, contactez le support technique. |
||
BRDT |
Température du châssis du contrôleur de calcul |
SSM |
Une alarme est déclenchée si la température du contrôleur de calcul d'une appliance StorageGRID dépasse le seuil nominal. Vérifier si les composants matériels et les problèmes environnementaux sont en surchauffe. Si nécessaire, remplacer l'organe. |
||
POINT DE FIN |
Décalage |
BADC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Une alarme se déclenche si l'heure d'entretien (secondes) diffère sensiblement de l'heure du système d'exploitation. Dans des conditions normales, le service doit se resynchroniser. Si le temps d'entretien dépasse trop loin du temps du système d'exploitation, le fonctionnement du système peut être affecté. Vérifiez que la source de temps du système StorageGRID est correcte. Si le problème persiste, contactez le support technique. |
||
BTSE |
État de l'horloge |
BADC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Une alarme se déclenche si l'heure du service n'est pas synchronisée avec l'heure suivie par le système d'exploitation. Dans des conditions normales, le service doit se resynchroniser. Si le temps dérive trop loin du temps du système d'exploitation, le fonctionnement du système peut être affecté. Vérifiez que la source de temps du système StorageGRID est correcte. Si le problème persiste, contactez le support technique. |
||
CAHP |
Pourcentage d'utilisation du tas Java |
DDS |
Une alarme se déclenche si Java ne parvient pas à effectuer la collecte des déchets à un rythme qui permet au système de disposer d'un espace suffisant pour fonctionner correctement. Une alarme peut indiquer une charge de travail d'utilisateur dépassant les ressources disponibles sur le système pour le magasin de métadonnées DDS. Vérifiez l'activité ILM dans le tableau de bord ou sélectionnez SUPPORT Outils topologie de grille, puis sélectionnez site grid node DDS Ressources Présentation main. Si le problème persiste, contactez le support technique. |
||
CAIH |
Nombre de destinations d'ingestion disponibles |
CLB |
Cette alarme est obsolète. |
||
CAQH |
Nombre de destinations disponibles |
CLB |
Cette alarme disparaît lorsque les problèmes sous-jacents des services LDR disponibles sont corrigés. Assurez-vous que le composant HTTP des services LDR est en ligne et fonctionne normalement. Si le problème persiste, contactez le support technique. |
||
CASA |
État de la banque de données |
DDS |
Une alarme est déclenchée si le magasin de métadonnées Cassandra n'est plus disponible. Vérifier l'état de Cassandra :
Cette alarme peut également indiquer que le magasin de métadonnées (base de données Cassandra) pour un nœud de stockage nécessite une reconstruction. Reportez-vous aux informations relatives au dépannage de l'alarme Services : état - Cassandra (SVST) dans Diagnostiquez les problèmes liés aux métadonnées. Si le problème persiste, contactez le support technique. |
||
CASSE |
État du magasin de données |
DDS |
Cette alarme est déclenchée lors de l'installation ou de l'extension pour indiquer qu'un nouveau magasin de données rejoint la grille. |
||
CCES |
Sessions entrantes - établies |
CLB |
Cette alarme est déclenchée si 20,000 sessions HTTP ou plus sont actuellement actives (ouvertes) sur le nœud passerelle. Si un client dispose de trop de connexions, il se peut que vous ayez constaté des échecs de connexion. Vous devez réduire la charge de travail. |
||
CCNE |
Matériel de calcul |
SSM |
Cette alarme est déclenchée si l'état du matériel du contrôleur de calcul d'une appliance StorageGRID nécessite une intervention. |
||
CDLP |
Espace utilisé pour les métadonnées (en %) |
DDS |
Cette alarme se déclenche lorsque l'espace effectif des métadonnées (CEMS) atteint 70 % (alarme mineure), 90 % (alarme majeure) et 100 % (alarme critique). Si cette alarme atteint le seuil de 90 %, un avertissement s'affiche sur le tableau de bord dans Grid Manager. Vous devez effectuer une procédure d'extension pour ajouter de nouveaux nœuds de stockage dès que possible. Voir Développez votre grille. Si cette alarme atteint le seuil de 100 %, vous devez arrêter d'ingérer immédiatement des objets et ajouter des nœuds de stockage. Cassandra exige un certain espace pour effectuer les opérations essentielles telles que le compactage et la réparation. Ces opérations seront affectées si les métadonnées de l'objet utilisent plus de 100 % de l'espace autorisé. Des résultats indésirables peuvent survenir. Remarque : contactez le support technique si vous ne pouvez pas ajouter de nœuds de stockage. Une fois que de nouveaux nœuds de stockage sont ajoutés, le système rééquilibre automatiquement les métadonnées d'objet sur tous les nœuds de stockage, et l'alarme est supprimée. Consultez également les informations relatives au dépannage de l'alerte de stockage de métadonnées faible dans Diagnostiquez les problèmes liés aux métadonnées. |
||
CLBA |
Statut CLB |
CLB |
Si une alarme est déclenchée, sélectionnez SUPPORT Outils topologie de grille, puis site grid node CLB Présentation main et CLB alarmes main pour déterminer la cause de l'alarme et résoudre le problème. Si le problème persiste, contactez le support technique. |
||
CLBE |
Etat CLB |
CLB |
Si la valeur de CLB State est Veille, continuez à surveiller la situation et si le problème persiste, contactez le support technique. Si l'état est hors ligne et qu'il n'y a aucun problème matériel connu du serveur (par exemple, le serveur est débranché) ou un temps d'arrêt programmé, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
CMNA |
État CMN |
CMN |
Si la valeur de l'état CMN est erreur, sélectionnez SUPPORT Outils topologie de grille, puis sélectionnez site grid node CMN Présentation main et CMN alarmes main pour déterminer la cause de l'erreur et résoudre le problème. Une alarme est déclenchée et la valeur de l'état CMN est pas de CMN en ligne lors d'une actualisation matérielle du nœud d'administration principal lorsque les CMN sont commutés (la valeur de l'ancien état CMN est en attente et la nouvelle est en ligne). Si le problème persiste, contactez le support technique. |
||
CPRC |
Capacité restante |
NMS |
Une alarme se déclenche si la capacité restante (nombre de connexions disponibles pouvant être ouvertes à la base de données NMS) est inférieure à la gravité configurée pour l'alarme. Si une alarme est déclenchée, contactez le support technique. |
||
CPSA |
Alimentation a du contrôleur de calcul |
SSM |
Une alarme est déclenchée en cas de problème au niveau de l'alimentation A du contrôleur de calcul d'une appliance StorageGRID. Si nécessaire, remplacer l'organe. |
||
CPSB |
Alimentation B du contrôleur de calcul |
SSM |
Une alarme est déclenchée en cas de problème au niveau de l'alimentation B du contrôleur de calcul d'une appliance StorageGRID. Si nécessaire, remplacer l'organe. |
||
CPUT |
Température du processeur du contrôleur de calcul |
SSM |
Une alarme est déclenchée si la température du CPU du contrôleur de calcul d'une appliance StorageGRID dépasse le seuil nominal. Si le nœud de stockage est une appliance StorageGRID, le système StorageGRID indique que le contrôleur nécessite une intervention. Vérifier si les composants matériels et les problèmes d'environnement sont en surchauffe. Si nécessaire, remplacer l'organe. |
||
DNST |
État DNS |
SSM |
Une fois l'installation terminée, une alarme DNST est déclenchée dans le service SSM. Une fois que le DNS est configuré et que les nouvelles informations de serveur atteignent tous les nœuds de la grille, l'alarme est annulée. |
||
ECCD |
Fragments corrompus détectés |
LDR |
Une alarme se déclenche lorsque le processus de vérification en arrière-plan détecte un fragment codé d'effacement corrompu. Si un fragment corrompu est détecté, une tentative de reconstruction du fragment est effectuée. Réinitialisez les fragments corrompus détectés et copie les attributs perdus à zéro et surveillez-les pour voir si les comptages sont à nouveau affichés. Si le nombre de pannes persiste, le stockage sous-jacent du nœud de stockage peut être problématique. Une copie des données d'objet avec code d'effacement n'est pas considérée comme manquante tant que le nombre de fragments perdus ou corrompus n'enfreint pas la tolérance aux pannes du code d'effacement. Il est donc possible d'avoir un fragment corrompu et de pouvoir récupérer l'objet. Si le problème persiste, contactez le support technique. |
||
ECST |
État de vérification |
LDR |
Cette alarme indique l'état actuel du processus de vérification en arrière-plan des données d'objet avec code d'effacement sur ce nœud de stockage. Une alarme majeure est déclenchée en cas d'erreur dans le processus de vérification en arrière-plan. |
||
FONPN |
Ouvrez les descripteurs de fichier |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Le FOPN peut devenir grand pendant l'activité de pointe. S'il ne diminue pas pendant des périodes de ralentissement d'activité, contacter le support technique. |
||
HSTE |
État HTTP |
BLDR |
Voir les actions recommandées pour HSTU. |
||
HSTU |
Statut HTTP |
BLDR |
Les HSTE et HSTU sont liés au protocole HTTP pour tout le trafic LDR, y compris le trafic S3, Swift et autre trafic StorageGRID interne. Une alarme indique que l'une des situations suivantes s'est produite :
L'attribut Auto-Start HTTP est activé par défaut. Si ce paramètre est modifié, HTTP peut rester hors ligne après un redémarrage. Si nécessaire, attendez que le service LDR redémarre. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite Storage Node LDR Configuration. Si le protocole HTTP est hors ligne, placez-le en ligne. Vérifiez que l'attribut Auto-Start HTTP est activé. Si le protocole HTTP reste hors ligne, contactez le support technique. |
||
HTA |
Démarrage automatique HTTP |
LDR |
Spécifie si les services HTTP doivent démarrer automatiquement au démarrage. Il s'agit d'une option de configuration spécifiée par l'utilisateur. |
||
IRSU |
État de la réplication entrante |
BLDR, BARC |
Une alarme indique que la réplication entrante a été désactivée. Confirmer les paramètres de configuration : sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid noeud LDR Replication Configuration main. |
||
LATA |
Latence moyenne |
NMS |
Vérifiez les problèmes de connectivité. Vérifiez l'activité du système pour confirmer qu'il y a une augmentation de l'activité du système. Une augmentation de l'activité système entraînera une augmentation de l'activité des données d'attribut. Cette augmentation de l'activité entraînera un retard dans le traitement des données d'attribut. Il peut s'agir d'une activité normale du système et se subside. Rechercher des alarmes multiples. Une augmentation des temps de latence moyens peut être indiquée par un nombre excessif d'alarmes déclenchées. Si le problème persiste, contactez le support technique. |
||
LDRE |
Etat LDR |
LDR |
Si la valeur de l'Etat LDR est en attente, continuez à suivre la situation et si le problème persiste, contactez l'assistance technique. Si la valeur de LDR State est hors ligne, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
PERDU |
Objets perdus |
DDS, LDR |
Déclenché lorsque le système StorageGRID ne parvient pas à extraire une copie de l'objet demandé à partir de n'importe quel emplacement du système. Avant le déclenchement d'une alarme PERDUE (objets perdus), le système tente de récupérer et de remplacer un objet manquant ailleurs dans le système. Les objets perdus représentent une perte de données. L'attribut objets perdus est incrémenté chaque fois que le nombre d'emplacements d'un objet passe à zéro sans que le service DDS purge automatiquement le contenu pour satisfaire la stratégie ILM. Rechercher immédiatement les alarmes PERDUES (objets PERDUS). Si le problème persiste, contactez le support technique. |
||
MCEP |
Expiration du certificat de l'interface de gestion |
CMN |
Déclenché lorsque le certificat utilisé pour accéder à l'interface de gestion est sur le point d'expirer.
|
||
MINQ |
Notifications par e-mail en file d'attente |
NMS |
Vérifiez les connexions réseau des serveurs hébergeant le service NMS et le serveur de messagerie externe. Vérifiez également que la configuration du serveur de messagerie est correcte. |
||
MINUTES |
Statut des notifications par e-mail |
BNMS |
Une alarme mineure se déclenche si le service NMS ne parvient pas à se connecter au serveur de messagerie. Vérifiez les connexions réseau des serveurs hébergeant le service NMS et le serveur de messagerie externe. Vérifiez également que la configuration du serveur de messagerie est correcte. |
||
MLLE |
État du moteur d'interface NMS |
BNMS |
Une alarme se déclenche si le moteur d'interface NMS du nœud d'administration qui collecte et génère du contenu d'interface est déconnecté du système. Cochez Server Manager pour déterminer si l'application individuelle du serveur est en panne. |
||
NANG |
Paramètre de négociation automatique du réseau |
SSM |
Vérifiez la configuration de la carte réseau. Le paramètre doit correspondre aux préférences de vos routeurs et commutateurs réseau. Un réglage incorrect peut avoir un impact important sur les performances du système. |
||
NUP |
Paramètre duplex réseau |
SSM |
Vérifiez la configuration de la carte réseau. Le paramètre doit correspondre aux préférences de vos routeurs et commutateurs réseau. Un réglage incorrect peut avoir un impact important sur les performances du système. |
||
NLNK |
Détection de la liaison réseau |
SSM |
Vérifiez les connexions des câbles réseau sur le port et au niveau du commutateur. Vérifiez les configurations du routeur, du commutateur et de la carte réseau. Redémarrez le serveur. Si le problème persiste, contactez le support technique. |
||
NRER |
Erreurs de réception |
SSM |
Les causes suivantes peuvent être des alarmes NRER :
Voir les informations sur le dépannage de l'alarme d'erreur de réception réseau (NRER) dans Résolution des problèmes de réseau, de matériel et de plateforme. |
||
NRLY |
Relais d'audit disponibles |
BADC, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Si les relais d'audit ne sont pas connectés aux services ADC, les événements d'audit ne peuvent pas être signalés. Elles sont mises en file d'attente et indisponibles aux utilisateurs jusqu'à ce que la connexion soit restaurée. Rétablir la connectivité avec un service ADC dès que possible. Si le problème persiste, contactez le support technique. |
||
NSCA |
Etat NMS |
NMS |
Si la valeur de NMS Status est DB Connectivity Error, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
NSCE |
Etat NMS |
NMS |
Si la valeur de l'état NMS est Veille, continuez à surveiller et si le problème persiste, contactez le support technique. Si la valeur de l'état NMS est hors ligne, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
NSPD |
Vitesse |
SSM |
Cela peut être dû à des problèmes de connectivité réseau ou de compatibilité des pilotes. Si le problème persiste, contactez le support technique. |
||
NTBR |
Espace libre |
NMS |
Si une alarme est déclenchée, vérifiez la rapidité d'utilisation de la base de données. Une chute soudaine (par opposition à un changement progressif dans le temps) indique une condition d'erreur. Si le problème persiste, contactez le support technique. Le réglage du seuil d'alarme vous permet de gérer de manière proactive les besoins de stockage supplémentaire. Si l'espace disponible atteint un seuil bas (voir seuil d'alarme), contactez le support technique pour modifier l'allocation de la base de données. |
||
NTRE |
Erreurs de transmission |
SSM |
Ces erreurs peuvent être résolues sans être réinitialisées manuellement. S'ils ne sont pas clairs, vérifiez le matériel réseau. Vérifiez que le matériel et le pilote de la carte sont correctement installés et configurés pour fonctionner avec vos routeurs et commutateurs réseau. Une fois le problème sous-jacent résolu, réinitialiser le compteur. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node SSM Ressources Configuration main, sélectionnez Réinitialiser le nombre d'erreurs de transmission et cliquez sur appliquer les modifications. |
||
NTFQ |
Décalage de fréquence NTP |
SSM |
Si le décalage de fréquence dépasse le seuil configuré, il y a probablement un problème matériel avec l'horloge locale. Si le problème persiste, contactez l'assistance technique pour organiser un remplacement. |
||
NTPL |
Verrouillage NTP |
SSM |
Si le démon NTP n'est pas verrouillé sur une source de temps externe, vérifiez la connectivité réseau aux sources de temps externes désignées, leur disponibilité et leur stabilité. |
||
NTOF |
Décalage horaire NTP |
SSM |
Si le décalage dépasse le seuil configuré, il y a probablement un problème matériel avec l'oscillateur de l'horloge locale. Si le problème persiste, contactez l'assistance technique pour organiser un remplacement. |
||
NTSJ |
Jitter de la source horaire choisie |
SSM |
Cette valeur indique la fiabilité et la stabilité de la source de temps que NTP sur le serveur local utilise comme référence. Si une alarme est déclenchée, cela peut indiquer que l'oscillateur de la source de temps est défectueux ou qu'il y a un problème avec la liaison WAN à la source de temps. |
||
NTSU |
État NTP |
SSM |
Si la valeur de l'état NTP n'est pas en cours d'exécution, contactez le support technique. |
||
OPST |
État général de l'alimentation |
SSM |
Une alarme se déclenche si l'alimentation d'un appareil StorageGRID diffère de la tension de fonctionnement recommandée. Vérifier l'état du bloc d'alimentation A ou B pour déterminer quelle alimentation fonctionne normalement. Si nécessaire remplacer l'alimentation. |
||
OQRT |
Objets en quarantaine |
LDR |
Une fois les objets restaurés automatiquement par le système StorageGRID, les objets mis en quarantaine peuvent être supprimés du répertoire de quarantaine.
Les objets mis en quarantaine sont supprimés et le nombre est remis à zéro. |
||
ORSU |
État de la réplication sortante |
BLDR, BARC |
Une alarme indique que la réplication sortante n'est pas possible : le stockage est dans un état où les objets ne peuvent pas être récupérés. Une alarme se déclenche si la réplication sortante est désactivée manuellement. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid noeud LDR Replication Configuration. Une alarme est déclenchée si le service LDR n'est pas disponible pour la réplication. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node LDR Storage. |
||
SLF |
État du tiroir |
SSM |
Une alarme est déclenchée si l'état de l'un des composants du tiroir de stockage d'une appliance de stockage est dégradé. Les composants des tiroirs de stockage incluent les IOM, les ventilateurs, les alimentations et les tiroirs disques.si cette alarme se déclenche, consultez les instructions de maintenance de votre appliance. |
||
PMEM |
Utilisation de la mémoire de service (pourcentage) |
BADC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Peut avoir une valeur supérieure à y% RAM, où y représente le pourcentage de mémoire utilisé par le serveur. Les chiffres inférieurs à 80 % sont normaux. Plus de 90 % sont considérés comme un problème. Si l'utilisation de la mémoire est élevée pour un seul service, surveillez la situation et recherchez. Si le problème persiste, contactez le support technique. |
||
PSAS |
État de l'alimentation Électrique A |
SSM |
Une alarme se déclenche si l'alimentation A d'un appareil StorageGRID diffère de la tension de fonctionnement recommandée. Si nécessaire remplacer l'alimentation A. |
||
PSB |
État de l'alimentation B |
SSM |
Une alarme se déclenche si l'alimentation B d'un appareil StorageGRID diffère de la tension de fonctionnement recommandée. Si nécessaire remplacer l'alimentation B. |
||
RTTD |
État de Tivoli Storage Manager |
BARC |
Disponible uniquement pour les nœuds d'archivage avec un type cible de Tivoli Storage Manager (TSM). Si la valeur de l'état Tivoli Storage Manager est hors ligne, vérifiez l'état de Tivoli Storage Manager et résolvez les problèmes éventuels. Remettre le composant en ligne. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node ARC cible Configuration main, sélectionnez Tivoli Storage Manager State Online, puis cliquez sur appliquer les modifications. |
||
RTU |
Statut de Tivoli Storage Manager |
BARC |
Disponible uniquement pour les nœuds d'archivage avec un type cible de Tivoli Storage Manager (TSM). Si la valeur de l'état de Tivoli Storage Manager est erreur de configuration et que le nœud d'archivage vient d'être ajouté au système StorageGRID, assurez-vous que le serveur middleware TSM est correctement configuré. Si la valeur de l'état de Tivoli Storage Manager est échec de la connexion ou échec de la connexion, essayez de nouveau, vérifiez la configuration réseau sur le serveur middleware TSM et la connexion réseau entre le serveur middleware TSM et le système StorageGRID. Si la valeur de l'état de Tivoli Storage Manager est échec de l'authentification ou échec de l'authentification, reconnexion, le système StorageGRID peut se connecter au serveur middleware TSM, mais ne peut pas authentifier la connexion. Vérifiez que le serveur middleware TSM est configuré avec l'utilisateur, le mot de passe et les autorisations appropriés, puis redémarrez le service. Si la valeur de Tivoli Storage Manager Status est session Failure (échec de session), une session établie a été perdue de manière inattendue. Vérifiez la connexion réseau entre le serveur middleware TSM et le système StorageGRID. Vérifiez que le serveur middleware ne comporte pas d'erreurs. Si la valeur de l'état de Tivoli Storage Manager est erreur inconnue, contactez l'assistance technique. |
||
RRF |
Réplications entrantes — échec |
BLDR, BARC |
Une alarme de répétition entrante — une alarme de défaillance peut se produire pendant des périodes de charge élevée ou de perturbations temporaires du réseau. Une fois l'activité du système réduite, cette alarme doit être déclenchée. Si le nombre de réplications ayant échoué continue à augmenter, recherchez des problèmes réseau et vérifiez que les services LDR et ARC source et destination sont en ligne et disponibles. Pour réinitialiser le nombre, sélectionnez SUPPORT Outils topologie de grille, puis sélectionnez site grid node LDR Replication Configuration main. Sélectionnez Réinitialiser le nombre d'échecs de réplication entrants, puis cliquez sur appliquer les modifications. |
||
RIRQ |
Réplications entrantes — en file d'attente |
BLDR, BARC |
Des alarmes peuvent se produire en cas de charge élevée ou d'interruption temporaire du réseau. Une fois l'activité du système réduite, cette alarme doit être déclenchée. Si le nombre de réplications en file d'attente continue à augmenter, recherchez des problèmes réseau et vérifiez que les services LDR et ARC source et destination sont en ligne et disponibles. |
||
RORQ |
Réplications sortantes — en file d'attente |
BLDR, BARC |
La file d'attente de réplication sortante contient des données d'objet copiées afin de satisfaire les règles ILM et les objets requis par les clients. Une alarme peut se produire suite à une surcharge du système. Attendez que l'alarme s'efface lorsque l'activité du système diminue. Si l'alarme se répète, ajoutez de la capacité en ajoutant des nœuds de stockage. |
||
VICE-PRÉSIDENT SAVP |
Espace utilisable total (pourcentage) |
LDR |
Si l'espace utilisable atteint un seuil minimal, options incluent l'extension du système StorageGRID ou le déplacement des données d'objet vers l'archivage via un nœud d'archivage. |
||
SCA |
État |
CMN |
Si la valeur Etat de la tâche de grille active est erreur, recherchez le message de tâche de grille. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node CMN Grid Tasks Présentation main. Le message de tâche de grille affiche des informations sur l'erreur (par exemple, « échec de la vérification sur le nœud 12130011 »). Après avoir examiné et corrigé le problème, redémarrez la tâche de grille. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node CMN tâches de grille Configuration main, puis actions Exécuter. Si la valeur Etat pour une tâche de grille en cours d'abandon est erreur, essayez à nouveau d'abandonner la tâche de grille. Si le problème persiste, contactez le support technique. |
||
SCEP |
Expiration du certificat des terminaux du service d'API de stockage |
CMN |
Déclenché lorsque le certificat utilisé pour accéder aux terminaux de l'API de stockage arrive à expiration.
|
||
SCHR |
État |
CMN |
Si la valeur Etat de la tâche de grille historique est abandonnée, recherchez la raison et exécutez à nouveau la tâche si nécessaire. Si le problème persiste, contactez le support technique. |
||
SCSA |
Contrôleur de stockage A |
SSM |
Une alarme est déclenchée en cas de problème au niveau du contrôleur de stockage A dans une appliance StorageGRID. Si nécessaire, remplacer l'organe. |
||
SCSB |
Contrôleur de stockage B |
SSM |
Une alarme est déclenchée en cas de problème au niveau du contrôleur de stockage B dans une appliance StorageGRID. Si nécessaire, remplacer l'organe. Certains modèles d'appliance ne disposent pas d'un contrôleur de stockage B. |
||
SHLH |
Santé |
LDR |
Si la valeur de l'option Santé d'un magasin d'objets est erreur, vérifiez et corrigez :
|
||
SLSA |
Moyenne de charge CPU |
SSM |
Plus la valeur est élevée, plus le système est occupé. Si la moyenne de charge CPU persiste à une valeur élevée, le nombre de transactions dans le système doit être examiné afin de déterminer si cela est dû à une charge importante à ce moment-là. Afficher un tableau de la moyenne de charge CPU : sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid noeud SSM Ressources Rapports graphiques. Si la charge du système n'est pas importante et que le problème persiste, contactez le support technique. |
||
SMST |
Etat du moniteur de journal |
SSM |
Si la valeur de l'état de surveillance du journal n'est pas connectée pendant une période prolongée, contactez le support technique. |
||
SMTT |
Nombre total d'événements |
SSM |
Si la valeur du total des événements est supérieure à zéro, vérifiez s'il existe des événements connus (tels que des défaillances réseau) pouvant en être la cause. Sauf si ces erreurs ont été effacées (c'est-à-dire que le nombre a été remis à 0), les alarmes Total Events peuvent être déclenchées. Lorsqu'un problème est résolu, réinitialisez le compteur pour effacer l'alarme. Sélectionnez NOEUDS site grid noeud Evénements Réinitialiser le nombre d'événements.
Si la valeur de Total Events est égale à zéro ou si le nombre augmente et que le problème persiste, contactez le support technique. |
||
SNST |
État |
CMN |
Une alarme indique qu'il y a un problème de stockage des lots de tâches de la grille. Si la valeur de l'état est erreur de point de contrôle ou si le quorum n'est pas atteint, confirmez qu'une majorité des services ADC sont connectés au système StorageGRID (50 % plus un) et patientez quelques minutes. Si le problème persiste, contactez le support technique. |
||
SOSS |
État du système d'exploitation de stockage |
SSM |
Une alarme se déclenche si le logiciel SANtricity indique qu'un composant d'une appliance StorageGRID présente un problème « nécessite une attention ». Sélectionnez NOEUDS. Sélectionnez ensuite appliance Storage Node Hardware. Faites défiler vers le bas pour afficher l'état de chaque composant. Dans le logiciel SANtricity, vérifiez les autres composants de l'appliance pour isoler le problème. |
||
SSMA |
État SSM |
SSM |
Si la valeur état SSM est erreur, sélectionnez SUPPORT Outils topologie de grille, puis sélectionnez site grid node SSM Présentation main et SSM Présentation alarmes pour déterminer la cause de l'alarme. Si le problème persiste, contactez le support technique. |
||
SSME |
État SSM |
SSM |
Si la valeur de l'état SSM est Veille, continuez à surveiller et si le problème persiste, contactez le support technique. Si la valeur de l'état SSM est hors ligne, redémarrez le service. Si le problème persiste, contactez le support technique. |
||
SST |
État du stockage |
BLDR |
Si la valeur de l'état de stockage est insuffisant espace utilisable, il n'y a plus de stockage disponible sur le nœud de stockage et les ingoses de données sont redirigées vers un autre nœud de stockage disponible. Les demandes de récupération peuvent continuer à être fournies à partir de ce nœud de grille. Un stockage supplémentaire doit être ajouté. Elle n'a aucun impact sur les fonctionnalités de l'utilisateur final, mais l'alarme persiste tant que du stockage supplémentaire n'est pas ajouté. Si la valeur de l'état du stockage est Volume(s) indisponible(s), une partie du stockage est indisponible. Le stockage et la récupération de ces volumes ne sont pas possibles. Pour plus d'informations, sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node LDR Storage Présentation main. L'état de santé du volume est répertorié sous magasins d'objets. Si la valeur de l'état de stockage est erreur, contactez le support technique. |
||
VST |
État |
SSM |
Cette alarme s'efface lorsque d'autres alarmes liées à un service non opérationnel sont résolues. Suivez les alarmes de service source pour rétablir le fonctionnement. Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid noeud SSM Services Présentation main. Lorsque l'état d'un service est indiqué comme non en cours d'exécution, son état est désactivé d'un point de vue administratif. L'état du service peut être indiqué comme étant en cours d'exécution pour les raisons suivantes :
Si un service n'est pas en cours d'exécution, redémarrez-le ( Cette alarme peut également indiquer que le magasin de métadonnées (base de données Cassandra) pour un nœud de stockage nécessite une reconstruction. Si le problème persiste, contactez le support technique. |
||
TMEM |
Mémoire installée |
SSM |
Les nœuds exécutés avec moins de 24 Gio de mémoire installée peuvent entraîner des problèmes de performances et l'instabilité du système. La quantité de mémoire installée sur le système doit être augmentée à au moins 24 Gio. |
||
TPOP |
Opérations en attente |
ADC |
Une file d'attente de messages peut indiquer que le service ADC est surchargé. Trop peu de services ADC peuvent être connectés au système StorageGRID. Dans un déploiement important, le service ADC peut nécessiter l'ajout de ressources de calcul, ou le système peut nécessiter des services ADC supplémentaires. |
||
UMEM |
Mémoire disponible |
SSM |
Si la RAM disponible est faible, déterminez s'il s'agit d'un problème matériel ou logiciel. S'il ne s'agit pas d'un problème matériel ou si la mémoire disponible est inférieure à 50 Mo (seuil d'alarme par défaut), contactez le support technique. |
||
VMFI |
Entrées disponibles |
SSM |
Cela indique que du stockage supplémentaire est nécessaire. Contactez l'assistance technique. |
||
VMFR |
Espace disponible |
SSM |
Si la valeur de l'espace disponible est trop faible (voir seuils d'alarme), il faut examiner si des fichiers journaux ne sont pas proportionnels ou si des objets prennent trop d'espace disque (voir seuils d'alarme) qui doivent être réduits ou supprimés. Si le problème persiste, contactez le support technique. |
||
VMST |
État |
SSM |
Une alarme est déclenchée si la valeur État du volume monté est Inconnu. Une valeur Inconnu ou Offline peut indiquer que le volume ne peut pas être monté ou accessible en raison d'un problème avec le périphérique de stockage sous-jacent. |
||
VPRI |
Priorité de vérification |
BLDR, BARC |
Par défaut, la valeur de la priorité de vérification est adaptative. Si la priorité de vérification est définie sur élevée, une alarme est déclenchée car la vérification du stockage peut ralentir le fonctionnement normal du service. |
||
VSTU |
État de vérification de l'objet |
BLDR |
Sélectionnez SUPPORT Outils topologie de grille. Sélectionnez ensuite site grid node LDR Storage Présentation main. Vérifiez si le système d'exploitation ne présente aucun signe d'erreur de périphérique de bloc ou de système de fichiers. Si la valeur de l'état de vérification de l'objet est erreur inconnue, elle indique généralement un problème matériel ou système de fichiers de bas niveau (erreur d'E/S) qui empêche la tâche de vérification du stockage d'accéder au contenu stocké. Contactez l'assistance technique. |
||
XAMS |
Référentiels d'audit inaccessibles |
BADC, BARC, BCLB, BCMN, BLDR, BNMS |
Vérifiez la connectivité réseau au serveur hébergeant le nœud d'administration. Si le problème persiste, contactez le support technique. |