Referencia de alertas
Esta referencia muestra las alertas por defecto que aparecen en Grid Manager. Las acciones recomendadas están en el mensaje de alerta que recibe.
Según sea necesario, puede crear reglas de alerta personalizadas que se ajusten a su enfoque de administración del sistema.
Algunas de las alertas predeterminadas utilizan "Métricas de Prometheus".
Alertas del dispositivo
Nombre de alerta | Descripción |
---|---|
La batería del dispositivo ha caducado |
La batería de la controladora de almacenamiento del dispositivo caducó. |
Error de la batería del aparato |
Se produjo un error en la batería de la controladora de almacenamiento del dispositivo. |
La batería del aparato no tiene suficiente capacidad adquirida |
La batería de la controladora de almacenamiento del aparato no tiene suficiente capacidad adquirida. |
La batería del aparato está a punto de agotarse |
La batería del controlador de almacenamiento del dispositivo está casi agotada. |
Se quitó la batería del aparato |
Falta la batería del controlador de almacenamiento del aparato. |
La batería del aparato está demasiado caliente |
La batería del controlador de almacenamiento del aparato se sobrecalienta. |
Error de comunicación de la BMC del dispositivo |
Se ha perdido la comunicación con el controlador de administración de la placa base (BMC). |
Error del dispositivo de backup de la caché del dispositivo |
Se produjo un error en un dispositivo de backup de caché persistente. |
La capacidad del dispositivo de backup de la caché del dispositivo es insuficiente |
La capacidad del dispositivo de copia de seguridad de la caché es insuficiente. |
Dispositivo de backup de la caché de dispositivo con protección contra escritura |
Un dispositivo de backup de caché está protegido contra escritura. |
El tamaño de la memoria caché del dispositivo no coincide |
Las dos controladoras del dispositivo tienen distintos tamaños de caché. |
Temperatura del chasis de la controladora de computación del dispositivo demasiado alta |
La temperatura de la controladora de computación en un dispositivo StorageGRID superó un umbral nominal. |
Temperatura de CPU del controlador de computación del dispositivo demasiado alta |
La temperatura de la CPU en la controladora de computación en un dispositivo StorageGRID superó un umbral nominal. |
La controladora de computación del dispositivo requiere atención |
Se detectó un error de hardware en la controladora de computación de un dispositivo StorageGRID. |
El suministro De alimentación De la controladora de computación del dispositivo A tiene un problema |
El suministro de alimentación A en la controladora de computación tiene un problema. |
El suministro de alimentación B de la controladora de computación del dispositivo tiene un problema |
El suministro de alimentación B en la controladora de computación tiene un problema. |
El servicio de supervisión del hardware de computación del dispositivo está estancado |
El servicio que supervisa el estado del hardware de almacenamiento se ha detenido. |
Fallo de la unidad DAS del dispositivo detectado |
Se detectó un problema con una unidad de almacenamiento de conexión directa (DAS) en el dispositivo. |
Reconstrucción de la unidad DAS del dispositivo |
Se está recompilando una unidad de almacenamiento de conexión directa (DAS). Esto se espera si se reemplazó o se retiró/reinsertó recientemente. |
Se ha detectado un fallo en el ventilador del dispositivo |
Se ha detectado un problema con una unidad de ventilador en el aparato. |
Se ha detectado un error de Fibre Channel del dispositivo |
Se detectó un problema de enlace de Fibre Channel entre la controladora de almacenamiento del dispositivo y la controladora de computación |
Error en el puerto HBA del Fibre Channel del dispositivo |
Un puerto HBA Fibre Channel está fallando o ya falló. |
Las unidades de memoria caché flash del dispositivo no son óptimas |
Las unidades que se usan para la caché SSD no están en estado óptimo. |
Se quitó la interconexión del dispositivo/el contenedor de batería |
Falta el contenedor de interconexión/batería. |
Falta el puerto LACP del dispositivo |
Un puerto de un dispositivo StorageGRID no participa en el enlace LACP. |
Fallo de NIC del dispositivo detectado |
Se ha detectado un problema con una tarjeta de interfaz de red (NIC) en el dispositivo. |
Se ha degradado el suministro de alimentación general del dispositivo |
La potencia de un dispositivo StorageGRID se ha desviado de la tensión de funcionamiento recomendada. |
Advertencia crítica del SSD del dispositivo |
El SSD de un dispositivo notifica una advertencia crítica. |
Fallo de la controladora A del almacenamiento del dispositivo |
Se produjo un error en la controladora De almacenamiento A de un dispositivo StorageGRID. |
Fallo del controlador B de almacenamiento del dispositivo |
Error de la controladora de almacenamiento B en un dispositivo StorageGRID. |
Fallo de la unidad de la controladora de almacenamiento del dispositivo |
Una o varias unidades de un dispositivo StorageGRID presenta errores o no están en estado óptimo. |
Problema de hardware de la controladora de almacenamiento del dispositivo |
El software SANtricity informa "necesita atención" para un componente de un dispositivo StorageGRID. |
Fallo en la alimentación de la controladora de almacenamiento del dispositivo |
La fuente De alimentación A de un dispositivo StorageGRID se ha desviado de la tensión de funcionamiento recomendada. |
Fallo en la fuente de alimentación B de la controladora de almacenamiento del dispositivo |
La fuente de alimentación B de un dispositivo StorageGRID se ha desviado de la tensión de funcionamiento recomendada. |
El servicio de supervisión del hardware de almacenamiento del dispositivo está estancado |
El servicio que supervisa el estado del hardware de almacenamiento se ha detenido. |
Las bandejas de almacenamiento del dispositivo degradadas |
El estado de uno de los componentes de la bandeja de almacenamiento de un dispositivo de almacenamiento es degradado. |
Se ha superado la temperatura del aparato |
Se ha excedido la temperatura nominal o máxima del controlador de almacenamiento del aparato. |
Se ha eliminado el sensor de temperatura del aparato |
Se ha quitado un sensor de temperatura. |
La actividad de I/o del disco es muy lenta |
La E/S de disco muy lenta puede afectar al rendimiento del grid. |
Fallo del ventilador del dispositivo de almacenamiento detectado |
Se detectó un problema con una unidad de ventilador en el controlador de almacenamiento para un dispositivo. |
Conectividad del almacenamiento del dispositivo de almacenamiento degradada |
Hay un problema con una o varias conexiones entre la controladora de computación y la controladora de almacenamiento. |
Dispositivo de almacenamiento inaccesible |
No se puede acceder a un dispositivo de almacenamiento. |
Alertas de auditoría y syslog
Nombre de alerta | Descripción |
---|---|
Los registros de auditoría se están agregando a la cola de la memoria |
El nodo no puede enviar registros al servidor de syslog local y la cola en memoria se está llenando. |
Error de reenvío del servidor de syslog externo |
El nodo no puede reenviar los registros al servidor de syslog externo. |
Cola de auditoría grande |
La cola de discos para los mensajes de auditoría está llena. Si no se resuelve esta condición, es posible que se produzcan errores en las operaciones S3 o Swift. |
Los registros se están agregando a la cola del disco |
El nodo no puede reenviar los registros al servidor de syslog externo y la cola en el disco se está llenando. |
Alertas de bloques
Nombre de alerta | Descripción |
---|---|
El bloque de FabricPool tiene una configuración de coherencia de bloques no compatible |
Un bloque de FabricPool utiliza el nivel de coherencia disponible, que no se admite. |
Alertas de Cassandra
Nombre de alerta | Descripción |
---|---|
Error del compactador automático de Cassandra |
El compactador automático Cassandra ha experimentado un error. |
Las métricas del compactador automático de Cassandra no están actualizadas |
Las métricas que describen al compactador automático Cassandra no están actualizadas. |
Error de comunicación de Cassandra |
Los nodos que ejecutan el servicio Cassandra tienen problemas para comunicarse entre sí. |
Compacciones de Cassandra sobrecargadas |
El proceso de compactación de Cassandra está sobrecargado. |
Error de escritura de sobretamaño de Cassandra |
Un proceso StorageGRID interno envió una solicitud de escritura a Cassandra que era demasiado grande. |
Las métricas de reparación de Cassandra están desfasadas |
Las métricas que describen los trabajos de reparación de Cassandra están desactualizadas. |
El progreso de reparación de Cassandra es lento |
El progreso de las reparaciones de la base de datos de Cassandra es lento. |
El servicio de reparación de Cassandra no está disponible |
El servicio de reparación de Cassandra no está disponible. |
Tablas dañadas en Cassandra |
Cassandra detectó daños en la tabla. Cassandra se reinicia automáticamente si detecta daños en la tabla. |
Disponibilidad de lectura mejorada deshabilitada |
Cuando la disponibilidad de lectura mejorada está deshabilitada, las solicitudes de OBTENCIÓN y CABEZAL pueden fallar cuando los nodos de almacenamiento no están disponibles. |
Alertas de Cloud Storage Pool
Nombre de alerta | Descripción |
---|---|
Error de conectividad del pool de almacenamiento en cloud |
La comprobación del estado de Cloud Storage Pools detectó uno o más errores nuevos. |
Alertas de replicación entre grid
Nombre de alerta | Descripción |
---|---|
Error permanente de replicación entre grid |
Se ha producido un error de replicación entre redes que requiere la intervención del usuario para resolverlo. |
Recursos de replicación entre grid no disponibles |
Las solicitudes de replicación entre grid están pendientes porque un recurso no está disponible. |
Alertas DHCP
Nombre de alerta | Descripción |
---|---|
El arrendamiento DHCP ha caducado |
El arrendamiento DHCP de una interfaz de red caducó. |
El arrendamiento DHCP caduca pronto |
El arrendamiento DHCP de una interfaz de red caduca pronto. |
Servidor DHCP no disponible |
El servidor DHCP no está disponible. |
Alertas de depuración y seguimiento
Nombre de alerta | Descripción |
---|---|
Depuración del impacto en el rendimiento |
Cuando el modo de depuración está activado, el rendimiento del sistema puede verse afectado negativamente. |
Configuración de seguimiento activada |
Cuando la configuración de seguimiento está habilitada, el rendimiento del sistema puede verse afectado negativamente. |
Alertas por correo electrónico y AutoSupport
Nombre de alerta | Descripción |
---|---|
No se pudo enviar el mensaje de AutoSupport |
No se puede enviar el mensaje de AutoSupport más reciente. |
Error en la notificación por correo electrónico |
No se pudo enviar la notificación por correo electrónico para una alerta. |
Alertas de código de borrado (EC)
Nombre de alerta | Descripción |
---|---|
Fallo de reequilibrio de EC |
El procedimiento de reequilibrio de EC ha fallado o se ha detenido. |
Fallo de reparación de EC |
Se ha producido un error en un trabajo de reparación de los datos de EC o se ha detenido. |
Reparación EC bloqueada |
Se ha detenido un trabajo de reparación para los datos de EC. |
Caducidad de las alertas de certificados
Nombre de alerta | Descripción |
---|---|
Vencimiento del certificado de cliente |
Uno o más certificados de cliente están a punto de caducar. |
Vencimiento del certificado de servidor global para S3 y Swift |
El certificado de servidor global para S3 y Swift está a punto de caducar. |
Caducidad del certificado de extremo de equilibrador de carga |
Uno o más certificados de punto final de equilibrio de carga están a punto de expirar. |
Caducidad del certificado de servidor para la interfaz de gestión |
El certificado de servidor utilizado para la interfaz de gestión está a punto de expirar. |
Vencimiento del certificado de CA de syslog externo |
El certificado de la entidad de certificación (CA) utilizado para firmar el certificado de servidor de syslog externo está a punto de expirar. |
Vencimiento del certificado de cliente de syslog externo |
El certificado de cliente para un servidor de syslog externo está a punto de expirar. |
Vencimiento del certificado de servidor de syslog externo |
El certificado de servidor presentado por el servidor de syslog externo está a punto de expirar. |
Alertas de red de grid
Nombre de alerta | Descripción |
---|---|
Discrepancia de MTU de red de grid |
La configuración de MTU de la interfaz de red de grid (eth0) difiere considerablemente entre los nodos del grid. |
Alertas de federación de grid
Nombre de alerta | Descripción |
---|---|
Caducidad del certificado de federación de grid |
Uno o varios certificados de federación de grid están a punto de caducar. |
Error de conexión de federación de grid |
La conexión de federación de grid entre el grid local y el remoto no funciona. |
Alertas de uso elevado o alta latencia
Nombre de alerta | Descripción |
---|---|
Uso de montón Java alto |
Se está utilizando un alto porcentaje de espacio de pila Java. |
Alta latencia para consultas de metadatos |
El tiempo medio para las consultas de metadatos de Cassandra es demasiado largo. |
Alertas de federación de identidades
Nombre de alerta | Descripción |
---|---|
Fallo de sincronización de la federación de identidades |
No se pueden sincronizar los grupos federados y los usuarios del origen de identidades. |
Error de sincronización de la federación de identidades para un inquilino |
No se pueden sincronizar los grupos federados y los usuarios del origen de identidades configurado por un arrendatario. |
Alertas de gestión de la vida útil de la información (ILM)
Nombre de alerta | Descripción |
---|---|
Se puede lograr una colocación de ILM |
No se puede conseguir una instrucción de ubicación en una regla de ILM para ciertos objetos. |
El periodo de análisis de ILM es demasiado largo |
El tiempo necesario para analizar, evaluar y aplicar ILM a los objetos es demasiado largo. |
Tasa baja de análisis de ILM |
La tasa de análisis de ILM se establece en menos de 100 objetos por segundo. |
Alertas del servidor de gestión de claves (KMS)
Nombre de alerta | Descripción |
---|---|
Vencimiento DEL certificado de CA DE KMS |
El certificado de la entidad de certificación (CA) utilizado para firmar el certificado de servidor de gestión de claves (KMS) está a punto de expirar. |
Vencimiento del certificado de cliente DE KMS |
El certificado de cliente para un servidor de gestión de claves está a punto de caducar |
No se ha podido cargar la configuración DE KMS |
La configuración del servidor de gestión de claves existe, pero no pudo cargar. |
Error de conectividad DE KMS |
Un nodo de dispositivo no pudo conectarse con el servidor de gestión de claves para su sitio. |
No se ha encontrado el nombre de la clave de cifrado DE KMS |
El servidor de gestión de claves configurado no tiene una clave de cifrado que coincida con el nombre proporcionado. |
Error en la rotación de la clave de cifrado DE KMS |
Todos los volúmenes del dispositivo se descifraron correctamente, pero uno o más volúmenes no pudieron rotar a la última clave. |
KMS no está configurado |
No existe ningún servidor de gestión de claves para este sitio. |
LA clave KMS no pudo descifrar el volumen de un dispositivo |
Uno o más volúmenes de un dispositivo con el cifrado de nodos activado no se pudieron descifrar con la clave KMS actual. |
Vencimiento del certificado DEL servidor DE KMS |
El certificado de servidor que utiliza el servidor de gestión de claves (KMS) está a punto de expirar. |
Alertas de desplazamiento de reloj local
Nombre de alerta | Descripción |
---|---|
Reloj local de gran desfase horario |
El ajuste entre el reloj local y la hora del protocolo de hora de red (NTP) es demasiado grande. |
Alertas de poca memoria o poco espacio
Nombre de alerta | Descripción |
---|---|
Capacidad de disco de registro de auditoría baja |
El espacio disponible para los registros de auditoría es bajo. Si no se resuelve esta condición, es posible que se produzcan errores en las operaciones S3 o Swift. |
Memoria del nodo baja disponible |
La cantidad de RAM disponible en un nodo es baja. |
Poco espacio libre para la piscina de almacenamiento |
El espacio disponible para almacenar datos de objetos en el nodo de almacenamiento es bajo. |
Memoria del nodo instalada baja |
La cantidad de memoria instalada en un nodo es baja. |
Almacenamiento de metadatos bajo |
El espacio disponible para almacenar metadatos de objetos es bajo. |
Capacidad de disco de métrica baja |
El espacio disponible para la base de datos de métricas es bajo. |
Almacenamiento de objetos bajo |
El espacio disponible para almacenar datos de objeto es bajo. |
Anulación de Marca de agua de sólo lectura baja |
La anulación de Marca de agua de solo lectura suave del volumen de almacenamiento es inferior a la Marca de agua optimizada mínima para un nodo de almacenamiento. |
Baja capacidad de disco raíz |
El espacio disponible en el disco raíz es bajo. |
Baja capacidad de datos del sistema |
El espacio disponible para los datos del sistema StorageGRID en el punto de montaje /var/local es bajo. |
Bajo espacio libre en el directorio tmp |
El espacio disponible en el directorio /tmp es bajo. |
Alertas de red de nodo o nodo
Nombre de alerta | Descripción |
---|---|
Fallo de configuración del firewall |
Fallo al aplicar la configuración del firewall. |
Error de conectividad de red de los nodos |
Se han producido errores al transferir datos entre nodos. |
Error de trama de recepción de red del nodo |
Un alto porcentaje de las tramas de red recibidas por un nodo tiene errores. |
El nodo no está sincronizado con el servidor NTP |
El nodo no está sincronizado con el servidor de protocolo de tiempo de red (NTP). |
El nodo no está bloqueado con el servidor NTP |
El nodo no está bloqueado por un servidor de protocolo de tiempo de red (NTP). |
Red de nodos que no es del dispositivo inactiva |
Uno o más dispositivos de red están inactivos o desconectados. |
Enlace del dispositivo de servicios inactivo en Admin Network |
La interfaz del dispositivo a la red de administración (eth1) está inactiva o desconectada. |
El dispositivo de servicios está desconectado en el puerto de red de administración 1 |
El puerto de red de administración 1 del dispositivo está inactivo o desconectado. |
Enlace del dispositivo de servicios inactivo en la red cliente |
La interfaz del dispositivo a la red cliente (eth2) está inactiva o desconectada. |
Enlace del dispositivo de servicios desactivado en el puerto de red 1 |
El puerto de red 1 del dispositivo está inactivo o desconectado. |
Enlace del dispositivo de servicios desactivado en el puerto de red 2 |
El puerto de red 2 del dispositivo está inactivo o desconectado. |
Enlace del dispositivo de servicios desactivado en el puerto de red 3 |
El puerto de red 3 del dispositivo está inactivo o desconectado. |
Enlace del dispositivo de servicios desactivado en el puerto de red 4 |
El puerto de red 4 del dispositivo está inactivo o desconectado. |
Enlace inactivo del dispositivo de almacenamiento en la red de administración |
La interfaz del dispositivo a la red de administración (eth1) está inactiva o desconectada. |
Enlace inactivo del dispositivo de almacenamiento en el puerto de red de administrador 1 |
El puerto de red de administración 1 del dispositivo está inactivo o desconectado. |
Enlace del dispositivo de almacenamiento inactivo en la red cliente |
La interfaz del dispositivo a la red cliente (eth2) está inactiva o desconectada. |
Enlace inactivo del dispositivo de almacenamiento en el puerto de red 1 |
El puerto de red 1 del dispositivo está inactivo o desconectado. |
Enlace inactivo del dispositivo de almacenamiento en el puerto de red 2 |
El puerto de red 2 del dispositivo está inactivo o desconectado. |
Enlace inactivo del dispositivo de almacenamiento en el puerto de red 3 |
El puerto de red 3 del dispositivo está inactivo o desconectado. |
Enlace inactivo del dispositivo de almacenamiento en el puerto de red 4 |
El puerto de red 4 del dispositivo está inactivo o desconectado. |
El nodo de almacenamiento no está en el estado de almacenamiento deseado |
El servicio LDR de un nodo de almacenamiento no puede realizar la transición al estado deseado debido a un error interno o a un problema relacionado con el volumen |
No es posible comunicarse con el nodo |
Uno o varios servicios no responden o no se puede acceder al nodo. |
Reinicio de nodo inesperado |
Un nodo se reinició de forma inesperada en las últimas 24 horas. |
Alertas de objetos
Nombre de alerta | Descripción |
---|---|
Error en la comprobación de la existencia del objeto |
Error en el trabajo de comprobación de la existencia del objeto. |
Comprobación de existencia de objeto bloqueada |
El trabajo de comprobación de la existencia del objeto se ha detenido. |
Objetos perdidos |
Se han perdido uno o más objetos de la cuadrícula. |
S3 PUT tamaño de objeto demasiado grande |
Un cliente está intentando realizar una operación PUT Object que supera los S3 límites de tamaño. |
Se detectó un objeto dañado no identificado |
Se encontró un archivo en el almacenamiento de objetos replicado que no se pudo identificar como un objeto replicado. |
Alertas de servicios de la plataforma
Nombre de alerta | Descripción |
---|---|
Servicios de plataforma no disponibles |
Hay muy pocos nodos de almacenamiento con el servicio RSM en ejecución o disponibles en un sitio. |
Alertas del volumen de almacenamiento
Nombre de alerta | Descripción |
---|---|
El volumen de almacenamiento necesita atención |
Un volumen de almacenamiento se encuentra sin conexión y necesita atención. |
Se debe restaurar el volumen de almacenamiento |
Se recuperó un volumen de almacenamiento y debe restaurarse. |
Volumen de almacenamiento sin conexión |
Un volumen de almacenamiento ha estado desconectado durante más de 5 minutos, posiblemente debido a que el nodo se reinició durante el paso de formato del volumen. |
La restauración de volumen no pudo iniciar la reparación de datos replicados |
No se pudo iniciar automáticamente la reparación de datos replicados en un volumen reparado. |
Alertas de servicios StorageGRID
Nombre de alerta | Descripción |
---|---|
servicio nginx mediante la configuración de copia de seguridad |
La configuración del servicio nginx no es válida. Ahora se está utilizando la configuración anterior. |
servicio nginx-gw que utiliza la configuración de copia de seguridad |
La configuración del servicio nginx-gw no es válida. Ahora se está utilizando la configuración anterior. |
Servicio SSH mediante la configuración de copia de seguridad |
La configuración del servicio SSH no es válida. Ahora se está utilizando la configuración anterior. |
Alertas de inquilinos
Nombre de alerta | Descripción |
---|---|
Uso de cuota de inquilino alto |
Se está utilizando un alto porcentaje de espacio de cuota. Esta regla está desactivada de forma predeterminada porque podría provocar demasiadas notificaciones. |