Referencia de alarmas (sistema heredado)
En la siguiente tabla se enumeran todas las alarmas predeterminadas heredadas. Si se activa una alarma, puede buscar el código de alarma en esta tabla para encontrar las acciones recomendadas.
Aunque el sistema de alarma heredado sigue siendo compatible, el sistema de alerta ofrece importantes ventajas y es más fácil de usar. |
Codificación | Nombre | Servicio | Acción recomendada | ||
---|---|---|---|---|---|
ABRL |
Relés de atributos disponibles |
BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Restaure la conectividad a un servicio (un servicio ADC) que ejecuta un atributo Lo antes posible. de servicio de retransmisión. Si no hay relés de atributos conectados, el nodo de cuadrícula no puede informar de valores de atributos al servicio NMS. Por lo tanto, el servicio NMS ya no puede supervisar el estado del servicio ni actualizar los atributos del servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
ACMS |
Servicios de metadatos disponibles |
BARC, BLDR, BCMN |
Se activa una alarma cuando un servicio LDR o ARC pierde la conexión con un servicio DDS. Si esto ocurre, no se pueden procesar las transacciones de procesamiento o recuperación. Si la falta de disponibilidad de los servicios de DDS es sólo un breve problema transitorio, las transacciones pueden retrasarse. Compruebe y restaure las conexiones a un servicio DDS para borrar esta alarma y devolver el servicio a su funcionalidad completa. |
||
HECHOS |
Estado del servicio de organización en niveles del cloud |
ARCO |
Solo disponible para nodos de archivado con un tipo objetivo de organización en niveles en cloud: Simple Storage Service (S3). Si el atributo ACTS del nodo de archivado está establecido en Read-only Enabled o Read-Write Disabled, debe establecer el atributo en Read-Write Enabled. Si se activa una alarma principal debido a un fallo de autenticación, compruebe las credenciales asociadas con el bloque de destino y los valores de actualización, si es necesario. Si se activa una alarma importante por cualquier otro motivo, póngase en contacto con el soporte técnico. |
||
ADCA |
Estado de ADC |
ADC |
Si se activa una alarma, seleccione SOPORTE > Herramientas > Topología de cuadrícula. A continuación, seleccione site > grid node > ADC > Overview > Main y ADC > Alarms > Main para determinar la causa de la alarma. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
ADCE |
Estado ADC |
ADC |
Si el valor del estado de ADC es en espera, continúe supervisando el servicio y si el problema persiste, póngase en contacto con el soporte técnico. Si el valor de Estado de ADC es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
AITE |
Recuperar estado |
BARC |
Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM). Si el valor de Retrieve State está esperando a Target, compruebe el servidor de middleware TSM y asegúrese de que funciona correctamente. Si el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que la conexión del nodo de archivado con el sistema de almacenamiento de archivado externo objetivo esté configurada correctamente. Si el valor del Estado de recuperación de archivo es sin conexión, intente actualizar el estado a en línea. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuración > Principal, seleccione Archivo recuperar estado > Online y haga clic en aplicar cambios. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
UIT |
Recuperar estado |
BARC |
Si el valor de Estado de recuperación es error de destino, compruebe si el sistema de almacenamiento de archivos externo objetivo presenta errores. Si se pierde el valor del estado de recuperación de archivo, compruebe el sistema de almacenamiento de archivo externo objetivo para asegurarse de que está en línea y funciona correctamente. Compruebe la conexión de red con el destino. Si el valor de Archive Retrieve Status es Unknown error, póngase en contacto con el soporte técnico. |
||
ALIS |
Sesiones de atributos entrantes |
ADC |
Si el número de sesiones de atributos entrantes en un relé de atributos aumenta demasiado, puede ser una indicación de que el sistema StorageGRID se ha desequilibrado. En condiciones normales, las sesiones de atributos deben distribuirse uniformemente entre los servicios ADC. Un desequilibrio puede producir problemas de rendimiento. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
ALOS |
Sesiones de atributos salientes |
ADC |
El servicio ADC tiene un gran número de sesiones de atributos y se está sobrecargando. Si se activa esta alarma, póngase en contacto con el soporte técnico. |
||
ALUR |
Repositorios de atributos inaccesibles |
ADC |
Compruebe la conectividad de red con el servicio NMS para asegurarse de que el servicio puede ponerse en contacto con el repositorio de atributos. Si se activa esta alarma y la conectividad de red es buena, póngase en contacto con el servicio técnico. |
||
AQS |
Mensajes de auditoría en cola |
BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Si los mensajes de auditoría no se pueden reenviar inmediatamente a un relé o repositorio de auditoría, los mensajes se almacenan en una cola de disco. Si la cola de discos se llena, pueden producirse interrupciones. Para permitirle responder en tiempo para evitar una interrupción, las alarmas AMQS se activan cuando el número de mensajes en la cola de discos alcanza los siguientes umbrales:
Si se activa una alarma AMQS, compruebe la carga en el sistema. Si ha habido un número significativo de transacciones, la alarma debe resolverse con el tiempo. En este caso, puede ignorar la alarma. Si la alarma persiste y aumenta su gravedad, vea un gráfico del tamaño de la cola. Si el número aumenta constantemente durante horas o días, es probable que la carga de auditoría haya superado la capacidad de auditoría del sistema. Reduzca la tasa de operaciones del cliente o disminuya el número de mensajes de auditoría registrados cambiando el nivel de auditoría a error o Desactivado. Consulte Configurar los mensajes de auditoría y los destinos de registro. |
||
AOTE |
Estado de la tienda |
BARC |
Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM). Si el valor de Estado de tienda está esperando a Target, compruebe el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente. Si el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que la conexión del nodo de archivado con el sistema de almacenamiento de archivado externo objetivo esté configurada correctamente. Si el valor del estado del almacén es sin conexión, compruebe el valor del estado del almacén. Corrija cualquier problema antes de volver a poner el estado de la tienda en línea. |
||
UOT |
Estado de la tienda |
BARC |
Si el valor del estado del almacén es pérdida de sesión, compruebe que el sistema de almacenamiento de archivos externo está conectado y en línea. Si el valor de Target error (error de destino), compruebe si hay errores en el sistema de almacenamiento de archivos externo. Si el valor de estado de almacén es error desconocido, póngase en contacto con el soporte técnico. |
||
APM |
Conectividad de acceso múltiple de almacenamiento |
SSM |
Si la alarma de estado multipath aparece como "degradado" (seleccione SOPORTE > Herramientas > Topología de cuadrícula y seleccione sitio > nodo de cuadrícula > SSM > Eventos), haga lo siguiente:
|
||
ARCE |
Estado DEL ARCO |
ARCO |
El servicio ARC tiene un estado de espera hasta que se hayan iniciado todos los componentes ARC (replicación, almacenamiento, recuperación, destino). A continuación, pasa a Online. Si el valor del estado ARC no pasa del modo en espera a en línea, compruebe el estado de los componentes del ARC. Si el valor del estado de ARC es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
ROQ |
Objetos en cola |
ARCO |
Esta alarma se puede activar si el dispositivo de almacenamiento extraíble se está ejecutando lentamente debido a problemas con el sistema de almacenamiento de archivos externo objetivo o si encuentra varios errores de lectura. Compruebe si hay errores en el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente. En algunos casos, este error puede producirse como resultado de una alta tasa de solicitudes de datos. Supervise el número de objetos en cola a medida que disminuye la actividad del sistema. |
||
ARRF |
Fallos de solicitudes |
ARCO |
Si se produce un error en una recuperación del sistema de almacenamiento de archivado externo objetivo, el nodo de archivado vuelve a intentar la recuperación, ya que el fallo puede deberse a un problema transitorio. Sin embargo, si los datos del objeto están dañados o se han marcado como no disponibles permanentemente, la recuperación no falla. En su lugar, el nodo de archivado vuelve a intentar la recuperación de forma continua y el valor de los fallos de solicitud continúa aumentando. Esta alarma puede indicar que el soporte de almacenamiento que contiene los datos solicitados está dañado. Compruebe el sistema de almacenamiento de archivos externo para diagnosticar el problema. Si determina que los datos del objeto ya no están en el archivado, el objeto tendrá que eliminarse del sistema StorageGRID. Para obtener más información, póngase en contacto con el soporte técnico. Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Request Failure Count y haga clic en Apply Changes. |
||
ARRV |
Errores de verificación |
ARCO |
Para diagnosticar y corregir este problema, póngase en contacto con el soporte técnico. Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Verification Failure Count y haga clic en Apply Changes. |
||
ARVF |
Errores de almacenamiento |
ARCO |
Esta alarma puede producirse como resultado de errores en el sistema de almacenamiento de archivos externo objetivo. Compruebe si hay errores en el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente. Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Store Failure Count y haga clic en Apply Changes. |
||
ASXP |
Acciones de auditoría |
AMS |
Se activa una alarma si el valor de los recursos compartidos de auditoría es Desconocido. Esta alarma puede indicar un problema con la instalación o configuración del nodo de administración. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
AUMA |
Estado de AMS |
AMS |
Si el valor de Estado AMS es error de conectividad de BD, reinicie el nodo de cuadrícula. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
AUME |
Estado AMS |
AMS |
Si el valor del estado AMS es Standby, continúe monitorizando el sistema StorageGRID. Si el problema persiste, póngase en contacto con el soporte técnico. Si el valor de Estado AMS es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
AUXS |
Estado de exportación de auditoría |
AMS |
Si se activa una alarma, corrija el problema subyacente y, a continuación, reinicie el servicio AMS. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
BADD |
Número de unidades con errores del controlador de almacenamiento |
SSM |
Esta alarma se activa cuando una o varias unidades de un dispositivo StorageGRID presenta errores o no están en estado óptimo. Sustituya las unidades según sea necesario. |
||
BASF |
Identificadores de objetos disponibles |
CMN |
Cuando se aprovisiona un sistema StorageGRID, al servicio CMN se le asigna un número fijo de identificadores de objeto. Esta alarma se activa cuando el sistema StorageGRID comienza a agotar su suministro de identificadores de objetos. Para asignar más identificadores, póngase en contacto con el soporte técnico. |
||
GRAVES |
Estado de asignación de bloque de identificador |
CMN |
De forma predeterminada, se activa una alarma cuando no se pueden asignar identificadores de objeto porque no se puede alcanzar el quórum de ADC. La asignación de bloques de identificador en el servicio CMN requiere que haya un quórum (50% + 1) de los servicios ADC conectado y conectado. Si el quórum no está disponible, el servicio CMN no puede asignar nuevos bloques de identificador hasta que se restablezca el quórum de ADC. Si se pierde el quórum de ADC, por lo general no se produce un impacto inmediato en el sistema StorageGRID (los clientes todavía pueden procesar y recuperar contenido), ya que el suministro de identificadores de aproximadamente un mes se almacena en caché en otro lugar del grid; Sin embargo, si la condición continúa, el sistema StorageGRID perderá la capacidad para procesar contenido nuevo. Si se activa una alarma, investigue el motivo de la pérdida de quórum de ADC (por ejemplo, puede ser un fallo de red o nodo de almacenamiento) y tome medidas correctivas. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
BRDT |
Temperatura del chasis de la controladora de computación |
SSM |
Se activa una alarma si la temperatura de la controladora de computación en un dispositivo StorageGRID supera un umbral nominal. Compruebe los componentes de hardware y los problemas medioambientales si hay un sobrecalentamiento. Si es necesario, sustituir el componente. |
||
BTOF |
Desviación |
BDC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Se activa una alarma si el tiempo de servicio (segundos) difiere significativamente del tiempo del sistema operativo. En condiciones normales, el servicio deberá volver a resincronizarse. Si el tiempo de servicio se desvía demasiado lejos del tiempo del sistema operativo, el funcionamiento del sistema puede verse afectado. Confirme que el origen de la hora del sistema StorageGRID es correcto. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
BTSE |
Estado del reloj |
BDC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC |
Se activa una alarma si el tiempo del servicio no está sincronizado con el tiempo de seguimiento del sistema operativo. En condiciones normales, el servicio deberá volver a resincronizarse. Si el tiempo se desvía demasiado lejos del tiempo del sistema operativo, el funcionamiento del sistema puede verse afectado. Confirme que el origen de la hora del sistema StorageGRID es correcto. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CAHP |
Porcentaje de uso de Java Heap |
DDS |
Se activa una alarma si Java no puede realizar la recolección de basura a una velocidad que permita suficiente espacio de pila para que el sistema funcione correctamente. Una alarma podría indicar una carga de trabajo de usuario que supere los recursos disponibles en todo el sistema para el almacén de metadatos de DDS. Compruebe la actividad de ILM en el Panel, o seleccione SUPPORT > Tools > Grid topolog, a continuación, seleccione site > grid node > DDS > Resources > Overview > Main. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CAIH |
Número de destinos de procesamiento disponibles |
CLB |
Esta alarma está obsoleta. |
||
CAQH |
Número de destinos disponibles |
CLB |
Esta alarma se borra cuando se corrigen los problemas subyacentes de los servicios LDR disponibles. Asegúrese de que el componente HTTP de los servicios LDR esté en línea y funcionando normalmente. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CASA |
Estado del almacén de datos |
DDS |
Se genera una alarma si el almacén de metadatos de Cassandra deja de estar disponible. Compruebe el estado de Cassandra:
Esta alarma también puede indicar que el almacén de metadatos (base de datos Cassandra) para un nodo de almacenamiento debe recompilarse. Consulte la información sobre cómo solucionar problemas de los Servicios: Estado - alarma Cassandra (SVST) en Solucionar problemas de metadatos. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CASO |
Estado del almacén de datos |
DDS |
Esta alarma se activa durante la instalación o expansión para indicar que un nuevo almacén de datos se está uniendo a la cuadrícula. |
||
CES |
Sesiones entrantes: Establecido |
CLB |
Esta alarma se activa si hay 20,000 o más sesiones HTTP activas actualmente (abiertas) en el nodo de puerta de enlace. Si un cliente tiene demasiadas conexiones, puede ver fallos de conexión. Debe reducir la carga de trabajo. |
||
CCNA |
Hardware de computación |
SSM |
Esta alarma se activa si el estado del hardware de la controladora de computación en un dispositivo StorageGRID requiere atención. |
||
CDLP |
Espacio usado de metadatos (porcentaje) |
DDS |
Esta alarma se activa cuando el espacio efectivo de metadatos (CEMS) alcanza un 70% de lleno (alarma secundaria), un 90% de lleno (alarma principal) y un 100% de lleno (alarma crítica). Si esta alarma alcanza el umbral del 90%, aparecerá una advertencia en el panel de control en Grid Manager. Debe realizar un procedimiento de ampliación para añadir un nuevo Lo antes posible. a los nodos de almacenamiento. Consulte Amplíe su grid. Si esta alarma alcanza el umbral del 100%, debe detener la incorporación de objetos y añadir nodos de almacenamiento inmediatamente. Cassandra requiere una cierta cantidad de espacio para realizar operaciones esenciales, como la compactación y la reparación. Estas operaciones se verán afectadas si los metadatos de los objetos utilizan más del 100 % del espacio permitido. Pueden producirse resultados no deseados. Nota: Póngase en contacto con el servicio de asistencia técnica si no puede agregar nodos de almacenamiento. Una vez que se añaden nodos de almacenamiento nuevos, el sistema reequilibra automáticamente los metadatos de los objetos en todos los nodos de almacenamiento y la alarma se borra. Consulte también información sobre la solución de problemas de la alerta de almacenamiento de metadatos bajos en Solucionar problemas de metadatos. |
||
CLBA |
Estado CLB |
CLB |
Si se activa una alarma, seleccione SOPORTE > Herramientas > topología de cuadrícula y, a continuación, seleccione sitio > nodo de cuadrícula > CLB > Descripción general > Principal y CLB > Alarmas > Principal para determinar la causa de la alarma y solucionar el problema. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CLBE |
Estado CLB |
CLB |
Si el valor del estado CLB es en espera, continúe supervisando la situación y, si el problema persiste, póngase en contacto con el servicio técnico. Si el estado es sin conexión y no hay problemas conocidos de hardware del servidor (por ejemplo, el servidor está desconectado) o tiempo de inactividad programado, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CMNA |
Estado de CMN |
CMN |
Si el valor de CMN Status es error, seleccione SUPPORT > Tools > Grid topolog y seleccione site > grid node > CMN > Overview > Main y CMN > Alarms > Main para determinar la causa del error y solucionar el problema. Se activa una alarma y el valor de CMN Status es no Online CMN durante una actualización de hardware del nodo de administración principal cuando se cambian los CMN (el valor del estado antiguo de CMN es Standby y el nuevo es Online). Si el problema persiste, póngase en contacto con el soporte técnico. |
||
CPRC |
La capacidad restante |
NMS |
Se activa una alarma si la capacidad restante (número de conexiones disponibles que se pueden abrir a la base de datos NMS) cae por debajo de la gravedad de alarma configurada. Si se activa una alarma, póngase en contacto con el soporte técnico. |
||
CPSA |
Suministro de alimentación De la controladora de computación a |
SSM |
Se activa una alarma si hay un problema con el suministro De alimentación A en el controlador de computación de un dispositivo StorageGRID. Si es necesario, sustituir el componente. |
||
CPSB |
Suministro de alimentación B de la controladora de computación |
SSM |
Se activa una alarma si existe un problema con la alimentación B en el controlador de computación de un dispositivo StorageGRID. Si es necesario, sustituir el componente. |
||
CPUT |
Temperatura de CPU de la controladora de computación |
SSM |
Se activa una alarma si la temperatura de la CPU en la controladora de computación de un dispositivo StorageGRID supera un umbral nominal. Si el nodo de almacenamiento es un dispositivo StorageGRID, el sistema StorageGRID indica que la controladora requiere atención. Compruebe los componentes de hardware y los problemas de entorno si hay un sobrecalentamiento. Si es necesario, sustituir el componente. |
||
DNST |
Estado de DNS |
SSM |
Una vez finalizada la instalación, se activa una alarma DNST en el servicio SSM. Una vez configurado el DNS y la nueva información del servidor llega a todos los nodos de la cuadrícula, la alarma se cancela. |
||
ECCD |
Se han detectado fragmentos dañados |
LDR |
Se activa una alarma cuando el proceso de verificación en segundo plano detecta un fragmento codificado por borrado dañado. Si se detecta un fragmento dañado, se intenta reconstruir el fragmento. Restablezca los fragmentos dañados detectados y copia los atributos perdidos a cero y monitoréelos para ver si los recuentos vuelven a subir. Si el número se aumenta, puede que haya un problema con el almacenamiento subyacente del nodo de almacenamiento. No se considera que falte una copia de los datos del objeto codificados para borrado hasta que el número de fragmentos perdidos o corruptos incumpla la tolerancia a fallos del código de borrado; por lo tanto, es posible tener un fragmento dañado y aún poder recuperar el objeto. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
ECST |
Estado de verificación |
LDR |
Esta alarma indica el estado actual del proceso de verificación en segundo plano para los datos de objetos codificados de borrado en este nodo de almacenamiento. Se activa una alarma importante si hay un error en el proceso de verificación en segundo plano. |
||
FONP |
Abra Descriptores de archivo |
BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
La FONP puede hacerse grande durante la actividad pico. Si no disminuye durante períodos de actividad lenta, póngase en contacto con el soporte técnico. |
||
HSTE |
Estado HTTP |
LDR |
Consulte acciones recomendadas para HSTU. |
||
HSTU |
Estado HTTP |
LDR |
HSTE y HSTU están relacionados con el protocolo HTTP para todo el tráfico de LDR, incluidos S3, Swift y otro tráfico interno de StorageGRID. Una alarma indica que se ha producido una de las siguientes situaciones:
El atributo HTTP de inicio automático está habilitado de forma predeterminada. Si se cambia esta configuración, HTTP podría permanecer sin conexión después de un reinicio. Si es necesario, espere a que el servicio LDR se reinicie. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione Storage Node > LDR > Configuración. Si el protocolo HTTP está sin conexión, colocarlo en línea. Compruebe que el atributo HTTP de inicio automático está habilitado. Si el protocolo HTTP permanece sin conexión, póngase en contacto con el soporte técnico. |
||
HTA |
HTTP de inicio automático |
LDR |
Especifica si se deben iniciar los servicios HTTP automáticamente al iniciar. Es una opción de configuración especificada por el usuario. |
||
IRSU |
Estado de replicación entrante |
BLDR, BARC |
Una alarma indica que se ha desactivado la replicación de entrada. Confirmar ajustes de configuración: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Replication > Configuración > Principal. |
||
LATA |
Latencia media |
NMS |
Compruebe si hay problemas de conectividad. Compruebe la actividad del sistema para confirmar que hay un aumento en la actividad del sistema. Un aumento en la actividad del sistema provocará un aumento de la actividad de los datos de atributos. Este aumento de la actividad dará lugar a un retraso en el procesamiento de datos de atributos. Esto puede ser una actividad normal del sistema y se resta. Compruebe si hay varias alarmas. Un aumento en los tiempos de latencia medios se puede indicar mediante un número excesivo de alarmas activadas. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
LDRE |
Estado LDR |
LDR |
Si el valor de LDR State es Standby, continúe supervisando la situación y, si el problema persiste, póngase en contacto con el soporte técnico. Si el valor del estado LDR es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
PERDIDO |
Objetos perdidos |
DDS, LDR |
Se activa cuando el sistema StorageGRID no logra recuperar una copia del objeto solicitado desde cualquier lugar del sistema. Antes de que se active una alarma PERDIDA (objetos perdidos), el sistema intenta recuperar y reemplazar un objeto que falta desde cualquier otro lugar del sistema. Los objetos perdidos representan una pérdida de datos. El atributo objetos perdidos se incrementa siempre que el número de ubicaciones de un objeto caiga a cero sin que el servicio DDS purice el contenido de forma intencionada para satisfacer la política ILM. Investigar inmediatamente las alarmas PERDIDAS (OBJETOS PERDIDOS). Si el problema persiste, póngase en contacto con el soporte técnico. |
||
MCEP |
Caducidad del certificado de la interfaz de gestión |
CMN |
Se activa cuando el certificado utilizado para acceder a la interfaz de gestión está a punto de expirar.
|
||
MINQ |
Notificaciones de correo electrónico en cola |
NMS |
Compruebe las conexiones de red de los servidores que alojan el servicio NMS y el servidor de correo externo. Confirme también que la configuración del servidor de correo electrónico sea correcta. |
||
MIN |
Estado de las notificaciones por correo electrónico |
BNMS |
Se activa una alarma menor si el servicio NMS no puede conectarse al servidor de correo. Compruebe las conexiones de red de los servidores que alojan el servicio NMS y el servidor de correo externo. Confirme también que la configuración del servidor de correo electrónico sea correcta. |
||
SRA. |
Estado del motor de la interfaz NMS |
BNMS |
Se activa una alarma si el motor de interfaz NMS del nodo de administración que recopila y genera contenido de interfaz se desconecta del sistema. Compruebe el Administrador del servidor para determinar si la aplicación individual del servidor está inactiva. |
||
NANG |
Configuración de negociación automática de red |
SSM |
Compruebe la configuración del adaptador de red. La configuración debe coincidir con las preferencias de los routers y switches de red. Un ajuste incorrecto puede tener un impacto grave en el rendimiento del sistema. |
||
NDUP |
Configuración dúplex de red |
SSM |
Compruebe la configuración del adaptador de red. La configuración debe coincidir con las preferencias de los routers y switches de red. Un ajuste incorrecto puede tener un impacto grave en el rendimiento del sistema. |
||
NLNK |
Detección de enlace de red |
SSM |
Compruebe las conexiones de los cables de red en el puerto y en el conmutador. Compruebe las configuraciones del router de red, del switch y del adaptador. Reinicie el servidor. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
NRER |
Recibir errores |
SSM |
Las siguientes pueden ser las causas de las alarmas NRER:
Consulte la información sobre cómo solucionar problemas de la alarma error de recepción de red (NRER) en Solucionar problemas de red, hardware y plataforma. |
||
NRLY |
Relés de auditoría disponibles |
BDC, BARC, BCLB, BCMN, BLDR, BNMS, BDDS |
Si los relés de auditoría no están conectados a los servicios ADC, no se pueden informar los eventos de auditoría. Los usuarios se ponen en cola y no están disponibles hasta que se restaura la conexión. Restaure la conectividad a un Lo antes posible. de servicio de ADC. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SCA |
Estado de NMS |
NMS |
Si el valor de Estado de NMS es error de conectividad de BD, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
NSCE |
Estado NMS |
NMS |
Si el valor del estado de NMS es en espera, continúe la monitorización y si el problema persiste, póngase en contacto con el servicio técnico. Si el valor del estado NMS es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
NSPD |
Velocidad |
SSM |
Esto puede deberse a problemas de conectividad de red o de compatibilidad de controladores. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
NBR |
Tablespace gratis |
NMS |
Si se activa una alarma, compruebe la rapidez con la que ha cambiado el uso de la base de datos. Una caída repentina (a diferencia de un cambio gradual a lo largo del tiempo) indica una condición de error. Si el problema persiste, póngase en contacto con el soporte técnico. El ajuste del umbral de alarma permite gestionar de manera proactiva cuándo se debe asignar más almacenamiento. Si el espacio disponible alcanza un umbral bajo (consulte umbral de alarma), póngase en contacto con el soporte técnico para cambiar la asignación de la base de datos. |
||
NTER |
Errores de transmisión |
SSM |
Estos errores se pueden borrar sin que se restablezcan manualmente. Si no se borran, compruebe el hardware de red. Compruebe que el hardware y el controlador del adaptador están correctamente instalados y configurados para funcionar con los routers y switches de la red. Cuando se resuelva el problema subyacente, restablezca el contador. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Recursos > Configuración > Principal, seleccione Restablecer recuento de errores de transmisión y haga clic en aplicar cambios. |
||
NTFQ |
Compensación de frecuencia NTP |
SSM |
Si el desvío de frecuencia supera el umbral configurado, es probable que haya un problema de hardware con el reloj local. Si el problema persiste, póngase en contacto con el soporte técnico para arreglar un reemplazo. |
||
NTLK |
Bloqueo NTP |
SSM |
Si el daemon NTP no está bloqueado en una fuente de hora externa, compruebe la conectividad de red con los orígenes de tiempo externos designados, su disponibilidad y su estabilidad. |
||
NOTF |
Ajuste de tiempo NTP |
SSM |
Si el desfase de tiempo supera el umbral configurado, es probable que haya un problema de hardware con el oscilador del reloj local. Si el problema persiste, póngase en contacto con el soporte técnico para arreglar un reemplazo. |
||
NTSJ |
Variación de origen de tiempo seleccionada |
SSM |
Este valor indica la fiabilidad y estabilidad del origen de tiempo que NTP utiliza en el servidor local como referencia. Si se activa una alarma, puede ser una indicación de que el oscilador de la fuente de tiempo está defectuoso, o de que hay un problema con el enlace WAN al origen de tiempo. |
||
NTSU |
Estado de NTP |
SSM |
Si el valor del estado de NTP no está en ejecución, póngase en contacto con el soporte técnico. |
||
OPST |
Estado general de la alimentación |
SSM |
Se activa una alarma si la alimentación de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado. Compruebe el estado de la fuente de alimentación A o B para determinar qué fuente de alimentación funciona de forma anormal. Si es necesario, sustituya la fuente de alimentación. |
||
OQRT |
Objetos en cuarentena |
LDR |
Una vez que el sistema StorageGRID restaura automáticamente los objetos, los objetos en cuarentena se pueden quitar del directorio de cuarentena.
Los objetos en cuarentena se eliminan y el recuento se restablece a cero. |
||
ORSU |
Estado de replicación saliente |
BLDR, BARC |
Una alarma indica que la replicación saliente no es posible: El almacenamiento se encuentra en un estado donde los objetos no se pueden recuperar. Se activa una alarma si la replicación saliente se desactiva manualmente. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Replication > Configuración. Se activa una alarma si el servicio LDR no está disponible para la replicación. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > almacenamiento. |
||
OSLF |
Estado de la bandeja |
SSM |
Se activa una alarma si el estado de uno de los componentes de la bandeja de almacenamiento de un dispositivo de almacenamiento está degradado. Los componentes de la bandeja de almacenamiento incluyen los IOM, los ventiladores, los suministros de alimentación y los cajones de unidades.Si esta alarma se activa, consulte las instrucciones de mantenimiento del dispositivo. |
||
PMEM |
Uso de memoria de servicio (porcentaje) |
BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS |
Puede tener un valor superior al y% de RAM, donde y representa el porcentaje de memoria que utiliza el servidor. Las cifras por debajo del 80% son normales. Más del 90% se considera un problema. Si el uso de la memoria es elevado para un único servicio, supervise la situación e investigue. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
PSA |
Estado del suministro de alimentación de |
SSM |
Se activa una alarma si la fuente De alimentación A de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado. Si es necesario, sustituya la fuente de alimentación A. |
||
PSBS |
Estado de la fuente de alimentación B |
SSM |
Se activa una alarma si la fuente de alimentación B de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado. Si es necesario, sustituya la fuente de alimentación B. |
||
RDTE |
Estado de Tivoli Storage Manager |
BARC |
Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM). Si el valor de Estado de Tivoli Storage Manager es sin conexión, compruebe el estado de Tivoli Storage Manager y resuelva cualquier problema. Vuelva a conectar el componente. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Target > Configuration > Main, seleccione Tivoli Storage Manager State > Online y haga clic en Apply Changes. |
||
RDTU |
Estado de Tivoli Storage Manager |
BARC |
Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM). Si el valor de Estado de Tivoli Storage Manager es error de configuración y el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que el servidor de middleware TSM está configurado correctamente. Si el valor de Estado de Tivoli Storage Manager es error de conexión o error de conexión, Retraer, comprobar la configuración de red en el servidor de middleware TSM y la conexión de red entre el servidor de middleware TSM y el sistema StorageGRID. Si el valor de Estado de Tivoli Storage Manager es error de autenticación o fallo de autenticación, volver a conectarse, el sistema StorageGRID puede conectarse al servidor de middleware TSM, pero no puede autenticar la conexión. Compruebe que el servidor de middleware TSM está configurado con el usuario, la contraseña y los permisos correctos y reinicie el servicio. Si el valor de Estado de Tivoli Storage Manager es error de sesión, se ha perdido inesperadamente una sesión establecida. Compruebe la conexión de red entre el servidor de middleware TSM y el sistema StorageGRID. Compruebe si hay errores en el servidor de middleware. Si el valor de Estado de Tivoli Storage Manager es error desconocido, póngase en contacto con el soporte técnico. |
||
RIRF |
Replicaciones entrantes — no se han podido realizar |
BLDR, BARC |
Se puede producir una alarma de réplicas entrantes — fallo durante periodos de altas cargas o interrupciones temporales de la red. Una vez que la actividad del sistema se reduce, esta alarma debe eliminarse. Si el número de repeticiones fallidas continúa aumentando, busque problemas de red y compruebe que los servicios LDR y ARC de origen y destino están en línea y disponibles. Para restablecer el recuento, seleccione SUPPORT > Tools > Grid topolog y, a continuación, seleccione site > grid node > LDR > Replication > Configuration > Main. Seleccione Restablecer recuento de fallos de replicación entrante y haga clic en aplicar cambios. |
||
RIRQ |
Replicaciones entrantes — en cola |
BLDR, BARC |
Las alarmas pueden producirse durante períodos de carga alta o interrupción temporal de la red. Una vez que la actividad del sistema se reduce, esta alarma debe eliminarse. Si el recuento de réplicas en cola continúa aumentando, busque problemas de red y compruebe que los servicios LDR y ARC de origen y destino están en línea y disponibles. |
||
RORQ |
Replicaciones salientes — en cola |
BLDR, BARC |
La cola de replicación saliente contiene datos de objeto que se copian para cumplir las reglas de ILM y los objetos solicitados por los clientes. Una alarma puede ocurrir como resultado de una sobrecarga del sistema. Espere a ver si la alarma se borra cuando disminuye la actividad del sistema. Si la alarma vuelve a producirse, añada capacidad añadiendo nodos de almacenamiento. |
||
VICEPRESIDENTE |
Espacio útil total (porcentaje) |
LDR |
Si el espacio útil alcanza un umbral bajo, las opciones incluyen expandir el sistema StorageGRID o mover datos de objeto para archivar a través de un nodo de archivado. |
||
CA |
Estado |
CMN |
Si el valor de Estado de la tarea de cuadrícula activa es error, busque el mensaje de tarea de cuadrícula. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > CMN > Grid Tasks > Overview > Main. El mensaje de tarea de la cuadrícula muestra información sobre el error (por ejemplo, "'check failed on node 12130011'"). Después de investigar y corregir el problema, reinicie la tarea de cuadrícula. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > CMN > Grid Tasks > Configuration > Main y seleccione Actions > Run. Si el valor de Estado para una tarea de cuadrícula que se está anulando es error, intente cancelar la tarea de cuadrícula. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SCEP |
Storage API Service finaliza la caducidad del certificado |
CMN |
Se desencadena cuando el certificado utilizado para acceder a extremos de API de almacenamiento está a punto de expirar.
|
||
SCHR |
Estado |
CMN |
Si se cancela el valor de Estado de la tarea de cuadrícula histórica, investigue el motivo y vuelva a ejecutar la tarea si es necesario. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SCSA |
Controladora de almacenamiento A |
SSM |
Se activa una alarma si hay un problema con la controladora A de almacenamiento en un dispositivo StorageGRID. Si es necesario, sustituir el componente. |
||
SCSB |
Controladora de almacenamiento B |
SSM |
Se activa una alarma si hay un problema con la controladora B de almacenamiento en un dispositivo StorageGRID. Si es necesario, sustituir el componente. Algunos modelos de dispositivos no tienen una controladora de almacenamiento B. |
||
SHLH |
Salud |
LDR |
Si el valor de Estado de un almacén de objetos es error, compruebe y corrija:
|
||
SLSA |
Promedio de carga de CPU |
SSM |
Cuanto mayor sea el valor, mayor será el número de bus del sistema. Si la media de carga de la CPU persiste en un valor alto, se debe investigar el número de transacciones del sistema para determinar si esto se debe a una carga pesada en ese momento. Vea un gráfico del promedio de carga de CPU: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Recursos > Informes > Cartas. Si la carga del sistema no es pesada y el problema persiste, póngase en contacto con el soporte técnico. |
||
SMST |
Estado del monitor de registro |
SSM |
Si el valor de Estado del Monitor de registro no está conectado durante un período de tiempo persistente, póngase en contacto con el soporte técnico. |
||
SMTT |
Total de eventos |
SSM |
Si el valor total de eventos es mayor que cero, compruebe si hay eventos conocidos (como errores de red) que puedan ser la causa. A menos que se hayan borrado estos errores (es decir, el recuento se ha restablecido a 0), se pueden activar las alarmas de eventos totales. Cuando se resuelve un problema, restablezca el contador para borrar la alarma. Seleccione NODES > site > grid node > Eventos > Restablecer recuentos de eventos.
Si el valor total de eventos es cero o el número aumenta y el problema persiste, póngase en contacto con el soporte técnico. |
||
SNST |
Estado |
CMN |
Una alarma indica que hay un problema al almacenar los paquetes de tareas de la cuadrícula. Si el valor de Estado es error de punto de comprobación o quórum no alcanzado, confirme que la mayoría de los servicios de ADC están conectados al sistema StorageGRID (50% más uno) y espere unos minutos. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SEDA |
Estado del sistema operativo de almacenamiento |
SSM |
Se activa una alarma si el software de SANtricity indica que hay un problema de "'necesita atención'" con un componente de un dispositivo StorageGRID. Seleccione NODES. A continuación, seleccione Appliance Storage Node > hardware. Desplácese hacia abajo para ver el estado de cada componente. En el software SANtricity, compruebe otros componentes del dispositivo para aislar el problema. |
||
SSMA |
Estado del SSM |
SSM |
Si el valor del estado del SSM es error, seleccione SUPPORT > Tools > Grid topolog y seleccione site > grid node > SSM > Overview > Main y SSM > Overview > Alarms para determinar la causa de la alarma. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SSME |
Estado SSM |
SSM |
Si el valor del estado del SSM es en espera, continúe la monitorización y si el problema persiste, póngase en contacto con el servicio técnico. Si el valor del estado SSM es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
SST |
Estado del almacenamiento |
LDR |
Si el valor del Estado de almacenamiento es espacio útil insuficiente, no hay más almacenamiento disponible en el nodo de almacenamiento y los ingestos datos se redirigen a otro nodo de almacenamiento disponible. Las solicitudes de recuperación pueden seguir suministrándose desde este nodo de grid. Debe añadirse almacenamiento adicional. No afecta al funcionamiento del usuario final, pero la alarma permanece hasta que se añade almacenamiento adicional. Si el valor del estado del almacenamiento es volúmenes no disponibles, una parte del almacenamiento no está disponible. No es posible almacenar ni recuperar datos de estos volúmenes. Compruebe el estado del volumen para obtener más información: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Storage > Overview > Main. El estado del volumen se enumera en almacenes de objetos. Si el valor del estado del almacenamiento es error, póngase en contacto con el soporte técnico. |
||
VST DE NETAPP |
Estado |
SSM |
Esta alarma se borra cuando se resuelven otras alarmas relacionadas con un servicio no en ejecución. Realice un seguimiento de las alarmas del servicio de origen para restaurar la operación. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Servicios > Descripción general > Principal. Cuando el estado de un servicio se muestra como no se está ejecutando, su estado es administrativamente inactivo. El estado del servicio puede aparecer como no en ejecución por los siguientes motivos:
Si un servicio aparece como no en ejecución, reinicie el servicio ( Esta alarma también puede indicar que el almacén de metadatos (base de datos Cassandra) para un nodo de almacenamiento debe recompilarse. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
TMEM |
Memoria instalada |
SSM |
Los nodos que se ejecutan con menos de 24 GIB de memoria instalada pueden provocar problemas de rendimiento e inestabilidad del sistema. La cantidad de memoria instalada en el sistema debe aumentarse a al menos 24 GIB. |
||
TPOP |
Operaciones pendientes |
ADC |
Una cola de mensajes puede indicar que el servicio ADC está sobrecargado. Se pueden conectar muy pocos servicios ADC al sistema StorageGRID. En una puesta en marcha de gran tamaño, el servicio de ADC puede requerir la adición de recursos computacionales o el sistema puede requerir servicios de ADC adicionales. |
||
UMEM |
Memoria disponible |
SSM |
Si la RAM disponible es baja, determine si se trata de un problema de hardware o software. Si no se trata de un problema de hardware, o si la memoria disponible cae por debajo de los 50 MB (el umbral de alarma predeterminado), póngase en contacto con el soporte técnico. |
||
VMFI |
Entradas disponibles |
SSM |
Esto indica que se requiere almacenamiento adicional. Póngase en contacto con el soporte técnico. |
||
VMFR |
Espacio disponible |
SSM |
Si el valor de espacio disponible es demasiado bajo (consulte umbrales de alarma), debe investigarse si hay archivos de registro que crecen desproporcionalmente o si los objetos ocupan demasiado espacio en disco (consulte umbrales de alarma) que se deben reducir o eliminar. Si el problema persiste, póngase en contacto con el soporte técnico. |
||
VMST |
Estado |
SSM |
Se activa una alarma si el valor de Estado del volumen montado es Desconocido. Un valor de Unknown o Offline puede indicar que no se puede montar el volumen ni acceder a él debido a un problema con el dispositivo de almacenamiento subyacente. |
||
VPRI |
Prioridad de verificación |
BLDR, BARC |
De forma predeterminada, el valor de prioridad de verificación es adaptable. Si la prioridad de verificación está establecida en Alta, se activa una alarma porque la verificación del almacenamiento puede ralentizar las operaciones normales del servicio. |
||
VSTU |
Estado de verificación de objetos |
LDR |
Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Storage > Overview > Main. Compruebe si hay signos de errores en el sistema de archivos o en el dispositivo de bloqueo. Si el valor de Estado de verificación de objetos es error desconocido, normalmente indica un problema de hardware o del sistema de archivos de bajo nivel (error de E/S) que impide que la tarea verificación de almacenamiento acceda al contenido almacenado. Póngase en contacto con el soporte técnico. |
||
XAMS |
Repositorios de auditoría inalcanzables |
BDC, BARC, BCLB, BCMN, BLDR, BNMS |
Compruebe la conectividad de red al servidor que aloja el nodo de administración. Si el problema persiste, póngase en contacto con el soporte técnico. |