Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Referencia de alarmas (sistema heredado)

Colaboradores

En la siguiente tabla se enumeran todas las alarmas predeterminadas heredadas. Si se activa una alarma, puede buscar el código de alarma en esta tabla para encontrar las acciones recomendadas.

Nota Aunque el sistema de alarma heredado sigue siendo compatible, el sistema de alerta ofrece importantes ventajas y es más fácil de usar.
Codificación Nombre Servicio Acción recomendada

ABRL

Relés de atributos disponibles

BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS

Restaure la conectividad a un servicio (un servicio ADC) que ejecuta un atributo Lo antes posible. de servicio de retransmisión. Si no hay relés de atributos conectados, el nodo de cuadrícula no puede informar de valores de atributos al servicio NMS. Por lo tanto, el servicio NMS ya no puede supervisar el estado del servicio ni actualizar los atributos del servicio.

Si el problema persiste, póngase en contacto con el soporte técnico.

ACMS

Servicios de metadatos disponibles

BARC, BLDR, BCMN

Se activa una alarma cuando un servicio LDR o ARC pierde la conexión con un servicio DDS. Si esto ocurre, no se pueden procesar las transacciones de procesamiento o recuperación. Si la falta de disponibilidad de los servicios de DDS es sólo un breve problema transitorio, las transacciones pueden retrasarse.

Compruebe y restaure las conexiones a un servicio DDS para borrar esta alarma y devolver el servicio a su funcionalidad completa.

HECHOS

Estado del servicio de organización en niveles del cloud

ARCO

Solo disponible para nodos de archivado con un tipo objetivo de organización en niveles en cloud: Simple Storage Service (S3).

Si el atributo ACTS del nodo de archivado está establecido en Read-only Enabled o Read-Write Disabled, debe establecer el atributo en Read-Write Enabled.

Si se activa una alarma principal debido a un fallo de autenticación, compruebe las credenciales asociadas con el bloque de destino y los valores de actualización, si es necesario.

Si se activa una alarma importante por cualquier otro motivo, póngase en contacto con el soporte técnico.

ADCA

Estado de ADC

ADC

Si se activa una alarma, seleccione SOPORTE > Herramientas > Topología de cuadrícula. A continuación, seleccione site > grid node > ADC > Overview > Main y ADC > Alarms > Main para determinar la causa de la alarma.

Si el problema persiste, póngase en contacto con el soporte técnico.

ADCE

Estado ADC

ADC

Si el valor del estado de ADC es en espera, continúe supervisando el servicio y si el problema persiste, póngase en contacto con el soporte técnico.

Si el valor de Estado de ADC es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

AITE

Recuperar estado

BARC

Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM).

Si el valor de Retrieve State está esperando a Target, compruebe el servidor de middleware TSM y asegúrese de que funciona correctamente. Si el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que la conexión del nodo de archivado con el sistema de almacenamiento de archivado externo objetivo esté configurada correctamente.

Si el valor del Estado de recuperación de archivo es sin conexión, intente actualizar el estado a en línea. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuración > Principal, seleccione Archivo recuperar estado > Online y haga clic en aplicar cambios.

Si el problema persiste, póngase en contacto con el soporte técnico.

UIT

Recuperar estado

BARC

Si el valor de Estado de recuperación es error de destino, compruebe si el sistema de almacenamiento de archivos externo objetivo presenta errores.

Si se pierde el valor del estado de recuperación de archivo, compruebe el sistema de almacenamiento de archivo externo objetivo para asegurarse de que está en línea y funciona correctamente. Compruebe la conexión de red con el destino.

Si el valor de Archive Retrieve Status es Unknown error, póngase en contacto con el soporte técnico.

ALIS

Sesiones de atributos entrantes

ADC

Si el número de sesiones de atributos entrantes en un relé de atributos aumenta demasiado, puede ser una indicación de que el sistema StorageGRID se ha desequilibrado. En condiciones normales, las sesiones de atributos deben distribuirse uniformemente entre los servicios ADC. Un desequilibrio puede producir problemas de rendimiento.

Si el problema persiste, póngase en contacto con el soporte técnico.

ALOS

Sesiones de atributos salientes

ADC

El servicio ADC tiene un gran número de sesiones de atributos y se está sobrecargando. Si se activa esta alarma, póngase en contacto con el soporte técnico.

ALUR

Repositorios de atributos inaccesibles

ADC

Compruebe la conectividad de red con el servicio NMS para asegurarse de que el servicio puede ponerse en contacto con el repositorio de atributos.

Si se activa esta alarma y la conectividad de red es buena, póngase en contacto con el servicio técnico.

AQS

Mensajes de auditoría en cola

BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BDDS

Si los mensajes de auditoría no se pueden reenviar inmediatamente a un relé o repositorio de auditoría, los mensajes se almacenan en una cola de disco. Si la cola de discos se llena, pueden producirse interrupciones.

Para permitirle responder en tiempo para evitar una interrupción, las alarmas AMQS se activan cuando el número de mensajes en la cola de discos alcanza los siguientes umbrales:

  • Aviso: Más de 100,000 mensajes

  • Menor: Al menos 500,000 mensajes

  • Importante: Al menos 2,000,000 mensajes

  • Crítico: Al menos 5,000,000 mensajes

Si se activa una alarma AMQS, compruebe la carga en el sistema. Si ha habido un número significativo de transacciones, la alarma debe resolverse con el tiempo. En este caso, puede ignorar la alarma.

Si la alarma persiste y aumenta su gravedad, vea un gráfico del tamaño de la cola. Si el número aumenta constantemente durante horas o días, es probable que la carga de auditoría haya superado la capacidad de auditoría del sistema. Reduzca la tasa de operaciones del cliente o disminuya el número de mensajes de auditoría registrados cambiando el nivel de auditoría a error o Desactivado. Consulte Configurar los mensajes de auditoría y los destinos de registro.

AOTE

Estado de la tienda

BARC

Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM).

Si el valor de Estado de tienda está esperando a Target, compruebe el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente. Si el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que la conexión del nodo de archivado con el sistema de almacenamiento de archivado externo objetivo esté configurada correctamente.

Si el valor del estado del almacén es sin conexión, compruebe el valor del estado del almacén. Corrija cualquier problema antes de volver a poner el estado de la tienda en línea.

UOT

Estado de la tienda

BARC

Si el valor del estado del almacén es pérdida de sesión, compruebe que el sistema de almacenamiento de archivos externo está conectado y en línea.

Si el valor de Target error (error de destino), compruebe si hay errores en el sistema de almacenamiento de archivos externo.

Si el valor de estado de almacén es error desconocido, póngase en contacto con el soporte técnico.

APM

Conectividad de acceso múltiple de almacenamiento

SSM

Si la alarma de estado multipath aparece como "degradado" (seleccione SOPORTE > Herramientas > Topología de cuadrícula y seleccione sitio > nodo de cuadrícula > SSM > Eventos), haga lo siguiente:

  1. Conecte o sustituya el cable que no muestre ninguna luz indicadora.

  2. Espere de uno a cinco minutos.

    No desenchufe el otro cable hasta que haya transcurrido al menos cinco minutos después de enchufarlo primero. La desconexión demasiado temprana puede provocar que el volumen raíz pase a ser de solo lectura, lo que requiere reiniciar el hardware.

  3. Vuelva a la página SSM > Recursos y compruebe que el estado de "degradado" Multipath ha cambiado a "'nominal'" en la sección hardware de almacenamiento.

ARCE

Estado DEL ARCO

ARCO

El servicio ARC tiene un estado de espera hasta que se hayan iniciado todos los componentes ARC (replicación, almacenamiento, recuperación, destino). A continuación, pasa a Online.

Si el valor del estado ARC no pasa del modo en espera a en línea, compruebe el estado de los componentes del ARC.

Si el valor del estado de ARC es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

ROQ

Objetos en cola

ARCO

Esta alarma se puede activar si el dispositivo de almacenamiento extraíble se está ejecutando lentamente debido a problemas con el sistema de almacenamiento de archivos externo objetivo o si encuentra varios errores de lectura. Compruebe si hay errores en el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente.

En algunos casos, este error puede producirse como resultado de una alta tasa de solicitudes de datos. Supervise el número de objetos en cola a medida que disminuye la actividad del sistema.

ARRF

Fallos de solicitudes

ARCO

Si se produce un error en una recuperación del sistema de almacenamiento de archivado externo objetivo, el nodo de archivado vuelve a intentar la recuperación, ya que el fallo puede deberse a un problema transitorio. Sin embargo, si los datos del objeto están dañados o se han marcado como no disponibles permanentemente, la recuperación no falla. En su lugar, el nodo de archivado vuelve a intentar la recuperación de forma continua y el valor de los fallos de solicitud continúa aumentando.

Esta alarma puede indicar que el soporte de almacenamiento que contiene los datos solicitados está dañado. Compruebe el sistema de almacenamiento de archivos externo para diagnosticar el problema.

Si determina que los datos del objeto ya no están en el archivado, el objeto tendrá que eliminarse del sistema StorageGRID. Para obtener más información, póngase en contacto con el soporte técnico.

Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Request Failure Count y haga clic en Apply Changes.

ARRV

Errores de verificación

ARCO

Para diagnosticar y corregir este problema, póngase en contacto con el soporte técnico.

Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Verification Failure Count y haga clic en Apply Changes.

ARVF

Errores de almacenamiento

ARCO

Esta alarma puede producirse como resultado de errores en el sistema de almacenamiento de archivos externo objetivo. Compruebe si hay errores en el sistema de almacenamiento de archivos externo y asegúrese de que funciona correctamente.

Una vez resuelto el problema que activó esta alarma, restablezca el número de fallos. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Retrieve > Configuration > Main, seleccione Reset Store Failure Count y haga clic en Apply Changes.

ASXP

Acciones de auditoría

AMS

Se activa una alarma si el valor de los recursos compartidos de auditoría es Desconocido. Esta alarma puede indicar un problema con la instalación o configuración del nodo de administración.

Si el problema persiste, póngase en contacto con el soporte técnico.

AUMA

Estado de AMS

AMS

Si el valor de Estado AMS es error de conectividad de BD, reinicie el nodo de cuadrícula.

Si el problema persiste, póngase en contacto con el soporte técnico.

AUME

Estado AMS

AMS

Si el valor del estado AMS es Standby, continúe monitorizando el sistema StorageGRID. Si el problema persiste, póngase en contacto con el soporte técnico.

Si el valor de Estado AMS es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

AUXS

Estado de exportación de auditoría

AMS

Si se activa una alarma, corrija el problema subyacente y, a continuación, reinicie el servicio AMS.

Si el problema persiste, póngase en contacto con el soporte técnico.

BADD

Número de unidades con errores del controlador de almacenamiento

SSM

Esta alarma se activa cuando una o varias unidades de un dispositivo StorageGRID presenta errores o no están en estado óptimo. Sustituya las unidades según sea necesario.

BASF

Identificadores de objetos disponibles

CMN

Cuando se aprovisiona un sistema StorageGRID, al servicio CMN se le asigna un número fijo de identificadores de objeto. Esta alarma se activa cuando el sistema StorageGRID comienza a agotar su suministro de identificadores de objetos.

Para asignar más identificadores, póngase en contacto con el soporte técnico.

GRAVES

Estado de asignación de bloque de identificador

CMN

De forma predeterminada, se activa una alarma cuando no se pueden asignar identificadores de objeto porque no se puede alcanzar el quórum de ADC.

La asignación de bloques de identificador en el servicio CMN requiere que haya un quórum (50% + 1) de los servicios ADC conectado y conectado. Si el quórum no está disponible, el servicio CMN no puede asignar nuevos bloques de identificador hasta que se restablezca el quórum de ADC. Si se pierde el quórum de ADC, por lo general no se produce un impacto inmediato en el sistema StorageGRID (los clientes todavía pueden procesar y recuperar contenido), ya que el suministro de identificadores de aproximadamente un mes se almacena en caché en otro lugar del grid; Sin embargo, si la condición continúa, el sistema StorageGRID perderá la capacidad para procesar contenido nuevo.

Si se activa una alarma, investigue el motivo de la pérdida de quórum de ADC (por ejemplo, puede ser un fallo de red o nodo de almacenamiento) y tome medidas correctivas.

Si el problema persiste, póngase en contacto con el soporte técnico.

BRDT

Temperatura del chasis de la controladora de computación

SSM

Se activa una alarma si la temperatura de la controladora de computación en un dispositivo StorageGRID supera un umbral nominal.

Compruebe los componentes de hardware y los problemas medioambientales si hay un sobrecalentamiento. Si es necesario, sustituir el componente.

BTOF

Desviación

BDC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC

Se activa una alarma si el tiempo de servicio (segundos) difiere significativamente del tiempo del sistema operativo. En condiciones normales, el servicio deberá volver a resincronizarse. Si el tiempo de servicio se desvía demasiado lejos del tiempo del sistema operativo, el funcionamiento del sistema puede verse afectado. Confirme que el origen de la hora del sistema StorageGRID es correcto.

Si el problema persiste, póngase en contacto con el soporte técnico.

BTSE

Estado del reloj

BDC, BLDR, BNMS, BAMS, BCLB, BCMN, BARC

Se activa una alarma si el tiempo del servicio no está sincronizado con el tiempo de seguimiento del sistema operativo. En condiciones normales, el servicio deberá volver a resincronizarse. Si el tiempo se desvía demasiado lejos del tiempo del sistema operativo, el funcionamiento del sistema puede verse afectado. Confirme que el origen de la hora del sistema StorageGRID es correcto.

Si el problema persiste, póngase en contacto con el soporte técnico.

CAHP

Porcentaje de uso de Java Heap

DDS

Se activa una alarma si Java no puede realizar la recolección de basura a una velocidad que permita suficiente espacio de pila para que el sistema funcione correctamente. Una alarma podría indicar una carga de trabajo de usuario que supere los recursos disponibles en todo el sistema para el almacén de metadatos de DDS. Compruebe la actividad de ILM en el Panel, o seleccione SUPPORT > Tools > Grid topolog, a continuación, seleccione site > grid node > DDS > Resources > Overview > Main.

Si el problema persiste, póngase en contacto con el soporte técnico.

CAIH

Número de destinos de procesamiento disponibles

CLB

Esta alarma está obsoleta.

CAQH

Número de destinos disponibles

CLB

Esta alarma se borra cuando se corrigen los problemas subyacentes de los servicios LDR disponibles. Asegúrese de que el componente HTTP de los servicios LDR esté en línea y funcionando normalmente.

Si el problema persiste, póngase en contacto con el soporte técnico.

CASA

Estado del almacén de datos

DDS

Se genera una alarma si el almacén de metadatos de Cassandra deja de estar disponible.

Compruebe el estado de Cassandra:

  1. En el nodo de almacenamiento, inicie sesión como admin y. su A root utilizando la contraseña que aparece en el archivo Passwords.txtI.

  2. Introduzca: service cassandra status

  3. Si Cassandra no se está ejecutando, reinicie: service cassandra restart

Esta alarma también puede indicar que el almacén de metadatos (base de datos Cassandra) para un nodo de almacenamiento debe recompilarse.

Consulte la información sobre cómo solucionar problemas de los Servicios: Estado - alarma Cassandra (SVST) en Solucionar problemas de metadatos.

Si el problema persiste, póngase en contacto con el soporte técnico.

CASO

Estado del almacén de datos

DDS

Esta alarma se activa durante la instalación o expansión para indicar que un nuevo almacén de datos se está uniendo a la cuadrícula.

CES

Sesiones entrantes: Establecido

CLB

Esta alarma se activa si hay 20,000 o más sesiones HTTP activas actualmente (abiertas) en el nodo de puerta de enlace. Si un cliente tiene demasiadas conexiones, puede ver fallos de conexión. Debe reducir la carga de trabajo.

CCNA

Hardware de computación

SSM

Esta alarma se activa si el estado del hardware de la controladora de computación en un dispositivo StorageGRID requiere atención.

CDLP

Espacio usado de metadatos (porcentaje)

DDS

Esta alarma se activa cuando el espacio efectivo de metadatos (CEMS) alcanza un 70% de lleno (alarma secundaria), un 90% de lleno (alarma principal) y un 100% de lleno (alarma crítica).

Si esta alarma alcanza el umbral del 90%, aparecerá una advertencia en el panel de control en Grid Manager. Debe realizar un procedimiento de ampliación para añadir un nuevo Lo antes posible. a los nodos de almacenamiento. Consulte Amplíe su grid.

Si esta alarma alcanza el umbral del 100%, debe detener la incorporación de objetos y añadir nodos de almacenamiento inmediatamente. Cassandra requiere una cierta cantidad de espacio para realizar operaciones esenciales, como la compactación y la reparación. Estas operaciones se verán afectadas si los metadatos de los objetos utilizan más del 100 % del espacio permitido. Pueden producirse resultados no deseados.

Nota: Póngase en contacto con el servicio de asistencia técnica si no puede agregar nodos de almacenamiento.

Una vez que se añaden nodos de almacenamiento nuevos, el sistema reequilibra automáticamente los metadatos de los objetos en todos los nodos de almacenamiento y la alarma se borra.

Consulte también información sobre la solución de problemas de la alerta de almacenamiento de metadatos bajos en Solucionar problemas de metadatos.

CLBA

Estado CLB

CLB

Si se activa una alarma, seleccione SOPORTE > Herramientas > topología de cuadrícula y, a continuación, seleccione sitio > nodo de cuadrícula > CLB > Descripción general > Principal y CLB > Alarmas > Principal para determinar la causa de la alarma y solucionar el problema.

Si el problema persiste, póngase en contacto con el soporte técnico.

CLBE

Estado CLB

CLB

Si el valor del estado CLB es en espera, continúe supervisando la situación y, si el problema persiste, póngase en contacto con el servicio técnico.

Si el estado es sin conexión y no hay problemas conocidos de hardware del servidor (por ejemplo, el servidor está desconectado) o tiempo de inactividad programado, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

CMNA

Estado de CMN

CMN

Si el valor de CMN Status es error, seleccione SUPPORT > Tools > Grid topolog y seleccione site > grid node > CMN > Overview > Main y CMN > Alarms > Main para determinar la causa del error y solucionar el problema.

Se activa una alarma y el valor de CMN Status es no Online CMN durante una actualización de hardware del nodo de administración principal cuando se cambian los CMN (el valor del estado antiguo de CMN es Standby y el nuevo es Online).

Si el problema persiste, póngase en contacto con el soporte técnico.

CPRC

La capacidad restante

NMS

Se activa una alarma si la capacidad restante (número de conexiones disponibles que se pueden abrir a la base de datos NMS) cae por debajo de la gravedad de alarma configurada.

Si se activa una alarma, póngase en contacto con el soporte técnico.

CPSA

Suministro de alimentación De la controladora de computación a

SSM

Se activa una alarma si hay un problema con el suministro De alimentación A en el controlador de computación de un dispositivo StorageGRID.

Si es necesario, sustituir el componente.

CPSB

Suministro de alimentación B de la controladora de computación

SSM

Se activa una alarma si existe un problema con la alimentación B en el controlador de computación de un dispositivo StorageGRID.

Si es necesario, sustituir el componente.

CPUT

Temperatura de CPU de la controladora de computación

SSM

Se activa una alarma si la temperatura de la CPU en la controladora de computación de un dispositivo StorageGRID supera un umbral nominal.

Si el nodo de almacenamiento es un dispositivo StorageGRID, el sistema StorageGRID indica que la controladora requiere atención.

Compruebe los componentes de hardware y los problemas de entorno si hay un sobrecalentamiento. Si es necesario, sustituir el componente.

DNST

Estado de DNS

SSM

Una vez finalizada la instalación, se activa una alarma DNST en el servicio SSM. Una vez configurado el DNS y la nueva información del servidor llega a todos los nodos de la cuadrícula, la alarma se cancela.

ECCD

Se han detectado fragmentos dañados

LDR

Se activa una alarma cuando el proceso de verificación en segundo plano detecta un fragmento codificado por borrado dañado. Si se detecta un fragmento dañado, se intenta reconstruir el fragmento. Restablezca los fragmentos dañados detectados y copia los atributos perdidos a cero y monitoréelos para ver si los recuentos vuelven a subir. Si el número se aumenta, puede que haya un problema con el almacenamiento subyacente del nodo de almacenamiento. No se considera que falte una copia de los datos del objeto codificados para borrado hasta que el número de fragmentos perdidos o corruptos incumpla la tolerancia a fallos del código de borrado; por lo tanto, es posible tener un fragmento dañado y aún poder recuperar el objeto.

Si el problema persiste, póngase en contacto con el soporte técnico.

ECST

Estado de verificación

LDR

Esta alarma indica el estado actual del proceso de verificación en segundo plano para los datos de objetos codificados de borrado en este nodo de almacenamiento.

Se activa una alarma importante si hay un error en el proceso de verificación en segundo plano.

FONP

Abra Descriptores de archivo

BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS

La FONP puede hacerse grande durante la actividad pico. Si no disminuye durante períodos de actividad lenta, póngase en contacto con el soporte técnico.

HSTE

Estado HTTP

LDR

Consulte acciones recomendadas para HSTU.

HSTU

Estado HTTP

LDR

HSTE y HSTU están relacionados con el protocolo HTTP para todo el tráfico de LDR, incluidos S3, Swift y otro tráfico interno de StorageGRID. Una alarma indica que se ha producido una de las siguientes situaciones:

  • El protocolo HTTP se ha desconectado manualmente.

  • Se ha deshabilitado el atributo HTTP de inicio automático.

  • El servicio LDR se está cerrando.

El atributo HTTP de inicio automático está habilitado de forma predeterminada. Si se cambia esta configuración, HTTP podría permanecer sin conexión después de un reinicio.

Si es necesario, espere a que el servicio LDR se reinicie.

Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione Storage Node > LDR > Configuración. Si el protocolo HTTP está sin conexión, colocarlo en línea. Compruebe que el atributo HTTP de inicio automático está habilitado.

Si el protocolo HTTP permanece sin conexión, póngase en contacto con el soporte técnico.

HTA

HTTP de inicio automático

LDR

Especifica si se deben iniciar los servicios HTTP automáticamente al iniciar. Es una opción de configuración especificada por el usuario.

IRSU

Estado de replicación entrante

BLDR, BARC

Una alarma indica que se ha desactivado la replicación de entrada. Confirmar ajustes de configuración: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Replication > Configuración > Principal.

LATA

Latencia media

NMS

Compruebe si hay problemas de conectividad.

Compruebe la actividad del sistema para confirmar que hay un aumento en la actividad del sistema. Un aumento en la actividad del sistema provocará un aumento de la actividad de los datos de atributos. Este aumento de la actividad dará lugar a un retraso en el procesamiento de datos de atributos. Esto puede ser una actividad normal del sistema y se resta.

Compruebe si hay varias alarmas. Un aumento en los tiempos de latencia medios se puede indicar mediante un número excesivo de alarmas activadas.

Si el problema persiste, póngase en contacto con el soporte técnico.

LDRE

Estado LDR

LDR

Si el valor de LDR State es Standby, continúe supervisando la situación y, si el problema persiste, póngase en contacto con el soporte técnico.

Si el valor del estado LDR es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

PERDIDO

Objetos perdidos

DDS, LDR

Se activa cuando el sistema StorageGRID no logra recuperar una copia del objeto solicitado desde cualquier lugar del sistema. Antes de que se active una alarma PERDIDA (objetos perdidos), el sistema intenta recuperar y reemplazar un objeto que falta desde cualquier otro lugar del sistema.

Los objetos perdidos representan una pérdida de datos. El atributo objetos perdidos se incrementa siempre que el número de ubicaciones de un objeto caiga a cero sin que el servicio DDS purice el contenido de forma intencionada para satisfacer la política ILM.

Investigar inmediatamente las alarmas PERDIDAS (OBJETOS PERDIDOS). Si el problema persiste, póngase en contacto con el soporte técnico.

MCEP

Caducidad del certificado de la interfaz de gestión

CMN

Se activa cuando el certificado utilizado para acceder a la interfaz de gestión está a punto de expirar.

  1. En Grid Manager, seleccione CONFIGURACIÓN > Seguridad > certificados.

  2. En la ficha Global, seleccione Certificado de interfaz de administración.

  3. Cargue un nuevo certificado de interfaz de gestión.

MINQ

Notificaciones de correo electrónico en cola

NMS

Compruebe las conexiones de red de los servidores que alojan el servicio NMS y el servidor de correo externo. Confirme también que la configuración del servidor de correo electrónico sea correcta.

MIN

Estado de las notificaciones por correo electrónico

BNMS

Se activa una alarma menor si el servicio NMS no puede conectarse al servidor de correo. Compruebe las conexiones de red de los servidores que alojan el servicio NMS y el servidor de correo externo. Confirme también que la configuración del servidor de correo electrónico sea correcta.

SRA.

Estado del motor de la interfaz NMS

BNMS

Se activa una alarma si el motor de interfaz NMS del nodo de administración que recopila y genera contenido de interfaz se desconecta del sistema. Compruebe el Administrador del servidor para determinar si la aplicación individual del servidor está inactiva.

NANG

Configuración de negociación automática de red

SSM

Compruebe la configuración del adaptador de red. La configuración debe coincidir con las preferencias de los routers y switches de red.

Un ajuste incorrecto puede tener un impacto grave en el rendimiento del sistema.

NDUP

Configuración dúplex de red

SSM

Compruebe la configuración del adaptador de red. La configuración debe coincidir con las preferencias de los routers y switches de red.

Un ajuste incorrecto puede tener un impacto grave en el rendimiento del sistema.

NLNK

Detección de enlace de red

SSM

Compruebe las conexiones de los cables de red en el puerto y en el conmutador.

Compruebe las configuraciones del router de red, del switch y del adaptador.

Reinicie el servidor.

Si el problema persiste, póngase en contacto con el soporte técnico.

NRER

Recibir errores

SSM

Las siguientes pueden ser las causas de las alarmas NRER:

  • La corrección de errores de avance (FEC) no coincide

  • Discrepancia entre el puerto del switch y la MTU de NIC

  • Índices altos de errores de enlace

  • Desbordamiento del búfer de anillo NIC

Consulte la información sobre cómo solucionar problemas de la alarma error de recepción de red (NRER) en Solucionar problemas de red, hardware y plataforma.

NRLY

Relés de auditoría disponibles

BDC, BARC, BCLB, BCMN, BLDR, BNMS, BDDS

Si los relés de auditoría no están conectados a los servicios ADC, no se pueden informar los eventos de auditoría. Los usuarios se ponen en cola y no están disponibles hasta que se restaura la conexión.

Restaure la conectividad a un Lo antes posible. de servicio de ADC.

Si el problema persiste, póngase en contacto con el soporte técnico.

SCA

Estado de NMS

NMS

Si el valor de Estado de NMS es error de conectividad de BD, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

NSCE

Estado NMS

NMS

Si el valor del estado de NMS es en espera, continúe la monitorización y si el problema persiste, póngase en contacto con el servicio técnico.

Si el valor del estado NMS es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

NSPD

Velocidad

SSM

Esto puede deberse a problemas de conectividad de red o de compatibilidad de controladores. Si el problema persiste, póngase en contacto con el soporte técnico.

NBR

Tablespace gratis

NMS

Si se activa una alarma, compruebe la rapidez con la que ha cambiado el uso de la base de datos. Una caída repentina (a diferencia de un cambio gradual a lo largo del tiempo) indica una condición de error. Si el problema persiste, póngase en contacto con el soporte técnico.

El ajuste del umbral de alarma permite gestionar de manera proactiva cuándo se debe asignar más almacenamiento.

Si el espacio disponible alcanza un umbral bajo (consulte umbral de alarma), póngase en contacto con el soporte técnico para cambiar la asignación de la base de datos.

NTER

Errores de transmisión

SSM

Estos errores se pueden borrar sin que se restablezcan manualmente. Si no se borran, compruebe el hardware de red. Compruebe que el hardware y el controlador del adaptador están correctamente instalados y configurados para funcionar con los routers y switches de la red.

Cuando se resuelva el problema subyacente, restablezca el contador. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Recursos > Configuración > Principal, seleccione Restablecer recuento de errores de transmisión y haga clic en aplicar cambios.

NTFQ

Compensación de frecuencia NTP

SSM

Si el desvío de frecuencia supera el umbral configurado, es probable que haya un problema de hardware con el reloj local. Si el problema persiste, póngase en contacto con el soporte técnico para arreglar un reemplazo.

NTLK

Bloqueo NTP

SSM

Si el daemon NTP no está bloqueado en una fuente de hora externa, compruebe la conectividad de red con los orígenes de tiempo externos designados, su disponibilidad y su estabilidad.

NOTF

Ajuste de tiempo NTP

SSM

Si el desfase de tiempo supera el umbral configurado, es probable que haya un problema de hardware con el oscilador del reloj local. Si el problema persiste, póngase en contacto con el soporte técnico para arreglar un reemplazo.

NTSJ

Variación de origen de tiempo seleccionada

SSM

Este valor indica la fiabilidad y estabilidad del origen de tiempo que NTP utiliza en el servidor local como referencia.

Si se activa una alarma, puede ser una indicación de que el oscilador de la fuente de tiempo está defectuoso, o de que hay un problema con el enlace WAN al origen de tiempo.

NTSU

Estado de NTP

SSM

Si el valor del estado de NTP no está en ejecución, póngase en contacto con el soporte técnico.

OPST

Estado general de la alimentación

SSM

Se activa una alarma si la alimentación de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado.

Compruebe el estado de la fuente de alimentación A o B para determinar qué fuente de alimentación funciona de forma anormal.

Si es necesario, sustituya la fuente de alimentación.

OQRT

Objetos en cuarentena

LDR

Una vez que el sistema StorageGRID restaura automáticamente los objetos, los objetos en cuarentena se pueden quitar del directorio de cuarentena.

  1. Seleccione SUPPORT > Tools > Topología de cuadrícula.

  2. Seleccione sitio > nodo de almacenamiento > LDR > verificación > Configuración > Principal.

  3. Seleccione Eliminar objetos en cuarentena.

  4. Haga clic en aplicar cambios.

Los objetos en cuarentena se eliminan y el recuento se restablece a cero.

ORSU

Estado de replicación saliente

BLDR, BARC

Una alarma indica que la replicación saliente no es posible: El almacenamiento se encuentra en un estado donde los objetos no se pueden recuperar. Se activa una alarma si la replicación saliente se desactiva manualmente. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Replication > Configuración.

Se activa una alarma si el servicio LDR no está disponible para la replicación. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > almacenamiento.

OSLF

Estado de la bandeja

SSM

Se activa una alarma si el estado de uno de los componentes de la bandeja de almacenamiento de un dispositivo de almacenamiento está degradado. Los componentes de la bandeja de almacenamiento incluyen los IOM, los ventiladores, los suministros de alimentación y los cajones de unidades.Si esta alarma se activa, consulte las instrucciones de mantenimiento del dispositivo.

PMEM

Uso de memoria de servicio (porcentaje)

BDC, BAMS, BARC, BCLB, BCMN, BLDR, BNMS, BSSM, BDDS

Puede tener un valor superior al y% de RAM, donde y representa el porcentaje de memoria que utiliza el servidor.

Las cifras por debajo del 80% son normales. Más del 90% se considera un problema.

Si el uso de la memoria es elevado para un único servicio, supervise la situación e investigue.

Si el problema persiste, póngase en contacto con el soporte técnico.

PSA

Estado del suministro de alimentación de

SSM

Se activa una alarma si la fuente De alimentación A de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado.

Si es necesario, sustituya la fuente de alimentación A.

PSBS

Estado de la fuente de alimentación B

SSM

Se activa una alarma si la fuente de alimentación B de un dispositivo StorageGRID se desvía del voltaje de funcionamiento recomendado.

Si es necesario, sustituya la fuente de alimentación B.

RDTE

Estado de Tivoli Storage Manager

BARC

Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM).

Si el valor de Estado de Tivoli Storage Manager es sin conexión, compruebe el estado de Tivoli Storage Manager y resuelva cualquier problema.

Vuelva a conectar el componente. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > ARC > Target > Configuration > Main, seleccione Tivoli Storage Manager State > Online y haga clic en Apply Changes.

RDTU

Estado de Tivoli Storage Manager

BARC

Sólo disponible para nodos de archivado con un tipo de destino de Tivoli Storage Manager (TSM).

Si el valor de Estado de Tivoli Storage Manager es error de configuración y el nodo de archivado se acaba de agregar al sistema StorageGRID, asegúrese de que el servidor de middleware TSM está configurado correctamente.

Si el valor de Estado de Tivoli Storage Manager es error de conexión o error de conexión, Retraer, comprobar la configuración de red en el servidor de middleware TSM y la conexión de red entre el servidor de middleware TSM y el sistema StorageGRID.

Si el valor de Estado de Tivoli Storage Manager es error de autenticación o fallo de autenticación, volver a conectarse, el sistema StorageGRID puede conectarse al servidor de middleware TSM, pero no puede autenticar la conexión. Compruebe que el servidor de middleware TSM está configurado con el usuario, la contraseña y los permisos correctos y reinicie el servicio.

Si el valor de Estado de Tivoli Storage Manager es error de sesión, se ha perdido inesperadamente una sesión establecida. Compruebe la conexión de red entre el servidor de middleware TSM y el sistema StorageGRID. Compruebe si hay errores en el servidor de middleware.

Si el valor de Estado de Tivoli Storage Manager es error desconocido, póngase en contacto con el soporte técnico.

RIRF

Replicaciones entrantes — no se han podido realizar

BLDR, BARC

Se puede producir una alarma de réplicas entrantes — fallo durante periodos de altas cargas o interrupciones temporales de la red. Una vez que la actividad del sistema se reduce, esta alarma debe eliminarse. Si el número de repeticiones fallidas continúa aumentando, busque problemas de red y compruebe que los servicios LDR y ARC de origen y destino están en línea y disponibles.

Para restablecer el recuento, seleccione SUPPORT > Tools > Grid topolog y, a continuación, seleccione site > grid node > LDR > Replication > Configuration > Main. Seleccione Restablecer recuento de fallos de replicación entrante y haga clic en aplicar cambios.

RIRQ

Replicaciones entrantes — en cola

BLDR, BARC

Las alarmas pueden producirse durante períodos de carga alta o interrupción temporal de la red. Una vez que la actividad del sistema se reduce, esta alarma debe eliminarse. Si el recuento de réplicas en cola continúa aumentando, busque problemas de red y compruebe que los servicios LDR y ARC de origen y destino están en línea y disponibles.

RORQ

Replicaciones salientes — en cola

BLDR, BARC

La cola de replicación saliente contiene datos de objeto que se copian para cumplir las reglas de ILM y los objetos solicitados por los clientes.

Una alarma puede ocurrir como resultado de una sobrecarga del sistema. Espere a ver si la alarma se borra cuando disminuye la actividad del sistema. Si la alarma vuelve a producirse, añada capacidad añadiendo nodos de almacenamiento.

VICEPRESIDENTE

Espacio útil total (porcentaje)

LDR

Si el espacio útil alcanza un umbral bajo, las opciones incluyen expandir el sistema StorageGRID o mover datos de objeto para archivar a través de un nodo de archivado.

CA

Estado

CMN

Si el valor de Estado de la tarea de cuadrícula activa es error, busque el mensaje de tarea de cuadrícula. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > CMN > Grid Tasks > Overview > Main. El mensaje de tarea de la cuadrícula muestra información sobre el error (por ejemplo, "'check failed on node 12130011'").

Después de investigar y corregir el problema, reinicie la tarea de cuadrícula. Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > CMN > Grid Tasks > Configuration > Main y seleccione Actions > Run.

Si el valor de Estado para una tarea de cuadrícula que se está anulando es error, intente cancelar la tarea de cuadrícula.

Si el problema persiste, póngase en contacto con el soporte técnico.

SCEP

Storage API Service finaliza la caducidad del certificado

CMN

Se desencadena cuando el certificado utilizado para acceder a extremos de API de almacenamiento está a punto de expirar.

  1. Seleccione CONFIGURACIÓN > Seguridad > certificados.

  2. En la ficha Global, seleccione S3 y Swift API Certificate.

  3. Cargue un nuevo certificado API S3 y Swift.

SCHR

Estado

CMN

Si se cancela el valor de Estado de la tarea de cuadrícula histórica, investigue el motivo y vuelva a ejecutar la tarea si es necesario.

Si el problema persiste, póngase en contacto con el soporte técnico.

SCSA

Controladora de almacenamiento A

SSM

Se activa una alarma si hay un problema con la controladora A de almacenamiento en un dispositivo StorageGRID.

Si es necesario, sustituir el componente.

SCSB

Controladora de almacenamiento B

SSM

Se activa una alarma si hay un problema con la controladora B de almacenamiento en un dispositivo StorageGRID.

Si es necesario, sustituir el componente.

Algunos modelos de dispositivos no tienen una controladora de almacenamiento B.

SHLH

Salud

LDR

Si el valor de Estado de un almacén de objetos es error, compruebe y corrija:

  • problemas con el volumen que se está montando

  • errores del sistema de archivos

SLSA

Promedio de carga de CPU

SSM

Cuanto mayor sea el valor, mayor será el número de bus del sistema.

Si la media de carga de la CPU persiste en un valor alto, se debe investigar el número de transacciones del sistema para determinar si esto se debe a una carga pesada en ese momento. Vea un gráfico del promedio de carga de CPU: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Recursos > Informes > Cartas.

Si la carga del sistema no es pesada y el problema persiste, póngase en contacto con el soporte técnico.

SMST

Estado del monitor de registro

SSM

Si el valor de Estado del Monitor de registro no está conectado durante un período de tiempo persistente, póngase en contacto con el soporte técnico.

SMTT

Total de eventos

SSM

Si el valor total de eventos es mayor que cero, compruebe si hay eventos conocidos (como errores de red) que puedan ser la causa. A menos que se hayan borrado estos errores (es decir, el recuento se ha restablecido a 0), se pueden activar las alarmas de eventos totales.

Cuando se resuelve un problema, restablezca el contador para borrar la alarma. Seleccione NODES > site > grid node > Eventos > Restablecer recuentos de eventos.

Nota Para restablecer los recuentos de eventos, debe tener el permiso Configuración de página de topología de cuadrícula.

Si el valor total de eventos es cero o el número aumenta y el problema persiste, póngase en contacto con el soporte técnico.

SNST

Estado

CMN

Una alarma indica que hay un problema al almacenar los paquetes de tareas de la cuadrícula. Si el valor de Estado es error de punto de comprobación o quórum no alcanzado, confirme que la mayoría de los servicios de ADC están conectados al sistema StorageGRID (50% más uno) y espere unos minutos.

Si el problema persiste, póngase en contacto con el soporte técnico.

SEDA

Estado del sistema operativo de almacenamiento

SSM

Se activa una alarma si el software de SANtricity indica que hay un problema de "'necesita atención'" con un componente de un dispositivo StorageGRID.

Seleccione NODES. A continuación, seleccione Appliance Storage Node > hardware. Desplácese hacia abajo para ver el estado de cada componente. En el software SANtricity, compruebe otros componentes del dispositivo para aislar el problema.

SSMA

Estado del SSM

SSM

Si el valor del estado del SSM es error, seleccione SUPPORT > Tools > Grid topolog y seleccione site > grid node > SSM > Overview > Main y SSM > Overview > Alarms para determinar la causa de la alarma.

Si el problema persiste, póngase en contacto con el soporte técnico.

SSME

Estado SSM

SSM

Si el valor del estado del SSM es en espera, continúe la monitorización y si el problema persiste, póngase en contacto con el servicio técnico.

Si el valor del estado SSM es sin conexión, reinicie el servicio. Si el problema persiste, póngase en contacto con el soporte técnico.

SST

Estado del almacenamiento

LDR

Si el valor del Estado de almacenamiento es espacio útil insuficiente, no hay más almacenamiento disponible en el nodo de almacenamiento y los ingestos datos se redirigen a otro nodo de almacenamiento disponible. Las solicitudes de recuperación pueden seguir suministrándose desde este nodo de grid.

Debe añadirse almacenamiento adicional. No afecta al funcionamiento del usuario final, pero la alarma permanece hasta que se añade almacenamiento adicional.

Si el valor del estado del almacenamiento es volúmenes no disponibles, una parte del almacenamiento no está disponible. No es posible almacenar ni recuperar datos de estos volúmenes. Compruebe el estado del volumen para obtener más información: Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Storage > Overview > Main. El estado del volumen se enumera en almacenes de objetos.

Si el valor del estado del almacenamiento es error, póngase en contacto con el soporte técnico.

VST DE NETAPP

Estado

SSM

Esta alarma se borra cuando se resuelven otras alarmas relacionadas con un servicio no en ejecución. Realice un seguimiento de las alarmas del servicio de origen para restaurar la operación.

Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > SSM > Servicios > Descripción general > Principal. Cuando el estado de un servicio se muestra como no se está ejecutando, su estado es administrativamente inactivo. El estado del servicio puede aparecer como no en ejecución por los siguientes motivos:

  • El servicio se ha detenido manualmente (/etc/init.d/<service\> stop).

  • Hay un problema con la base de datos de MySQL y Server Manager cierra EL servicio MI.

  • Se añadió un nodo de cuadrícula, pero no se inició.

  • Durante la instalación, un nodo de grid aún no se ha conectado al nodo de administrador.

Si un servicio aparece como no en ejecución, reinicie el servicio (/etc/init.d/<service\> restart).

Esta alarma también puede indicar que el almacén de metadatos (base de datos Cassandra) para un nodo de almacenamiento debe recompilarse.

Si el problema persiste, póngase en contacto con el soporte técnico.

TMEM

Memoria instalada

SSM

Los nodos que se ejecutan con menos de 24 GIB de memoria instalada pueden provocar problemas de rendimiento e inestabilidad del sistema. La cantidad de memoria instalada en el sistema debe aumentarse a al menos 24 GIB.

TPOP

Operaciones pendientes

ADC

Una cola de mensajes puede indicar que el servicio ADC está sobrecargado. Se pueden conectar muy pocos servicios ADC al sistema StorageGRID. En una puesta en marcha de gran tamaño, el servicio de ADC puede requerir la adición de recursos computacionales o el sistema puede requerir servicios de ADC adicionales.

UMEM

Memoria disponible

SSM

Si la RAM disponible es baja, determine si se trata de un problema de hardware o software. Si no se trata de un problema de hardware, o si la memoria disponible cae por debajo de los 50 MB (el umbral de alarma predeterminado), póngase en contacto con el soporte técnico.

VMFI

Entradas disponibles

SSM

Esto indica que se requiere almacenamiento adicional. Póngase en contacto con el soporte técnico.

VMFR

Espacio disponible

SSM

Si el valor de espacio disponible es demasiado bajo (consulte umbrales de alarma), debe investigarse si hay archivos de registro que crecen desproporcionalmente o si los objetos ocupan demasiado espacio en disco (consulte umbrales de alarma) que se deben reducir o eliminar.

Si el problema persiste, póngase en contacto con el soporte técnico.

VMST

Estado

SSM

Se activa una alarma si el valor de Estado del volumen montado es Desconocido. Un valor de Unknown o Offline puede indicar que no se puede montar el volumen ni acceder a él debido a un problema con el dispositivo de almacenamiento subyacente.

VPRI

Prioridad de verificación

BLDR, BARC

De forma predeterminada, el valor de prioridad de verificación es adaptable. Si la prioridad de verificación está establecida en Alta, se activa una alarma porque la verificación del almacenamiento puede ralentizar las operaciones normales del servicio.

VSTU

Estado de verificación de objetos

LDR

Seleccione SUPPORT > Tools > Topología de cuadrícula. A continuación, seleccione site > grid node > LDR > Storage > Overview > Main.

Compruebe si hay signos de errores en el sistema de archivos o en el dispositivo de bloqueo.

Si el valor de Estado de verificación de objetos es error desconocido, normalmente indica un problema de hardware o del sistema de archivos de bajo nivel (error de E/S) que impide que la tarea verificación de almacenamiento acceda al contenido almacenado. Póngase en contacto con el soporte técnico.

XAMS

Repositorios de auditoría inalcanzables

BDC, BARC, BCLB, BCMN, BLDR, BNMS

Compruebe la conectividad de red al servidor que aloja el nodo de administración.

Si el problema persiste, póngase en contacto con el soporte técnico.