Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Identifique y vuelva a intentar operaciones de replicación fallidas

Colaboradores

Después de resolver la alerta de error permanente * de replicación entre redes, debe determinar si algún objeto o marcador de borrado no se pudo replicar en la otra cuadrícula. A continuación, puede volver a ingerir estos objetos o utilizar la API de administración de grid para volver a intentar la replicación.

La alerta de error permanente * de replicación cruzada de la red indica que los objetos del inquilino no se pueden replicar entre los depósitos en dos cuadrículas por una razón que requiere la intervención del usuario para resolverlos. Esta alerta suele deberse a un cambio en el depósito de origen o de destino. Para obtener más información, consulte "Solucionar errores de federación de grid".

Determine si se ha producido un fallo en la replicación de algún objeto

Para determinar si algún objeto o marcador de borrado no se ha replicado en la otra cuadrícula, puede buscar en el registro de auditoría "CGRR (Solicitud de Replicación entre Grid)" mensajes. Este mensaje se agrega al registro cuando StorageGRID no puede replicar un objeto, un objeto multiparte o un marcador de eliminación en el bloque de destino.

Puede utilizar el "herramienta audit-explain" para traducir los resultados a un formato más fácil de leer.

Antes de empezar
  • Tiene permiso de acceso raíz.

  • Usted tiene la Passwords.txt archivo.

  • Conoce la dirección IP del nodo de administración principal.

Pasos
  1. Inicie sesión en el nodo de administración principal:

    1. Introduzca el siguiente comando: ssh admin@primary_Admin_Node_IP

    2. Introduzca la contraseña que aparece en Passwords.txt archivo.

    3. Introduzca el siguiente comando para cambiar a la raíz: su -

    4. Introduzca la contraseña que aparece en Passwords.txt archivo.

      Cuando ha iniciado sesión como root, el símbolo del sistema cambia de $ para #.

  2. Busque en audit.log mensajes CGRR y utilice la herramienta audit-explain para dar formato a los resultados.

    Por ejemplo, este comando greps para todos los mensajes CGRR en los últimos 30 minutos y utiliza la herramienta audit-explain.

    # awk -vdate=$(date -d "30 minutes ago" '+%Y-%m-%dT%H:%M:%S') '$1$2 >= date { print }' audit.log | grep CGRR | audit-explain

Los resultados del comando se parecerán a este ejemplo, que tiene entradas para seis mensajes CGRR. En el ejemplo, todas las solicitudes de replicación entre grid devolvieron un error general porque el objeto no se pudo replicar. Los tres primeros errores son para las operaciones de «objeto de réplica», y los tres últimos errores son para las operaciones de «marcador de borrado de réplica».

CGRR Cross-Grid Replication Request tenant:50736445269627437748 connection:447896B6-6F9C-4FB2-95EA-AEBF93A774E9 operation:"replicate object" bucket:bucket123 object:"audit-0" version:QjRBNDIzODAtNjQ3My0xMUVELTg2QjEtODJBMjAwQkI3NEM4 error:general error
CGRR Cross-Grid Replication Request tenant:50736445269627437748 connection:447896B6-6F9C-4FB2-95EA-AEBF93A774E9 operation:"replicate object" bucket:bucket123 object:"audit-3" version:QjRDOTRCOUMtNjQ3My0xMUVELTkzM0YtOTg1MTAwQkI3NEM4 error:general error
CGRR Cross-Grid Replication Request tenant:50736445269627437748 connection:447896B6-6F9C-4FB2-95EA-AEBF93A774E9 operation:"replicate delete marker" bucket:bucket123 object:"audit-1" version:NUQ0OEYxMDAtNjQ3NC0xMUVELTg2NjMtOTY5NzAwQkI3NEM4 error:general error
CGRR Cross-Grid Replication Request tenant:50736445269627437748 connection:447896B6-6F9C-4FB2-95EA-AEBF93A774E9 operation:"replicate delete marker" bucket:bucket123 object:"audit-5" version:NUQ1ODUwQkUtNjQ3NC0xMUVELTg1NTItRDkwNzAwQkI3NEM4 error:general error

Cada entrada contiene la siguiente información:

Campo Descripción

Solicitud de Replicación de Cuadrícula Cruzada de CGRR

Nombre de la solicitud

inquilino

El ID de cuenta del inquilino

conexión

El ID de la conexión de federación de grid

funcionamiento

Tipo de operación de replicación que se intentó:

  • replicar objeto

  • replicar marcador de borrado

  • replicar objeto de varias partes

cucharón

El nombre del cubo

objeto

El nombre del objeto

versión

El ID de versión del objeto

error

Tipo de error. Si se produce un error en la replicación entre cuadrículas, el error es Error general.

Vuelva a intentar las replicaciones fallidas

Después de generar una lista de objetos y de eliminar marcadores que no se han replicado en el depósito de destino y resolver los problemas subyacentes, puede volver a intentar la replicación de una de las dos formas siguientes:

  • Vuelva a ingerir cada objeto en el bloque de origen.

  • Utilice la API privada de Grid Management, tal y como se describe.

Pasos
  1. En la parte superior de Grid Manager, selecciona el icono de ayuda y selecciona Documentación de API.

  2. Seleccione Ir a documentación privada de API.

    Nota Los puntos finales de la API de StorageGRID que están marcados como “Privados” están sujetos a cambios sin previo aviso. Los extremos privados de StorageGRID también ignoran la versión de API de la solicitud.
  3. En la sección cross-grid-replication-advanced, seleccione el siguiente punto final:

    POST /private/cross-grid-replication-retry-failed

  4. Seleccione probar.

  5. En el cuadro de texto body, reemplace la entrada de ejemplo para versionID por un ID de versión del audit.log que corresponda a una solicitud fallida de replicación cruzada.

    Asegúrese de conservar las comillas dobles alrededor de la cadena.

  6. Seleccione Ejecutar.

  7. Confirme que el código de respuesta del servidor es 204, lo que indica que el objeto o marcador de borrado se ha marcado como pendiente para la replicación de cuadrícula cruzada a la otra cuadrícula.

    Nota Pendiente significa que la solicitud de replicación entre grid se ha agregado a la cola interna para su procesamiento.

Supervisar reintentos de replicación

Debe supervisar las operaciones de reintento de replicación para asegurarse de que se completen.

Consejo Puede que un objeto o marcador de eliminación tarde varias horas o más en la otra cuadrícula.

Es posible supervisar las operaciones de reintento de dos maneras:

  • Utilice un S3 "OBJETO HEAD" o. "OBTENER objeto" solicitud. La respuesta incluye los recursos específicos de StorageGRID x-ntap-sg-cgr-replication-status cabecera de respuesta, que tendrá uno de los siguientes valores:

    Cuadrícula Estado de replicación

    Origen

    • ÉXITO: La replicación fue exitosa.

    • PENDIENTE: El objeto aún no ha sido replicado.

    • FALLO: La replicación falló con un fallo permanente. Un usuario debe resolver el error.

    Destino

    REPLICA: El objeto fue replicado desde la cuadrícula de origen.

  • Utilice la API privada de Grid Management, tal y como se describe.

Pasos
  1. En la sección cross-grid-replication-advanced de la documentación de la API privada, seleccione el siguiente punto final:

    GET /private/cross-grid-replication-object-status/{id}

  2. Seleccione probar.

  3. En la sección Parámetro, introduzca el ID de versión que utilizó en el cross-grid-replication-retry-failed solicitud.

  4. Seleccione Ejecutar.

  5. Confirme que el código de respuesta del servidor es 200.

  6. Revise el estado de replicación, que será uno de los siguientes:

    • PENDIENTE: El objeto aún no ha sido replicado.

    • COMPLETADO: La replicación fue exitosa.

    • ERROR: La replicación falló con un fallo permanente. Un usuario debe resolver el error.