Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Restaure datos de objetos al volumen de almacenamiento, si es necesario

Colaboradores

Si la sn-recovery-postinstall.sh Se necesita un script para volver a formatear uno o más volúmenes de almacenamiento con error, se deben restaurar los datos de objetos al volumen de almacenamiento con formato reformateado desde otros nodos de almacenamiento y nodos de archivado. Estos pasos no son necesarios a menos que se reformatee uno o más volúmenes de almacenamiento.

Lo que necesitará
  • Debe haber confirmado que el nodo de almacenamiento recuperado tiene un estado de conexión de conectado marca de verificación verde de alerta de icono En la ficha NODES > Descripción general de Grid Manager.

Acerca de esta tarea

Los datos de objetos se pueden restaurar desde otros nodos de almacenamiento, un nodo de archivado o un pool de almacenamiento en cloud si se configuran las reglas de gestión del ciclo de vida de la información del grid de modo que las copias de objetos estén disponibles.

Tenga en cuenta lo siguiente:

  • Si se configuró una regla de ILM para almacenar una sola copia replicada y esa copia estaba en un volumen de almacenamiento que falló, no podrá recuperar el objeto.

  • Si la única copia restante de un objeto se encuentra en un Cloud Storage Pool, StorageGRID debe emitir varias solicitudes al extremo Cloud Storage Pool para restaurar datos de objetos. Antes de realizar este procedimiento, póngase en contacto con el soporte técnico para obtener ayuda a la hora de calcular el plazo de recuperación y los costes asociados.

  • Si la única copia restante de un objeto se encuentra en un nodo de archivado, los datos de objeto se recuperan del nodo de archivado. La restauración de datos de objetos en un nodo de almacenamiento desde un nodo de archivado tarda más que en restaurar copias de otros nodos de almacenamiento, debido a la latencia asociada a las recuperaciones desde sistemas de almacenamiento de archivado externos.

Acerca de la repair-data guión

Para restaurar datos de objeto, ejecute el repair-data guión. Este script inicia el proceso de restauración de datos de objetos y funciona con el análisis de ILM para garantizar que se cumplan las reglas de ILM.

Seleccione datos replicados o datos codificados con borrado (EC) a continuación para conocer las diferentes opciones para repair-data script, en función de si va a restaurar datos replicados o datos codificados de borrado. Si necesita restaurar ambos tipos de datos, debe ejecutar ambos conjuntos de comandos.

Nota Para obtener más información acerca de repair-data guión, introduzca repair-data --help Desde la línea de comandos del nodo de administrador principal.
Datos replicados

Hay dos comandos disponibles para restaurar los datos replicados, según si necesita reparar el nodo completo o solo ciertos volúmenes del nodo:

repair-data start-replicated-node-repair

repair-data start-replicated-volume-repair

Puede realizar un seguimiento de las reparaciones de los datos replicados con este comando:

repair-data show-replicated-repair-status

Importante La show-replicated-repair-status Esta opción está disponible para la versión preliminar técnica de StorageGRID 11.6. Esta característica está en desarrollo y el valor devuelto puede ser incorrecto o retardado. Para determinar si una reparación está completa, utilice esperando – todos, reparaciones intentadas (XRPA) y periodo de exploración — estimado (XSCM) como se describe en Reparaciones del monitor.
Datos con código de borrado (EC)

Hay dos comandos disponibles para restaurar datos codificados de borrado a partir de si necesita reparar el nodo completo o solo ciertos volúmenes en el nodo:

repair-data start-ec-node-repair

repair-data start-ec-volume-repair

Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles.

Puede realizar un seguimiento de las reparaciones de datos codificados de borrado con este comando:

repair-data show-ec-repair-status

Nota El trabajo de reparación de la CE reserva temporalmente una gran cantidad de almacenamiento. Es posible que se activen las alertas de almacenamiento, pero se resolverán cuando se complete la reparación. Si no hay suficiente almacenamiento para la reserva, el trabajo de reparación de la CE fallará. Las reservas de almacenamiento se liberan cuando se completa el trabajo de reparación de EC, tanto si el trabajo ha fallado como si ha sido correcto.

Busque el nombre de host del nodo de almacenamiento

  1. Inicie sesión en el nodo de administración principal:

    1. Introduzca el siguiente comando: ssh admin@primary_Admin_Node_IP

    2. Introduzca la contraseña que aparece en Passwords.txt archivo.

    3. Introduzca el siguiente comando para cambiar a la raíz: su -

    4. Introduzca la contraseña que aparece en Passwords.txt archivo.

      Cuando ha iniciado sesión como root, el símbolo del sistema cambia de $ para #.

  2. Utilice la /etc/hosts File para encontrar el nombre de host del nodo de almacenamiento para los volúmenes de almacenamiento restaurados. Para ver una lista de todos los nodos de la cuadrícula, introduzca lo siguiente: cat /etc/hosts.

Repare los datos si todos los volúmenes presentan errores

Si todos los volúmenes de almacenamiento presentan errores, repare todo el nodo. Siga las instrucciones para datos replicados, datos codificados con borrado (EC), o ambos, en función de si utiliza datos replicados, datos codificados con borrado (EC), o ambos.

Si solo se produjo un error en algunos volúmenes, vaya a. Repare los datos si solo algunos volúmenes han fallado.

Importante No se puede ejecutar repair-data operaciones para más de un nodo a la vez. Para recuperar varios nodos, póngase en contacto con el soporte técnico.
Datos replicados

Si la cuadrícula incluye datos replicados, utilice repair-data start-replicated-node-repair con el --nodes Opción de reparar todo el nodo de almacenamiento.

Este comando repara los datos replicados en un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-replicated-node-repair --nodes SG-DC-SN3

Nota A medida que se restauran los datos del objeto, se activa la alerta objetos perdidos si el sistema StorageGRID no encuentra los datos del objeto replicados. Es posible que se activen alertas en los nodos de almacenamiento de todo el sistema. Debe determinar la causa de la pérdida y si es posible la recuperación. Consulte Supervisión y solución de problemas.
Datos con código de borrado (EC)

Si el grid contiene datos con código de borrado, utilice repair-data start-ec-node-repair con el --nodes Opción de reparar todo el nodo de almacenamiento.

Este comando repara los datos codificados con borrado en un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-ec-node-repair --nodes SG-DC-SN3

La operación devuelve un valor exclusivo repair ID eso lo identifica repair_data funcionamiento. Utilice esto repair ID para realizar un seguimiento del progreso y el resultado de la repair_data funcionamiento. No se devuelve ningún otro comentario cuando finaliza el proceso de recuperación.

Nota Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles.

Repare los datos si solo algunos volúmenes han fallado

Si solo se produjo un error en algunos de los volúmenes, repare los volúmenes afectados. Siga las instrucciones para datos replicados, datos codificados con borrado (EC), o ambos, en función de si utiliza datos replicados, datos codificados con borrado (EC), o ambos.

Si todos los volúmenes presentan errores, vaya a. Repare los datos si todos los volúmenes presentan errores.

Introduzca los ID de volumen en hexadecimal. Por ejemplo: 0000 es el primer volumen y. 000F es el volumen decimosexto. Es posible especificar un volumen, un rango de volúmenes o varios volúmenes que no están en una secuencia.

Todos los volúmenes deben estar en el mismo nodo de almacenamiento. Si necesita restaurar volúmenes para más de un nodo de almacenamiento, póngase en contacto con el soporte técnico.

Datos replicados

Si la cuadrícula contiene datos replicados, utilice start-replicated-volume-repair con el --nodes opción para identificar el nodo. A continuación, agregue el --volumes o. --volume-range como se muestra en los siguientes ejemplos.

Single volume: Este comando restaura los datos replicados al volumen 0002 En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002

Intervalo de volúmenes: Este comando restaura los datos replicados a todos los volúmenes del intervalo 0003 para 0009 En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003,0009

Varios volúmenes que no están en una secuencia: Este comando restaura los datos replicados a los volúmenes 0001, 0005, y. 0008 En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008

Nota A medida que se restauran los datos del objeto, se activa la alerta objetos perdidos si el sistema StorageGRID no encuentra los datos del objeto replicados. Es posible que se activen alertas en los nodos de almacenamiento de todo el sistema. Debe determinar la causa de la pérdida y si es posible la recuperación. Consulte las instrucciones para supervisar y solucionar problemas de StorageGRID.
Datos con código de borrado (EC)

Si el grid contiene datos con código de borrado, utilice start-ec-volume-repair con el --nodes opción para identificar el nodo. A continuación, agregue el --volumes o. --volume-range como se muestra en los siguientes ejemplos.

Volumen único: Este comando restaura los datos codificados por borrado al volumen 0007 En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007

Intervalo de volúmenes: Este comando restaura los datos codificados por borrado a todos los volúmenes del intervalo 0004 para 0006 En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004,0006

Múltiples volúmenes no en una secuencia: Este comando restaura datos codificados por borrado a volúmenes 000A, 000C, y. 000E En un nodo de almacenamiento denominado SG-DC-SN3:

repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E

La repair-data la operación devuelve un valor exclusivo repair ID eso lo identifica repair_data funcionamiento. Utilice esto repair ID para realizar un seguimiento del progreso y el resultado de la repair_data funcionamiento. No se devuelve ningún otro comentario cuando finaliza el proceso de recuperación.

Nota Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles.

Reparaciones del monitor

Supervise el estado de los trabajos de reparación, en función de si utiliza datos replicados, datos codificados por borrado (EC) o ambos.

Datos replicados
  • Para determinar si las reparaciones están completas:

    1. Seleccione NODES > Storage Node que se está reparando > ILM.

    2. Revise los atributos en la sección Evaluación. Una vez completadas las reparaciones, el atributo esperando - todo indica 0 objetos.

  • Para supervisar la reparación con más detalle:

    1. Seleccione SUPPORT > Tools > Topología de cuadrícula.

    2. Seleccione grid > nodo de almacenamiento que se está reparando > LDR > almacén de datos.

    3. Utilice una combinación de los siguientes atributos para determinar, como sea posible, si las reparaciones replicadas se han completado.

      Nota Es posible que existan incoherencias de Cassandra y que no se realice un seguimiento de las reparaciones fallidas.
      • Reparaciones intentadas (XRPA): Utilice este atributo para realizar un seguimiento del progreso de las reparaciones replicadas. Este atributo aumenta cada vez que un nodo de almacenamiento intenta reparar un objeto de alto riesgo. Cuando este atributo no aumenta durante un período más largo que el período de exploración actual (proporcionado por el atributo período de exploración — estimado), significa que el análisis de ILM no encontró objetos de alto riesgo que necesitan ser reparados en ningún nodo.

        Nota Los objetos de alto riesgo son objetos que corren el riesgo de perderse por completo. Esto no incluye objetos que no cumplan con su configuración de ILM.
      • Período de exploración — estimado (XSCM): Utilice este atributo para estimar cuándo se aplicará un cambio de directiva a objetos ingeridos previamente. Si el atributo reparos intentados no aumenta durante un período más largo que el período de adquisición actual, es probable que se realicen reparaciones replicadas. Tenga en cuenta que el período de adquisición puede cambiar. El atributo período de exploración — estimado (XSCM) se aplica a toda la cuadrícula y es el máximo de todos los periodos de exploración de nodos. Puede consultar el historial de atributos período de exploración — Estimated de la cuadrícula para determinar un intervalo de tiempo adecuado.

  • Opcionalmente, para obtener un porcentaje estimado de finalización para la reparación replicada, agregue el show-replicated-repair-status opción del comando repair-data.

    repair-data show-replicated-repair-status

    Importante La show-replicated-repair-status Esta opción está disponible para la versión preliminar técnica de StorageGRID 11.6. Esta característica está en desarrollo y el valor devuelto puede ser incorrecto o retardado. Para determinar si una reparación está completa, utilice esperando – todos, reparaciones intentadas (XRPA) y periodo de exploración — estimado (XSCM) como se describe en Reparaciones del monitor.
Datos con código de borrado (EC)

Para supervisar la reparación de datos codificados mediante borrado y vuelva a intentar cualquier solicitud que pudiera haber fallado:

  1. Determine el estado de las reparaciones de datos codificadas por borrado:

    • Seleccione SUPPORT > Tools > Metrics para ver el tiempo estimado hasta la finalización y el porcentaje de finalización del trabajo actual. A continuación, seleccione EC Overview en la sección Grafana. Consulte los paneles tiempo estimado de trabajo de Grid EC hasta finalización y Porcentaje de trabajo de Grid EC completado.

    • Utilice este comando para ver el estado de un elemento específico repair-data operación:

      repair-data show-ec-repair-status --repair-id repair ID

    • Utilice este comando para enumerar todas las reparaciones:

      repair-data show-ec-repair-status

    El resultado muestra información, como repair ID, para todas las reparaciones que se estén ejecutando anteriormente y actualmente.

  2. Si el resultado muestra que la operación de reparación ha dado error, utilice el --repair-id opción de volver a intentar la reparación.

    Este comando vuelve a intentar una reparación de nodo con fallos mediante el ID de reparación 6949309319275667690:

    repair-data start-ec-node-repair --repair-id 6949309319275667690

    Este comando reintenta realizar una reparación de volumen con fallos mediante el ID de reparación 6949309319275667690:

    repair-data start-ec-volume-repair --repair-id 6949309319275667690