Restaure los datos de objetos al volumen de almacenamiento donde la unidad del sistema esté intacta
Después de recuperar un volumen de almacenamiento en un nodo de almacenamiento donde la unidad del sistema está intacta, puede restaurar los datos de objetos que se perdieron cuando se produjo un error en el volumen de almacenamiento.
-
Debe haber confirmado que el nodo de almacenamiento recuperado tiene un estado de conexión de conectado En la ficha NODES > Descripción general de Grid Manager.
Los datos de objetos se pueden restaurar desde otros nodos de almacenamiento, un nodo de archivado o un pool de almacenamiento en cloud si se configuran las reglas de gestión del ciclo de vida de la información del grid de modo que las copias de objetos estén disponibles.
Tenga en cuenta lo siguiente:
-
Si se configuró una regla de ILM para almacenar una sola copia replicada y esa copia estaba en un volumen de almacenamiento que falló, no podrá recuperar el objeto.
-
Si la única copia restante de un objeto se encuentra en un Cloud Storage Pool, StorageGRID debe emitir varias solicitudes al extremo Cloud Storage Pool para restaurar datos de objetos. Antes de realizar este procedimiento, póngase en contacto con el soporte técnico para obtener ayuda a la hora de calcular el plazo de recuperación y los costes asociados.
-
Si la única copia restante de un objeto se encuentra en un nodo de archivado, los datos de objeto se recuperan del nodo de archivado. La restauración de datos de objetos en un nodo de almacenamiento desde un nodo de archivado tarda más que en restaurar copias de otros nodos de almacenamiento, debido a la latencia asociada a las recuperaciones desde sistemas de almacenamiento de archivado externos.
Acerca de la repair-data
guión
Para restaurar datos de objeto, ejecute el repair-data
guión. Este script inicia el proceso de restauración de datos de objetos y funciona con el análisis de ILM para garantizar que se cumplan las reglas de ILM.
Seleccione datos replicados o datos codificados con borrado (EC) a continuación para conocer las diferentes opciones para repair-data
script, en función de si va a restaurar datos replicados o datos codificados de borrado. Si necesita restaurar ambos tipos de datos, debe ejecutar ambos conjuntos de comandos.
Para obtener más información acerca de repair-data guión, introduzca repair-data --help Desde la línea de comandos del nodo de administrador principal.
|
Hay dos comandos disponibles para restaurar los datos replicados, según si necesita reparar el nodo completo o solo ciertos volúmenes del nodo:
repair-data start-replicated-node-repair
repair-data start-replicated-volume-repair
Puede realizar un seguimiento de las reparaciones de los datos replicados con este comando:
repair-data show-replicated-repair-status
La show-replicated-repair-status Esta opción está disponible para la versión preliminar técnica de StorageGRID 11.6. Esta característica está en desarrollo y el valor devuelto puede ser incorrecto o retardado. Para determinar si una reparación está completa, utilice esperando – todos, reparaciones intentadas (XRPA) y periodo de exploración — estimado (XSCM) como se describe en Reparaciones del monitor.
|
Hay dos comandos disponibles para restaurar datos codificados de borrado a partir de si necesita reparar el nodo completo o solo ciertos volúmenes en el nodo:
repair-data start-ec-node-repair
repair-data start-ec-volume-repair
Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles.
Puede realizar un seguimiento de las reparaciones de datos codificados de borrado con este comando:
repair-data show-ec-repair-status
El trabajo de reparación de la CE reserva temporalmente una gran cantidad de almacenamiento. Es posible que se activen las alertas de almacenamiento, pero se resolverán cuando se complete la reparación. Si no hay suficiente almacenamiento para la reserva, el trabajo de reparación de la CE fallará. Las reservas de almacenamiento se liberan cuando se completa el trabajo de reparación de EC, tanto si el trabajo ha fallado como si ha sido correcto. |
Busque el nombre de host del nodo de almacenamiento
-
Inicie sesión en el nodo de administración principal:
-
Introduzca el siguiente comando:
ssh admin@primary_Admin_Node_IP
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo. -
Introduzca el siguiente comando para cambiar a la raíz:
su -
-
Introduzca la contraseña que aparece en
Passwords.txt
archivo.Cuando ha iniciado sesión como root, el símbolo del sistema cambia de
$
para#
.
-
-
Utilice la
/etc/hosts
File para encontrar el nombre de host del nodo de almacenamiento para los volúmenes de almacenamiento restaurados. Para ver una lista de todos los nodos de la cuadrícula, introduzca lo siguiente:cat /etc/hosts
.
Repare los datos si todos los volúmenes presentan errores
Si todos los volúmenes de almacenamiento presentan errores, repare todo el nodo. Siga las instrucciones para datos replicados, datos codificados con borrado (EC), o ambos, en función de si utiliza datos replicados, datos codificados con borrado (EC), o ambos.
Si solo se produjo un error en algunos volúmenes, vaya a. Repare los datos si solo algunos volúmenes han fallado.
No se puede ejecutar repair-data operaciones para más de un nodo a la vez. Para recuperar varios nodos, póngase en contacto con el soporte técnico.
|
Si la cuadrícula incluye datos replicados, utilice repair-data start-replicated-node-repair
con el --nodes
Opción de reparar todo el nodo de almacenamiento.
Este comando repara los datos replicados en un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-replicated-node-repair --nodes SG-DC-SN3
A medida que se restauran los datos del objeto, se activa la alerta objetos perdidos si el sistema StorageGRID no encuentra los datos del objeto replicados. Es posible que se activen alertas en los nodos de almacenamiento de todo el sistema. Debe determinar la causa de la pérdida y si es posible la recuperación. Consulte Supervisión y solución de problemas. |
Si el grid contiene datos con código de borrado, utilice repair-data start-ec-node-repair
con el --nodes
Opción de reparar todo el nodo de almacenamiento.
Este comando repara los datos codificados con borrado en un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-ec-node-repair --nodes SG-DC-SN3
La operación devuelve un valor exclusivo repair ID
eso lo identifica repair_data
funcionamiento. Utilice esto repair ID
para realizar un seguimiento del progreso y el resultado de la repair_data
funcionamiento. No se devuelve ningún otro comentario cuando finaliza el proceso de recuperación.
Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles. |
Repare los datos si solo algunos volúmenes han fallado
Si solo se produjo un error en algunos de los volúmenes, repare los volúmenes afectados. Siga las instrucciones para datos replicados, datos codificados con borrado (EC), o ambos, en función de si utiliza datos replicados, datos codificados con borrado (EC), o ambos.
Si todos los volúmenes presentan errores, vaya a. Repare los datos si todos los volúmenes presentan errores.
Introduzca los ID de volumen en hexadecimal. Por ejemplo: 0000
es el primer volumen y. 000F
es el volumen decimosexto. Es posible especificar un volumen, un rango de volúmenes o varios volúmenes que no están en una secuencia.
Todos los volúmenes deben estar en el mismo nodo de almacenamiento. Si necesita restaurar volúmenes para más de un nodo de almacenamiento, póngase en contacto con el soporte técnico.
Si la cuadrícula contiene datos replicados, utilice start-replicated-volume-repair
con el --nodes
opción para identificar el nodo. A continuación, agregue el --volumes
o. --volume-range
como se muestra en los siguientes ejemplos.
Single volume: Este comando restaura los datos replicados al volumen 0002
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002
Intervalo de volúmenes: Este comando restaura los datos replicados a todos los volúmenes del intervalo 0003
para 0009
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003,0009
Varios volúmenes que no están en una secuencia: Este comando restaura los datos replicados a los volúmenes 0001
, 0005
, y. 0008
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008
A medida que se restauran los datos del objeto, se activa la alerta objetos perdidos si el sistema StorageGRID no encuentra los datos del objeto replicados. Es posible que se activen alertas en los nodos de almacenamiento de todo el sistema. Debe determinar la causa de la pérdida y si es posible la recuperación. Consulte las instrucciones para supervisar y solucionar problemas de StorageGRID. |
Si el grid contiene datos con código de borrado, utilice start-ec-volume-repair
con el --nodes
opción para identificar el nodo. A continuación, agregue el --volumes
o. --volume-range
como se muestra en los siguientes ejemplos.
Volumen único: Este comando restaura los datos codificados por borrado al volumen 0007
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007
Intervalo de volúmenes: Este comando restaura los datos codificados por borrado a todos los volúmenes del intervalo 0004
para 0006
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004,0006
Múltiples volúmenes no en una secuencia: Este comando restaura datos codificados por borrado a volúmenes 000A
, 000C
, y. 000E
En un nodo de almacenamiento denominado SG-DC-SN3:
repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E
La repair-data
la operación devuelve un valor exclusivo repair ID
eso lo identifica repair_data
funcionamiento. Utilice esto repair ID
para realizar un seguimiento del progreso y el resultado de la repair_data
funcionamiento. No se devuelve ningún otro comentario cuando finaliza el proceso de recuperación.
Las reparaciones de datos codificados para borrado pueden comenzar con algunos nodos de almacenamiento sin conexión. La reparación se completará después de que todos los nodos estén disponibles. |
Reparaciones del monitor
Supervise el estado de los trabajos de reparación, en función de si utiliza datos replicados, datos codificados por borrado (EC) o ambos.
-
Para determinar si las reparaciones están completas:
-
Seleccione NODES > Storage Node que se está reparando > ILM.
-
Revise los atributos en la sección Evaluación. Una vez completadas las reparaciones, el atributo esperando - todo indica 0 objetos.
-
-
Para supervisar la reparación con más detalle:
-
Seleccione SUPPORT > Tools > Topología de cuadrícula.
-
Seleccione grid > nodo de almacenamiento que se está reparando > LDR > almacén de datos.
-
Utilice una combinación de los siguientes atributos para determinar, como sea posible, si las reparaciones replicadas se han completado.
Es posible que existan incoherencias de Cassandra y que no se realice un seguimiento de las reparaciones fallidas. -
Reparaciones intentadas (XRPA): Utilice este atributo para realizar un seguimiento del progreso de las reparaciones replicadas. Este atributo aumenta cada vez que un nodo de almacenamiento intenta reparar un objeto de alto riesgo. Cuando este atributo no aumenta durante un período más largo que el período de exploración actual (proporcionado por el atributo período de exploración — estimado), significa que el análisis de ILM no encontró objetos de alto riesgo que necesitan ser reparados en ningún nodo.
Los objetos de alto riesgo son objetos que corren el riesgo de perderse por completo. Esto no incluye objetos que no cumplan con su configuración de ILM. -
Período de exploración — estimado (XSCM): Utilice este atributo para estimar cuándo se aplicará un cambio de directiva a objetos ingeridos previamente. Si el atributo reparos intentados no aumenta durante un período más largo que el período de adquisición actual, es probable que se realicen reparaciones replicadas. Tenga en cuenta que el período de adquisición puede cambiar. El atributo período de exploración — estimado (XSCM) se aplica a toda la cuadrícula y es el máximo de todos los periodos de exploración de nodos. Puede consultar el historial de atributos período de exploración — Estimated de la cuadrícula para determinar un intervalo de tiempo adecuado.
-
-
-
Opcionalmente, para obtener un porcentaje estimado de finalización para la reparación replicada, agregue el
show-replicated-repair-status
opción del comando repair-data.repair-data show-replicated-repair-status
La show-replicated-repair-status
Esta opción está disponible para la versión preliminar técnica de StorageGRID 11.6. Esta característica está en desarrollo y el valor devuelto puede ser incorrecto o retardado. Para determinar si una reparación está completa, utilice esperando – todos, reparaciones intentadas (XRPA) y periodo de exploración — estimado (XSCM) como se describe en Reparaciones del monitor.
Para supervisar la reparación de datos codificados mediante borrado y vuelva a intentar cualquier solicitud que pudiera haber fallado:
-
Determine el estado de las reparaciones de datos codificadas por borrado:
-
Seleccione SUPPORT > Tools > Metrics para ver el tiempo estimado hasta la finalización y el porcentaje de finalización del trabajo actual. A continuación, seleccione EC Overview en la sección Grafana. Consulte los paneles tiempo estimado de trabajo de Grid EC hasta finalización y Porcentaje de trabajo de Grid EC completado.
-
Utilice este comando para ver el estado de un elemento específico
repair-data
operación:repair-data show-ec-repair-status --repair-id repair ID
-
Utilice este comando para enumerar todas las reparaciones:
repair-data show-ec-repair-status
El resultado muestra información, como
repair ID
, para todas las reparaciones que se estén ejecutando anteriormente y actualmente. -
-
Si el resultado muestra que la operación de reparación ha dado error, utilice el
--repair-id
opción de volver a intentar la reparación.Este comando vuelve a intentar una reparación de nodo con fallos mediante el ID de reparación 6949309319275667690:
repair-data start-ec-node-repair --repair-id 6949309319275667690
Este comando reintenta realizar una reparación de volumen con fallos mediante el ID de reparación 6949309319275667690:
repair-data start-ec-volume-repair --repair-id 6949309319275667690