Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Identifique y desmonte los volúmenes de almacenamiento que han fallado

Colaboradores

Al recuperar un nodo de almacenamiento con volúmenes de almacenamiento con fallos, se deben identificar y desmontar los volúmenes con errores. Debe verificar que solo los volúmenes de almacenamiento con errores se hayan reformateado como parte del procedimiento de recuperación.

Lo que necesitará

Debe iniciar sesión en Grid Manager mediante un navegador web compatible.

Acerca de esta tarea

Debe recuperar Lo antes posible. de volúmenes de almacenamiento con errores.

El primer paso del proceso de recuperación es detectar volúmenes que se han desvinculado, se deben desmontar o se producen errores de I/O. Si los volúmenes con fallos siguen conectados pero tienen un sistema de archivos dañado de forma aleatoria, es posible que el sistema no detecte ningún daño en partes del disco que no estén en uso o no estén asignados.

Nota Debe finalizar este procedimiento antes de realizar los pasos manuales para recuperar los volúmenes, como añadir o volver a conectar los discos, detener el nodo, iniciar el nodo o reiniciar. De lo contrario, cuando ejecute el reformat_storage_block_devices.rb script, puede encontrar un error del sistema de archivos que provoca el bloqueo o el error del script.
Nota Repare el hardware y conecte correctamente los discos antes de ejecutar el reboot comando.
Precaución Identifique cuidadosamente los volúmenes de almacenamiento fallidos. Utilizará esta información para verificar qué volúmenes se deben reformatear. Una vez que un volumen se ha reformateado, no se pueden recuperar los datos del volumen.

Para recuperar correctamente los volúmenes de almacenamiento con fallos, es necesario conocer los nombres de los dispositivos de los volúmenes de almacenamiento con errores y sus ID de volumen.

En la instalación, a cada dispositivo de almacenamiento se le asigna un identificador único universal (UUID) del sistema de archivos y se monta en un directorio de configuración en el nodo de almacenamiento utilizando ese UUID del sistema de archivos asignado. El UUID del sistema de archivos y el directorio rangedb se muestran en la /etc/fstab archivo. El nombre del dispositivo, el directorio rangedb y el tamaño del volumen montado se muestran en el Administrador de grid.

En el siguiente ejemplo, dispositivo /dev/sdc Tiene un tamaño de volumen de 4 TB, se monta a. /var/local/rangedb/0, utilizando el nombre del dispositivo /dev/disk/by-uuid/822b0547-3b2b-472e-ad5e-e1cf1809faba en la /etc/fstab archivo:

Muestra de tamaño de volumen
Pasos
  1. Complete los siguientes pasos para registrar los volúmenes de almacenamiento que han fallado y sus nombres de dispositivo:

    1. Seleccione SUPPORT > Tools > Topología de cuadrícula.

    2. Seleccione sitio nodo de almacenamiento fallido LDR almacenamiento Descripción general Principal y busque almacenes de objetos con alarmas.

      Sección de almacenes de objetos
    3. Seleccione site Failed Storage Node SSM Resources Overview Main. Determine el punto de montaje y el tamaño del volumen de cada volumen de almacenamiento con error identificado en el paso anterior.

      Los almacenes de objetos están numerados en notación hexadecimal. Por ejemplo, 0000 es el primer volumen y 000F es el decimosexto volumen. En el ejemplo, el almacén de objetos con un ID de 0000 corresponde a. /var/local/rangedb/0 Con nombre de dispositivo sdc y un tamaño de 107 GB.

    ejemplo que muestra almacenes de objetos y puntos de montaje
  2. Inicie sesión en el nodo de almacenamiento con errores:

    1. Introduzca el siguiente comando: ssh admin@grid_node_IP

    2. Introduzca la contraseña que aparece en Passwords.txt archivo.

    3. Introduzca el siguiente comando para cambiar a la raíz: su -

    4. Introduzca la contraseña que aparece en Passwords.txt archivo.

    Cuando ha iniciado sesión como root, el símbolo del sistema cambia de $ para #.

  3. Ejecute el siguiente script para detener los servicios de almacenamiento y desmontar un volumen de almacenamiento con errores:

    sn-unmount-volume object_store_ID

    La object_store_ID Es el ID del volumen de almacenamiento con errores. Por ejemplo, especifique 0 En el comando de un almacén de objetos con ID 0000.

  4. Si se le solicita, pulse y para detener los servicios de almacenamiento en el nodo de almacenamiento.

    Nota Si los servicios de almacenamiento ya se han detenido, no se le solicitará. El servicio Cassandra se ha detenido solo para el volumen 0.
    Desmonte el volumen de almacenamiento que ha fallado

    En unos segundos, los servicios de almacenamiento se detienen y el volumen se desasocia. Aparecen mensajes que indican cada paso del proceso. El mensaje final indica que el volumen no está asociado.