Identifiez et démontez les volumes de stockage défectueux
Lors de la restauration d'un nœud de stockage dont les volumes de stockage sont en panne, vous devez identifier et démonter les volumes en panne. Vous devez vérifier que seuls les volumes de stockage défaillants sont reformatés dans le cadre de la procédure de restauration.
Vous devez être connecté au Grid Manager à l'aide d'un navigateur web pris en charge.
Vous devriez récupérer les volumes de stockage défaillants dès que possible.
La première étape du processus de restauration consiste à détecter les volumes qui se sont détachés, qui doivent être démontés ou qui présentent des erreurs d'E/S. Si les volumes défaillants sont toujours attachés mais qu'un système de fichiers est corrompu de façon aléatoire, le système risque de ne pas détecter de corruption dans les pièces non utilisées ou non attribuées du disque.
Vous devez terminer cette procédure avant d'effectuer manuellement les étapes de restauration des volumes, telles que l'ajout ou la reconfiguration des disques, l'arrêt du nœud, le démarrage du nœud ou le redémarrage. Sinon, lorsque vous exécutez le reformat_storage_block_devices.rb script, vous pouvez rencontrer une erreur du système de fichiers qui entraîne l'arrêt ou l'échec du script.
|
Réparez le matériel et fixez correctement les disques avant de faire fonctionner le reboot commande.
|
Identifiez minutieusement les volumes de stockage défaillants. Ces informations vous permettront de vérifier quels volumes doivent être reformatés. Une fois le volume reformaté, les données du volume ne peuvent pas être récupérées. |
Pour récupérer correctement les volumes de stockage défectueux, vous devez connaître à la fois les noms des périphériques des volumes de stockage défaillants et leurs ID de volume.
Lors de l'installation, un identifiant unique universel du système de fichiers (UUID) est attribué à chaque périphérique de stockage et il est monté dans un répertoire rangedb du nœud de stockage à l'aide de l'UUID attribué au système de fichiers. L'UUID du système de fichiers et le répertoire rangedb sont répertoriés dans le /etc/fstab
fichier. Le nom du périphérique, le répertoire rangedb et la taille du volume monté sont affichés dans le Gestionnaire de grille.
Dans l'exemple suivant, périphérique /dev/sdc
A une taille de volume de 4 To, est monté sur /var/local/rangedb/0
, en utilisant le nom du périphérique /dev/disk/by-uuid/822b0547-3b2b-472e-ad5e-e1cf1809faba
dans le /etc/fstab
fichier :
-
Procédez comme suit pour enregistrer les volumes de stockage défaillants et leurs noms de périphériques :
-
Sélectionnez SUPPORT > Outils > topologie de grille.
-
Sélectionnez site > noeud de stockage défaillant > LDR > Storage > Présentation > main et recherchez des magasins d'objets avec alarmes.
-
Sélectionnez site > noeud de stockage défaillant > SSM > Ressources > Présentation > main. Déterminez la taille du point de montage et du volume de chaque volume de stockage défectueux identifié à l'étape précédente.
Les magasins d'objets sont numérotés en notation hexadécimale. Par exemple, 0000 est le premier volume et 000F est le seizième volume. Dans l'exemple, le magasin d'objets avec un ID de 0000 correspond à
/var/local/rangedb/0
Avec le nom de périphérique sdc et une taille de 107 Go.
-
-
Connectez-vous au noeud de stockage défaillant :
-
Saisissez la commande suivante :
ssh admin@grid_node_IP
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier. -
Entrez la commande suivante pour passer à la racine :
su -
-
Entrez le mot de passe indiqué dans le
Passwords.txt
fichier.
Lorsque vous êtes connecté en tant que root, l'invite passe de
$
à#
. -
-
Exécutez le script suivant pour arrêter les services de stockage et démonter un volume de stockage défectueux :
sn-unmount-volume object_store_ID
Le
object_store_ID
Est l'ID du volume de stockage défaillant. Par exemple, spécifiez0
Dans la commande pour un magasin d'objets avec l'ID 0000. -
Si vous y êtes invité, appuyez sur y pour arrêter les services de stockage sur le nœud de stockage.
Si les services de stockage sont déjà arrêtés, vous n'êtes pas invité à le faire. Le service Cassandra est arrêté uniquement pour le volume 0. En quelques secondes, les services de stockage sont arrêtés et le volume est démonté. Des messages s'affichent indiquant chaque étape du processus. Le dernier message indique que le volume est démonté.