Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Restaurez les nœuds de la grille sur l'hôte

Contributeurs

Pour restaurer un nœud de grille défaillant sur un nouvel hôte Linux, procédez comme suit afin de restaurer le fichier de configuration du nœud.

  1. Restaurer et valider le nœud en restaurant le fichier de configuration du nœud. Pour une nouvelle installation, vous créez un fichier de configuration de nœud pour chaque nœud de grille à installer sur un hôte. Lors de la restauration d'un nœud de grille sur un hôte de remplacement, vous restaurez ou remplacez le fichier de configuration de nœud pour les nœuds de grille défaillants.

  2. Démarrez le service d'hôte StorageGRID.

  3. Si nécessaire, restaurez tous les nœuds qui ne démarrent pas.

Si des volumes de stockage en blocs ont été préservés à partir de l'hôte précédent, vous devrez peut-être effectuer des procédures de restauration supplémentaires. Les commandes de cette section vous aident à déterminer les procédures supplémentaires requises.

Restaurez et validez les nœuds de la grille

Vous devez restaurer les fichiers de configuration de la grille de tout nœud de grille ayant échoué, puis valider les fichiers de configuration de la grille et résoudre les erreurs éventuelles.

Description de la tâche

Vous pouvez importer tout nœud de grille qui doit être présent sur l'hôte, tant que son /var/local le volume n'a pas été perdu suite à la défaillance de l'hôte précédent. Par exemple, le /var/local Il se peut que le volume existe toujours si vous utilisez le stockage partagé pour les volumes de données du système StorageGRID, comme décrit dans les instructions d'installation de StorageGRID pour votre système d'exploitation Linux. L'importation du nœud restaure son fichier de configuration de nœud vers l'hôte.

S'il n'est pas possible d'importer des nœuds manquants, vous devez recréer leurs fichiers de configuration de grille.

Vous devez ensuite valider le fichier de configuration de la grille et résoudre tous les problèmes de réseau ou de stockage qui pourraient se produire avant de redémarrer StorageGRID. Lorsque vous recréez le fichier de configuration d'un nœud, vous devez utiliser le même nom pour le nœud de remplacement utilisé pour le nœud en cours de restauration.

Reportez-vous aux instructions d'installation pour plus d'informations sur l'emplacement du /var/local volume pour un nœud.

Étapes
  1. Sur la ligne de commande de l'hôte restauré, répertoriez tous les nœuds grid StorageGRID actuellement configurés :sudo storagegrid node list

    Si aucun nœud de grille n'est configuré, il n'y aura pas de sortie. Si certains nœuds de grid sont configurés, la sortie doit être au format suivant :

    Name               Metadata-Volume
    ================================================================
    dc1-adm1           /dev/mapper/sgws-adm1-var-local
    dc1-gw1            /dev/mapper/sgws-gw1-var-local
    dc1-sn1            /dev/mapper/sgws-sn1-var-local
    dc1-arc1           /dev/mapper/sgws-arc1-var-local

    Si certains ou tous les nœuds de grille qui doivent être configurés sur l'hôte ne sont pas répertoriés, vous devez restaurer les nœuds de grille manquants.

  2. Pour importer des nœuds de grille dotés d'un /var/local volume :

    1. Exécutez la commande suivante pour chaque nœud à importer :sudo storagegrid node import node-var-local-volume-path

      Le storagegrid node import la commande ne réussit que si le nœud cible a été arrêté correctement sur l'hôte sur lequel il a été exécuté pour la dernière fois. Si ce n'est pas le cas, vous observez une erreur semblable à ce qui suit :

      This node (node-name) appears to be owned by another host (UUID host-uuid).

    Use the --force flag if you are sure import is safe.

    1. Si vous voyez l'erreur relative au nœud qui appartient à un autre hôte, exécutez de nouveau la commande avec le --force indicateur pour terminer l'importation :sudo storagegrid --force node import node-var-local-volume-path

      Remarque Tous les nœuds importés avec le --force flag nécessitera des étapes de récupération supplémentaires avant qu'elles ne puissent rejoindre la grille, comme décrit dans "Qu'est-ce qui suit : effectuez d'autres étapes de restauration, le cas échéant".
  3. Pour les nœuds grid n'ont pas de /var/local volume, recréez le fichier de configuration du nœud pour le restaurer sur l'hôte. Pour obtenir des instructions, reportez-vous à la section :

    • "Créez des fichiers de configuration de nœuds pour Red Hat Enterprise Linux ou CentOS"

    • "Créez des fichiers de configuration de nœud pour Ubuntu ou Debian"

      Important Lorsque vous recréez le fichier de configuration d'un nœud, vous devez utiliser le même nom pour le nœud de remplacement utilisé pour le nœud en cours de restauration. Pour les déploiements Linux, assurez-vous que le nom du fichier de configuration contient le nom du nœud. Lorsque cela est possible, vous devez utiliser les mêmes interfaces réseau, les mêmes mappages de périphériques de bloc et les mêmes adresses IP. Cette pratique réduit la quantité de données à copier sur le nœud lors de la restauration, ce qui peut accélérer la restauration (dans certains cas, quelques minutes au lieu de plusieurs semaines).
    Important Si vous utilisez de nouveaux périphériques de bloc (périphériques que le nœud StorageGRID n'utilisait pas auparavant) comme valeurs pour l'une des variables de configuration commençant par BLOCK_DEVICE_ lorsque vous recréez le fichier de configuration d'un nœud, suivez les instructions de la section Corrigez les erreurs de périphérique de bloc manquantes.
  4. Exécutez la commande suivante sur l'hôte restauré pour lister tous les nœuds StorageGRID.

    sudo storagegrid node list

  5. Valider le fichier de configuration de nœud pour chaque nœud de la grille dont le nom s'affiche dans la sortie de la liste des nœuds StorageGRID :

    sudo storagegrid node validate node-name

    Vous devez corriger toute erreur ou avertissement avant de démarrer le service hôte StorageGRID. Les sections suivantes donnent plus de détails sur les erreurs susceptibles d'avoir une importance particulière pendant la récupération.

Corrigez les erreurs d'interface réseau manquantes

Si le réseau hôte n'est pas configuré correctement ou si un nom est mal orthographié, une erreur se produit lorsque StorageGRID vérifie le mappage spécifié dans l' /etc/storagegrid/nodes/node-name.conf fichier.

Une erreur ou un avertissement correspondant à ce modèle peut s'afficher :

Checking configuration file /etc/storagegrid/nodes/<node-name>.conf for node <node-name>...
ERROR: <node-name>: GRID_NETWORK_TARGET = <host-interface-name>
       <node-name>: Interface <host-interface-name>' does not exist

L'erreur peut être signalée pour le réseau Grid, le réseau Admin ou le réseau client. Cette erreur signifie que le /etc/storagegrid/nodes/node-name.conf Le fichier mappe le réseau StorageGRID indiqué sur l'interface hôte nommée host-interface-name, mais il n'y a pas d'interface avec ce nom sur l'hôte actuel.

Si vous recevez cette erreur, vérifiez que vous avez terminé les étapes de la section "Déploiement de nouveaux hôtes Linux". Utilisez les mêmes noms pour toutes les interfaces hôtes que ceux utilisés sur l'hôte d'origine.

Si vous ne parvenez pas à nommer les interfaces hôtes pour qu'elles correspondent au fichier de configuration du nœud, vous pouvez modifier le fichier de configuration du nœud et modifier la valeur de GRID_NETWORK_TARGET, ADMIN_NETWORK_TARGET ou client_NETWORK_TARGET pour qu'elle corresponde à une interface hôte existante.

Assurez-vous que l'interface hôte donne accès au port réseau physique ou au VLAN approprié et que l'interface ne fait pas directement référence à un périphérique de liaison ou de pont. Vous devez soit configurer un VLAN (soit une autre interface virtuelle) sur le périphérique de liaison de l'hôte, soit utiliser un pont et une paire Ethernet virtuelle (veth).

Corrigez les erreurs de périphérique de bloc manquantes

Le système vérifie que chaque nœud récupéré est associé à un fichier spécial de périphérique de bloc valide ou à un lien logiciel valide vers un fichier spécial de périphérique de bloc. Si StorageGRID trouve un mappage non valide dans le /etc/storagegrid/nodes/node-name.conf fichier, une erreur de périphérique de bloc manquant s'affiche.

Si vous observez une erreur correspondant à ce modèle :

Checking configuration file /etc/storagegrid/nodes/<node-name>.conf for node <node-name>...
ERROR: <node-name>: BLOCK_DEVICE_PURPOSE = <path-name>
       <node-name>: <path-name> does not exist

Cela signifie que /etc/storagegrid/nodes/node-name.conf mappe le périphérique de bloc utilisé par nom-nœud pour PURPOSE Au nom de chemin indiqué dans le système de fichiers Linux, mais il n'existe pas de fichier spécial de périphérique de bloc valide, ou de lien logiciel vers un fichier spécial de périphérique de bloc, à cet emplacement.

Vérifiez que vous avez terminé les étapes de la section "Déploiement de nouveaux hôtes Linux". Utilisez les mêmes noms de périphériques persistants pour tous les périphériques de bloc que ceux utilisés sur l'hôte d'origine.

Si vous ne parvenez pas à restaurer ou à recréer le fichier spécial de périphérique de bloc manquant, vous pouvez attribuer un nouveau périphérique de bloc de la taille et de la catégorie de stockage appropriées et modifier le fichier de configuration de nœud pour modifier la valeur de BLOCK_DEVICE_PURPOSE pour pointer vers le nouveau fichier spécial de périphérique de bloc.

Déterminez la taille et la catégorie de stockage appropriées à l'aide des tableaux correspondant à votre système d'exploitation Linux :

Consultez les recommandations de configuration du stockage hôte avant de procéder au remplacement du périphérique de bloc :

Important Si vous devez fournir une nouvelle unité de stockage bloc pour l'une des variables de fichier de configuration commençant par BLOCK_DEVICE_ comme le périphérique de bloc d'origine a été perdu avec l'hôte défaillant, assurez-vous que le nouveau périphérique de bloc n'est pas formaté avant de tenter d'autres procédures de récupération. Le nouveau périphérique de bloc n'est pas formaté si vous utilisez un stockage partagé et que vous avez créé un nouveau volume. Si vous n'êtes pas certain, exécutez la commande suivante sur tout nouveau fichier spécial de périphérique de stockage en mode bloc.
Avertissement

Exécutez la commande suivante uniquement pour les nouveaux périphériques de stockage en mode bloc. N'exécutez pas cette commande si vous pensez que le stockage en mode bloc contient toujours des données valides pour le nœud en cours de restauration, car toutes les données du périphérique seront perdues.

sudo dd if=/dev/zero of=/dev/mapper/my-block-device-name bs=1G count=1

Démarrez le service d'hôte StorageGRID

Pour démarrer vos nœuds StorageGRID et s'assurer qu'ils redémarrent après un redémarrage de l'hôte, vous devez activer et démarrer le service hôte StorageGRID.

Étapes
  1. Exécutez les commandes suivantes sur chaque hôte :

    sudo systemctl enable storagegrid
    sudo systemctl start storagegrid
  2. Exécutez la commande suivante pour vérifier que le déploiement se déroule :

    sudo storagegrid node status node-name
  3. Si un nœud renvoie le statut « Not running » ou « Ssured, », exécutez la commande suivante :

    sudo storagegrid node start node-name
  4. Si vous avez déjà activé et démarré le service hôte StorageGRID (ou si vous n'êtes pas sûr que le service a été activé et démarré), exécutez également la commande suivante :

    sudo systemctl reload-or-restart storagegrid

Restaurez les nœuds qui ne démarrent pas normalement

Si un nœud StorageGRID ne rejoint pas la grille normalement et qu'il n'apparaît pas comme récupérable, il est possible qu'il soit corrompu. Vous pouvez forcer le nœud en mode de récupération.

Étapes
  1. Vérifiez que la configuration réseau du nœud est correcte.

    Le nœud n'a peut-être pas pu rejoindre la grille en raison de mappages d'interface réseau incorrects ou d'une adresse IP ou d'une passerelle de réseau Grid incorrecte.

  2. Si la configuration réseau est correcte, exécutez le force-recovery commande :

    sudo storagegrid node force-recovery node-name

  3. Effectuez les étapes de restauration supplémentaires pour le nœud. Voir "Qu'est-ce qui suit : effectuez d'autres étapes de restauration, le cas échéant".