Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Le cas échéant, la restauration de données d'objet vers un volume de stockage

Contributeurs

Si le sn-recovery-postinstall.sh Un script est nécessaire pour reformater un ou plusieurs volumes de stockage défaillants. Vous devez restaurer les données d'objet vers le volume de stockage reformaté à partir d'autres nœuds de stockage et nœuds d'archivage. Ces étapes ne sont pas nécessaires, sauf si un ou plusieurs volumes de stockage ont été reformatés.

Ce dont vous avez besoin
  • Vous devez avoir confirmé que le noeud de stockage récupéré possède un état de connexion * connecté*icône d'alerte verte coche Dans l'onglet noeuds Présentation du gestionnaire de grille.

Description de la tâche

Les données d'objet peuvent être restaurées depuis d'autres nœuds de stockage, un nœud d'archivage ou un pool de stockage cloud, en supposant que les règles ILM de la grille soient configurées de manière à ce que les copies d'objet soient disponibles.

Important Si une règle ILM a été configurée pour stocker une seule copie répliquée, et que cette copie existait sur un volume de stockage défaillant, vous ne pourrez pas restaurer l'objet.
Important Si la seule copie restante d'un objet se trouve dans un pool de stockage cloud, StorageGRID doit émettre plusieurs demandes vers le terminal de pool de stockage cloud pour restaurer les données d'objet. Avant d'effectuer cette procédure, contactez le support technique pour obtenir de l'aide pour estimer le délai de restauration et les coûts associés.
Remarque Si la seule copie restante d'un objet se trouve sur un noeud d'archivage, les données d'objet sont extraites du noeud d'archivage. Du fait de la latence associée aux récupérations à partir de systèmes de stockage d'archives externes, la restauration de données d'objet sur un nœud de stockage à partir d'un nœud d'archivage prend plus de temps que la restauration de copies à partir d'autres nœuds de stockage.

Pour restaurer les données d'objet, exécutez le repair-data script. Ce script commence le processus de restauration des données d'objet et fonctionne avec l'analyse ILM pour s'assurer que les règles ILM sont respectées. Vous utilisez différentes options avec le repair-data le script, basé sur la restauration des données répliquées ou des données avec code d'effacement, comme suit :

  • Données répliquées : deux commandes sont disponibles pour la restauration des données répliquées, selon que vous devez réparer le nœud entier ou uniquement certains volumes sur le nœud :

    repair-data start-replicated-node-repair
    repair-data start-replicated-volume-repair
  • Données codées d'effacement (EC) : deux commandes sont disponibles pour restaurer les données codées d'effacement, selon que vous devez réparer le nœud entier ou uniquement certains volumes sur le nœud :

    repair-data start-ec-node-repair
    repair-data start-ec-volume-repair

    Les réparations des données codées d'effacement peuvent commencer alors que certains nœuds de stockage sont hors ligne. La réparation s'effectuera une fois que tous les nœuds sont disponibles. Vous pouvez suivre les réparations des données codées d'effacement à l'aide de cette commande :

    repair-data show-ec-repair-status
Remarque Le travail de réparation EC réserve temporairement une grande quantité de stockage. Les alertes de stockage peuvent être déclenchées, mais elles seront résolus une fois la réparation terminée. S'il n'y a pas assez de stockage pour la réservation, la tâche de réparation EC échouera. Les réservations de stockage sont libérées lorsque la tâche de réparation EC est terminée, que la tâche ait échoué ou a réussi.

Pour plus d'informations sur l'utilisation du repair-data script, entrez repair-data --help Dans la ligne de commande du nœud d'administration principal.

Étapes
  1. Connectez-vous au nœud d'administration principal :

    1. Saisissez la commande suivante : ssh admin@primary_Admin_Node_IP

    2. Entrez le mot de passe indiqué dans le Passwords.txt fichier.

    3. Entrez la commande suivante pour passer à la racine : su -

    4. Entrez le mot de passe indiqué dans le Passwords.txt fichier.

      Lorsque vous êtes connecté en tant que root, l'invite passe de $ à #.

  2. Utilisez le /etc/hosts Fichier pour trouver le nom d'hôte du noeud de stockage pour les volumes de stockage restaurés. Pour afficher la liste de tous les nœuds de la grille, saisissez les éléments suivants : cat /etc/hosts

  3. Si tous les volumes de stockage sont en panne, réparez l'intégralité du nœud. (Si seuls certains volumes ont échoué, passez à l'étape suivante.)

    Important Vous ne pouvez pas exécuter repair-data opérations simultanément pour plusieurs nœuds. Pour restaurer plusieurs nœuds, contactez le support technique.
    • Si votre grid inclut des données répliquées, utilisez le repair-data start-replicated-node-repair commande avec --nodes Option pour réparer l'ensemble du nœud de stockage.

      Cette commande répare les données répliquées sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-replicated-node-repair --nodes SG-DC-SN3
      Remarque Lorsque les données d'objet sont restaurées, l'alerte objets perdus est déclenchée si le système StorageGRID ne peut pas localiser les données d'objet répliqué. Des alertes peuvent être déclenchées sur les nœuds de stockage dans le système. Vous devez déterminer la cause de la perte et si la récupération est possible. Voir les instructions de surveillance et de dépannage de StorageGRID.
    • Si votre grille contient des données avec code d'effacement, utilisez la repair-data start-ec-node-repair commande avec --nodes Option pour réparer l'ensemble du nœud de stockage.

      Cette commande répare les données codées d'effacement sur un nœud de stockage appelé SG-DC-SN3 :

      repair-data start-ec-node-repair --nodes SG-DC-SN3

      L'opération renvoie un seul repair ID qui l'identifie repair_data fonctionnement. Utilisez-le repair ID pour suivre la progression et le résultat du repair_data fonctionnement. Aucun autre retour n'est renvoyé à la fin du processus de récupération.

    Remarque Les réparations des données codées d'effacement peuvent commencer alors que certains nœuds de stockage sont hors ligne. La réparation s'effectuera une fois que tous les nœuds sont disponibles.
    • Si votre grille contient des données répliquées et dont le code d'effacement est codé, exécutez les deux commandes.

  4. Si seulement certains volumes ont échoué, réparez les volumes affectés.

    Saisissez les ID de volume en hexadécimal. Par exemple : 0000 est le premier volume et 000F est le seizième volume. Vous pouvez spécifier un volume, une plage de volumes ou plusieurs volumes qui ne sont pas dans une séquence.

    Tous les volumes doivent se trouver sur le même nœud de stockage. Si vous devez restaurer des volumes pour plusieurs nœuds de stockage, contactez le support technique.

    • Si votre grid contient des données répliquées, utilisez le start-replicated-volume-repair commande avec --nodes option permettant d'identifier le nœud. Ajoutez ensuite l'une ou l'autre des --volumes ou --volume-range comme indiqué dans les exemples suivants.

      Volume unique : cette commande restaure les données répliquées vers le volume 0002 Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0002

      Plage de volumes : cette commande restaure les données répliquées vers tous les volumes de la plage 0003 à 0009 Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volume-range 0003-0009

      Volumes multiples non compris dans une séquence : cette commande restaure les données répliquées vers des volumes 0001, 0005, et 0008 Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-replicated-volume-repair --nodes SG-DC-SN3 --volumes 0001,0005,0008
      Remarque Lorsque les données d'objet sont restaurées, l'alerte objets perdus est déclenchée si le système StorageGRID ne peut pas localiser les données d'objet répliqué. Des alertes peuvent être déclenchées sur les nœuds de stockage dans le système. Vous devez déterminer la cause de la perte et si la récupération est possible. Voir les instructions de surveillance et de dépannage de StorageGRID.
    • Si votre grille contient des données avec code d'effacement, utilisez la start-ec-volume-repair commande avec --nodes option permettant d'identifier le nœud. Ajoutez ensuite l'une ou l'autre des --volumes ou --volume-range comme indiqué dans les exemples suivants.

      Volume unique : cette commande restaure les données avec code d'effacement dans le volume 0007 Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 0007

      Plage de volumes : cette commande restaure les données avec code d'effacement sur tous les volumes de la plage 0004 à 0006 Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volume-range 0004-0006

      Volumes multiples non dans une séquence : cette commande restaure les données codées d'effacement dans des volumes 000A, 000C, et 000E Sur un nœud de stockage nommé SG-DC-SN3 :

      repair-data start-ec-volume-repair --nodes SG-DC-SN3 --volumes 000A,000C,000E

      Le repair-data l'opération renvoie un seul repair ID qui l'identifie repair_data fonctionnement. Utilisez-le repair ID pour suivre la progression et le résultat du repair_data fonctionnement. Aucun autre retour n'est renvoyé à la fin du processus de récupération.

    Remarque Les réparations des données codées d'effacement peuvent commencer alors que certains nœuds de stockage sont hors ligne. La réparation s'effectuera une fois que tous les nœuds sont disponibles.
    • Si votre grille contient des données répliquées et dont le code d'effacement est codé, exécutez les deux commandes.

  5. Surveiller la réparation des données répliquées.

    1. Sélectionnez noeuds noeud de stockage en cours de réparation ILM.

    2. Utilisez les attributs de la section évaluation pour déterminer si les réparations sont terminées.

      Lorsque les réparations sont terminées, l'attribut attente - tous indique 0 objet.

    3. Pour surveiller la réparation plus en détail, sélectionnez support Outils topologie de grille.

    4. Sélectionnez GRID nœud de stockage en cours de réparation LDR Data Store.

    5. Utilisez une combinaison des attributs suivants pour déterminer, autant que possible, si les réparations répliquées sont terminées.

      Remarque Cassandra peut présenter des incohérences et les réparations qui ont échoué ne sont pas suivies.
      • Réparations tentées (XRPA) : utilisez cet attribut pour suivre la progression des réparations répliquées. Cet attribut augmente chaque fois qu'un nœud de stockage tente de réparer un objet à haut risque. Lorsque cet attribut n'augmente pas pendant une période plus longue que la période d'acquisition actuelle (fournie par l'attribut période d'analyse — estimation), cela signifie que l'analyse ILM n'a trouvé aucun objet à haut risque qui doit être réparé sur n'importe quel nœud.

        Remarque Les objets à haut risque sont des objets qui risquent d'être complètement perdus. Cela n'inclut pas les objets qui ne satisfont pas leur configuration ILM.
      • Période d'acquisition — estimée (XSCM) : utilisez cet attribut pour estimer quand une modification de règle sera appliquée aux objets précédemment ingérés. Si l'attribut réparations tentées n'augmente pas pendant une période supérieure à la période d'acquisition actuelle, il est probable que les réparations répliquées soient effectuées. Notez que la période d'acquisition peut changer. L'attribut période d'acquisition — estimée (XSCM) s'applique à la grille entière et est le maximum de toutes les périodes d'acquisition de nœud. Vous pouvez interroger l'historique d'attributs période de balayage — estimation de la grille pour déterminer une période appropriée.

  6. Surveillez la réparation des données codées d'effacement, puis réessayez toute demande qui pourrait avoir échoué.

    1. Déterminez l'état des réparations des données avec code d'effacement :

      • Utilisez cette commande pour afficher le statut d'un spécifique repair-data fonctionnement :

        repair-data show-ec-repair-status --repair-id repair ID
      • Utilisez cette commande pour lister toutes les réparations :

        repair-data show-ec-repair-status

        Les informations de sortie sont affichées, notamment repair ID, pour toutes les réparations précédentes et en cours.

      root@DC1-ADM1:~ # repair-data show-ec-repair-status
      
      Repair ID Scope Start Time End Time State Est Bytes Affected/Repaired Retry Repair
      ==================================================================================
      949283 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:27:06.9 Success 17359 17359 No
      949292 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:37:06.9 Failure 17359 0 Yes
      949294 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:47:06.9 Failure 17359 0 Yes
      949299 DC1-S-99-10(Volumes: 1,2) 2016-11-30T15:57:06.9 Failure 17359 0 Yes
    2. Si le résultat indique que l'opération de réparation a échoué, utilisez le --repair-id option permettant de réessayer la réparation.

      Cette commande relance une réparation de nœud ayant échoué à l'aide de l'ID de réparation 83930030303133434 :

      repair-data start-ec-node-repair --repair-id 83930030303133434

      Cette commande relance une réparation de volume en échec à l'aide de l'ID de réparation 83930030303133434 :

    repair-data start-ec-volume-repair --repair-id 83930030303133434
Informations associées

"Administrer StorageGRID"