Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Désaffectation des nœuds de la grille déconnectés

Contributeurs

Vous devrez peut-être désaffecter un nœud qui n'est pas actuellement connecté à la grille (dont l'état de santé est inconnu ou désactivé d'un point de vue administratif).

Avant de commencer
  • Vous comprenez les éléments à prendre en compte pour la mise hors service "Nœuds d'administration, de passerelle et d'archivage" et les considérations relatives au déclassement "Nœuds de stockage".

  • Vous avez obtenu tous les éléments prérequis.

  • Vous avez vérifié qu'aucun travail de réparation de données n'est actif. Voir "Vérifier les travaux de réparation des données".

  • Vous avez confirmé que la restauration du nœud de stockage n'est pas en cours dans la grille. Si c'est le cas, vous devez attendre que la reconstruction Cassandra soit terminée. Vous pouvez ensuite procéder au déclassement.

  • Vous avez vérifié que d'autres procédures de maintenance ne seront pas exécutées alors que la procédure de mise hors service du nœud est en cours d'exécution, à moins que la procédure de mise hors service du nœud soit interrompue.

  • La colonne Decommission possible pour le ou les nœuds déconnectés que vous souhaitez désaffecter contient une coche verte.

  • Vous avez la phrase secrète pour le provisionnement.

Description de la tâche

Vous pouvez identifier les nœuds déconnectés en recherchant des icônes inconnues (bleu) ou administrativement déconnectées (gris) dans la colonne Santé. Dans l'exemple, le nœud d'archivage DC1-ARC1 est déconnecté.

Page Désaffectez les nœuds avec un nœud déconnecté

Avant de désaffecter un nœud déconnecté, notez ce qui suit :

  • Cette procédure est principalement destinée à supprimer un seul nœud déconnecté. Si votre grille contient plusieurs nœuds déconnectés, le logiciel requiert que vous les désinsaffectez tous en même temps, ce qui augmente le risque de résultats inattendus.

    Avertissement Une perte de données peut se produire si vous mettez hors service plusieurs nœuds de stockage déconnectés à la fois. Voir "Considérations relatives aux nœuds de stockage déconnectés".
    Avertissement Soyez prudent lorsque vous désaffectez des nœuds de stockage dans un grid contenant des nœuds de métadonnées uniquement basés sur des logiciels. Si vous désaffectez tous les nœuds configurés pour stocker les deux objets et les métadonnées, la capacité de stockage des objets est supprimée de la grille. Voir "Types de nœuds de stockage" Pour plus d'informations sur les nœuds de stockage des métadonnées uniquement.
  • Si un nœud déconnecté ne peut pas être supprimé (par exemple, un nœud de stockage requis pour le quorum ADC), aucun autre nœud déconnecté ne peut être supprimé.

Étapes
  1. Sauf si vous désaffectez un nœud d'archivage (qui doit être déconnecté), essayez de remettre en ligne ou de restaurer les nœuds de grille déconnectés.

    Voir "Procédures de restauration des nœuds de la grille" pour obtenir des instructions.

  2. Si vous ne pouvez pas restaurer un nœud de grid déconnecté et que vous souhaitez le désaffecter alors qu'il est déconnecté, cochez la case correspondant à ce nœud.

    Remarque Si votre grille contient plusieurs nœuds déconnectés, le logiciel requiert que vous les désinsaffectez tous en même temps, ce qui augmente le risque de résultats inattendus.
    Avertissement Soyez prudent lorsque vous choisissez de désaffecter plusieurs nœuds de grid déconnectés à la fois, en particulier si vous sélectionnez plusieurs nœuds de stockage déconnectés. Si vous ne pouvez pas restaurer plusieurs nœuds de stockage déconnectés, contactez le support technique pour déterminer la meilleure solution.
  3. Saisissez la phrase secrète pour le provisionnement.

    Le bouton Start Decommission est activé.

  4. Cliquez sur Start Decommission.

    Un avertissement apparaît, indiquant que vous avez sélectionné un nœud déconnecté et que ces données d'objet seront perdues si le nœud possède la seule copie d'un objet.

  5. Consultez la liste des nœuds et cliquez sur OK.

    La procédure de mise hors service démarre et la progression est affichée pour chaque nœud. Au cours de la procédure, un nouveau progiciel de récupération est généré contenant le changement de configuration de la grille.

  6. Dès que le nouveau progiciel de récupération est disponible, cliquez sur le lien ou sélectionnez MAINTENANCE > système > paquet de récupération pour accéder à la page du progiciel de récupération. Ensuite, téléchargez le .zip fichier.

    Reportez-vous aux instructions pour "Téléchargement du progiciel de restauration".

    Remarque Téléchargez le progiciel de récupération dès que possible pour vous assurer que vous pouvez récupérer votre grille si un problème survient pendant la procédure de mise hors service.
    Avertissement Le fichier du progiciel de récupération doit être sécurisé car il contient des clés de cryptage et des mots de passe qui peuvent être utilisés pour obtenir des données du système StorageGRID.
  7. Surveillez régulièrement la page mise hors service pour vous assurer que tous les nœuds sélectionnés sont correctement mis hors service.

    La désaffectation des nœuds de stockage peut prendre plusieurs jours ou semaines. Lorsque toutes les tâches sont terminées, la liste de sélection de nœud apparaît à nouveau avec un message de réussite. Si vous avez désactivé un nœud de stockage déconnecté, un message d'information indique que les tâches de réparation ont été lancées.

  8. Une fois les nœuds arrêtés automatiquement dans le cadre de la procédure de mise hors service, supprimez les machines virtuelles restantes ou d'autres ressources associées au nœud mis hors service.

    Avertissement N'effectuez pas cette étape tant que les nœuds ne s'arrêtent pas automatiquement.
  9. Si vous désaffecez un nœud de stockage, surveillez l'état des tâches de réparation données répliquées et données codées d'effacement (EC) qui sont automatiquement lancées pendant le processus de mise hors service.

Les données répliquées
  • Pour obtenir une estimation du pourcentage d'achèvement de la réparation répliquée, ajoutez le show-replicated-repair-status option de la commande repair-data.

    repair-data show-replicated-repair-status

  • Pour déterminer si les réparations sont terminées :

    1. Sélectionnez NŒUDS > nœud de stockage en cours de réparation > ILM.

    2. Vérifiez les attributs dans la section évaluation. Lorsque les réparations sont terminées, l'attribut attente - tous indique 0 objets.

  • Pour surveiller la réparation plus en détail :

    1. Sélectionnez SUPPORT > Outils > topologie de grille.

    2. Sélectionnez GRID > Storage Node en cours de réparation > LDR > Data Store.

    3. Utilisez une combinaison des attributs suivants pour déterminer, autant que possible, si les réparations répliquées sont terminées.

      Remarque Cassandra présente peut-être des incohérences et les réparations échouées ne sont pas suivies.
      • Réparations tentées (XRPA) : utilisez cet attribut pour suivre la progression des réparations répliquées. Cet attribut augmente chaque fois qu'un nœud de stockage tente de réparer un objet à haut risque. Lorsque cet attribut n'augmente pas pendant une période plus longue que la période d'acquisition actuelle (fournie par l'attribut période d'analyse — estimation), cela signifie que l'analyse ILM n'a trouvé aucun objet à haut risque qui doit être réparé sur n'importe quel nœud.

        Remarque Les objets à haut risque sont des objets qui risquent d'être complètement perdus. Cela n'inclut pas les objets qui ne répondent pas à leur configuration ILM.
      • Période d'acquisition — estimée (XSCM) : utilisez cet attribut pour estimer quand une modification de règle sera appliquée aux objets précédemment ingérés. Si l'attribut réparations tentées n'augmente pas pendant une période supérieure à la période d'acquisition actuelle, il est probable que les réparations répliquées soient effectuées. Notez que la période d'acquisition peut changer. L'attribut période d'acquisition — estimée (XSCM) s'applique à la grille entière et est le maximum de toutes les périodes d'acquisition de nœud. Vous pouvez interroger l'historique d'attributs période de balayage — estimation de la grille pour déterminer une période appropriée.

Données avec code d'effacement (EC)

Pour surveiller la réparation des données codées d'effacement et réessayer toute demande qui pourrait avoir échoué :

  1. Déterminez l'état des réparations des données par code d'effacement :

    • Sélectionnez SUPPORT > Tools > Metrics pour afficher le temps de réalisation estimé et le pourcentage de réalisation de la tâche en cours. Sélectionnez ensuite EC Overview dans la section Grafana. Examinez les tableaux de bord Grid EC Job estimé Time to Completion et Grid EC Job Percentage Finted.

    • Utilisez cette commande pour afficher le statut d'un spécifique repair-data fonctionnement :

      repair-data show-ec-repair-status --repair-id repair ID

    • Utilisez cette commande pour lister toutes les réparations :

      repair-data show-ec-repair-status

    Les informations de sortie sont affichées, notamment repair ID, pour toutes les réparations précédentes et en cours.

  2. Si le résultat indique que l'opération de réparation a échoué, utilisez le --repair-id option permettant de réessayer la réparation.

    Cette commande relance une réparation de nœud ayant échoué à l'aide de l'ID de réparation 6949309319275667690 :

    repair-data start-ec-node-repair --repair-id 6949309319275667690

    Cette commande relance une réparation de volume en échec à l'aide de l'ID de réparation 6949309319275667690 :

    repair-data start-ec-volume-repair --repair-id 6949309319275667690

Une fois que vous avez terminé

Dès que les nœuds déconnectés ont été désaffectés et que toutes les tâches de réparation de données ont été effectuées, vous pouvez désaffecter tous les nœuds de la grille connectés si nécessaire.

Ensuite, procédez comme suit après avoir effectué la procédure de mise hors service :

  • Assurez-vous que les disques du nœud de la grille mis hors service sont nettoyés. Utilisez un outil ou un service d'effacement de données disponible dans le commerce pour supprimer définitivement et de manière sécurisée les données des lecteurs.

  • Si vous désaffecté un nœud d'appliance et que les données de l'appliance étaient protégées à l'aide du chiffrement des nœuds, utilisez le programme d'installation de l'appliance StorageGRID pour effacer la configuration du serveur de gestion des clés (KMS transparent). Vous devez effacer la configuration KMS si vous souhaitez ajouter l'appliance à une autre grille. Pour obtenir des instructions, reportez-vous à la section "Surveillez le chiffrement des nœuds en mode de maintenance".