Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Arrêter les contrôleurs - - AFF A300

Contributeurs

Pour remplacer le châssis, vous devez arrêter les contrôleurs.

Option 1 : arrêter le contrôleur

Arrêtez les contrôleurs afin d'effectuer des opérations de maintenance sur le châssis.

Cette procédure concerne les systèmes ayant des configurations à deux nœuds. Si votre système comporte plus de deux nœuds, reportez-vous à la section "Comment effectuer un arrêt normal et mettre sous tension une paire haute disponibilité dans un cluster à quatre nœuds".

Avant de commencer
  • Empêchez tous les clients/hôtes d'accéder aux données sur le système NetApp.

  • Suspendre les tâches de sauvegarde externes.

  • Vérifiez que vous disposez des autorisations et des informations d'identification nécessaires :

    • Informations d'identification de l'administrateur local pour ONTAP.

    • Phrase secrète pour la gestion des clés intégrée NetApp à l'échelle du cluster en cas d'utilisation du chiffrement du stockage ou de NVE/NAE.

    • Accès BMC pour chaque contrôleur.

  • Assurez-vous de disposer des outils et de l'équipement nécessaires pour le remplacement.

  • Avant de procéder à l'arrêt, vous devez :

Étapes
  1. Connectez-vous au cluster via SSH ou connectez-vous à un nœud du cluster à l'aide d'un câble de console local et d'un ordinateur portable/d'une console.

  2. Désactivez AutoSupport et indiquez la durée de mise hors ligne du système :

    system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  3. Identifiez l'adresse SP/BMC de tous les nœuds :

    system service-processor show -node * -fields address

  4. Quitter le cluster shell : exit

  5. Connectez-vous au processeur de service/contrôleur BMC via SSH en utilisant l'adresse IP de l'un des nœuds répertoriés dans le résultat de l'étape précédente.

    Si vous utilisez une console ou un ordinateur portable, connectez-vous au contrôleur à l'aide des mêmes informations d'identification d'administrateur de cluster.

    Remarque Ouvrez une session SSH sur chaque connexion SP/BMC afin de pouvoir surveiller la progression.
  6. Arrêtez les deux nœuds situés dans le châssis défectueux :

    system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

    Remarque Pour les clusters qui utilisent SnapMirror en mode synchrone : system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
  7. Entrez y pour chaque contrôleur du cluster lorsque vous voyez Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:

  8. Attendez que chaque contrôleur s'arrête et affichez l'invite DU CHARGEUR.

Option 2 : les contrôleurs sont configurés MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche
  • Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes
  1. Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

  2. Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

    En cas de dysfonctionnement du contrôleur…​ Alors…​

    A automatiquement basculé

    Passez à l'étape suivante.

    N'a pas été automatiquement commutée

    Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

    N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

    Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

  3. Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  4. Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  7. Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.