Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Arrêter les contrôleurs - - AFF A300

Contributeurs

Pour remplacer le châssis, vous devez arrêter les contrôleurs.

Option 1 : arrêter le contrôleur

Cette procédure concerne uniquement les configurations à 2 nœuds non MetroCluster. Si votre système comporte plus de deux nœuds, reportez-vous à la section "Comment effectuer un arrêt normal et mettre sous tension une paire haute disponibilité dans un cluster à 4 nœuds".

Avant de commencer

Éléments requis :

  • Informations d'identification de l'administrateur local pour ONTAP.

  • Phrase secrète pour la gestion des clés intégrée NetApp à l'échelle du cluster (OKM) en cas d'utilisation du chiffrement du stockage.

  • Accès SP/BMC pour chaque contrôleur.

  • Empêchez tous les clients/hôtes d'accéder aux données sur le système NetApp.

  • Suspendre les tâches de sauvegarde externes.

  • Outils et équipements nécessaires au remplacement.

Remarque Si le système est un système NetApp StorageGRID ou ONTAP S3 utilisé en tant que Tier cloud FabricPool, reportez-vous au "Arrêtez et mettez votre système de stockage sous tension en toute simplicité" après avoir effectué cette procédure.
Remarque Si vous utilisez des LUN de baies FlexArray, suivez la documentation spécifique du fournisseur à la baie de stockage pour la procédure d'arrêt à effectuer pour ces systèmes après avoir réalisé cette procédure.

Avant de procéder à l'arrêt, vous devez :

Étapes
  1. Connectez-vous au cluster via SSH ou connectez-vous à un nœud du cluster à l'aide d'un câble de console local et d'un ordinateur portable/d'une console.

  2. Désactivez AutoSupport et indiquez la durée pendant laquelle vous vous attendez à ce que le système soit hors ligne :

    system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  3. Identifiez l'adresse SP/BMC de tous les nœuds :

    system service-processor show -node * -fields address

  4. Quitter le cluster shell : exit

  5. Connectez-vous au processeur de service/contrôleur BMC via SSH en utilisant l'adresse IP de l'un des nœuds répertoriés dans le résultat de l'étape précédente.

    Si votre utilise une console ou un ordinateur portable, connectez-vous au contrôleur à l'aide des mêmes informations d'identification d'administrateur de cluster.

    Remarque Ouvrez une session SSH sur chaque connexion SP/BMC afin de pouvoir surveiller la progression.
  6. Arrêter tous les nœuds du cluster :

    system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true.

    Remarque Pour les clusters qui utilisent SnapMirror en mode synchrone : system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
  7. Entrez y pour chaque contrôleur du cluster lorsque vous voyez Warning: Are you sure you want to halt node "cluster name-controller number"? {y|n}:

  8. Attendez que chaque contrôleur s'arrête et affichez l'invite DU CHARGEUR.

  9. Mettez chaque bloc d'alimentation hors tension ou débranchez-les s'il n'y a pas d'interrupteur marche/arrêt du bloc d'alimentation.

  10. Débranchez le cordon d'alimentation de chaque bloc d'alimentation.

  11. Vérifiez que tous les contrôleurs du châssis défectueux sont hors tension.

Option 2 : les contrôleurs sont configurés MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche
  • Si vous utilisez NetApp Storage Encryption, vous devez avoir réinitialisé le MSID à l'aide des instructions de la section « Return a FIPS drive or SED to Unprotected mode » de "Présentation du chiffrement NetApp avec l'interface de ligne de commande".

  • Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes
  1. Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

  2. Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

    En cas de dysfonctionnement du contrôleur…​ Alors…​

    A automatiquement basculé

    Passez à l'étape suivante.

    N'a pas été automatiquement commutée

    Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

    N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

    Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

  3. Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  4. Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  7. Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.