Arrêtez les contrôleurs - ASA C400
Arrêtez ou prenez le contrôleur défaillant en suivant la procédure appropriée pour votre configuration.
Option 1 : arrêter les contrôleurs lors du remplacement d'un châssis
Arrêtez les contrôleurs afin d'effectuer des opérations de maintenance sur le châssis.
Cette procédure concerne les systèmes ayant des configurations à deux nœuds. Si votre système comporte plus de deux nœuds, reportez-vous à la section "Comment effectuer un arrêt normal et mettre sous tension une paire haute disponibilité dans un cluster à quatre nœuds".
-
Empêchez tous les clients/hôtes d'accéder aux données sur le système NetApp.
-
Suspendre les tâches de sauvegarde externes.
-
Vérifiez que vous disposez des autorisations et des informations d'identification nécessaires :
-
Informations d'identification de l'administrateur local pour ONTAP.
-
Phrase secrète pour la gestion des clés intégrée NetApp à l'échelle du cluster en cas d'utilisation du chiffrement du stockage ou de NVE/NAE.
-
Accès BMC pour chaque contrôleur.
-
-
Assurez-vous de disposer des outils et de l'équipement nécessaires pour le remplacement.
-
Avant de procéder à l'arrêt, vous devez :
-
Effectuer des opérations supplémentaires "vérifications de l'état du système".
-
Mettez à niveau ONTAP vers une version recommandée pour le système.
-
Résoudre tout "Alertes et risques liés au bien-être Active IQ". Notez toutes les anomalies présentes sur le système, telles que les voyants des composants du système.
-
-
Connectez-vous au cluster via SSH ou connectez-vous à un nœud du cluster à l'aide d'un câble de console local et d'un ordinateur portable/d'une console.
-
Désactivez AutoSupport et indiquez la durée de mise hors ligne du système :
system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"
-
Identifiez l'adresse SP/BMC de tous les nœuds :
system service-processor show -node * -fields address
-
Quitter le cluster shell :
exit
-
Connectez-vous au processeur de service/contrôleur BMC via SSH en utilisant l'adresse IP de l'un des nœuds répertoriés dans le résultat de l'étape précédente.
Si votre utilise une console ou un ordinateur portable, connectez-vous au contrôleur à l'aide des mêmes informations d'identification d'administrateur de cluster.
Ouvrez une session SSH sur chaque connexion SP/BMC afin de pouvoir surveiller la progression. -
Arrêtez les deux nœuds situés dans le châssis défectueux :
system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
Pour les clusters qui utilisent SnapMirror en mode synchrone : system node halt -node <node>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
-
Entrez y pour chaque contrôleur du cluster lorsque vous voyez
Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:
-
Attendez que chaque contrôleur s'arrête et affichez l'invite DU CHARGEUR.
-
Si le système est un NetApp StorageGRID ou ONTAP S3 utilisé en tant que Tier cloud FabricPool, reportez-vous à la section "Arrêtez et mettez votre système de stockage sous tension en toute simplicité" après avoir effectué cette procédure d'arrêt.
-
Si vous utilisez des disques SSD, reportez-vous à la section "SU490 : meilleures pratiques relatives aux SSD (impact : critique) : évitez les risques de panne disque et de perte de données si vous les mettez hors tension pendant plus de deux mois" après avoir réalisé cette procédure d'arrêt.
Option 2 : arrêter un contrôleur dans une configuration MetroCluster à deux nœuds
Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.
-
Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.
-
Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état :
metrocluster show
-
Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :
En cas de dysfonctionnement du contrôleur… Alors… A automatiquement basculé
Passez à l'étape suivante.
N'a pas été automatiquement commutée
Effectuer un basculement planifié à partir du contrôleur en bon état :
metrocluster switchover
N'a pas été automatiquement commutée, vous avez tenté de basculer avec le
metrocluster switchover
la commande, et le basculement a été vetotéExaminez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.
-
Resynchroniser les agrégats de données en exécutant le
metrocluster heal -phase aggregates
commande provenant du cluster survivant.controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster heal
commande avec-override-vetoes
paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction. -
Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
Vérifier l'état des agrégats à l'aide de
storage aggregate show
commande.controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
Réparez les agrégats racine à l'aide de
metrocluster heal -phase root-aggregates
commande.mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster heal
commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction. -
Vérifier que l'opération de correction est terminée en utilisant le
metrocluster operation show
commande sur le cluster destination :mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.