Arrêtez les contrôleurs - FAS9000
Pour remplacer le châssis, vous devez arrêter les contrôleurs.
Option 1 : arrêter les contrôleurs
Cette procédure concerne les systèmes ayant des configurations à deux nœuds. Pour plus d'informations sur l'arrêt normal lors de la maintenance d'un cluster, reportez-vous à la section "Arrêtez et mettez sous tension votre système de stockage - Guide de résolution - base de connaissances NetApp".
-
Vérifiez que vous disposez des autorisations et des informations d'identification nécessaires :
-
Informations d'identification de l'administrateur local pour ONTAP.
-
Accessibilité BMC pour chaque contrôleur.
-
-
Assurez-vous de disposer des outils et de l'équipement nécessaires pour le remplacement.
-
Connectez-vous au cluster via SSH ou connectez-vous à un nœud du cluster à l'aide d'un câble de console local et d'un ordinateur portable/d'une console.
-
Empêchez tous les clients/hôtes d'accéder aux données sur le système NetApp.
-
Suspendre les tâches de sauvegarde externes.
-
Si AutoSupport est activé, supprimez la création de dossiers et indiquez combien de temps le système doit rester hors ligne :
system node autosupport invoke -node * -type all -message "MAINT=2h Replace chassis" -
Identifier l'adresse SP/BMC de tous les nœuds du cluster :
system service-processor show -node * -fields address -
Quitter le cluster shell :
exit -
Connectez-vous au SP/BMC de chaque contrôleur en utilisant l'adresse IP identifiée à l'étape précédente :
-
Si vous vous connectez depuis le BMC via SSH, connectez-vous en utilisant l'adresse SP/BMC (par exemple,
ssh admin@<SP/BMC_address>), puis entrez la commandesystem consoleet authentifiez-vous. -
Si vous utilisez une console locale ou un ordinateur portable connecté directement au contrôleur, connectez-vous en utilisant les mêmes identifiants d'administrateur du cluster.
-
-
Arrêtez les deux nœuds situés dans le châssis défectueux :
system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover truePour les clusters qui utilisent SnapMirror en mode synchrone : system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true -
Entrez y pour chaque contrôleur du cluster lorsque vous voyez :
Warning: Are you sure you want to halt node <node_name>? {y|n}: -
Attendez que chaque contrôleur s'arrête et affichez l'invite DU CHARGEUR.
Option 2 : arrêter un nœud dans une configuration MetroCluster à deux nœuds
Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.
-
Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.
-
Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état :
metrocluster show -
Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :
En cas de dysfonctionnement du contrôleur… Alors… A automatiquement basculé
Passez à l'étape suivante.
N'a pas été automatiquement commutée
Effectuer un basculement planifié à partir du contrôleur en bon état :
metrocluster switchoverN'a pas été automatiquement commutée, vous avez tenté de basculer avec le
metrocluster switchoverla commande, et le basculement a été vetotéExaminez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.
-
Resynchroniser les agrégats de données en exécutant le
metrocluster heal -phase aggregatescommande provenant du cluster survivant.controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster healcommande avec-override-vetoesparamètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction. -
Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: - -
Vérifier l'état des agrégats à l'aide de
storage aggregate showcommande.controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
Réparez les agrégats racine à l'aide de
metrocluster heal -phase root-aggregatescommande.mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster healcommande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction. -
Vérifier que l'opération de correction est terminée en utilisant le
metrocluster operation showcommande sur le cluster destination :mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: - -
Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.