Arrêtez les contrôleurs - AFF C400
Contributeurs
Arrêtez ou prenez le contrôleur défaillant en suivant la procédure appropriée pour votre configuration.
Option 1 : arrêter les contrôleurs lors du remplacement d’un châssis
Cette procédure concerne uniquement les configurations à 2 nœuds non MetroCluster. Si votre système comporte plus de deux nœuds, reportez-vous à la section "Comment effectuer un arrêt normal et mettre sous tension une paire haute disponibilité dans un cluster à 4 nœuds".
Éléments requis :
-
Informations d’identification de l’administrateur local pour ONTAP.
-
Phrase secrète pour la gestion des clés intégrée NetApp à l’échelle du cluster (OKM) en cas d’utilisation du chiffrement du stockage.
-
Accès SP/BMC pour chaque contrôleur.
-
Empêchez tous les clients/hôtes d’accéder aux données sur le système NetApp.
-
Suspendre les tâches de sauvegarde externes.
-
Outils et équipements nécessaires au remplacement.
|
Si le système est un système NetApp StorageGRID ou ONTAP S3 utilisé en tant que Tier cloud FabricPool, reportez-vous au "Arrêtez et mettez votre système de stockage sous tension en toute simplicité" après avoir effectué cette procédure. |
|
Si vous utilisez des LUN de baies FlexArray, suivez la documentation spécifique du fournisseur à la baie de stockage pour la procédure d’arrêt à effectuer pour ces systèmes après avoir réalisé cette procédure. |
|
Si vous utilisez des disques SSD, reportez-vous à la section "SU490 : meilleures pratiques relatives aux SSD (impact : critique) : évitez les risques de panne disque et de perte de données si vous les mettez hors tension pendant plus de deux mois" |
Avant de procéder à l’arrêt, vous devez :
-
Effectuer des opérations supplémentaires "vérifications de l’état du système".
-
Mettez à niveau ONTAP vers une version recommandée pour le système.
-
Résoudre tout "Alertes et risques liés au bien-être Active IQ". Notez toutes les anomalies présentes sur le système, telles que les voyants des composants du système.
-
Connectez-vous au cluster via SSH ou connectez-vous à un nœud du cluster à l’aide d’un câble de console local et d’un ordinateur portable/d’une console.
-
Désactivez AutoSupport et indiquez la durée pendant laquelle vous vous attendez à ce que le système soit hors ligne :
system node autosupport invoke -node * -type all -messages "MAINT=8h Power Maintenance"
-
Identifiez l’adresse SP/BMC de tous les nœuds :
system service-processor show -node * -fields address
-
Quitter le cluster shell :
exit
-
Connectez-vous au processeur de service/contrôleur BMC via SSH en utilisant l’adresse IP de l’un des nœuds répertoriés dans le résultat de l’étape précédente.
Si votre utilise une console ou un ordinateur portable, connectez-vous au contrôleur à l’aide des mêmes informations d’identification d’administrateur de cluster.
Ouvrez une session SSH sur chaque connexion SP/BMC afin de pouvoir surveiller la progression. -
Arrêter tous les nœuds du cluster :
system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
.Pour les clusters qui utilisent SnapMirror en mode synchrone : system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
-
Entrez y pour chaque contrôleur du cluster lorsque vous voyez
Warning: Are you sure you want to halt node "cluster name-controller number"? {y|n}:
-
Attendez que chaque contrôleur s’arrête et affichez l’invite DU CHARGEUR.
-
Mettez chaque bloc d’alimentation hors tension ou débranchez-les s’il n’y a pas d’interrupteur marche/arrêt du bloc d’alimentation.
-
Débranchez le cordon d’alimentation de chaque bloc d’alimentation.
-
Vérifiez que tous les contrôleurs du châssis défectueux sont hors tension.
Option 2 : arrêter un contrôleur dans une configuration MetroCluster à deux nœuds
Pour arrêter le contrôleur défaillant, vous devez déterminer l’état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.
-
Si vous utilisez NetApp Storage Encryption, vous devez avoir réinitialisé le MSID à l’aide des instructions de la section « Return a FIPS drive or SED to Unprotected mode » de "Présentation du chiffrement NetApp avec l’interface de ligne de commande".
-
Vous devez laisser les alimentations allumées à l’issue de cette procédure pour fournir une alimentation au contrôleur en état.
-
Vérifiez l’état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état :
metrocluster show
-
Selon qu’un basculement automatique s’est produit, suivre le tableau suivant :
En cas de dysfonctionnement du contrôleur… Alors… A automatiquement basculé
Passez à l’étape suivante.
N’a pas été automatiquement commutée
Effectuer un basculement planifié à partir du contrôleur en bon état :
metrocluster switchover
N’a pas été automatiquement commutée, vous avez tenté de basculer avec le
metrocluster switchover
la commande, et le basculement a été vetotéExaminez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.
-
Resynchroniser les agrégats de données en exécutant le
metrocluster heal -phase aggregates
commande provenant du cluster survivant.controller_A_1::> metrocluster heal -phase aggregates [Job 130] Job succeeded: Heal Aggregates is successful.
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster heal
commande avec-override-vetoes
paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l’opération de correction. -
Vérifiez que l’opération a été terminée à l’aide de la commande MetroCluster Operation show.
controller_A_1::> metrocluster operation show Operation: heal-aggregates State: successful Start Time: 7/25/2016 18:45:55 End Time: 7/25/2016 18:45:56 Errors: -
-
Vérifier l’état des agrégats à l’aide de
storage aggregate show
commande.controller_A_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 mcc1-a2 raid_dp, mirrored, normal...
-
Réparez les agrégats racine à l’aide de
metrocluster heal -phase root-aggregates
commande.mcc1A::> metrocluster heal -phase root-aggregates [Job 137] Job succeeded: Heal Root Aggregates is successful
Si la guérison est vetotée, vous avez la possibilité de réémettre le
metrocluster heal
commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l’opération de correction. -
Vérifier que l’opération de correction est terminée en utilisant le
metrocluster operation show
commande sur le cluster destination :mcc1A::> metrocluster operation show Operation: heal-root-aggregates State: successful Start Time: 7/29/2016 20:54:41 End Time: 7/29/2016 20:54:42 Errors: -
-
Sur le module de contrôleur défaillant, débranchez les blocs d’alimentation.