Remplacez un module DIMM - AFF A220 et FAS2700
Contributeurs
Vous devez remplacer un module DIMM dans le module de contrôleur lorsque votre système enregistre un nombre croissant de codes de correction d’erreurs (ECC) pouvant être corrigés ; dans le cas contraire, le système risque de se trouver en panne.
Tous les autres composants du système doivent fonctionner correctement ; si ce n’est pas le cas, vous devez contacter le support technique.
Vous devez remplacer le composant défectueux par un composant FRU de remplacement que vous avez reçu de votre fournisseur.
Étape 1 : arrêtez le contrôleur défaillant
Pour arrêter le contrôleur défaillant, vous devez déterminer l’état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.
-
Si vous utilisez NetApp Storage Encryption, vous devez avoir réinitialisé le MSID en suivant les instructions de la section "Retour des disques SED en mode non protégé".
-
Si vous disposez d’un système SAN, vous devez avoir vérifié les messages d’événement
cluster kernel-service show
) Pour la lame SCSI du contrôleur altérée. Lecluster kernel-service show
commande affiche le nom du nœud, l’état quorum du nœud concerné, l’état de disponibilité de ce nœud et l’état opérationnel de ce nœud.Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.
-
Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n’est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l’éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".
-
Si AutoSupport est activé, supprimez la création automatique de dossier en invoquant un message AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures :
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Désactiver le rétablissement automatique depuis la console du contrôleur sain :
storage failover modify –node local -auto-giveback false
Lorsque vous voyez voulez-vous désactiver l’auto-giveback?, entrez y
. -
Faites passer le contrôleur douteux à l’invite DU CHARGEUR :
Si le contrôleur en état de fonctionnement s’affiche… Alors… Invite DU CHARGEUR
Passez à la section retrait du module de contrôleur.
Attente du retour…
Appuyez sur Ctrl-C, puis répondez
y
lorsque vous y êtes invité.Invite système ou invite de mot de passe
Prendre le contrôle défectueux ou l’arrêter à partir du contrôleur en bon état :
storage failover takeover -ofnode impaired_node_name
Lorsque le contrôleur douteux s’affiche en attente de rétablissement…, appuyez sur Ctrl-C et répondez
y
. -
Si le système ne dispose que d’un seul module de contrôleur dans le châssis, mettez les blocs d’alimentation hors tension, puis débranchez les câbles d’alimentation du contrôleur pour cause d’altération de la source d’alimentation.
Étape 2 : retirer le module de contrôleur
Pour accéder aux composants à l’intérieur du contrôleur, vous devez d’abord retirer le module de contrôleur du système, puis retirer le capot du module de contrôleur.
-
Si vous n’êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
-
Desserrez le crochet et la bride de boucle qui relient les câbles au périphérique de gestion des câbles, puis débranchez les câbles système et les SFP (si nécessaire) du module de contrôleur, en maintenant une trace de l’emplacement où les câbles ont été connectés.
Laissez les câbles dans le périphérique de gestion des câbles de sorte que lorsque vous réinstallez le périphérique de gestion des câbles, les câbles sont organisés.
-
Retirez et mettez de côté les dispositifs de gestion des câbles des côtés gauche et droit du module de contrôleur.
-
Appuyez sur le loquet de la poignée de came jusqu’à ce qu’il se libère, ouvrez complètement la poignée de came pour libérer le module de contrôleur du fond de panier central, puis, à l’aide de deux mains, retirez le module de contrôleur du châssis.
-
Retournez le module de contrôleur et placez-le sur une surface plane et stable.
-
Ouvrez le capot en le faisant glisser dans les languettes bleues pour le dégager, puis faites pivoter le couvercle vers le haut et ouvrez-le.
Étape 3 : remplacez les modules DIMM
Pour remplacer les modules DIMM, localisez-les à l’intérieur du contrôleur et suivez l’ordre des étapes.
Si vous remplacez un module DIMM, vous devez le retirer une fois que vous avez débranché la batterie NVMEM du module de contrôleur.
-
Si vous n’êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
-
Vérifiez le voyant NVMEM à l’arrière du module de contrôleur.
Vous devez effectuer un arrêt correct du système avant de remplacer les composants du système pour éviter de perdre des données non écrites dans la mémoire non volatile (NVMEM). La LED se trouve à l’arrière du module de contrôleur. Recherchez l’icône suivante :
-
Si la LED NVMEM ne clignote pas, il n’y a pas de contenu dans la NVMEM ; vous pouvez passer aux étapes suivantes et passer à la tâche suivante de cette procédure.
-
Si la LED NVMEM clignote, des données sont disponibles dans la NVMEM et vous devez la déconnecter pour effacer la mémoire :
-
Localisez la batterie, appuyez sur le clip situé sur la face de la fiche de la batterie pour libérer le clip de verrouillage de la prise mâle, puis débranchez le câble de la batterie de la prise.
-
Vérifiez que la LED NVMEM n’est plus allumée.
-
Rebrancher le connecteur de la batterie.
-
-
Revenir à "Remplacez les modules DIMM" De cette procédure pour vérifier à nouveau la LED NVMEM.
-
Localisez les modules DIMM de votre module de contrôleur.
-
Notez l’orientation du module DIMM dans le support afin que vous puissiez insérer le module DIMM de remplacement dans le bon sens.
-
Éjectez le module DIMM de son logement en écartant lentement les deux languettes de l’éjecteur de DIMM de chaque côté du module DIMM, puis en faisant glisser le module DIMM hors de son logement.
Tenez soigneusement le module DIMM par les bords pour éviter toute pression sur les composants de la carte de circuit DIMM. Le nombre et le positionnement des modules DIMM du système dépendent du modèle de votre système.
L’illustration suivante montre l’emplacement des DIMM système :
-
Retirez le module DIMM de remplacement du sac d’expédition antistatique, tenez le module DIMM par les coins et alignez-le sur le logement.
L’encoche entre les broches du DIMM doit être alignée avec la languette du support.
-
Assurez-vous que les languettes de l’éjecteur de DIMM sur le connecteur sont en position ouverte, puis insérez le module DIMM directement dans le logement.
Le module DIMM s’insère bien dans le logement, mais devrait être facilement installé. Si ce n’est pas le cas, réalignez le module DIMM avec le logement et réinsérez-le.
Inspectez visuellement le module DIMM pour vérifier qu’il est bien aligné et complètement inséré dans le logement. -
Poussez délicatement, mais fermement, sur le bord supérieur du module DIMM jusqu’à ce que les languettes de l’éjecteur s’enclenchent sur les encoches situées aux extrémités du module DIMM.
-
Localisez la prise de la batterie NVMEM, puis appuyez sur le clip situé sur la face de la fiche du câble de la batterie pour l’insérer dans la prise.
Assurez-vous que la fiche se verrouille sur le module de contrôleur.
-
Fermez le capot du module de contrôleur.
Étape 4 : réinstallez le module de contrôleur
Après avoir remplacé des composants dans le module de contrôleur, réinstallez-les dans le châssis.
-
Si vous n’êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
-
Si vous ne l’avez pas encore fait, remettez le capot sur le module de contrôleur.
-
Alignez l’extrémité du module de contrôleur avec l’ouverture du châssis, puis poussez doucement le module de contrôleur à mi-course dans le système.
N’insérez pas complètement le module de contrôleur dans le châssis tant qu’il n’y a pas été demandé. -
Recâblage du système, selon les besoins.
Si vous avez retiré les convertisseurs de support (QSFP ou SFP), n’oubliez pas de les réinstaller si vous utilisez des câbles à fibre optique.
-
Terminez la réinstallation du module de contrôleur :
Si votre système est en… Ensuite, procédez comme suit… Une paire haute disponibilité
Le module de contrôleur commence à démarrer dès qu’il est complètement inséré dans le châssis. Soyez prêt à interrompre le processus de démarrage.
-
Avec la poignée de came en position ouverte, poussez fermement le module de contrôleur jusqu’à ce qu’il rencontre le fond de panier et soit bien en place, puis fermez la poignée de came en position verrouillée.
Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d’endommager les connecteurs. Le contrôleur commence à démarrer dès qu’il est assis dans le châssis.
-
Si ce n’est déjà fait, réinstallez le périphérique de gestion des câbles.
-
Fixez les câbles au dispositif de gestion des câbles à l’aide du crochet et de la sangle de boucle.
-
Lorsque le message s’affiche
Press Ctrl-C for Boot Menu
, appuyez surCtrl-C
pour interrompre le processus de démarrage.Si l’invite et le module de contrôleur ne démarre pas sur ONTAP, entrez halt
, Puis à l’invite DU CHARGEUR, entrezboot_ontap
, appuyez surCtrl-C
Lorsque vous y êtes invité, puis démarrez en mode de maintenance. -
Sélectionnez l’option pour démarrer en mode maintenance dans le menu qui s’affiche.
Une configuration autonome
-
Avec la poignée de came en position ouverte, poussez fermement le module de contrôleur jusqu’à ce qu’il rencontre le fond de panier et soit bien en place, puis fermez la poignée de came en position verrouillée.
Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d’endommager les connecteurs. -
Si ce n’est déjà fait, réinstallez le périphérique de gestion des câbles.
-
Fixez les câbles au dispositif de gestion des câbles à l’aide du crochet et de la sangle de boucle.
-
Rebranchez les câbles d’alimentation aux blocs d’alimentation et aux sources d’alimentation, mettez le système sous tension pour démarrer le processus de démarrage, puis appuyez sur
Ctrl-C
après que vous ayez vu lePress Ctrl-C for Boot Menu
messagerie.Si l’invite et le module de contrôleur ne démarre pas sur ONTAP, entrez halt
, Puis à l’invite DU CHARGEUR, entrezboot_ontap
, appuyez surCtrl-C
Lorsque vous y êtes invité, puis démarrez en mode de maintenance. -
Dans le menu de démarrage, sélectionner l’option pour le mode maintenance.
-
Étape 5 : exécutez les diagnostics au niveau du système
Après avoir installé un nouveau module DIMM, exécutez les tests de diagnostic.
Votre système doit être à l’invite DU CHARGEUR pour démarrer System Level Diagnostics.
Toutes les commandes des procédures de diagnostic sont émises par le contrôleur où le composant est remplacé.
-
Si le contrôleur à réparer n’est pas à l’invite DU CHARGEUR, effectuez la procédure suivante :
-
Sélectionnez l’option mode Maintenance dans le menu affiché.
-
Une fois le contrôleur démarré en mode maintenance, arrêtez le contrôleur :
halt
Une fois que vous avez terminé d’exécuter la commande, vous devez attendre que le système s’arrête à l’invite DU CHARGEUR.
Au cours du processus de démarrage, vous pouvez répondre en toute sécurité y
pour demander :-
Un avertissement s’affiche lorsque vous passez en mode maintenance dans une configuration HA, vous devez vous assurer que le contrôleur en bon état reste arrêté.
-
-
-
À l’invite DU CHARGEUR, accédez aux pilotes spéciaux spécialement conçus pour les diagnostics au niveau du système afin de fonctionner correctement :
boot_diags
Au cours du processus de démarrage, vous pouvez répondre en toute sécurité
y
Aux invites jusqu’à ce que l’invite du mode Maintenance (*>) s’affiche. -
Exécutez les tests de diagnostic de la mémoire système :
sldiag device run -dev mem
-
Vérifiez qu’aucun problème matériel ne provient du remplacement des modules DIMM :
sldiag device status -dev mem -long -state failed
Les diagnostics au niveau du système vous renvoie à l’invite s’il n’y a pas d’échec de test ou répertorie l’état complet des échecs résultant du test du composant.
-
Procédez comme suit en fonction du résultat de l’étape précédente :
Si les tests de diagnostic au niveau du système… Alors… Ont été achevés sans défaillance
-
Effacez les journaux d’état :
sldiag device clearstatus
-
Vérifiez que le journal a été effacé :
sldiag device status
La réponse par défaut suivante est affichée :
SLDIAG : aucun message de journal n’est présent.
-
Quitter le mode Maintenance :
halt
Le contrôleur affiche l’invite DU CHARGEUR.
-
Démarrez le contrôleur à partir de l’invite DU CHARGEUR :
bye
-
Faire revenir le contrôleur en mode de fonctionnement normal :
Si votre contrôleur est en… Alors… Une paire haute disponibilité
Effectuer un retour :
storage failover giveback -ofnode replacement_node_name
Si vous avez désactivé le rétablissement automatique, réactivez-le à l’aide de la commande Storage Failover modify. Configuration MetroCluster à deux nœuds
Passez à l’étape suivante.
La procédure de rétablissement MetroCluster est effectuée lors de la prochaine tâche du processus de remplacement.
Une configuration autonome
Passez à l’étape suivante.
Aucune action n’est requise.
Vous avez terminé les diagnostics au niveau du système.
A entraîné des échecs de test
Déterminez la cause du problème :
-
Quitter le mode Maintenance :
halt
Une fois que vous avez terminé d’exécuter la commande, attendez que le système s’arrête à l’invite DU CHARGEUR.
-
Mettez les blocs d’alimentation hors tension ou laissez-les hors tension, en fonction du nombre de modules de contrôleur présents dans le châssis :
-
Si le châssis comporte deux modules de contrôleur, laissez les blocs d’alimentation sous tension afin de fournir l’alimentation à l’autre module de contrôleur.
-
Si le châssis comporte un module de contrôleur, mettez les blocs d’alimentation hors tension et débranchez-les des sources d’alimentation.
-
-
Vérifier que vous avez bien remarqué tous les facteurs à prendre en compte pour l’exécution des diagnostics au niveau du système, que les câbles sont correctement connectés et que les composants matériels sont correctement installés dans le système de stockage.
-
Démarrez le module de contrôleur que vous effectuez le service, interrompant le démarrage en appuyant sur
Ctrl-C
Lorsque vous êtes invité à accéder au menu de démarrage :-
Si le châssis comporte deux modules de contrôleur, asseoir complètement le module de contrôleur que vous effectuez l’entretien dans le châssis.
Le module de contrôleur s’amorce lorsqu’il est bien en place.
-
Si vous avez un module de contrôleur dans le châssis, connectez les blocs d’alimentation, puis mettez-les sous tension.
-
-
Dans le menu, sélectionnez Boot to maintenance mode.
-
Quittez le mode maintenance en saisissant la commande suivante :
halt
Une fois que vous avez terminé d’exécuter la commande, attendez que le système s’arrête à l’invite DU CHARGEUR.
-
Exécutez à nouveau le test de diagnostic au niveau du système.
-
Étape 6 : retournez les agrégats via une configuration MetroCluster à deux nœuds
Après avoir terminé le remplacement des unités remplaçables sur site dans une configuration MetroCluster à deux nœuds, vous pouvez exécuter l’opération de rétablissement MetroCluster. Cette configuration renvoie la configuration à son état de fonctionnement normal, avec les SVM (Storage Virtual machines) source et sur le site précédemment douteux actifs et peuvent accéder aux données des pools de disques locaux.
Cette tâche s’applique uniquement aux configurations MetroCluster à deux nœuds.
-
Vérifiez que tous les nœuds sont dans le
enabled
état :metrocluster node show
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed.
-
Vérifier que la resynchronisation est terminée sur tous les SVM :
metrocluster vserver show
-
Vérifier que toutes les migrations LIF automatiques effectuées par les opérations de correction ont été effectuées correctement :
metrocluster check lif show
-
Effectuez le rétablissement en utilisant le
metrocluster switchback
utilisez une commande à partir d’un nœud du cluster survivant. -
Vérifiez que l’opération de rétablissement est terminée :
metrocluster show
L’opération de rétablissement s’exécute toujours lorsqu’un cluster est dans
waiting-for-switchback
état :cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
Le rétablissement est terminé une fois les clusters dans
normal
état :cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
Si un rétablissement prend beaucoup de temps, vous pouvez vérifier l’état des lignes de base en cours en utilisant le
metrocluster config-replication resync-status show
commande. -
Rétablir toutes les configurations SnapMirror ou SnapVault.
Étape 7 : renvoyer la pièce défaillante à NetApp
Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièce et amp ; remplacements" pour plus d’informations.