Remplacez le module NVRAM - AFF A1K
Le module NVRAM se compose du matériel NVRAM12 et de modules DIMM remplaçables sur site. Vous pouvez remplacer un module NVRAM défectueux ou les modules DIMM à l'intérieur du module NVRAM. Pour remplacer un module NVRAM défectueux, vous devez retirer le module du boîtier, déplacer les modules DIMM vers le module de remplacement et installer le module NVRAM de remplacement dans le boîtier.
Tous les autres composants du système doivent fonctionner correctement ; si ce n'est pas le cas, vous devez contacter "Support NetApp".
Vous devez remplacer le composant défectueux par un composant FRU de remplacement que vous avez reçu de votre fournisseur.
Étape 1 : arrêtez le contrôleur défaillant
Arrêtez ou prenez le contrôleur pour facultés affaiblies en utilisant l'une des options suivantes.
Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.
-
Si vous disposez d'un système SAN, vous devez avoir vérifié les messages d'événement
cluster kernel-service show
) pour le serveur lame SCSI du contrôleur défectueux. `cluster kernel-service show`La commande (from priv mode Advanced) affiche le nom du nœud, son état de disponibilité et "état du quorum"son état de fonctionnement.Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.
-
Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".
-
Si AutoSupport est activé, supprimez la création automatique de cas en appelant un message AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures :
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Désactiver le rétablissement automatique depuis la console du contrôleur sain :
storage failover modify –node local -auto-giveback false
Lorsque vous voyez voulez-vous désactiver l'auto-giveback?, entrez y
. -
Faites passer le contrôleur douteux à l'invite DU CHARGEUR :
Si le contrôleur en état de fonctionnement s'affiche… Alors… Invite DU CHARGEUR
Passez à l'étape suivante.
Attente du retour…
Appuyez sur Ctrl-C, puis répondez
y
lorsque vous y êtes invité.Invite système ou invite de mot de passe
Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état :
storage failover takeover -ofnode impaired_node_name
Lorsque le contrôleur douteux s'affiche en attente de rétablissement…, appuyez sur Ctrl-C et répondez
y
.
Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.
-
Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".
-
Vous devez avoir confirmé que l'état de configuration MetroCluster est configuré et que les nœuds sont à l'état activé et normal (
metrocluster node show
).
-
Si AutoSupport est activé, supprimez la création automatique de dossier en invoquant un message AutoSupport :
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures :
cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
-
Désactiver le rétablissement automatique depuis la console du contrôleur sain :
storage failover modify –node local -auto-giveback false
-
Faites passer le contrôleur douteux à l'invite DU CHARGEUR :
Si le contrôleur en état de fonctionnement s'affiche… Alors… Invite DU CHARGEUR
Passez à la section suivante.
Attente du retour…
Appuyez sur Ctrl-C, puis répondez
y
lorsque vous y êtes invité.Invite système ou invite de mot de passe (entrer le mot de passe système)
Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état :
storage failover takeover -ofnode impaired_node_name
Lorsque le contrôleur douteux s'affiche en attente de rétablissement…, appuyez sur Ctrl-C et répondez
y
.
Étape 2 : remplacer le module NVRAM
Pour remplacer le module NVRAM, localisez-le dans le logement 4/5 du boîtier et suivez la séquence spécifique des étapes.
-
Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
-
Débranchez le cordon d'alimentation des deux blocs d'alimentation.
-
Faites pivoter le chemin de câbles vers le bas en tirant doucement les broches situées aux extrémités du bac et en faisant pivoter le bac vers le bas.
-
Retirez le module NVRAM défectueux du boîtier :
-
Appuyer sur le bouton de came de verrouillage.
Le bouton de came s'éloigne du boîtier.
-
Faites pivoter le loquet de came le plus loin possible.
-
Retirez le module NVRAM défectueux du boîtier en accrochant votre doigt dans l'ouverture du levier de came et en tirant le module hors du boîtier.
Bouton de verrouillage de came
Languettes de verrouillage DIMM
-
-
Placez le module NVRAM sur une surface stable.
-
Retirez les modules DIMM, un par un, du module NVRAM défectueux et installez-les dans le module NVRAM de remplacement.
-
Installez le module NVRAM de remplacement dans le boîtier :
-
Alignez le module avec les bords de l'ouverture du boîtier dans le logement 4/5.
-
Faites glisser doucement le module dans son logement jusqu'à ce qu'il se trouve à fond, puis faites pivoter le loquet de la came jusqu'à ce qu'il soit verrouillé en place.
-
-
Réenregistrement des blocs d'alimentation.
-
Faites pivoter le chemin de câbles vers le haut jusqu'à la position fermée.
Étape 3 : remplacer un module DIMM NVRAM
Pour remplacer les barrettes DIMM NVRAM dans le module NVRAM, vous devez retirer le module NVRAM, puis remplacer le module DIMM cible.
-
Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
-
Débranchez le cordon d'alimentation des deux blocs d'alimentation.
-
Faites pivoter le chemin de câbles vers le bas en tirant doucement les broches situées aux extrémités du bac et en faisant pivoter le bac vers le bas.
-
Retirez le module NVRAM cible du boîtier.
Bouton de verrouillage de came
Languettes de verrouillage DIMM
-
Placez le module NVRAM sur une surface stable.
-
Repérez le module DIMM à remplacer à l'intérieur du module NVRAM.
Consultez l'étiquette FRU map située sur le côté du module NVRAM pour déterminer l'emplacement des emplacements DIMM 1 et 2. -
Retirez le module DIMM en appuyant sur les languettes de verrouillage du module DIMM et en soulevant le module DIMM hors du support.
-
Installez le module DIMM de remplacement en alignant le module DIMM avec le support et en poussant doucement le module DIMM dans le support jusqu'à ce que les languettes de verrouillage se verrouillent en place.
-
Installez le module NVRAM dans le boîtier :
-
Faites glisser doucement le module dans le logement jusqu'à ce que le loquet de came commence à s'engager avec la broche de came d'E/S, puis faites tourner le loquet de came complètement vers le haut pour verrouiller le module en place.
-
-
Réenregistrement des blocs d'alimentation.
-
Faites pivoter le chemin de câbles vers le haut jusqu'à la position fermée.
Étape 4 : redémarrer le contrôleur
Après avoir remplacé le FRU, vous devez redémarrer le module de contrôleur.
-
Pour démarrer ONTAP à partir de l'invite du CHARGEUR, entrez bye.
-
Remettre le contrôleur défectueux en fonctionnement normal en réutilisant son espace de stockage :
storage failover giveback -ofnode _impaired_node_name
. -
Si le rétablissement automatique a été désactivé, réactivez-le :
storage failover modify -node local -auto-giveback true
. -
Si AutoSupport est activé, restaurer/annuler la suppression automatique de la création de cas :
system node autosupport invoke -node * -type all -message MAINT=END
.
Étape 5 : réaffectation de disques
Vous devez confirmer la modification de l'ID système au démarrage du contrôleur, puis vérifier que la modification a été implémentée.
La réaffectation de disque n'est nécessaire que lors du remplacement du module NVRAM et ne s'applique pas au remplacement du module DIMM NVRAM. |
-
Si le contrôleur est en mode Maintenance (affichant l'
*>
invite), quittez le mode Maintenance et allez à l'invite du CHARGEUR : halt -
À partir de l'invite du CHARGEUR sur le contrôleur, démarrez le contrôleur et entrez y lorsque vous êtes invité à remplacer l'ID système en raison d'une incompatibilité d'ID système.
-
Attendez l'attente du retour… Le message s'affiche sur la console du contrôleur avec le module de remplacement, puis, à partir du contrôleur sain, vérifiez que le nouvel ID système partenaire a été automatiquement attribué : Storage failover show
Dans le résultat de la commande, un message indiquant l'ID système modifié sur le contrôleur associé est affiché, indiquant l'ancien et le nouveau ID corrects. Dans l'exemple suivant, le node2 a fait l'objet d'un remplacement et a un nouvel ID système de 151759706.
node1:> storage failover show Takeover Node Partner Possible State Description ------------ ------------ -------- ------------------------------------- node1 node2 false System ID changed on partner (Old: 151759755, New: 151759706), In takeover node2 node1 - Waiting for giveback (HA mailboxes)
-
Remettre le contrôleur :
-
Depuis le contrôleur sain, remettre le stockage du contrôleur remplacé : Storage failover giveback -ofnode replacement_node_name
Le contrôleur récupère son stockage et termine le démarrage.
Si vous êtes invité à remplacer l'ID système en raison d'une incompatibilité d'ID système, vous devez entrer y.
Si le retour est vetoté, vous pouvez envisager d'ignorer les vetoes.
Pour plus d'informations, reportez-vous à la section "Commandes de rétablissement manuel" rubrique pour remplacer le droit de veto.
-
Une fois le rétablissement terminé, vérifiez que la paire HA est en bon état et qu'un basculement est possible : Storage failover show
La sortie du
storage failover show
La commande ne doit pas inclure l'ID système modifié dans le message partenaire.
-
-
Vérifier que les disques ont été correctement affectés :
storage disk show -ownership
Les disques appartenant au contrôleur doivent afficher le nouvel ID système. Dans l'exemple suivant, les disques appartenant au nœud1 affichent alors le nouvel ID système, 151759706 :
node1:> storage disk show -ownership Disk Aggregate Home Owner DR Home Home ID Owner ID DR Home ID Reserver Pool ----- ------ ----- ------ -------- ------- ------- ------- --------- --- 1.0.0 aggr0_1 node1 node1 - 151759706 151759706 - 151759706 Pool0 1.0.1 aggr0_1 node1 node1 151759706 151759706 - 151759706 Pool0 . . .
-
Si le système est dans une configuration MetroCluster, surveiller l'état du contrôleur : MetroCluster node show
La configuration MetroCluster prend quelques minutes après le remplacement pour revenir à un état normal. À ce moment, chaque contrôleur affiche un état configuré, avec la mise en miroir reprise sur incident activée et un mode de fonctionnement normal. Le
metrocluster node show -fields node-systemid
résultat de la commande affiche l'ID système affecté jusqu'à ce que la configuration MetroCluster revienne à l'état normal. -
Si le contrôleur est dans une configuration MetroCluster, en fonction de l'état de la MetroCluster, vérifiez que le champ ID de domicile de la reprise après incident affiche le propriétaire d'origine du disque si le propriétaire d'origine est un contrôleur sur le site de secours.
Ceci est requis si les deux conditions suivantes sont vraies :
-
La configuration MetroCluster est en état de basculement.
-
Le contrôleur est le propriétaire actuel des disques sur le site de secours.
-
-
Si votre système est dans une configuration MetroCluster, vérifiez que chaque contrôleur est configuré : MetroCluster node show - champs configuration-state
node1_siteA::> metrocluster node show -fields configuration-state dr-group-id cluster node configuration-state ----------- ---------------------- -------------- ------------------- 1 node1_siteA node1mcc-001 configured 1 node1_siteA node1mcc-002 configured 1 node1_siteB node1mcc-003 configured 1 node1_siteB node1mcc-004 configured 4 entries were displayed.
-
Vérifier que les volumes attendus sont présents pour chaque contrôleur :
vol show -node node-name
-
Remettre le contrôleur défectueux en fonctionnement normal en réutilisant son espace de stockage :
storage failover giveback -ofnode impaired_node_name
. -
Si le rétablissement automatique a été désactivé, réactivez-le :
storage failover modify -node local -auto-giveback true
. -
Si AutoSupport est activé, restaurer/annuler la suppression automatique de la création de cas :
system node autosupport invoke -node * -type all -message MAINT=END
.
Étape 6 : renvoyer la pièce défaillante à NetApp
Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièces et remplacements" page pour plus d'informations.