Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacez le module NVRAM ou les barrettes DIMM NVRAM - AFF A700

Contributeurs

Le module NVRAM se compose de l'architecture NVRAM10 et de modules DIMM, et jusqu'à deux modules Flash cache SSD NVMe (Flash cache ou modules de cache) par module NVRAM. Vous pouvez remplacer un module NVRAM défectueux ou les modules DIMM à l'intérieur du module NVRAM.

Pour remplacer un module NVRAM défectueux, vous devez le retirer du châssis, retirer le ou les modules Flash cache du module NVRAM, transférer les modules DIMM vers le module de remplacement, réinstaller le ou les modules Flash cache et installer le module NVRAM de remplacement dans le châssis.

Étant donné que l'ID système est dérivé du module NVRAM, si vous remplacez le module, les disques appartenant au système sont réaffectés au nouvel ID système.

Avant de commencer
  • Tous les tiroirs disques doivent fonctionner correctement.

  • Si votre système se trouve dans une paire haute disponibilité, le nœud partenaire doit pouvoir reprendre le nœud associé au module NVRAM qui est remplacé.

  • Cette procédure utilise la terminologie suivante :

    • Le noeud trouble est le noeud sur lequel vous effectuez la maintenance.

    • Le noeud Healthy est le partenaire HA du noeud douteux.

  • Cette procédure comprend les étapes de réaffectation automatique ou manuelle des disques au module de contrôleur associé au nouveau module NVRAM. Vous devez réaffecter les disques lorsqu'il est demandé dans la procédure. La réaffectation du disque avant le retour peut entraîner des problèmes.

  • Vous devez remplacer le composant défectueux par un composant FRU de remplacement que vous avez reçu de votre fournisseur.

  • Vous ne pouvez pas changer de disque ou de tiroir disque dans le cadre de cette procédure.

Étape 1 : arrêtez le contrôleur défaillant

Arrêtez ou prenez le contrôleur pour facultés affaiblies en utilisant l'une des options suivantes.

Option 1 : la plupart des systèmes

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.

Description de la tâche
  • Si vous disposez d'un système SAN, vous devez avoir vérifié les messages d'événement cluster kernel-service show) pour le serveur lame SCSI du contrôleur défectueux. `cluster kernel-service show`La commande (from priv mode Advanced) affiche le nom du nœud, son état de disponibilité et "état du quorum"son état de fonctionnement.

    Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.

  • Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".

Étapes
  1. Si AutoSupport est activé, supprimez la création automatique de cas en appelant un message AutoSupport : system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures : cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Désactiver le rétablissement automatique depuis la console du contrôleur sain : storage failover modify –node local -auto-giveback false

    Remarque Lorsque vous voyez voulez-vous désactiver l'auto-giveback?, entrez y.
  3. Faites passer le contrôleur douteux à l'invite DU CHARGEUR :

    Si le contrôleur en état de fonctionnement s'affiche…​ Alors…​

    Invite DU CHARGEUR

    Passez à l'étape suivante.

    Attente du retour…​

    Appuyez sur Ctrl-C, puis répondez y lorsque vous y êtes invité.

    Invite système ou invite de mot de passe

    Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état : storage failover takeover -ofnode impaired_node_name

    Lorsque le contrôleur douteux s'affiche en attente de rétablissement…​, appuyez sur Ctrl-C et répondez y.

Option 2 : le contrôleur est intégré à un MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche
  • Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes
  1. Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

  2. Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

    En cas de dysfonctionnement du contrôleur…​ Alors…​

    A automatiquement basculé

    Passez à l'étape suivante.

    N'a pas été automatiquement commutée

    Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

    N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

    Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

  3. Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  4. Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  7. Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.

Étape 2 : remplacer le module NVRAM

Pour remplacer le module NVRAM, localisez-le dans le logement 6 du châssis et suivez la séquence des étapes.

Étapes
  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Déplacez le module Flash cache de l'ancien module NVRAM vers le nouveau module NVRAM :

    Remplacer le module de cache

    Légende numéro 1

    Bouton de déblocage orange (gris sur les modules Flash cache vides)

    Légende numéro 2

    Poignée de came du FlashCache

    1. Appuyez sur le bouton orange situé à l'avant du module Flash cache.

      Remarque Le bouton de déblocage des modules Flash cache vides est gris.
    2. Faites pivoter la poignée de came vers l'extérieur jusqu'à ce que le module commence à glisser hors de l'ancien module NVRAM.

    3. Saisissez la poignée de came du module et faites-la glisser hors du module NVRAM et insérez-la dans l'avant du nouveau module NVRAM.

    4. Poussez doucement le module FlashCache jusqu'au module NVRAM, puis fermez la poignée de came jusqu'à ce qu'il verrouille le module.

  3. Retirez le module NVRAM cible du châssis :

    1. Appuyer sur le bouton à came numéroté et numéroté.

      Le bouton de came s'éloigne du châssis.

    2. Faites pivoter le loquet de came vers le bas jusqu'à ce qu'il soit en position horizontale.

      Le module NVRAM se désengage du châssis et se déplace en quelques pouces.

    3. Retirez le module NVRAM du châssis en tirant sur les languettes de traction situées sur les côtés de la face du module.

      Retirez le module NVRAM

    Légende numéro 1

    Loquet de came d'E/S numéroté et numéroté

    Légende numéro 2

    Loquet d'E/S complètement déverrouillé

  4. Placez le module NVRAM sur une surface stable et retirez le capot du module NVRAM en appuyant sur le bouton de verrouillage bleu du capot, puis, tout en maintenant le bouton bleu enfoncé, faites glisser le couvercle hors du module NVRAM.

    Retirez le contenu du module NVRAM

    Légende numéro 1

    Bouton de verrouillage du couvercle

    Légende numéro 2

    Languettes d'éjection du module DIMM et du module DIMM

  5. Retirez les modules DIMM, un par un, de l'ancien module NVRAM et installez-les dans le module NVRAM de remplacement.

  6. Fermez le capot du module.

  7. Installez le module NVRAM de remplacement dans le châssis :

    1. Alignez le module sur les bords de l'ouverture du châssis dans le logement 6.

    2. Faites glisser doucement le module dans le logement jusqu'à ce que le loquet de came d'E/S numéroté et numéroté commence à s'engager avec la goupille de came d'E/S, puis poussez le loquet de came d'E/S jusqu'à ce qu'il se verrouille en place.

Étape 3 : remplacer un module DIMM NVRAM

Pour remplacer les modules DIMM NVRAM du module NVRAM, vous devez retirer le module NVRAM, ouvrir le module, puis remplacer le module DIMM cible.

Étapes
  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Retirez le module NVRAM cible du châssis :

    1. Appuyer sur le bouton à came numéroté et numéroté.

      Le bouton de came s'éloigne du châssis.

    2. Faites pivoter le loquet de came vers le bas jusqu'à ce qu'il soit en position horizontale.

      Le module NVRAM se désengage du châssis et se déplace en quelques pouces.

    3. Retirez le module NVRAM du châssis en tirant sur les languettes de traction situées sur les côtés de la face du module.

      Retirez le module NVRAM

    Légende numéro 1

    Loquet de came d'E/S numéroté et numéroté

    Légende numéro 2

    Loquet d'E/S complètement déverrouillé

  3. Placez le module NVRAM sur une surface stable et retirez le capot du module NVRAM en appuyant sur le bouton de verrouillage bleu du capot, puis, tout en maintenant le bouton bleu enfoncé, faites glisser le couvercle hors du module NVRAM.

    Retirez le contenu du module NVRAM

    Légende numéro 1

    Bouton de verrouillage du couvercle

    Légende numéro 2

    Languettes d'éjection du module DIMM et du module DIMM

  4. Repérez le module DIMM à remplacer à l'intérieur du module NVRAM, puis retirez-le en appuyant sur les languettes de verrouillage du module DIMM et en soulevant le module DIMM pour le sortir du support.

  5. Installez le module DIMM de remplacement en alignant le module DIMM avec le support et en poussant doucement le module DIMM dans le support jusqu'à ce que les languettes de verrouillage se verrouillent en place.

  6. Fermez le capot du module.

  7. Installez le module NVRAM de remplacement dans le châssis :

    1. Alignez le module sur les bords de l'ouverture du châssis dans le logement 6.

    2. Faites glisser doucement le module dans le logement jusqu'à ce que le loquet de came d'E/S numéroté et numéroté commence à s'engager avec la goupille de came d'E/S, puis poussez le loquet de came d'E/S jusqu'à ce qu'il se verrouille en place.

Étape 4 : redémarrer le contrôleur après le remplacement d'une unité remplaçable sur site

Après avoir remplacé le FRU, vous devez redémarrer le module de contrôleur.

Étape
  1. Pour démarrer ONTAP à partir de l'invite DU CHARGEUR, entrez bye.

Étape 5 : réaffectation de disques

Selon que vous disposez d'une paire haute disponibilité ou d'une configuration MetroCluster à deux nœuds, vous devez vérifier la réaffectation des disques sur le nouveau module de contrôleur ou réaffecter manuellement les disques.

Sélectionnez l'une des options suivantes pour obtenir des instructions sur la réaffectation de disques au nouveau contrôleur.

Option 1 : vérification de l'ID (paire HA)
La vérification de la modification de l'ID système sur un système HA

Vous devez confirmer la modification de l'ID système lors du démarrage du replace node, puis vérifier que la modification a été implémentée.

Avertissement La réaffectation de disque n'est nécessaire que lors du remplacement du module NVRAM et ne s'applique pas au remplacement du module DIMM NVRAM.
Étapes
  1. Si le nœud de remplacement est en mode maintenance (affiche le *> Invite, quittez le mode maintenance et accédez à l'invite DU CHARGEUR : halt

  2. Dans l'invite DU CHARGEUR sur le nœud de remplacement, démarrez le nœud, entrez y Si vous êtes invité à remplacer l'ID système en raison d'une discordance d'ID système.

    boot_ontap bye

    Si AUTOBOOT est défini, le nœud redémarre.

  3. Attendre jusqu'à Waiting for giveback…​ Le message s'affiche sur la console replace node, puis, à partir du nœud en bon état, vérifiez que le nouvel ID système partenaire a été automatiquement attribué : storage failover show

    Dans le résultat de la commande, un message indiquant l'ID du système a changé sur le nœud pour lequel l'ID a été modifié, et indiquant l'ancien et le nouveau ID corrects. Dans l'exemple suivant, le node2 a fait l'objet d'un remplacement et a un nouvel ID système de 151759706.

    node1> `storage failover show`
                                        Takeover
    Node              Partner           Possible     State Description
    ------------      ------------      --------     -------------------------------------
    node1             node2             false        System ID changed on partner (Old:
                                                      151759755, New: 151759706), In takeover
    node2             node1             -            Waiting for giveback (HA mailboxes)
  4. Depuis le nœud sain, vérifier que les « core dumps » sont enregistrés :

    1. Changement au niveau de privilège avancé : set -privilege advanced

      Vous pouvez répondre Y lorsque vous êtes invité à passer en mode avancé. L'invite du mode avancé s'affiche (*>).

    2. Enregistrez les « coredumps » : system node run -node local-node-name partner savecore

    3. Attendez que la commande `savecore'se termine avant d'émettre le retour.

      Vous pouvez saisir la commande suivante pour surveiller la progression de la commande savecore : system node run -node local-node-name partner savecore -s

    4. Retour au niveau de privilège admin : set -privilege admin

  5. Remettre le nœud :

    1. Depuis le nœud sain, remettre le stockage du nœud remplacé : storage failover giveback -ofnode replacement_node_name

      Le remplacement node reprend son stockage et termine son démarrage.

      Si vous êtes invité à remplacer l'ID système en raison d'une discordance d'ID système, vous devez entrer y.

      Remarque Si le retour est vetoté, vous pouvez envisager d'ignorer les vetoes.
    1. Une fois le retour arrière terminé, vérifiez que la paire HA est saine et que le basculement est possible : storage failover show

      La sortie du storage failover show la commande ne doit pas inclure le System ID changed on partner messagerie.

  6. Vérifier que les disques ont été correctement affectés : storage disk show -ownership

    Les disques appartenant au replace node doivent afficher le nouvel ID système. Dans l'exemple suivant, les disques appartenant au nœud1 affichent alors le nouvel ID système, 1873775277 :

    node1> `storage disk show -ownership`
    
    Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
    ----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
    1.0.0  aggr0_1  node1 node1  -        1873775277 1873775277  -       1873775277 Pool0
    1.0.1  aggr0_1  node1 node1           1873775277 1873775277  -       1873775277 Pool0
    .
    .
    .
  7. Si le système est dans une configuration MetroCluster, surveillez l'état du nœud : metrocluster node show

    La configuration MetroCluster prend quelques minutes après le remplacement pour revenir à un état normal. À ce moment, chaque nœud affiche un état configuré, avec la mise en miroir reprise sur incident activée et un mode de fonctionnement normal. Le metrocluster node show -fields node-systemid Le résultat de la commande affiche l'ancien ID système jusqu'à ce que la configuration MetroCluster revienne à un état normal.

  8. Si le nœud est dans une configuration MetroCluster, en fonction de l'état de la MetroCluster, vérifiez que le champ ID de domicile DR affiche le propriétaire d'origine du disque si le propriétaire d'origine est un nœud sur le site de secours.

    Ceci est requis si les deux conditions suivantes sont vraies :

  9. Si votre système se trouve dans une configuration MetroCluster, vérifiez que chaque nœud est configuré : metrocluster node show - fields configuration-state

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  10. Vérifiez que les volumes attendus sont présents pour chaque nœud : vol show -node node-name

  11. Si vous avez désactivé le basculement automatique au redémarrage, activez-le à partir du nœud sain : storage failover modify -node replacement-node-name -onreboot true

Option 2 : réattribuer un ID (configuration MetroCluster)
Réaffectez l'ID système dans une configuration MetroCluster à deux nœuds

Dans une configuration MetroCluster à deux nœuds exécutant ONTAP, vous devez réallouer manuellement des disques vers le nouvel ID système du contrôleur avant de rétablir le fonctionnement normal du système.

Description de la tâche

Cette procédure s'applique uniquement aux systèmes d'une configuration MetroCluster à deux nœuds exécutant ONTAP.

Vous devez être sûr d'exécuter les commandes dans cette procédure sur le nœud approprié :

  • Le noeud trouble est le noeud sur lequel vous effectuez la maintenance.

  • Le remplacement node est le nouveau noeud qui a remplacé le noeud douteux dans le cadre de cette procédure.

  • Le noeud Healthy est le partenaire DR du noeud douteux.

Étapes
  1. Si ce n'est déjà fait, redémarrez le replace node, interrompez le processus d'amorçage en entrant Ctrl-C, Puis sélectionnez l'option pour démarrer en mode maintenance à partir du menu affiché.

    Vous devez entrer Y Lorsque vous êtes invité à remplacer l'ID système en raison d'une discordance d'ID système.

  2. Afficher les anciens ID système du nœud sain : `metrocluster node show -fields node-systemid,dr-partenaire-systémid'

    Dans cet exemple, le noeud_B_1 est l'ancien noeud, avec l'ancien ID système 118073209:

    dr-group-id cluster         node                 node-systemid dr-partner-systemid
     ----------- --------------------- -------------------- ------------- -------------------
     1           Cluster_A             Node_A_1             536872914     118073209
     1           Cluster_B             Node_B_1             118073209     536872914
     2 entries were displayed.
  3. Afficher le nouvel ID système à l'invite du mode maintenance sur le nœud pour personnes avec facultés affaiblies : disk show

    Dans cet exemple, le nouvel ID système est 118065481 :

    Local System ID: 118065481
        ...
        ...
  4. Réassigner la propriété des disques (pour les systèmes FAS) ou la propriété LUN (pour les systèmes FlexArray), en utilisant les informations d'ID système obtenues via la commande disk show : disk reassign -s old system ID

    Dans l'exemple précédent, la commande est : disk reassign -s 118073209

    Vous pouvez répondre Y lorsque vous êtes invité à continuer.

  5. Vérifier que les disques (ou LUN FlexArray) ont été correctement affectés : disk show -a

    Vérifiez que les disques appartenant au replace node affichent le nouvel ID système pour le replace node. Dans l'exemple suivant, les disques appartenant au système-1 affichent désormais le nouvel ID système, 118065481 :

    *> disk show -a
    Local System ID: 118065481
    
      DISK     OWNER                 POOL   SERIAL NUMBER  HOME
    -------    -------------         -----  -------------  -------------
    disk_name   system-1  (118065481) Pool0  J8Y0TDZC       system-1  (118065481)
    disk_name   system-1  (118065481) Pool0  J8Y09DXC       system-1  (118065481)
    .
    .
    .
  6. Depuis le nœud sain, vérifier que les « core dumps » sont enregistrés :

    1. Changement au niveau de privilège avancé : set -privilege advanced

      Vous pouvez répondre Y lorsque vous êtes invité à passer en mode avancé. L'invite du mode avancé s'affiche (*>).

    2. Vérifier que les « coredumps » sont enregistrés : system node run -node local-node-name partner savecore

      Si la sortie de la commande indique que savecore est en cours, attendez que savecore soit terminé avant d'émettre le retour. Vous pouvez surveiller la progression de la sauvegarde à l'aide du system node run -node local-node-name partner savecore -s command.</info>.

    3. Retour au niveau de privilège admin : set -privilege admin

  7. Si le remplacement node est en mode Maintenance (affichage de l'invite *>), quittez le mode Maintenance et accédez à l'invite DU CHARGEUR : halt

  8. Démarrez le remplacement node : boot_ontap

  9. Une fois que le remplacement noeud a été complètement démarré, effectuez un rétablissement : metrocluster switchback

  10. Vérifiez la configuration MetroCluster : metrocluster node show - fields configuration-state

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  11. Vérifier le fonctionnement de la configuration MetroCluster dans Data ONTAP :

    1. Vérifier si des alertes d'intégrité sont disponibles sur les deux clusters : system health alert show

    2. Vérifier que le MetroCluster est configuré et en mode normal : metrocluster show

    3. Effectuer une vérification MetroCluster : metrocluster check run

    4. Afficher les résultats de la vérification MetroCluster : metrocluster check show

    5. Exécutez Config Advisor. Accédez à la page Config Advisor du site de support NetApp à l'adresse "support.netapp.com/NOW/download/tools/config_advisor/".

      Une fois Config Advisor exécuté, vérifiez les résultats de l'outil et suivez les recommandations fournies dans la sortie pour résoudre tous les problèmes détectés.

  12. Simuler une opération de basculement :

    1. Depuis l'invite de n'importe quel nœud, passez au niveau de privilège avancé : set -privilege advanced

      Vous devez répondre avec y lorsque vous êtes invité à passer en mode avancé et à afficher l'invite du mode avancé (*>).

    2. Effectuez l'opération de rétablissement avec le paramètre -Simulate : metrocluster switchover -simulate

    3. Retour au niveau de privilège admin : set -privilege admin

Étape 6 : renvoyer la pièce défaillante à NetApp

Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièces et remplacements" page pour plus d'informations.