Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacez un module DIMM - AFF A300

Contributeurs

Vous devez remplacer un module DIMM dans le module de contrôleur lorsque votre système enregistre un nombre croissant de codes de correction d'erreurs (ECC) pouvant être corrigés ; dans le cas contraire, le système risque de se trouver en panne.

Tous les autres composants du système doivent fonctionner correctement ; si ce n'est pas le cas, vous devez contacter le support technique.

Vous devez remplacer le composant défectueux par un composant FRU de remplacement que vous avez reçu de votre fournisseur.

Étape 1 : arrêtez le contrôleur défaillant

Arrêtez ou prenez le contrôleur défaillant en suivant la procédure appropriée pour votre configuration.

Option 1 : plupart des configurations

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.

Description de la tâche
  • Si vous disposez d'un système SAN, vous devez avoir vérifié les messages d'événement cluster kernel-service show) Pour la lame SCSI du contrôleur altérée. Le cluster kernel-service show commande affiche le nom du nœud, l'état quorum du nœud concerné, l'état de disponibilité de ce nœud et l'état opérationnel de ce nœud.

    Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.

  • Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".

Étapes
  1. Si AutoSupport est activé, supprimez la création automatique de dossier en invoquant un message AutoSupport : system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh

    Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures : cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Désactiver le rétablissement automatique depuis la console du contrôleur sain : storage failover modify –node local -auto-giveback false

    Remarque Lorsque vous voyez voulez-vous désactiver l'auto-giveback?, entrez y.
  3. Faites passer le contrôleur douteux à l'invite DU CHARGEUR :

    Si le contrôleur en état de fonctionnement s'affiche…​ Alors…​

    Invite DU CHARGEUR

    Passez à l'étape suivante.

    Attente du retour…​

    Appuyez sur Ctrl-C, puis répondez y lorsque vous y êtes invité.

    Invite système ou invite de mot de passe

    Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état : storage failover takeover -ofnode impaired_node_name

    Lorsque le contrôleur douteux s'affiche en attente de rétablissement…​, appuyez sur Ctrl-C et répondez y.

Option 2 : le contrôleur est intégré à un MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche
  • Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes
  1. Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

  2. Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

    En cas de dysfonctionnement du contrôleur…​ Alors…​

    A automatiquement basculé

    Passez à l'étape suivante.

    N'a pas été automatiquement commutée

    Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

    N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

    Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

  3. Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  4. Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  7. Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.

Étape 2 : ouvrir le module de contrôleur

Pour accéder aux composants à l'intérieur du contrôleur, vous devez d'abord retirer le module de contrôleur du système, puis retirer le capot du module de contrôleur.

  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Desserrez le crochet et la bride de boucle qui relient les câbles au périphérique de gestion des câbles, puis débranchez les câbles système et les SFP (si nécessaire) du module de contrôleur, en maintenant une trace de l'emplacement où les câbles ont été connectés.

    Laissez les câbles dans le périphérique de gestion des câbles de sorte que lorsque vous réinstallez le périphérique de gestion des câbles, les câbles sont organisés.

  3. Retirez et mettez de côté les dispositifs de gestion des câbles des côtés gauche et droit du module de contrôleur.

    drw 32xx gestion cbl ARM
  4. Desserrez la vis moletée sur la poignée de came du module de contrôleur.

    vis moletée de la poignée de came drw 8020

    Légende numéro 1

    Vis moletée

    Légende numéro 2

    Poignée de came

  5. Tirez la poignée de came vers le bas et commencez à faire glisser le module de contrôleur hors du châssis.

    Assurez-vous de prendre en charge la partie inférieure du module de contrôleur lorsque vous le faites glisser hors du châssis.

Étape 3 : remplacez les modules DIMM

Pour remplacer les modules DIMM, localisez-les à l'intérieur du contrôleur et suivez l'ordre des étapes.

  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Vérifiez le voyant NVMEM sur le module de contrôleur.

    Vous devez effectuer un arrêt correct du système avant de remplacer les composants du système pour éviter de perdre des données non écrites dans la mémoire non volatile (NVMEM). La LED se trouve à l'arrière du module de contrôleur. Recherchez l'icône suivante :

    icône drw hw nvram
  3. Si la LED NVMEM ne clignote pas, il n'y a pas de contenu dans la NVMEM ; vous pouvez passer aux étapes suivantes et passer à la tâche suivante de cette procédure.

  4. Débranchez la batterie :

    Remarque Le voyant NVMEM clignote lors de la transfert du contenu vers la mémoire flash lorsque vous arrêtez le système. Une fois le transfert terminé, le voyant s'éteint.
    • Si l'alimentation est perdue sans arrêt correct, la LED NVMEM clignote jusqu'à ce que le transfert soit terminé, puis la LED s'éteint.

    • Si le voyant est allumé et que l'alimentation est allumée, les données non écrites sont stockées sur NVMEM.

      Cela se produit généralement lors d'un arrêt non contrôlé après le démarrage du système Data ONTAP.

      1. Ouvrez le conduit d'air de la CPU et localisez la batterie NVMEM.

        batterie rxl nvmem drw

    Légende numéro 1

    Onglet de verrouillage de la batterie NVMEM

    Légende numéro 2

    Batterie NVMEM

    1. Localisez la fiche mâle batterie et appuyez sur le clip situé sur la face de la fiche mâle batterie pour libérer la fiche de la prise, puis débranchez le câble de batterie de la prise.

    2. Patientez quelques secondes, puis rebranchez la batterie dans la prise.

  5. Revenez à l'étape 2 de cette procédure pour vérifier à nouveau la LED NVMEM.

  6. Localisez les modules DIMM de votre module de contrôleur.

  7. Notez l'orientation du module DIMM dans le support afin que vous puissiez insérer le module DIMM de remplacement dans le bon sens.

  8. Éjectez le module DIMM de son logement en écartant lentement les deux languettes de l'éjecteur de DIMM de chaque côté du module DIMM, puis en faisant glisser le module DIMM hors de son logement.

    Remarque Tenez soigneusement le module DIMM par les bords pour éviter toute pression sur les composants de la carte de circuit DIMM.

    Le nombre et le positionnement des modules DIMM du système dépendent du modèle de votre système.

    L'illustration suivante montre l'emplacement des DIMM système :

    dimm rxl drw
  9. Retirez le module DIMM de remplacement du sac d'expédition antistatique, tenez le module DIMM par les coins et alignez-le sur le logement.

    L'encoche entre les broches du DIMM doit être alignée avec la languette du support.

  10. Assurez-vous que les languettes de l'éjecteur de DIMM sur le connecteur sont en position ouverte, puis insérez le module DIMM directement dans le logement.

    Le module DIMM s'insère bien dans le logement, mais devrait être facilement installé. Si ce n'est pas le cas, réalignez le module DIMM avec le logement et réinsérez-le.

    Remarque Inspectez visuellement le module DIMM pour vérifier qu'il est bien aligné et complètement inséré dans le logement.
  11. Poussez délicatement, mais fermement, sur le bord supérieur du module DIMM jusqu'à ce que les languettes de l'éjecteur s'enclenchent sur les encoches situées aux extrémités du module DIMM.

  12. Localisez la prise de la batterie NVMEM, puis appuyez sur le clip situé sur la face de la fiche du câble de la batterie pour l'insérer dans la prise.

    Assurez-vous que la fiche se verrouille sur le module de contrôleur.

  13. Fermez le capot du module de contrôleur.

Étape 4 : réinstallez le contrôleur

Après avoir remplacé un composant du module de contrôleur, vous devez réinstaller le module de contrôleur dans le châssis du système.

  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Alignez l'extrémité du module de contrôleur avec l'ouverture du châssis, puis poussez doucement le module de contrôleur à mi-course dans le système.

    Remarque N'insérez pas complètement le module de contrôleur dans le châssis tant qu'il n'y a pas été demandé.
  3. Recâblage du système, selon les besoins.

    Si vous avez retiré les convertisseurs de support (QSFP ou SFP), n'oubliez pas de les réinstaller si vous utilisez des câbles à fibre optique.

  4. Terminez la réinstallation du module de contrôleur :

    Le module de contrôleur commence à démarrer dès qu'il est complètement inséré dans le châssis.

    1. Avec la poignée de came en position ouverte, poussez fermement le module de contrôleur jusqu'à ce qu'il rencontre le fond de panier et soit bien en place, puis fermez la poignée de came en position verrouillée.

      Remarque Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d'endommager les connecteurs.
    2. Serrez la vis moletée sur la poignée de came à l'arrière du module de contrôleur.

    3. Si ce n'est déjà fait, réinstallez le périphérique de gestion des câbles.

    4. Fixez les câbles au dispositif de gestion des câbles à l'aide du crochet et de la sangle de boucle.

Étape 5 : (MetroCluster à deux nœuds uniquement) : basculement des agrégats

Après avoir terminé le remplacement des unités remplaçables sur site dans une configuration MetroCluster à deux nœuds, vous pouvez exécuter l'opération de rétablissement MetroCluster. Cette configuration renvoie la configuration à son état de fonctionnement normal, avec les SVM (Storage Virtual machines) source et sur le site précédemment douteux actifs et peuvent accéder aux données des pools de disques locaux.

Cette tâche s'applique uniquement aux configurations MetroCluster à deux nœuds.

Étapes
  1. Vérifiez que tous les nœuds sont dans le enabled état : metrocluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. Vérifier que la resynchronisation est terminée sur tous les SVM : metrocluster vserver show

  3. Vérifier que toutes les migrations LIF automatiques effectuées par les opérations de correction ont été effectuées correctement : metrocluster check lif show

  4. Effectuez le rétablissement en utilisant le metrocluster switchback utilisez une commande à partir d'un nœud du cluster survivant.

  5. Vérifiez que l'opération de rétablissement est terminée : metrocluster show

    L'opération de rétablissement s'exécute toujours lorsqu'un cluster est dans waiting-for-switchback état :

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    Le rétablissement est terminé une fois les clusters dans normal état :

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    Si un rétablissement prend beaucoup de temps, vous pouvez vérifier l'état des lignes de base en cours en utilisant le metrocluster config-replication resync-status show commande.

  6. Rétablir toutes les configurations SnapMirror ou SnapVault.

Étape 6 : renvoyer la pièce défaillante à NetApp

Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièce et amp ; remplacements" pour plus d'informations.