Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacez une carte PCIe ou mezzanine - AFF C400

Contributeurs

Pour remplacer une carte PCIe ou mezzanine, déconnectez les câbles et tous les modules SFP et QSFP des cartes, remplacez la carte PCIe ou mezzanine défectueuse, puis recâble les cartes.

  • Cette procédure peut être utilisée avec toutes les versions de ONTAP prises en charge par votre système

  • Tous les autres composants du système doivent fonctionner correctement ; si ce n'est pas le cas, vous devez contacter le support technique.

Étape 1 : arrêtez le contrôleur défaillant

Vous pouvez arrêter ou reprendre le contrôleur défaillant en suivant différentes procédures, en fonction de la configuration matérielle du système de stockage.

Option 1 : plupart des configurations

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, prendre le contrôle de façon à ce que le contrôleur en bonne santé continue de transmettre des données provenant du stockage défaillant du contrôleur.

Description de la tâche
  • Si vous utilisez NetApp Storage Encryption, vous devez avoir réinitialisé le MSID en suivant les instructions de la section "Retour des disques SED en mode non protégé".

  • Si vous disposez d'un système SAN, vous devez avoir vérifié les messages d'événement cluster kernel-service show) Pour la lame SCSI du contrôleur altérée. Le cluster kernel-service show commande affiche le nom du nœud, l'état quorum du nœud concerné, l'état de disponibilité de ce nœud et l'état opérationnel de ce nœud.

    Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.

  • Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".

Étapes
  1. Si AutoSupport est activé, supprimez la création automatique de dossier en invoquant un message AutoSupport : system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh

    Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures : cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Désactiver le rétablissement automatique depuis la console du contrôleur sain : storage failover modify –node local -auto-giveback false

    Remarque Lorsque vous voyez voulez-vous désactiver l'auto-giveback?, entrez y.
  3. Faites passer le contrôleur douteux à l'invite DU CHARGEUR :

    Si le contrôleur en état de fonctionnement s'affiche…​ Alors…​

    Invite DU CHARGEUR

    Passez à l'étape suivante.

    Attente du retour…​

    Appuyez sur Ctrl-C, puis répondez y lorsque vous y êtes invité.

    Invite système ou invite de mot de passe

    Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état : storage failover takeover -ofnode impaired_node_name

    Lorsque le contrôleur douteux s'affiche en attente de rétablissement…​, appuyez sur Ctrl-C et répondez y.

Option 2 : le contrôleur est intégré à un MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche
  • Si vous utilisez NetApp Storage Encryption, vous devez avoir réinitialisé le MSID à l'aide des instructions de la section « Return a FIPS drive or SED to Unprotected mode » de "Présentation du chiffrement NetApp avec l'interface de ligne de commande".

  • Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes
  1. Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

  2. Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

    En cas de dysfonctionnement du contrôleur…​ Alors…​

    A automatiquement basculé

    Passez à l'étape suivante.

    N'a pas été automatiquement commutée

    Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

    N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

    Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

  3. Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  4. Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

  7. Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.

Étape 2 : retirer le module de contrôleur

Pour accéder aux composants à l'intérieur du module de contrôleur, vous devez retirer le module de contrôleur du châssis.

  1. Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.

  2. Libérez les dispositifs de retenue du câble d'alimentation, puis débranchez les câbles des blocs d'alimentation.

  3. Desserrez le crochet et la bride de boucle qui relient les câbles au périphérique de gestion des câbles, puis débranchez les câbles système et les SFP (si nécessaire) du module de contrôleur, en maintenant une trace de l'emplacement où les câbles ont été connectés.

    Laissez les câbles dans le périphérique de gestion des câbles de sorte que lorsque vous réinstallez le périphérique de gestion des câbles, les câbles sont organisés.

  4. Retirez le périphérique de gestion des câbles du module de contrôleur et mettez-le de côté.

  5. Appuyez sur les deux loquets de verrouillage, puis faites pivoter les deux loquets vers le bas en même temps.

    Le module de contrôleur se déplace légèrement hors du châssis.

    drw c400 retirer le contrôleur IEOPS 1216

    Légende numéro 1

    Loquets de verrouillage

    Légende numéro 2

    Le contrôleur sort légèrement du châssis

  6. Faites glisser le module de contrôleur hors du châssis.

    Assurez-vous de prendre en charge la partie inférieure du module de contrôleur lorsque vous le faites glisser hors du châssis.

  7. Placez le module de commande sur une surface plane et stable.

Étape 3 : remplacer une carte PCIe

Pour remplacer une carte PCIe, vous devez localiser la carte PCIe défectueuse, retirer la carte de montage qui contient la carte du module de contrôleur, remplacer la carte, puis réinstaller la carte de montage PCIe dans le module de contrôleur.

Vous pouvez utiliser l'animation, l'illustration ou les étapes écrites suivantes pour remplacer une carte PCIe.

Animation - remplacer une carte PCIe

largeur=500 px

Légende numéro 1

Loquet de verrouillage de la rehausse

Légende numéro 2

Loquet de verrouillage de la carte PCI

Numéro de légende 3

Plaque de verrouillage PCI

Numéro de légende 4

Carte PCI

  1. Retirez la carte de montage contenant la carte à remplacer :

    1. Ouvrez le conduit d'air en appuyant sur les pattes de verrouillage situées sur les côtés du conduit d'air, faites-le glisser vers l'arrière du module de contrôleur, puis faites-le tourner jusqu'à sa position complètement ouverte.

    2. Retirez tous les modules SFP ou QSFP qui peuvent se trouver dans les cartes PCIe.

    3. Faites pivoter le loquet de verrouillage de la rehausse sur le côté gauche de la rehausse vers le haut et vers le conduit d'air.

      La carte de montage se soulève légèrement du module de contrôleur.

    4. Soulevez le montant droit et mettez-le de côté sur une surface plane stable,

  2. Retirez la carte PCIe de la carte de montage :

    1. Tournez la carte de montage pour accéder à la carte PCIe.

    2. Appuyez sur le support de verrouillage situé sur le côté de la carte de montage PCIe, puis faites-le pivoter en position ouverte.

    3. Pour les surmontoirs 2 et 3 uniquement, faites pivoter le panneau latéral vers le haut.

    4. Retirez la carte PCIe de la carte de montage en poussant doucement vers le haut sur le support et en la soulevant hors du support.

  3. Installez la carte PCIe de remplacement dans la carte de montage en alignant la carte avec le support, appuyez sur la carte dans le support, puis fermez le panneau latéral de la carte de montage, le cas échéant.

    Assurez-vous d'aligner correctement la carte dans la fente et d'exercer une pression uniforme sur la carte lorsqu'elle est insérée dans la prise. La carte PCIe doit être complètement et uniformément insérée dans le logement.

    Remarque Si vous installez une carte dans le logement inférieur et que vous ne voyez pas bien le support de carte, retirez la carte supérieure de sorte que vous puissiez voir le support de carte, installer la carte, puis réinstaller la carte que vous avez retirée du logement supérieur.
  4. Réinstallez la carte de montage :

    1. Alignez la carte de montage avec les broches sur le côté du support de montage, abaissez la carte de montage sur les broches.

    2. Poussez la carte de montage directement dans la prise de la carte mère.

    3. Faites pivoter le loquet vers le bas au ras de la tôle de la rehausse.

Étape 4 : remplacer la carte mezzanine

La carte mezzanine se trouve sous la carte de montage numéro 3 (logements 4 et 5). Vous devez retirer cette carte de montage pour accéder à la carte mezzanine, remplacer la carte mezzanine, puis réinstaller le numéro de montage 3. Voir le mappage des FRU sur le module de contrôleur pour plus d'informations.

Vous pouvez utiliser l'animation, l'illustration ou les étapes écrites suivantes pour remplacer la carte mezzanine.

Animation : remplacez la carte mezzanine
drw c400 remplacer la carte mezz IOPS 1236

Légende numéro 1

Carte de montage PCI

Légende numéro 2

Vis moletée de la carte de montage

Numéro de légende 3

Carte de montage

  1. Retirez la carte de montage numéro 3 (emplacements 4 et 5) :

    1. Ouvrez le conduit d'air en appuyant sur les pattes de verrouillage situées sur les côtés du conduit d'air, faites-le glisser vers l'arrière du module de contrôleur, puis faites-le tourner jusqu'à sa position complètement ouverte.

    2. Retirez tous les modules SFP ou QSFP qui peuvent se trouver dans les cartes PCIe.

    3. Faites pivoter le loquet de verrouillage de la rehausse sur le côté gauche de la rehausse vers le haut et vers le conduit d'air.

      La carte de montage se soulève légèrement du module de contrôleur.

    4. Soulevez la rehausse, puis mettez-la de côté sur une surface plane et stable.

  2. Remplacez la carte mezzanine :

    1. Retirez tous les modules QSFP ou SFP de la carte.

    2. Desserrez les vis moletées de la carte mezzanine, soulevez doucement la carte pour la retirer du support et mettez-la de côté.

    3. Alignez la carte mezzanine de remplacement sur le support et les broches de guidage, puis poussez doucement la carte dans le support.

    4. Serrez les vis moletées sur la carte mezzanine.

  3. Réinstallez la carte de montage :

    1. Alignez la carte de montage avec les broches sur le côté du support de montage, abaissez la carte de montage sur les broches.

    2. Poussez la carte de montage directement dans la prise de la carte mère.

    3. Faites pivoter le loquet vers le bas au ras de la tôle de la rehausse.

Étape 5 : installer le module de contrôleur

Après avoir remplacé le composant du module de contrôleur, vous devez réinstaller le module de contrôleur dans le châssis, puis le démarrer en mode Maintenance.

  1. Si ce n'est déjà fait, fermer le conduit d'air.

  2. Alignez l'extrémité du module de contrôleur avec l'ouverture du châssis, puis poussez doucement le module de contrôleur à mi-course dans le système.

    Remarque N'insérez pas complètement le module de contrôleur dans le châssis tant qu'il n'y a pas été demandé.
  3. Recâblage du système, selon les besoins.

    Si vous avez retiré les convertisseurs de support (QSFP ou SFP), n'oubliez pas de les réinstaller si vous utilisez des câbles à fibre optique.

  4. Terminez l'installation du module de contrôleur :

    1. Branchez le cordon d'alimentation dans le bloc d'alimentation, réinstallez le collier de verrouillage du câble d'alimentation, puis connectez le bloc d'alimentation à la source d'alimentation.

    2. A l'aide des loquets de verrouillage, poussez fermement le module de contrôleur dans le châssis jusqu'à ce qu'il rencontre le fond de panier central et qu'il soit bien en place.

      Les loquets de verrouillage se montent lorsque le module de contrôleur est bien en place.

      Remarque Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d'endommager les connecteurs.

    Le module de contrôleur commence à démarrer dès qu'il est complètement inséré dans le châssis. Soyez prêt à interrompre le processus de démarrage.

    1. Insérez complètement le module de commande dans le châssis en faisant tourner les loquets de verrouillage vers le haut, en les inclinant de manière à dégager les goupilles de verrouillage, poussez doucement le contrôleur complètement vers l'intérieur, puis abaissez les loquets de verrouillage en position verrouillée.

    2. Si ce n'est déjà fait, réinstallez le périphérique de gestion des câbles.

    3. Interrompez le processus de démarrage normal et démarrez vers LE CHARGEUR en appuyant sur Ctrl-C.

      Remarque Si votre système s'arrête au menu de démarrage, sélectionnez l'option de démarrage pour DÉMARRER le CHARGEUR.
    4. À l'invite DU CHARGEUR, entrez bye Pour réinitialiser les cartes PCIe et d'autres composants et laisser le contrôleur redémarrer.

  5. Rétablir le fonctionnement normal du contrôleur en renvoie son espace de stockage : storage failover giveback -ofnode impaired_node_name

  6. Si le retour automatique a été désactivé, réactivez-le : storage failover modify -node local -auto-giveback true

Étape 6 : rétablir le fonctionnement du module de contrôleur

Pour restaurer le contrôleur, vous devez refaire le système, remettre le module de contrôleur, puis réactiver le rétablissement automatique.

  1. Recâblage du système, selon les besoins.

    Si vous avez retiré les convertisseurs de support (QSFP ou SFP), n'oubliez pas de les réinstaller si vous utilisez des câbles à fibre optique.

  2. Rétablir le fonctionnement normal du contrôleur en renvoie son espace de stockage : storage failover giveback -ofnode impaired_node_name

  3. Si le retour automatique a été désactivé, réactivez-le : storage failover modify -node local -auto-giveback true

Étape 7 : retournez les agrégats via une configuration MetroCluster à deux nœuds

Après avoir terminé le remplacement des unités remplaçables sur site dans une configuration MetroCluster à deux nœuds, vous pouvez exécuter l'opération de rétablissement MetroCluster. Cette configuration renvoie la configuration à son état de fonctionnement normal, avec les SVM (Storage Virtual machines) source et sur le site précédemment douteux actifs et peuvent accéder aux données des pools de disques locaux.

Cette tâche s'applique uniquement aux configurations MetroCluster à deux nœuds.

Étapes
  1. Vérifiez que tous les nœuds sont dans le enabled état : metrocluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. Vérifier que la resynchronisation est terminée sur tous les SVM : metrocluster vserver show

  3. Vérifier que toutes les migrations LIF automatiques effectuées par les opérations de correction ont été effectuées correctement : metrocluster check lif show

  4. Effectuez le rétablissement en utilisant le metrocluster switchback utilisez une commande à partir d'un nœud du cluster survivant.

  5. Vérifiez que l'opération de rétablissement est terminée : metrocluster show

    L'opération de rétablissement s'exécute toujours lorsqu'un cluster est dans waiting-for-switchback état :

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    Le rétablissement est terminé une fois les clusters dans normal état :

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    Si un rétablissement prend beaucoup de temps, vous pouvez vérifier l'état des lignes de base en cours en utilisant le metrocluster config-replication resync-status show commande.

  6. Rétablir toutes les configurations SnapMirror ou SnapVault.

Étape 8 : renvoyer la pièce défaillante à NetApp

Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièce et amp ; remplacements" pour plus d'informations.