La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacement d'une carte PCIe - AFF A300

07/10/2026 Contributeurs

PDF

Pour remplacer une carte PCIe, vous devez effectuer une séquence de tâches spécifique.

Cette procédure peut être utilisée avec toutes les versions de ONTAP prises en charge par votre système
Tous les autres composants du système doivent fonctionner correctement ; si ce n'est pas le cas, vous devez contacter le support technique.

Étape 1 : arrêtez le contrôleur défaillant

Vous pouvez arrêter ou reprendre le contrôleur défaillant en suivant différentes procédures, en fonction de la configuration matérielle du système de stockage.

Option 1 : plupart des configurations

Prenez le contrôle et arrêtez le contrôleur défaillant afin que le contrôleur fonctionnel continue de fournir les données provenant du stockage du contrôleur défaillant. Pour ce faire, vous supprimez la création automatique de cas dans AutoSupport, désactivez la restitution automatique et amenez le contrôleur défaillant à l'invite LOADER. L'invite LOADER correspond à l'état d'arrêt sécurisé à partir duquel vous pouvez remplacer la FRU.

Description de la tâche

Si vous disposez d'un système SAN, vous devez avoir vérifié les messages d'événement cluster kernel-service show) pour le serveur lame SCSI du contrôleur défectueux. `cluster kernel-service show`La commande (from priv mode Advanced) affiche le nom du nœud, son état de disponibilité et "état du quorum"son état de fonctionnement.

Chaque processus SCSI-Blade doit se trouver au quorum avec les autres nœuds du cluster. Tout problème doit être résolu avant de procéder au remplacement.
Si vous avez un cluster avec plus de deux nœuds, il doit être dans le quorum. Si le cluster n'est pas au quorum ou si un contrôleur en bonne santé affiche la valeur false pour l'éligibilité et la santé, vous devez corriger le problème avant de désactiver le contrôleur défaillant ; voir "Synchroniser un nœud avec le cluster".

Étapes

Si AutoSupport est activé, supprimez la création automatique de dossier en invoquant un message AutoSupport :

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

Cela empêche l'ouverture automatique de tickets d'assistance pendant votre fenêtre de maintenance planifiée. La durée maximale de suspension est de 72 heures. Si votre maintenance se termine plus tôt, vous pouvez réactiver la création de tickets en envoyant un AutoSupport message avec MAINT=END. Pour plus d'informations, consultez "Comment désactiver la création automatique de tickets pendant les fenêtres de maintenance planifiées".

Le message AutoSupport suivant supprime la création automatique de dossiers pendant deux heures :

cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
Désactiver le retour automatique :
1. Entrez la commande suivante depuis la console du contrôleur sain :
  
  storage failover modify -node impaired_node_name -auto-giveback false
2. Entrer y lorsque vous voyez l'invite Voulez-vous désactiver le retour automatique ?

Faites passer le contrôleur douteux à l'invite DU CHARGEUR :

Si le contrôleur en état de fonctionnement s'affiche… Alors…

Si le contrôleur en état de fonctionnement s'affiche…	Alors…
Invite DU CHARGEUR	Passez à l'étape suivante.
Attente du retour…	Appuyez sur Ctrl-C, puis répondez `y` lorsque vous y êtes invité.
Invite système ou invite de mot de passe	Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état : `storage failover takeover -ofnode impaired_node_name -halt true` Le paramètre -halt true vous amène à l'invite Loader.

Invite DU CHARGEUR

Passez à l'étape suivante.

Attente du retour…

Appuyez sur Ctrl-C, puis répondez y lorsque vous y êtes invité.

Invite système ou invite de mot de passe

Prendre le contrôle défectueux ou l'arrêter à partir du contrôleur en bon état :

storage failover takeover -ofnode impaired_node_name -halt true

Le paramètre -halt true vous amène à l'invite Loader.

Option 2 : le contrôleur est intégré à un MetroCluster à deux nœuds

Pour arrêter le contrôleur défaillant, vous devez déterminer l'état du contrôleur et, si nécessaire, basculer le contrôleur de sorte que ce dernier continue de transmettre des données depuis le stockage défaillant du contrôleur.

Description de la tâche

Vous devez laisser les alimentations allumées à l'issue de cette procédure pour fournir une alimentation au contrôleur en état.

Étapes

Vérifiez l'état du contrôleur MetroCluster pour déterminer si le contrôleur défectueux a automatiquement basculé sur le contrôleur en bon état : metrocluster show

Selon qu'un basculement automatique s'est produit, suivre le tableau suivant :

En cas de dysfonctionnement du contrôleur… Alors…

En cas de dysfonctionnement du contrôleur…	Alors…
A automatiquement basculé	Passez à l'étape suivante.
N'a pas été automatiquement commutée	Effectuer un basculement planifié à partir du contrôleur en bon état : `metrocluster switchover`
N'a pas été automatiquement commutée, vous avez tenté de basculer avec le `metrocluster switchover` la commande, et le basculement a été vetoté	Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

A automatiquement basculé

Passez à l'étape suivante.

N'a pas été automatiquement commutée

Effectuer un basculement planifié à partir du contrôleur en bon état : metrocluster switchover

N'a pas été automatiquement commutée, vous avez tenté de basculer avec le metrocluster switchover la commande, et le basculement a été vetoté

Examinez les messages de veto et, si possible, résolvez le problème et réessayez. Si vous ne parvenez pas à résoudre le problème, contactez le support technique.

Resynchroniser les agrégats de données en exécutant le metrocluster heal -phase aggregates commande provenant du cluster survivant.
```
controller_A_1::> metrocluster heal -phase aggregates
[Job 130] Job succeeded: Heal Aggregates is successful.
```
Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec -override-vetoes paramètre. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

Vérifiez que l'opération a été terminée à l'aide de la commande MetroCluster Operation show.

controller_A_1::> metrocluster operation show
    Operation: heal-aggregates
      State: successful
Start Time: 7/25/2016 18:45:55
   End Time: 7/25/2016 18:45:56
     Errors: -

Vérifier l'état des agrégats à l'aide de storage aggregate show commande.

controller_A_1::> storage aggregate show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...

Réparez les agrégats racine à l'aide de metrocluster heal -phase root-aggregates commande.
```
mcc1A::> metrocluster heal -phase root-aggregates
[Job 137] Job succeeded: Heal Root Aggregates is successful
```
Si la guérison est vetotée, vous avez la possibilité de réémettre le metrocluster heal commande avec le paramètre -override-vetos. Si vous utilisez ce paramètre facultatif, le système remplace tout veto logiciel qui empêche l'opération de correction.

Vérifier que l'opération de correction est terminée en utilisant le metrocluster operation show commande sur le cluster destination :

mcc1A::> metrocluster operation show
  Operation: heal-root-aggregates
      State: successful
 Start Time: 7/29/2016 20:54:41
   End Time: 7/29/2016 20:54:42
     Errors: -

Sur le module de contrôleur défaillant, débranchez les blocs d'alimentation.

Étape 2 : ouvrir le module de contrôleur

Pour accéder aux composants à l'intérieur du contrôleur, vous devez d'abord retirer le module de contrôleur du système, puis retirer le capot du module de contrôleur.

Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
Desserrez le crochet et la bride de boucle qui relient les câbles au périphérique de gestion des câbles, puis débranchez les câbles système et les SFP (si nécessaire) du module de contrôleur, en maintenant une trace de l'emplacement où les câbles ont été connectés.

Laissez les câbles dans le périphérique de gestion des câbles de sorte que lorsque vous réinstallez le périphérique de gestion des câbles, les câbles sont organisés.
Retirez et mettez de côté les dispositifs de gestion des câbles des côtés gauche et droit du module de contrôleur.
Desserrez la vis moletée sur la poignée de came du module de contrôleur.

Vis moletée

Poignée de came
Tirez la poignée de came vers le bas et commencez à faire glisser le module de contrôleur hors du châssis.

Assurez-vous de prendre en charge la partie inférieure du module de contrôleur lorsque vous le faites glisser hors du châssis.

Étape 3 : remplacer une carte PCIe

Pour remplacer une carte PCIe, localisez-la dans le contrôleur et suivez la séquence d'étapes spécifique.

Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
Desserrez la vis moletée sur le panneau latéral du module de contrôleur.
Faire pivoter le panneau latéral pour le retirer du module de contrôleur.

Panneau latéral

Carte PCIe
Retirez la carte PCIe du module de contrôleur et mettez-la de côté.

Installez la carte PCIe de remplacement.

Assurez-vous d'aligner correctement la carte dans la fente et d'exercer une pression uniforme sur la carte lorsqu'elle est insérée dans la prise. La carte PCIe doit être complètement et uniformément insérée dans le logement.

Si vous installez une carte dans le logement inférieur et que vous ne voyez pas bien le support de carte, retirez la carte supérieure de sorte que vous puissiez voir le support de carte, installer la carte, puis réinstaller la carte que vous avez retirée du logement supérieur.

Fermez le panneau latéral et serrez la vis à molette.

Étape 4 : réinstallez le contrôleur

Après avoir remplacé un composant dans le module de contrôleur, vous devez réinstaller le module de contrôleur dans le châssis du système et le démarrer.

Si vous n'êtes pas déjà mis à la terre, mettez-vous à la terre correctement.
Alignez l'extrémité du module de contrôleur avec l'ouverture du châssis, puis poussez doucement le module de contrôleur à mi-course dans le système.

N'insérez pas complètement le module de contrôleur dans le châssis tant qu'il n'y a pas été demandé.
Recâblage du système, selon les besoins.

Si vous avez retiré les convertisseurs de support (QSFP ou SFP), n'oubliez pas de les réinstaller si vous utilisez des câbles à fibre optique.

Terminez la réinstallation du module de contrôleur :

Le module de contrôleur commence à démarrer dès qu'il est complètement inséré dans le châssis.

Si votre système est en…

Ensuite, procédez comme suit…

Une paire haute disponibilité

Avec la poignée de came en position ouverte, poussez fermement le module de contrôleur jusqu'à ce qu'il rencontre le fond de panier et soit bien en place, puis fermez la poignée de came en position verrouillée. Serrez la vis moletée sur la poignée de came à l'arrière du module de contrôleur.

Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d'endommager les connecteurs.
Si ce n'est déjà fait, réinstallez le périphérique de gestion des câbles.
Si ce n'est déjà fait, reconnectez les câbles au module de contrôleur.
Fixez les câbles au dispositif de gestion des câbles à l'aide du crochet et de la sangle de boucle.

Configuration MetroCluster à deux nœuds

Avec la poignée de came en position ouverte, poussez fermement le module de contrôleur jusqu'à ce qu'il rencontre le fond de panier et soit bien en place, puis fermez la poignée de came en position verrouillée. Serrez la vis moletée sur la poignée de came à l'arrière du module de contrôleur.

Ne forcez pas trop lorsque vous faites glisser le module de contrôleur dans le châssis pour éviter d'endommager les connecteurs.
Si ce n'est déjà fait, réinstallez le périphérique de gestion des câbles.
Si ce n'est déjà fait, reconnectez les câbles au module de contrôleur.
Fixez les câbles au dispositif de gestion des câbles à l'aide du crochet et de la sangle de boucle.
Rebranchez les câbles d'alimentation aux blocs d'alimentation et aux sources d'alimentation, puis mettez le système sous tension pour démarrer le processus d'amorçage.

Si votre système est configuré pour prendre en charge l'interconnexion de cluster 10 GbE et les connexions de données sur les cartes réseau 40 GbE ou les ports intégrés, convertissez ces ports en connexions 10 GbE à l'aide de la commande nicadmin convert en mode Maintenance.

Assurez-vous de quitter le mode Maintenance après avoir terminé la conversion.

Faire revenir le contrôleur en mode de fonctionnement normal :

Si votre système est en… Exécutez cette commande depuis la console du partenaire…

Si votre système est en…	Exécutez cette commande depuis la console du partenaire…
Une paire haute disponibilité	`storage failover giveback -ofnode impaired_node_name`
Configuration MetroCluster à deux nœuds	Passez à l'étape suivante. La procédure de rétablissement MetroCluster est effectuée lors de la prochaine tâche du processus de remplacement.

Une paire haute disponibilité

storage failover giveback -ofnode impaired_node_name

Configuration MetroCluster à deux nœuds

Passez à l'étape suivante. La procédure de rétablissement MetroCluster est effectuée lors de la prochaine tâche du processus de remplacement.

Si le retour automatique a été désactivé, réactivez-le : storage failover modify -node local -auto-giveback true

Étape 5 (MetroCluster à deux nœuds uniquement) : agrégat de dos du switch

Cette tâche s'applique uniquement aux configurations MetroCluster à deux nœuds.

Étapes

Vérifiez que tous les nœuds sont dans le enabled état : metrocluster node show

cluster_B::>  metrocluster node show

DR                           Configuration  DR
Group Cluster Node           State          Mirroring Mode
----- ------- -------------- -------------- --------- --------------------
1     cluster_A
              controller_A_1 configured     enabled   heal roots completed
      cluster_B
              controller_B_1 configured     enabled   waiting for switchback recovery
2 entries were displayed.

Vérifier que la resynchronisation est terminée sur tous les SVM : metrocluster vserver show
Vérifier que toutes les migrations LIF automatiques effectuées par les opérations de correction ont été effectuées correctement : metrocluster check lif show
Effectuez le rétablissement en utilisant le metrocluster switchback utilisez une commande à partir d'un nœud du cluster survivant.

Vérifiez que l'opération de rétablissement est terminée : metrocluster show

L'opération de rétablissement s'exécute toujours lorsqu'un cluster est dans waiting-for-switchback état :

cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured       	switchover
Remote: cluster_A configured       	waiting-for-switchback

Le rétablissement est terminé une fois les clusters dans normal état :

cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured      		normal
Remote: cluster_A configured      		normal

Si un rétablissement prend beaucoup de temps, vous pouvez vérifier l'état des lignes de base en cours en utilisant le metrocluster config-replication resync-status show commande.

Rétablir toutes les configurations SnapMirror ou SnapVault.

Étape 6 : renvoyer la pièce défaillante à NetApp

Retournez la pièce défectueuse à NetApp, tel que décrit dans les instructions RMA (retour de matériel) fournies avec le kit. Voir la "Retour de pièces et remplacements" page pour plus d'informations.

Remplacement d'une carte PCIe - AFF A300

Creating your file...

Étape 1 : arrêtez le contrôleur défaillant

Étape 2 : ouvrir le module de contrôleur

Étape 3 : remplacer une carte PCIe

Étape 4 : réinstallez le contrôleur

Étape 5 (MetroCluster à deux nœuds uniquement) : agrégat de dos du switch

Étape 6 : renvoyer la pièce défaillante à NetApp