Skip to main content
Une version plus récente de ce produit est disponible.
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Remplacez les modules DIMM dans les nœuds de calcul

Contributeurs

Vous pouvez remplacer un module DIMM (Dual Inline Memory module) défectueux dans les nœuds de calcul NetApp HCI au lieu de remplacer le nœud entier.

Ce dont vous avez besoin
  • Avant de commencer cette procédure, vous devez avoir contacté le support NetApp et reçu une pièce de rechange. Le support sera impliqué pendant l'installation du remplacement. Si ce n'est déjà fait, contactez "Assistance".

  • Vous avez planifié de temps d'indisponibilité du système, car vous devez mettre le nœud hors tension ou le mettre hors tension puis sous tension et démarrer le nœud en mode sans échec NetApp pour accéder à l'interface utilisateur du terminal (TUI).

Description de la tâche

Cette procédure s'applique aux modèles de nœud de calcul suivants :

  • Nœuds H410C. Un nœud H410C est inséré dans un châssis NetApp HCI 2U.

  • Nœud H610C Un nœud H610C est intégré dans le châssis.

  • Nœud H615C. Un nœud H615C est intégré au châssis.

    Important Les nœuds H410C et H615C incluent les modules DIMM de différents fournisseurs. Veillez à ne pas mélanger des modules DIMM de différents fournisseurs dans un châssis.
    Remarque Les termes « châssis » et « nœud » sont utilisés de manière interchangeable dans les cas de H610C et de l'H615C, car les nœuds et les châssis ne sont pas des composants distincts.

Voici les étapes du remplacement des modules DIMM dans les nœuds de calcul :

Préparez-vous à remplacer le module DIMM

En cas de problème avec le module DIMM, VMware ESXi affiche des alertes, par exemple Memory Configuration Error, Memory Uncorrectable ECC, Memory Transition to Critical, et Memory Critical Overtemperature. Même si les alertes disparaissent après un certain temps, le problème matériel peut persister. Vous devez diagnostiquer et corriger le module DIMM défectueux. Vous pouvez obtenir des informations sur le module DIMM défectueux à partir de vCenter Server. Si vous avez besoin de plus d'informations que ce qui est disponible dans vCenter Server, vous devez exécuter la vérification matérielle dans l'interface TUI.

Étapes
  1. Identifiez l'emplacement qui a consigné l'erreur comme suit :

    1. Pour l'H615C :

      1. Connectez-vous à l'interface utilisateur du contrôleur BMC.

      2. Sélectionnez journaux et rapports > Journal d'événements IPMI.

      3. Dans le journal des événements, recherchez l'erreur de mémoire et identifiez l'emplacement sur lequel l'erreur est consignée.

        La présente l'erreur de mémoire non réparable dans l'interface utilisateur BMC pour les nœuds H615C
    2. Pour H410C, procédez comme suit :

      1. Connectez-vous à l'interface utilisateur du contrôleur BMC.

      2. Sélectionnez Server Health > Health Event Log.

      3. Dans le journal des événements, recherchez l'erreur de mémoire et identifiez l'emplacement sur lequel l'erreur est consignée.

        Affiche l'erreur de mémoire dans l'interface utilisateur BMC du nœud H410C.
  2. Procédez comme suit pour identifier le numéro de référence du fabricant du module DIMM.

    Important Les nœuds H410C et H615C incluent des modules DIMM provenant de différents fabricants. Vous ne devez pas combiner différents types de modules DIMM dans le même châssis. Vous devez identifier le fabricant du module DIMM défectueux et commander un remplacement du même type.
    1. Connectez-vous au BMC pour lancer la console sur le nœud.

    2. Appuyez sur F2 sur le clavier pour accéder au menu Personnaliser le système/Afficher les journaux.

    3. Saisissez le mot de passe lorsque vous y êtes invité.

      Remarque Le mot de passe doit correspondre à celui que vous avez configuré dans le moteur de déploiement NetApp lors de la configuration de NetApp HCI.
    Affiche la fenêtre pour saisir le mot de passe pour vous connecter à la console du nœud.
    1. Dans le menu Personnalisation du système, appuyez sur la flèche vers le bas pour accéder aux Options de dépannage, puis appuyez sur entrée.

      Affiche le menu Personnalisation du système.
    2. Dans le menu Options du mode de dépannage, utilisez la flèche vers le haut ou vers le bas pour activer le shell ESXi et SSH, qui sont désactivés par défaut.

    3. Appuyez deux fois sur la touche <Esc> pour quitter les options de dépannage.

    4. Exécutez le smbiosDump utilisez l'une des options suivantes :

      Option Étapes

      Option A

      1. Connectez-vous à l'hôte ESXi (nœud de calcul) à l'aide de l'adresse IP de l'hôte et des informations d'identification root que vous avez définies.

      2. Exécutez le smbiosDump commande. Voir l'exemple de sortie suivant :

      `Memory Device:#30
      Location: "P1-DIMMA1"
      Bank: "P0_Node0_Channel0_Dimm0"
      Manufacturer:"Samsung"
      Serial: "38EB8380"
      Asset Tag: "P1-DIMMA1_AssetTag (date:18/15)"
      Part Number: "M393A4K40CB2-CTD"
      Memory Array: #29
      Form Factor: 0x09(DIMM)
      Type: 0x1a (DDR4)
      Type Detail: 0x0080 (Synchronous)
      Data Width: 64 bits (+8 ECC bits)
      Size: 32 GB`

      Option B

      1. Appuyez sur Alt + F1 pour entrer le shell et connectez-vous au nœud pour exécuter la commande.

  3. Contactez le support NetApp pour obtenir de l'aide lors des étapes suivantes. Le support NetApp nécessite les informations suivantes pour traiter le remplacement d'une pièce :

    • Numéro de série du nœud

    • Nom du cluster

    • Détails du journal des événements système à partir de l'interface utilisateur BMC

    • Sortie du smbiosDump commande

Remplacez le module DIMM du châssis

Avant de retirer et de remplacer physiquement le module DIMM défectueux dans le châssis, vérifiez que vous avez effectué toutes les opérations de "étapes préparatoires".

Important Les modules DIMM doivent être remplacés dans les emplacements où ils ont été retirés.
Étapes
  1. Accédez au nœud en vous connectant à vCenter Server.

  2. Cliquez avec le bouton droit de la souris sur le nœud signalant l'erreur, puis sélectionnez l'option pour placer le nœud en mode maintenance.

  3. Migrez les machines virtuelles vers un autre hôte disponible.

    Remarque Pour connaître les étapes de migration, reportez-vous à la documentation VMware.
  4. Mettez le châssis ou le nœud hors tension.

    Remarque Dans le cas d'un châssis H610C ou H615C, mettez le châssis hors tension. Pour les nœuds H410C dans un châssis 2U à quatre nœuds, mettez uniquement le nœud hors tension lorsque le module DIMM est défectueux.
  5. Retirez les câbles d'alimentation et les câbles réseau, faites glisser avec précaution le nœud ou le châssis hors du rack et placez-le sur une surface plane et antistatique.

    Astuce Pensez à utiliser des serre-câbles pour les câbles.
  6. Mettez la protection antistatique avant d'ouvrir le capot du châssis pour remplacer le module DIMM.

  7. Effectuez les étapes pertinentes pour votre modèle de nœud :

    Modèle de nœud Étapes

    H410C

    1. Recherchez le module DIMM défectueux en faisant correspondre le numéro/l'ID de logement que vous avez noté précédemment avec la numérotation sur la carte mère. Voici quelques exemples d'images montrant les numéros des emplacements DIMM sur la carte mère :

      La montre les numéros des emplacements DIMM sur la carte mère du nœud H410C.
      La montre une vue rapprochée des numéros des emplacements DIMM sur la carte mère du nœud H410C.
    2. Appuyez sur les deux clips de fixation vers l'extérieur et tirez doucement le DIMM vers le haut. Voici un exemple d'image montrant les clips de retenue :

      La illustre les clips de fixation des DIMM du nœud H410C.
    3. Installez correctement le module DIMM de remplacement. Lorsque vous insérez correctement le DIMM dans le logement, les deux clips se verrouillent en place.

      Important Assurez-vous que vous ne touchez que les extrémités arrière du module DIMM. Si vous appuyez sur d'autres parties du module DIMM, le matériel risque d'être endommagé.
    4. Installez le nœud dans le châssis NetApp HCI, en veillant à ce que ce dernier s'enclenche lorsque vous le faites glisser.

    H610C

    1. Soulevez le capot comme indiqué sur l'image suivante :

      La représente le couvercle levé sur le nœud H610C.
    2. Desserrez les quatre vis de blocage bleues à l'arrière du nœud. Voici un exemple d'image montrant l'emplacement des deux vis de blocage ; vous trouverez les deux autres sur l'autre côté du nœud :

      La représente les vis de blocage à l'arrière du nœud H610C.
    3. Retirez les deux caches de carte PCI.

    4. Retirez le GPU et le capot du flux d'air.

    5. Recherchez le module DIMM défectueux en faisant correspondre le numéro/l'ID de logement que vous avez noté précédemment avec la numérotation sur la carte mère. Voici un exemple d'image illustrant l'emplacement des numéros des connecteurs DIMM sur la carte mère :

      La montre les numéros des connecteurs DIMM de la carte mère H610C.
    6. Appuyez sur les deux clips de fixation vers l'extérieur et tirez doucement le DIMM vers le haut.

    7. Installez correctement le module DIMM de remplacement. Lorsque vous insérez correctement le DIMM dans le logement, les deux clips se verrouillent en place.

      Important Assurez-vous que vous ne touchez que les extrémités arrière du module DIMM. Si vous appuyez sur d'autres parties du module DIMM, le matériel risque d'être endommagé.
    8. Remplacez tous les composants que vous avez retirés : GPU, capot du flux d'air et caches PCI.

    9. Serrer les vis de blocage.

    10. Replacer le capot sur le nœud.

    11. Installez le châssis H610C sur le rack, en veillant à ce que le châssis s'enclenche lorsque vous le faites glisser.

    H615C

    1. Soulevez le capot comme indiqué sur l'image suivante :

      La représente le capot soulevé sur le nœud H615C.
    2. Retirez le processeur graphique (si votre nœud H615C est équipé d'un processeur graphique) et du capot du flux d'air.

      La représente le capot du flux d'air retiré sur le nœud H615C.
    3. Recherchez le module DIMM défectueux en faisant correspondre le numéro/l'ID de logement que vous avez noté précédemment avec la numérotation sur la carte mère. Voici un exemple d'image illustrant l'emplacement des numéros des connecteurs DIMM sur la carte mère :

      La montre les numéros des connecteurs DIMM de la carte mère H615C.
    4. Appuyez sur les deux clips de fixation vers l'extérieur et tirez doucement le DIMM vers le haut.

    5. Installez correctement le module DIMM de remplacement. Lorsque vous insérez correctement le DIMM dans le logement, les deux clips se verrouillent en place.

      Important Assurez-vous que vous ne touchez que les extrémités arrière du module DIMM. Si vous appuyez sur d'autres parties du module DIMM, le matériel risque d'être endommagé.
    6. Remettez en place le couvercle du débit d'air.

    7. Replacer le capot sur le nœud.

    8. Installez le châssis H610C sur le rack, en veillant à ce que le châssis s'enclenche lorsque vous le faites glisser.

  8. Insérez les câbles d'alimentation et les câbles réseau. Assurez-vous que tous les voyants des ports s'allument.

  9. Appuyez sur le bouton d'alimentation situé à l'avant du nœud si celui-ci ne s'exécute pas automatiquement lors de l'installation.

  10. Une fois le nœud affiché dans vSphere, cliquez avec le bouton droit de la souris sur le nom et sortez le nœud du mode de maintenance.

  11. Vérifiez les informations matérielles comme suit :

    1. Connectez-vous à l'interface utilisateur du contrôleur de gestion de la carte mère (BMC).

    2. Sélectionnez système > informations sur le matériel et vérifiez les modules DIMM répertoriés.

Et la suite

Lorsque le nœud revient à un fonctionnement normal, dans vCenter, vérifiez l'onglet Résumé pour vous assurer que la capacité de mémoire est la bonne.

Remarque Si le module DIMM n'est pas installé correctement, le nœud fonctionne normalement mais avec une capacité de mémoire inférieure à la capacité prévue.
Astuce Après la procédure de remplacement du module DIMM, vous pouvez effacer les avertissements et erreurs de l'onglet Etat du matériel dans vCenter. Vous pouvez le faire si vous souhaitez effacer l'historique des erreurs liées au matériel que vous avez remplacé. "En savoir plus >>".