Skip to main content
Eine neuere Version dieses Produkts ist erhältlich.
Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

DIMMs in Computing-Nodes ersetzen

Beitragende

Sie können ein fehlerhaftes Dual Inline Memory Module (DIMM) in NetApp HCI-Computing-Nodes ersetzen, anstatt den gesamten Node zu ersetzen.

Was Sie benötigen
  • Bevor Sie mit diesem Verfahren beginnen, sollten Sie den NetApp Support kontaktieren und ein Ersatzteil erhalten haben. Bei der Installation des Ersatzes ist der Support beteiligt. Wenn Sie dies noch nicht getan haben, wenden Sie sich an "Support".

  • Geplante Systemausfallzeiten sind geplant, da der Node heruntergefahren oder aus- und wieder eingeschaltet und der Node im NetApp Safe Mode gebootet werden muss, um auf die Terminal User Interface (TUI) zuzugreifen.

Über diese Aufgabe

Dieses Verfahren gilt für die folgenden Computing-Node-Modelle:

  • H410C Nodes Ein H410C Node wird in ein 2-HE-NetApp HCI-Chassis eingesetzt.

  • H610C Node: Ein H610C Node ist in das Chassis integriert.

  • H615C Node: Ein H615C Node ist in das Chassis integriert.

    Wichtig H410C und H615C Nodes enthalten DIMMs verschiedener Anbieter. Stellen Sie sicher, dass Sie DIMMs verschiedener Anbieter in einem Gehäuse nicht mischen.
    Hinweis Die Begriffe „Chassis“ und „Node“ werden im Fall von H610C und H615C gemeinsam verwendet, da der Node und das Chassis keine separaten Komponenten sind.

Nachfolgend sind die Schritte aufgeführt, die beim Austausch von DIMMs bei Computing-Nodes erforderlich sind:

Bereiten Sie den Austausch des DIMM vor

Wenn Probleme mit dem DIMM auftreten, zeigt VMware ESXi Warnungen an, wie Memory Configuration Error, , Memory Uncorrectable ECC Memory Transition to Critical und Memory Critical Overtemperature. Selbst wenn die Meldungen nach einer Weile verschwinden, könnte das Hardware-Problem weiterhin bestehen. Sie sollten das fehlerhafte DIMM diagnostizieren und beheben. Informationen zum fehlerhaften DIMM erhalten Sie vom vCenter Server. Wenn Sie mehr Informationen benötigen, als über den vCenter Server verfügbar ist, müssen Sie den Hardwarecheck im TUI ausführen.

Schritte
  1. Greifen Sie auf den Knoten zu, indem Sie sich bei vCenter Server anmelden.

  2. Klicken Sie mit der rechten Maustaste auf den Node, der den Fehler meldet, und wählen Sie die Option aus, um den Node in den Wartungsmodus zu versetzen.

  3. Migrieren Sie die Virtual Machines (VMs) zu einem anderen verfügbaren Host.

    Hinweis Die Migrationsschritte finden Sie in der VMware Dokumentation.
  4. Schalten Sie den Computing-Node aus.

    Hinweis Wenn Sie über die Informationen verfügen, welche DIMM-Module ausgetauscht werden müssen und nicht auf die TUI zugreifen müssen, können Sie die folgenden Schritte in diesem Abschnitt überspringen.
  5. Schließen Sie eine Tastatur, ein Video und eine Maus (KVM) an die Rückseite des Knotens an, der den Fehler gemeldet hat.

  6. Drücken Sie den Netzschalter an der Vorderseite des Knotens. Das Booten des Node dauert etwa sechs Minuten. Auf dem Bildschirm wird ein Startmenü angezeigt.

  7. Identifizieren Sie den Steckplatz, der den Fehler protokolliert hat wie folgt:

    1. Für H615C gehen Sie wie folgt vor:

      1. Melden Sie sich bei der Benutzeroberfläche von BMC an.

      2. Wählen Sie Protokolle & Berichte > IPMI-Ereignisprotokoll aus.

      3. Suchen Sie im Ereignisprotokoll den Speicherfehler und identifizieren Sie den Steckplatz, in dem der Fehler protokolliert wird.

        Zeigt den nicht behebbaren Speicherfehler in der BMC-UI für H615C Nodes
  8. Führen Sie bei H410C- und H615C-Knoten die Schritte aus, um die Teilenummer des DIMM-Herstellers zu ermitteln.

    Wichtig H410C und H615C Nodes sind DIMMs verschiedener Hersteller enthalten. Es sollten keine verschiedenen DIMM-Typen im selben Gehäuse kombiniert werden. Sie sollten den Hersteller des fehlerhaften DIMM identifizieren und einen Austausch desselben Typs bestellen.
    1. Melden Sie sich beim BMC an, um die Konsole auf dem Node zu starten.

    2. Drücken Sie auf der Tastatur * F2*, um zum Menü System/Protokolle anpassen zu gelangen.

    3. Geben Sie bei der entsprechenden Aufforderung das Passwort ein.

      Hinweis Das Passwort sollte mit den Parametern übereinstimmen, die Sie bei der Einrichtung von NetApp HCI in der NetApp Deployment Engine konfiguriert haben.
    Zeigt das Fenster
    1. Drücken Sie im Menü Systemanpassung den Abwärtspfeil, um zu Fehlerbehebungsoptionen zu navigieren, und drücken Sie Enter.

      Zeigt das Menü Systemanpassung an.
    2. Verwenden Sie im Menü Optionen für den Fehlerbehebungsmodus den Pfeil nach oben oder unten, um ESXi Shell und SSH zu aktivieren, die standardmäßig deaktiviert sind.

    3. Drücken Sie zweimal die Taste <Esc>, um die Fehlerbehebungsoptionen zu beenden.

    4. Führen Sie den Befehl mit einer der folgenden Optionen aus smbiosDump:

      Option Schritte

      Option A

      1. Stellen Sie eine Verbindung zum ESXi-Host (Compute-Node) her, indem Sie die IP-Adresse des Hosts und die von Ihnen definierten Root-Anmeldedaten verwenden.

      2. Führen Sie den smbiosDump Befehl aus. Die folgende Beispielausgabe finden Sie unter:

      `Memory Device:#30
      Location: "P1-DIMMA1"
      Bank: "P0_Node0_Channel0_Dimm0"
      Manufacturer:"Samsung"
      Serial: "38EB8380"
      Asset Tag: "P1-DIMMA1_AssetTag (date:18/15)"
      Part Number: "M393A4K40CB2-CTD"
      Memory Array: #29
      Form Factor: 0x09(DIMM)
      Type: 0x1a (DDR4)
      Type Detail: 0x0080 (Synchronous)
      Data Width: 64 bits (+8 ECC bits)
      Size: 32 GB`

      Option B

      1. Drücken Sie Alt + F1, um Shell einzugeben, und melden Sie sich beim Knoten an, um den Befehl auszuführen.

  9. Wenden Sie sich an den NetApp Support, um Unterstützung bei den nächsten Schritten zu erhalten. Der NetApp Support benötigt folgende Informationen, um einen Teileaustausch zu bearbeiten:

    • Seriennummer der Nodes

    • Cluster-Name

    • Systemereignisprotokoll von der BMC-Benutzeroberfläche (Protokolle und Berichte > IPMI-Ereignisprotokoll> Ereignisprotokolle herunterladen)

    • Die Ausgabe erfolgt über den smbiosDump Befehl

Ersetzen Sie das DIMM aus dem Gehäuse

Bevor Sie das fehlerhafte DIMM-Modul im Gehäuse entfernen und austauschen, stellen Sie sicher, dass Sie alle ausgeführt haben"Vorbereitungsschritte".

Wichtig DIMMs sollten in den gleichen Steckplätzen, aus denen sie entfernt wurden, ersetzt werden.
Schritte
  1. Fahren Sie das Chassis oder den Node herunter.

    Hinweis Für ein H610C oder H615C Chassis schalten Sie das Chassis herunter. Für H410C Nodes in einem 2-HE-Chassis mit vier Nodes schalten Sie nur den Node mit dem fehlerhaften DIMM aus.
  2. Entfernen Sie die Stromkabel und Netzwerkkabel, schieben Sie den Node bzw. das Chassis vorsichtig aus dem Rack und legen Sie ihn auf eine flache, antistatische Oberfläche.

    Tipp Ziehen Sie die Verwendung von Twistbinen für Kabel in Betracht.
  3. Setzen Sie den antistatischen Schutz auf, bevor Sie die Gehäuseabdeckung öffnen, um das DIMM auszutauschen.

  4. Führen Sie die für Ihr Node-Modell relevanten Schritte aus:

    Node-Modell Schritte

    H410C

    1. Suchen Sie das ausgefallene DIMM, indem Sie die zuvor angegebene Steckplatznummer/ID mit der Nummerierung auf der Hauptplatine vergleichen. Hier sind Beispielbilder, die die DIMM-Steckplatznummern auf der Hauptplatine anzeigen:

      Zeigt die DIMM-Steckplatznummern auf der Hauptplatine des H410C Nodes an.
      Zeigt eine Nahansicht der DIMM-Steckplatznummern auf der H410C Node-Hauptplatine.
    2. Drücken Sie die beiden Halteclips nach außen, und ziehen Sie das DIMM vorsichtig nach oben. Hier sehen Sie ein Beispielbild mit den Halteklammern:

      Zeigt die Halteklammern für die DIMMs im H410C-Knoten.
    3. Installieren Sie das ErsatzDIMM richtig. Wenn Sie das DIMM richtig in den Steckplatz einsetzen, verriegeln die beiden Clips.

      Wichtig Stellen Sie sicher, dass Sie nur die hinteren Enden des DIMM berühren. Wenn Sie auf andere Teile des DIMM drücken, kann dies zu einer Beschädigung der Hardware führen.
    4. Installieren Sie den Node im NetApp HCI-Chassis und stellen Sie sicher, dass der Node beim Einschieben einrastet.

    H610C

    1. Heben Sie die Abdeckung wie in der folgenden Abbildung dargestellt an:

      Zeigt die Abdeckung
    2. Lösen Sie die vier blauen Sicherungsschrauben an der Rückseite des Knotens. Hier sehen Sie ein Beispielbild, das die Position von zwei Sicherungsschrauben zeigt. Die anderen beiden Schrauben befinden sich auf der anderen Seite des Knotens:

      Zeigt die Sicherungsschrauben an der Rückseite des H610C Node.
    3. Entfernen Sie beide PCI-Kartensteckplatzhalter.

    4. Entfernen Sie die GPU und die Luftstromabdeckung.

    5. Suchen Sie das ausgefallene DIMM, indem Sie die zuvor angegebene Steckplatznummer/ID mit der Nummerierung auf der Hauptplatine vergleichen. Hier ist ein Beispielbild, das die Position der DIMM-Steckplatznummern auf der Hauptplatine anzeigt:

      Zeigt die DIMM-Slot-Nummern auf der H610C Hauptplatine an.
    6. Drücken Sie die beiden Halteclips nach außen, und ziehen Sie das DIMM vorsichtig nach oben.

    7. Installieren Sie das ErsatzDIMM richtig. Wenn Sie das DIMM richtig in den Steckplatz einsetzen, verriegeln die beiden Clips.

      Wichtig Stellen Sie sicher, dass Sie nur die hinteren Enden des DIMM berühren. Wenn Sie auf andere Teile des DIMM drücken, kann dies zu einer Beschädigung der Hardware führen.
    8. Ersetzen Sie alle Komponenten, die Sie entfernt haben: GPU, Luftstromabdeckung und PCI-Leereinschübe.

    9. Ziehen Sie die Sicherungsschrauben fest.

    10. Setzen Sie die Abdeckung wieder auf den Knoten.

    11. Installieren Sie das H610C Chassis im Rack und stellen Sie sicher, dass das Chassis beim Einschieben einrastet.

    H615C

    1. Heben Sie die Abdeckung wie in der folgenden Abbildung dargestellt an:

      Zeigt die Abdeckung
    2. Entfernen Sie die GPU (wenn auf Ihrem H615C Node GPU installiert ist) und die Luftstromabdeckung.

      Zeigt die Luftstromabdeckung
    3. Suchen Sie das ausgefallene DIMM, indem Sie die zuvor angegebene Steckplatznummer/ID mit der Nummerierung auf der Hauptplatine vergleichen. Hier ist ein Beispielbild, das die Position der DIMM-Steckplatznummern auf der Hauptplatine anzeigt:

      Zeigt die DIMM-Slot-Nummern auf der H615C Hauptplatine an.
    4. Drücken Sie die beiden Halteclips nach außen, und ziehen Sie das DIMM vorsichtig nach oben.

    5. Installieren Sie das ErsatzDIMM richtig. Wenn Sie das DIMM richtig in den Steckplatz einsetzen, verriegeln die beiden Clips.

      Wichtig Stellen Sie sicher, dass Sie nur die hinteren Enden des DIMM berühren. Wenn Sie auf andere Teile des DIMM drücken, kann dies zu einer Beschädigung der Hardware führen.
    6. Setzen Sie die Luftstromabdeckung wieder ein.

    7. Setzen Sie die Abdeckung wieder auf den Knoten.

    8. Installieren Sie das H610C Chassis im Rack und stellen Sie sicher, dass das Chassis beim Einschieben einrastet.

  5. Schließen Sie die Stromkabel und Netzwerkkabel an. Stellen Sie sicher, dass alle Port-LEDs eingeschaltet sind.

  6. Drücken Sie den Netzschalter an der Vorderseite des Knotens, wenn er nicht automatisch eingeschaltet wird, wenn Sie ihn installieren.

  7. Nachdem der Node in vSphere angezeigt wird, klicken Sie mit der rechten Maustaste auf den Namen und nehmen Sie den Node aus dem Wartungsmodus.

  8. Überprüfen Sie die Hardwareinformationen wie folgt:

    1. Melden Sie sich bei der Baseboard Management Controller (BMC) UI an.

    2. Wählen Sie System > Hardware-Informationen, und überprüfen Sie die aufgeführten DIMMs.

Wie es weiter geht

Nachdem der Knoten wieder in den normalen Betrieb zurückkehrt, überprüfen Sie in vCenter die Registerkarte Zusammenfassung, um sicherzustellen, dass die Speicherkapazität wie erwartet ist.

Hinweis Wenn das DIMM nicht ordnungsgemäß installiert ist, funktioniert der Node ordnungsgemäß, ist aber mit einer geringeren als erwarteten Speicherkapazität ausgestattet.
Tipp Nach dem DIMM-Ersatzverfahren können Sie die Warnungen und Fehler auf der Registerkarte Hardwarestatus in vCenter löschen. Sie können dies tun, wenn Sie den Fehlerverlauf der Hardware, die Sie ausgetauscht haben, löschen möchten. "Weitere Informationen .".