Ersetzen Sie ein DIMM – AFF A220 und FAS2700
Beitragende
Sie müssen ein DIMM im Controller-Modul ersetzen, wenn Ihr System eine steigende Anzahl korrigierbarer Fehlerkorrekturcodes (ECC) registriert; andernfalls wird eine Systempanik verursacht.
Alle anderen Komponenten des Systems müssen ordnungsgemäß funktionieren. Falls nicht, müssen Sie sich an den technischen Support wenden.
Sie müssen die fehlerhafte Komponente durch eine vom Anbieter empfangene Ersatz-FRU-Komponente ersetzen.
Schritt 1: Schalten Sie den beeinträchtigten Regler aus
Um den beeinträchtigten Controller herunterzufahren, müssen Sie den Status des Controllers bestimmen und gegebenenfalls den Controller übernehmen, damit der gesunde Controller weiterhin Daten aus dem beeinträchtigten Reglerspeicher bereitstellen kann.
-
Wenn Sie NetApp Storage Encryption verwenden, müssen Sie die MSID mithilfe der Anweisungen im zurückgesetzt haben "SEDs werden in den ungeschützten Modus versetzt".
-
Wenn Sie über ein SAN-System verfügen, müssen Sie Ereignismeldungen geprüft haben
cluster kernel-service show
) Für beeinträchtigte Controller SCSI-Blade. Dercluster kernel-service show
Der Befehl zeigt den Node-Namen, den Quorum-Status dieses Node, den Verfügbarkeitsstatus dieses Node und den Betriebsstatus dieses Node an.Jeder Prozess des SCSI-Blades sollte sich im Quorum mit den anderen Nodes im Cluster befinden. Probleme müssen behoben werden, bevor Sie mit dem Austausch fortfahren.
-
Wenn Sie über ein Cluster mit mehr als zwei Nodes verfügen, muss es sich im Quorum befinden. Wenn sich das Cluster nicht im Quorum befindet oder ein gesunder Controller FALSE anzeigt, um die Berechtigung und den Zustand zu erhalten, müssen Sie das Problem korrigieren, bevor Sie den beeinträchtigten Controller herunterfahren; siehe "Synchronisieren eines Node mit dem Cluster".
-
Wenn AutoSupport aktiviert ist, unterdrücken Sie die automatische Erstellung eines Cases durch Aufrufen einer AutoSupport Meldung:
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
Die folgende AutoSupport Meldung unterdrückt die automatische Erstellung von Cases für zwei Stunden:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Deaktivieren Sie das automatische Giveback von der Konsole des gesunden Controllers:
storage failover modify –node local -auto-giveback false
Wenn Sie sehen Möchten Sie Auto-Giveback deaktivieren?, geben Sie ein y
. -
Nehmen Sie den beeinträchtigten Controller zur LOADER-Eingabeaufforderung:
Wenn der eingeschränkte Controller angezeigt wird… Dann… Die LOADER-Eingabeaufforderung
Wechseln Sie zu Controller-Modul entfernen.
Warten auf Giveback…
Drücken Sie Strg-C, und antworten Sie dann
y
Wenn Sie dazu aufgefordert werden.Eingabeaufforderung für das System oder Passwort
Übernehmen oder stoppen Sie den beeinträchtigten Regler von der gesunden Steuerung:
storage failover takeover -ofnode impaired_node_name
Wenn der Regler „beeinträchtigt“ auf Zurückgeben wartet… anzeigt, drücken Sie Strg-C, und antworten Sie dann
y
. -
Wenn das System nur über ein Controller-Modul im Gehäuse verfügt, schalten Sie die Netzteile aus und ziehen Sie dann die Netzkabel des beeinträchtigten Controllers von der Stromquelle ab.
Schritt 2: Controller-Modul entfernen
Um auf Komponenten innerhalb des Controllers zuzugreifen, müssen Sie zuerst das Controller-Modul aus dem System entfernen und dann die Abdeckung am Controller-Modul entfernen.
-
Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.
-
Lösen Sie den Haken- und Schlaufenriemen, mit dem die Kabel am Kabelführungsgerät befestigt sind, und ziehen Sie dann die Systemkabel und SFPs (falls erforderlich) vom Controller-Modul ab, um zu verfolgen, wo die Kabel angeschlossen waren.
Lassen Sie die Kabel im Kabelverwaltungs-Gerät so, dass bei der Neuinstallation des Kabelverwaltungsgeräts die Kabel organisiert sind.
-
Entfernen Sie die Kabelführungsgeräte von der linken und rechten Seite des Controller-Moduls und stellen Sie sie zur Seite.
-
Drücken Sie die Verriegelung am Nockengriff, bis sie loslässt, öffnen Sie den Nockengriff vollständig, um das Controller-Modul aus der Mittelplatine zu lösen, und ziehen Sie das Controller-Modul anschließend mit zwei Händen aus dem Gehäuse heraus.
-
Drehen Sie das Controller-Modul um und legen Sie es auf eine flache, stabile Oberfläche.
-
Öffnen Sie die Abdeckung, indem Sie die blauen Laschen einschieben, um die Abdeckung zu lösen, und schwenken Sie dann die Abdeckung nach oben und öffnen Sie sie.
Schritt 3: Ersetzen Sie die DIMMs
Um die DIMMs auszutauschen, suchen Sie sie im Controller und befolgen Sie die Schritte in der jeweiligen Reihenfolge.
Wenn Sie ein DIMM ersetzen, müssen Sie es entfernen, nachdem Sie den NVMEM-Akku aus dem Controller-Modul ausgesteckt haben.
-
Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.
-
Überprüfen Sie die NVMEM-LED auf der Rückseite des Controller-Moduls.
Sie müssen ein sauberes System herunterfahren, bevor Sie Systemkomponenten ersetzen, um nicht geschriebene Daten im nichtflüchtigen Speicher (NVMEM) zu verlieren. Die LED befindet sich auf der Rückseite des Controller-Moduls. Achten Sie auf das folgende Symbol:
-
Wenn die NVMEM-LED nicht blinkt, befindet sich kein Inhalt in der NVMEM. Sie können die folgenden Schritte überspringen und mit der nächsten Aufgabe bei diesem Verfahren fortfahren.
-
Wenn die NVMEM-LED blinkt, befinden sich Daten in der NVMEM und Sie müssen die Batterie trennen, um den Speicher zu löschen:
-
Suchen Sie den Akku, drücken Sie den Clip auf der Vorderseite des Batteriesteckers, um den Sicherungsclip von der Steckdose zu lösen, und ziehen Sie dann das Akkukabel aus der Steckdose.
-
Vergewissern Sie sich, dass die NVMEM-LED nicht mehr leuchtet.
-
Schließen Sie den Batteriestecker wieder an.
-
-
Kehren Sie zu zurück "Ersetzen Sie die DIMMs" Wie Sie die NVMEM-LED erneut prüfen.
-
Suchen Sie die DIMMs auf dem Controller-Modul.
-
Beachten Sie die Ausrichtung des DIMM-Moduls in der Buchse, damit Sie das ErsatzDIMM in die richtige Ausrichtung einsetzen können.
-
Werfen Sie das DIMM aus dem Steckplatz, indem Sie die beiden DIMM-Auswerferlaschen auf beiden Seiten des DIMM langsam auseinander drücken und dann das DIMM aus dem Steckplatz schieben.
Halten Sie das DIMM vorsichtig an den Rändern, um Druck auf die Komponenten auf der DIMM-Leiterplatte zu vermeiden. Die Anzahl und Anordnung der System-DIMMs hängt vom Modell Ihres Systems ab.
Die folgende Abbildung zeigt die Position der System-DIMMs:
-
Entfernen Sie das Ersatz-DIMM aus dem antistatischen Versandbeutel, halten Sie das DIMM an den Ecken und richten Sie es am Steckplatz aus.
Die Kerbe zwischen den Stiften am DIMM sollte mit der Lasche im Sockel aufliegen.
-
Vergewissern Sie sich, dass sich die DIMM-Auswerferlaschen am Anschluss in der geöffneten Position befinden und setzen Sie das DIMM-Auswerfer anschließend in den Steckplatz ein.
Das DIMM passt eng in den Steckplatz, sollte aber leicht einpassen. Falls nicht, richten Sie das DIMM-Modul mit dem Steckplatz aus und setzen Sie es wieder ein.
Prüfen Sie das DIMM visuell, um sicherzustellen, dass es gleichmäßig ausgerichtet und vollständig in den Steckplatz eingesetzt ist. -
Drücken Sie vorsichtig, aber fest auf die Oberseite des DIMM, bis die Auswurfklammern über den Kerben an den Enden des DIMM einrasten.
-
Suchen Sie den NVMEM-Batteriestecker, und drücken Sie dann den Clip auf der Vorderseite des Batteriesteckers, um ihn in den Sockel zu stecken.
Vergewissern Sie sich, dass der Stecker am Controller-Modul abhält.
-
Schließen Sie die Abdeckung des Controller-Moduls.
Schritt 4: Installieren Sie das Controller-Modul neu
Nachdem Sie die Komponenten im Controller-Modul ausgetauscht haben, setzen Sie sie wieder in das Gehäuse ein.
-
Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.
-
Wenn dies noch nicht geschehen ist, bringen Sie die Abdeckung am Controller-Modul wieder an.
-
Richten Sie das Ende des Controller-Moduls an der Öffnung im Gehäuse aus, und drücken Sie dann vorsichtig das Controller-Modul zur Hälfte in das System.
Setzen Sie das Controller-Modul erst dann vollständig in das Chassis ein, wenn Sie dazu aufgefordert werden. -
Das System nach Bedarf neu einsetzen.
Wenn Sie die Medienkonverter (QSFPs oder SFPs) entfernt haben, sollten Sie diese erneut installieren, wenn Sie Glasfaserkabel verwenden.
-
Führen Sie die Neuinstallation des Controller-Moduls durch:
Ihr System befindet sich in… Führen Sie dann folgende Schritte aus… Ein HA-Paar
Das Controller-Modul beginnt zu booten, sobald es vollständig im Gehäuse sitzt. Bereiten Sie sich darauf vor, den Bootvorgang zu unterbrechen.
-
Schieben Sie das Steuermodul fest in die offene Position, bis es auf die Mittelebene trifft und vollständig sitzt, und schließen Sie dann den Nockengriff in die verriegelte Position.
Beim Einschieben des Controller-Moduls in das Gehäuse keine übermäßige Kraft verwenden, um Schäden an den Anschlüssen zu vermeiden. Der Controller beginnt zu booten, sobald er im Gehäuse sitzt.
-
Wenn Sie dies noch nicht getan haben, installieren Sie das Kabelverwaltungsgerät neu.
-
Verbinden Sie die Kabel mit dem Haken- und Schlaufenband mit dem Kabelmanagement-Gerät.
-
Wenn die Meldung angezeigt wird
Press Ctrl-C for Boot Menu
, Drücken SieCtrl-C
Um den Bootvorgang zu unterbrechen.Wenn die Eingabeaufforderung nicht angezeigt wird und das Controller-Modul im ONTAP gebootet wird, geben Sie ein halt
, Und geben Sie an der LOADER-Eingabeaufforderung einboot_ontap
, Drücken SieCtrl-C
Wenn Sie dazu aufgefordert werden, und starten Sie dann in den Wartungsmodus. -
Wählen Sie im angezeigten Menü die Option zum Starten im Wartungsmodus aus.
Eine eigenständige Konfiguration
-
Schieben Sie das Steuermodul fest in die offene Position, bis es auf die Mittelebene trifft und vollständig sitzt, und schließen Sie dann den Nockengriff in die verriegelte Position.
Beim Einschieben des Controller-Moduls in das Gehäuse keine übermäßige Kraft verwenden, um Schäden an den Anschlüssen zu vermeiden. -
Wenn Sie dies noch nicht getan haben, installieren Sie das Kabelverwaltungsgerät neu.
-
Verbinden Sie die Kabel mit dem Haken- und Schlaufenband mit dem Kabelmanagement-Gerät.
-
Schließen Sie die Stromkabel wieder an die Netzteile und an die Stromquellen an, schalten Sie den Netzstrom ein, um den Bootvorgang zu starten, und drücken Sie dann
Ctrl-C
Nachdem Sie den gesehen habenPress Ctrl-C for Boot Menu
Nachricht:Wenn die Eingabeaufforderung nicht angezeigt wird und das Controller-Modul im ONTAP gebootet wird, geben Sie ein halt
, Und geben Sie an der LOADER-Eingabeaufforderung einboot_ontap
, Drücken SieCtrl-C
Wenn Sie dazu aufgefordert werden, und starten Sie dann in den Wartungsmodus. -
Wählen Sie im Startmenü die Option Wartungsmodus aus.
-
Schritt 5: Führen Sie die Diagnose auf Systemebene aus
Nach der Installation eines neuen DIMM sollten Sie die Diagnose ausführen.
Ihr System muss die LOADER-Eingabeaufforderung aufweisen, um die Diagnose auf Systemebene zu starten.
Alle Befehle im Diagnoseverfahren werden vom Controller ausgegeben, der die Komponente ersetzt wird.
-
Wenn der zu wartenden Controller nicht an der LOADER-Eingabeaufforderung angezeigt wird, führen Sie die folgenden Schritte aus:
-
Wählen Sie im angezeigten Menü die Option Wartungsmodus.
-
Nachdem der Controller in den Wartungsmodus gebootet wurde, beenden Sie den Controller:
halt
Nachdem Sie den Befehl ausgegeben haben, sollten Sie warten, bis das System an der LOADER-Eingabeaufforderung angehalten wird.
Während des Startvorgangs können Sie sicher reagieren y
So werden Sie aufgefordert:-
Eine Eingabeaufforderung mit einer Warnmeldung, dass Sie beim Aufrufen des Wartungsmodus in einer HA-Konfiguration sicherstellen müssen, dass der gesunde Controller weiterhin ausgefallen ist.
-
-
-
Rufen Sie an der LOADER-Eingabeaufforderung die speziellen Treiber auf, die speziell für die Diagnose auf Systemebene entwickelt wurden, um ordnungsgemäß zu funktionieren:
boot_diags
Während des Startvorgangs können Sie sicher reagieren
y
Zu den Aufforderungen, bis die Eingabeaufforderung für den Wartungsmodus (*>) angezeigt wird. -
Führen Sie eine Diagnose für den Systemspeicher aus:
sldiag device run -dev mem
-
Stellen Sie sicher, dass keine Hardwareprobleme durch den Austausch der DIMMs entstanden sind:
sldiag device status -dev mem -long -state failed
Die Diagnose auf Systemebene gibt die Eingabeaufforderung zurück, wenn keine Testfehler auftreten oder den vollständigen Status von Fehlern, die durch das Testen der Komponente entstehen, angezeigt wird.
-
Fahren Sie auf der Grundlage des Ergebnisses des vorhergehenden Schritts fort:
Wenn die Diagnose auf Systemebene testet… Dann… Wurden ohne Fehler abgeschlossen
-
Löschen Sie die Statusprotokolle:
sldiag device clearstatus
-
Überprüfen Sie, ob das Protokoll gelöscht wurde:
sldiag device status
Die folgende Standardantwort wird angezeigt:
SLDIAG: Es sind keine Protokollnachrichten vorhanden.
-
Beenden des Wartungsmodus:
halt
Der Controller zeigt die LOADER-Eingabeaufforderung an.
-
Booten des Controllers über die LOADER-Eingabeaufforderung:
bye
-
Zurückkehren des Controllers in den normalen Betrieb:
Wenn Ihr Controller in… Dann… Ein HA-Paar
Geben Sie zurück:
storage failover giveback -ofnode replacement_node_name
Wenn Sie die automatische Rückgabe deaktivieren, aktivieren Sie sie mit dem Befehl Storage Failover modify erneut. MetroCluster Konfiguration mit zwei Nodes
Fahren Sie mit dem nächsten Schritt fort.
Das Verfahren zum Wechsel von MetroCluster erfolgt bei der nächsten Aufgabe des Ersatzprozesses.
Eine eigenständige Konfiguration
Fahren Sie mit dem nächsten Schritt fort.
Es ist keine Aktion erforderlich.
Sie haben die Diagnose auf Systemebene abgeschlossen.
Es kam zu einigen Testfehlern
Bestimmen Sie die Ursache des Problems:
-
Beenden des Wartungsmodus:
halt
Nachdem Sie den Befehl ausgegeben haben, warten Sie, bis das System an der LOADER-Eingabeaufforderung angehalten wird.
-
Schalten Sie die Netzteile aus oder wieder ein, abhängig von der Anzahl der Controller-Module im Chassis:
-
Wenn Sie zwei Controller-Module im Chassis besitzen, lassen Sie die Netzteile eingeschaltet, um das andere Controller-Modul mit Strom zu versorgen.
-
Wenn Sie ein Controller-Modul im Gehäuse haben, schalten Sie die Netzteile aus und ziehen Sie sie von den Netzteilen ab.
-
-
Überprüfen Sie, ob Sie alle Aspekte, die bei der Ausführung von Diagnose auf Systemebene zu beachten sind, dass die Kabel sicher angeschlossen sind und die Hardwarekomponenten ordnungsgemäß im Storage-System installiert wurden.
-
Booten Sie das zu betreuende Controller-Modul, und unterbrechen Sie den Boot, indem Sie auf drücken
Ctrl-C
Wenn Sie dazu aufgefordert werden, zum Startmenü zu gelangen:-
Wenn Sie zwei Controller-Module im Chassis haben, setzen Sie das Controller-Modul vollständig ein, das Sie im Chassis warten.
Das Controller-Modul wird bei vollem Sitz hochgestartet.
-
Wenn Sie ein Controller-Modul im Chassis haben, schließen Sie die Netzteile an und schalten Sie sie dann ein.
-
-
Wählen Sie aus dem Menü die Option Start in den Wartungsmodus.
-
Beenden Sie den Wartungsmodus, indem Sie den folgenden Befehl eingeben:
halt
Nachdem Sie den Befehl ausgegeben haben, warten Sie, bis das System an der LOADER-Eingabeaufforderung angehalten wird.
-
Führen Sie den Diagnosetest auf Systemebene erneut aus.
-
Schritt 6: Aggregate in einer MetroCluster Konfiguration mit zwei Nodes zurückwechseln
Nachdem Sie in einer MetroCluster Konfiguration mit zwei Nodes den FRU-Austausch abgeschlossen haben, können Sie den MetroCluster SwitchBack-Vorgang durchführen. Damit wird die Konfiguration in ihren normalen Betriebszustand zurückversetzt, wobei die Synchronisations-Storage Virtual Machines (SVMs) auf dem ehemals beeinträchtigten Standort jetzt aktiv sind und Daten aus den lokalen Festplattenpools bereitstellen.
Dieser Task gilt nur für MetroCluster-Konfigurationen mit zwei Nodes.
-
Vergewissern Sie sich, dass sich alle Nodes im befinden
enabled
Bundesland:metrocluster node show
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A controller_A_1 configured enabled heal roots completed cluster_B controller_B_1 configured enabled waiting for switchback recovery 2 entries were displayed.
-
Überprüfen Sie, ob die Neusynchronisierung auf allen SVMs abgeschlossen ist:
metrocluster vserver show
-
Überprüfen Sie, ob die automatischen LIF-Migrationen durch die heilenden Vorgänge erfolgreich abgeschlossen wurden:
metrocluster check lif show
-
Führen Sie den Wechsel zurück mit dem aus
metrocluster switchback
Befehl von einem beliebigen Node im verbleibenden Cluster -
Stellen Sie sicher, dass der Umkehrvorgang abgeschlossen ist:
metrocluster show
Der Vorgang zum zurückwechseln wird weiterhin ausgeführt, wenn sich ein Cluster im befindet
waiting-for-switchback
Bundesland:cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured switchover Remote: cluster_A configured waiting-for-switchback
Der Vorgang zum zurückwechseln ist abgeschlossen, wenn sich die Cluster im befinden
normal
Bundesland:cluster_B::> metrocluster show Cluster Configuration State Mode -------------------- ------------------- --------- Local: cluster_B configured normal Remote: cluster_A configured normal
Wenn ein Wechsel eine lange Zeit in Anspruch nimmt, können Sie den Status der in-progress-Basispläne über die überprüfen
metrocluster config-replication resync-status show
Befehl. -
Wiederherstellung beliebiger SnapMirror oder SnapVault Konfigurationen
Schritt 7: Senden Sie das fehlgeschlagene Teil an NetApp zurück
Senden Sie das fehlerhafte Teil wie in den dem Kit beiliegenden RMA-Anweisungen beschrieben an NetApp zurück. Siehe "Teilerückgabe Austausch" Seite für weitere Informationen.