Skip to main content
Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Ersetzen Sie das Caching-Modul oder fügen Sie ein Core Dump-Modul – FAS9000 – hinzu

Beitragende

Sie müssen das Caching-Modul im Controller-Modul ersetzen, wenn das System eine einzelne AutoSupport-Meldung (ASUP) registriert, dass das Modul offline geschaltet wurde; andernfalls kommt es zu Performance-Einbußen. Wenn AutoSupport nicht aktiviert ist, können Sie das fehlerhafte Cache-Modul mithilfe der Fehler-LED an der Vorderseite des Moduls finden. Sie können auch das 1-TB-, X9170A-Core Dump-Modul hinzufügen oder ersetzen. Dies ist erforderlich, wenn Sie NS224-Laufwerk-Shelfs in einem AFF A700 System installieren.

Bevor Sie beginnen
  • Sie müssen die fehlerhafte Komponente durch eine vom Anbieter empfangene Ersatz-FRU-Komponente ersetzen.

  • Anweisungen zum Hot-Swap des Cache-Moduls finden Sie unter "Hot-Swap eines Cache-Moduls".

  • Beim Entfernen, Ersetzen oder Hinzufügen von Caching- oder Core-Dump-Modulen muss der Ziel-Node dem LOADER angehalten werden.

  • Die AFF A700 unterstützt das Core Dump-Modul mit 1 TB, X9170A. Dies ist erforderlich, wenn Sie NS224 Festplatten-Shelfs hinzufügen.

  • Die Core Dump-Module können in den Steckplätzen 6-1 und 6 installiert werden. Die empfohlene Best Practice ist die Installation des Moduls in Steckplatz 6-1.

  • Das Core Dump-Modul X9170A ist nicht Hot-Swap-fähig.

Schritt 1: Schalten Sie den beeinträchtigten Regler aus

Sie können den beeinträchtigten Controller je nach Hardwarekonfiguration des Speichersystems mithilfe verschiedener Verfahren herunterfahren oder übernehmen.

Option 1: Die meisten Konfigurationen

Um den beeinträchtigten Controller herunterzufahren, müssen Sie den Status des Controllers bestimmen und gegebenenfalls den Controller übernehmen, damit der gesunde Controller weiterhin Daten aus dem beeinträchtigten Reglerspeicher bereitstellen kann.

Über diese Aufgabe
  • Wenn Sie über ein SAN-System verfügen, müssen Sie Ereignismeldungen geprüft haben cluster kernel-service show) Für beeinträchtigte Controller SCSI-Blade. Der cluster kernel-service show Der Befehl zeigt den Node-Namen, den Quorum-Status dieses Node, den Verfügbarkeitsstatus dieses Node und den Betriebsstatus dieses Node an.

    Jeder Prozess des SCSI-Blades sollte sich im Quorum mit den anderen Nodes im Cluster befinden. Probleme müssen behoben werden, bevor Sie mit dem Austausch fortfahren.

  • Wenn Sie über ein Cluster mit mehr als zwei Nodes verfügen, muss es sich im Quorum befinden. Wenn sich das Cluster nicht im Quorum befindet oder ein gesunder Controller FALSE anzeigt, um die Berechtigung und den Zustand zu erhalten, müssen Sie das Problem korrigieren, bevor Sie den beeinträchtigten Controller herunterfahren; siehe "Synchronisieren eines Node mit dem Cluster".

Schritte
  1. Wenn AutoSupport aktiviert ist, unterdrücken Sie die automatische Erstellung eines Cases durch Aufrufen einer AutoSupport Meldung: system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh

    Die folgende AutoSupport Meldung unterdrückt die automatische Erstellung von Cases für zwei Stunden: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Deaktivieren Sie das automatische Giveback von der Konsole des gesunden Controllers: storage failover modify –node local -auto-giveback false

    Hinweis Wenn Sie sehen Möchten Sie Auto-Giveback deaktivieren?, geben Sie ein y.
  3. Nehmen Sie den beeinträchtigten Controller zur LOADER-Eingabeaufforderung:

    Wenn der eingeschränkte Controller angezeigt wird…​ Dann…​

    Die LOADER-Eingabeaufforderung

    Fahren Sie mit dem nächsten Schritt fort.

    Warten auf Giveback…​

    Drücken Sie Strg-C, und antworten Sie dann y Wenn Sie dazu aufgefordert werden.

    Eingabeaufforderung für das System oder Passwort

    Übernehmen oder stoppen Sie den beeinträchtigten Regler von der gesunden Steuerung: storage failover takeover -ofnode impaired_node_name

    Wenn der Regler „beeinträchtigt“ auf Zurückgeben wartet…​ anzeigt, drücken Sie Strg-C, und antworten Sie dann y.

Option 2: Controller befindet sich in einem MetroCluster mit zwei Nodes

Um den beeinträchtigten Controller herunterzufahren, müssen Sie den Status des Controllers bestimmen und gegebenenfalls den Controller umschalten, damit der gesunde Controller weiterhin Daten aus dem beeinträchtigten Reglerspeicher bereitstellen kann.

Über diese Aufgabe
  • Wenn Sie NetApp Storage Encryption verwenden, müssen Sie die MSID mithilfe der Anweisungen im Abschnitt „ein FIPS-Laufwerk oder SED in ungeschützten Modus zurückgeben“ von zurücksetzen "NetApp Encryption: Übersicht mit CLI".

  • Sie müssen die Netzteile am Ende dieses Verfahrens einschalten, um den gesunden Controller mit Strom zu versorgen.

Schritte
  1. Überprüfen Sie den MetroCluster-Status, um festzustellen, ob der beeinträchtigte Controller automatisch auf den gesunden Controller umgeschaltet wurde: metrocluster show

  2. Je nachdem, ob eine automatische Umschaltung stattgefunden hat, fahren Sie mit der folgenden Tabelle fort:

    Wenn die eingeschränkte Steuerung…​ Dann…​

    Ist automatisch umgeschaltet

    Fahren Sie mit dem nächsten Schritt fort.

    Nicht automatisch umgeschaltet

    Einen geplanten Umschaltvorgang vom gesunden Controller durchführen: metrocluster switchover

    Hat nicht automatisch umgeschaltet, haben Sie versucht, mit dem zu wechseln metrocluster switchover Befehl und Switchover wurde vetoed

    Überprüfen Sie die Veto-Meldungen, und beheben Sie das Problem, wenn möglich, und versuchen Sie es erneut. Wenn das Problem nicht behoben werden kann, wenden Sie sich an den technischen Support.

  3. Synchronisieren Sie die Datenaggregate neu, indem Sie das ausführen metrocluster heal -phase aggregates Befehl aus dem verbleibenden Cluster.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Wenn die Heilung ein Vetorecht ist, haben Sie die Möglichkeit, das zurückzugeben metrocluster heal Befehl mit dem -override-vetoes Parameter. Wenn Sie diesen optionalen Parameter verwenden, überschreibt das System alle weichen Vetos, die die Heilung verhindern.

  4. Überprüfen Sie, ob der Vorgang mit dem befehl „MetroCluster Operation show“ abgeschlossen wurde.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Überprüfen Sie den Status der Aggregate mit storage aggregate show Befehl.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Heilen Sie die Root-Aggregate mit dem metrocluster heal -phase root-aggregates Befehl.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Wenn die Heilung ein Vetorecht ist, haben Sie die Möglichkeit, das zurückzugeben metrocluster heal Befehl mit dem Parameter -override-vetoes. Wenn Sie diesen optionalen Parameter verwenden, überschreibt das System alle weichen Vetos, die die Heilung verhindern.

  7. Stellen Sie sicher, dass der Heilungsvorgang abgeschlossen ist, indem Sie den verwenden metrocluster operation show Befehl auf dem Ziel-Cluster:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Trennen Sie am Controller-Modul mit eingeschränkter Betriebsstörung die Netzteile.

Schritt 2: Ein Caching-Modul ersetzen oder hinzufügen

Die NVMe SSD Flash Cache Module (Flash Cache oder Caching-Module) sind separate Module. Sie befinden sich an der Vorderseite des NVRAM-Moduls. Wenn Sie ein Caching-Modul ersetzen oder hinzufügen möchten, suchen Sie es auf der Rückseite des Systems in Steckplatz 6, und befolgen Sie dann die Schritte, um es zu ersetzen.

Bevor Sie beginnen

Ihr Storage-System muss je nach Ihrer Situation bestimmte Kriterien erfüllen:

  • Sie muss über das entsprechende Betriebssystem für das zu installierenden Cache-Modul verfügen.

  • Es muss die Caching-Kapazität unterstützen.

  • Der Ziel-Node muss sich an DER LOADER-Eingabeaufforderung befindet, bevor Sie das Caching-Modul hinzufügen oder ersetzen.

  • Das Ersatz-Caching-Modul muss die gleiche Kapazität haben wie das ausgefallene Caching-Modul, kann aber von einem anderen unterstützten Anbieter stammen.

  • Alle anderen Komponenten des Storage-Systems müssen ordnungsgemäß funktionieren. Falls nicht, müssen Sie sich an den technischen Support wenden.

Schritte
  1. Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.

  2. Suchen Sie das fehlgeschlagene Cache-Modul in Steckplatz 6 mithilfe der gelb beleuchteten Warn-LED an der Vorderseite des Cache-Moduls.

  3. Entfernen Sie das Caching-Modul:

    Hinweis Wenn Sie Ihrem System ein weiteres Caching-Modul hinzufügen, entfernen Sie das leere Modul, und fahren Sie mit dem nächsten Schritt fort.
    drw 9000 entfernen flashcache

    Legende Nummer 1

    Orangefarbene Entriegelungstaste.

    Legende Nummer 2

    Nockengriff für das Caching-Modul.

    1. Drücken Sie die orangefarbene Entriegelungstaste auf der Vorderseite des Cache-Moduls.

      Hinweis Verwenden Sie nicht die nummerierte und letzte E/A-Nockenverriegelung, um das Cache-Modul auszuwerfen. Die nummerierte und gerettete E/A-Nockenverriegelung wirft das gesamte NVRAM10-Modul und nicht das Caching-Modul aus.
    2. Drehen Sie den Nockengriff, bis das Caching-Modul beginnt, aus dem NVRAM10-Modul zu schieben.

    3. Ziehen Sie den Nockengriff vorsichtig gerade zu Ihnen, um das Cache-Modul aus dem NVRAM10-Modul zu entfernen.

      Achten Sie darauf, das Cache-Modul zu unterstützen, wenn Sie es aus dem NVRAM10-Modul entfernen.

  4. Installieren Sie das Caching-Modul:

    1. Richten Sie die Kanten des Cache-Moduls an der Öffnung im NVRAM10-Modul aus.

    2. Schieben Sie das Cache-Modul vorsichtig in den Schacht, bis der Nockengriff einrastet.

    3. Den Nockengriff drehen, bis er einrastet.

Schritt 3: Ein X9170A-Core-Dump-Modul hinzufügen oder ersetzen

Der 1-TB-Cache Core Dump, X9170A, wird nur in den AFF A700 Systemen verwendet. Das Core Dump-Modul kann nicht im laufenden Betrieb ausgetauscht werden. Das Core Dump-Modul befindet sich normalerweise an der Vorderseite des NVRAM-Moduls in Steckplatz 6-1 auf der Rückseite des Systems. Wenn Sie das Core Dump-Modul ersetzen oder hinzufügen möchten, suchen Sie nach Steckplatz 6-1 und befolgen Sie dann die spezifische Sequenz der Schritte, um es hinzuzufügen oder zu ersetzen.

Bevor Sie beginnen
  • Ihr System muss ONTAP 9.8 oder höher ausführen, um ein Core Dump-Modul hinzuzufügen.

  • Das Core Dump-Modul X9170A ist nicht Hot-Swap-fähig.

  • Der Ziel-Node muss sich an DER LOADER-Eingabeaufforderung befindet, bevor Sie das Code-Dump-Modul hinzufügen oder ersetzen.

  • Sie müssen zwei X9170 Core Dump-Module erhalten haben; eines für jeden Controller.

  • Alle anderen Komponenten des Storage-Systems müssen ordnungsgemäß funktionieren. Falls nicht, müssen Sie sich an den technischen Support wenden.

Schritte
  1. Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.

  2. Wenn Sie ein ausgefallenes Core Dump-Modul ersetzen, suchen und entfernen Sie es:

    drw 9000 entfernen flashcache

    Legende Nummer 1

    Orangefarbene Entriegelungstaste.

    Legende Nummer 2

    Core Dump Modul Nockengriff.

    1. Suchen Sie das fehlerhafte Modul mithilfe der gelben Warn-LED an der Vorderseite des Moduls.

    2. Drücken Sie die orangefarbene Entriegelungstaste an der Vorderseite des Core Dump-Moduls.

      Hinweis Verwenden Sie nicht die nummerierte und letzte E/A-Nockenverriegelung, um das Core-Dump-Modul auszuwerfen. Die nummerierte und gerettete E/A-Nockenverriegelung wirft das gesamte NVRAM10-Modul und nicht das Core-Dump-Modul aus.
    3. Drehen Sie den Nockengriff, bis das Kernabbaumodul aus dem NVRAM10-Modul herausrutscht.

    4. Ziehen Sie den Nockengriff vorsichtig gerade zu Ihnen, um das Core Dump-Modul aus dem NVRAM10-Modul zu entfernen und beiseite zu legen.

      Achten Sie darauf, das Core Dump-Modul zu unterstützen, wenn Sie es aus dem NVRAM10-Modul entfernen.

  3. Installieren Sie das Core Dump-Modul:

    1. Wenn Sie ein neues Core Dump-Modul installieren, entfernen Sie das leere Modul aus Steckplatz 6-1.

    2. Richten Sie die Kanten des Core Dump-Moduls an der Öffnung im NVRAM10-Modul aus.

    3. Schieben Sie das Core Dump-Modul vorsichtig in den Schacht, bis der Nockengriff einrastet.

    4. Den Nockengriff drehen, bis er einrastet.

Schritt 4: Starten Sie den Controller nach dem FRU-Austausch neu

Nachdem Sie die FRU ersetzt haben, müssen Sie das Controller-Modul neu booten.

Schritt
  1. Um ONTAP von der LOADER-Eingabeaufforderung zu booten, geben Sie ein bye.

Schritt 5: Aggregate in einer MetroCluster Konfiguration mit zwei Nodes zurückwechseln

Nachdem Sie in einer MetroCluster Konfiguration mit zwei Nodes den FRU-Austausch abgeschlossen haben, können Sie den MetroCluster SwitchBack-Vorgang durchführen. Damit wird die Konfiguration in ihren normalen Betriebszustand zurückversetzt, wobei die Synchronisations-Storage Virtual Machines (SVMs) auf dem ehemals beeinträchtigten Standort jetzt aktiv sind und Daten aus den lokalen Festplattenpools bereitstellen.

Dieser Task gilt nur für MetroCluster-Konfigurationen mit zwei Nodes.

Schritte
  1. Vergewissern Sie sich, dass sich alle Nodes im befinden enabled Bundesland: metrocluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. Überprüfen Sie, ob die Neusynchronisierung auf allen SVMs abgeschlossen ist: metrocluster vserver show

  3. Überprüfen Sie, ob die automatischen LIF-Migrationen durch die heilenden Vorgänge erfolgreich abgeschlossen wurden: metrocluster check lif show

  4. Führen Sie den Wechsel zurück mit dem aus metrocluster switchback Befehl von einem beliebigen Node im verbleibenden Cluster

  5. Stellen Sie sicher, dass der Umkehrvorgang abgeschlossen ist: metrocluster show

    Der Vorgang zum zurückwechseln wird weiterhin ausgeführt, wenn sich ein Cluster im befindet waiting-for-switchback Bundesland:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    Der Vorgang zum zurückwechseln ist abgeschlossen, wenn sich die Cluster im befinden normal Bundesland:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    Wenn ein Wechsel eine lange Zeit in Anspruch nimmt, können Sie den Status der in-progress-Basispläne über die überprüfen metrocluster config-replication resync-status show Befehl.

  6. Wiederherstellung beliebiger SnapMirror oder SnapVault Konfigurationen

Schritt 6: Senden Sie das fehlgeschlagene Teil an NetApp zurück

Senden Sie das fehlerhafte Teil wie in den dem Kit beiliegenden RMA-Anweisungen beschrieben an NetApp zurück. Siehe "Teilerückgabe Austausch" Seite für weitere Informationen.