Hot-Swap eines E/A-Moduls - FAS50
Sie können ein Ethernet-E/A-Modul in Ihrem FAS50-Speichersystem per Hot-Swap austauschen, wenn ein Modul ausfällt und Ihr Speichersystem alle ONTAP-Versionanforderungen erfüllt.
Um ein E/A-Modul per Hot-Swap auszutauschen, stellen Sie sicher, dass Ihr Speichersystem die ONTAP-Versionsanforderungen erfüllt, bereiten Sie Ihr Speichersystem und das E/A-Modul vor, führen Sie den Hot-Swap des defekten Moduls durch, nehmen Sie das Ersatzmodul in Betrieb, stellen Sie den normalen Betrieb des Speichersystems wieder her und senden Sie das defekte Modul an NetApp zurück.
-
Hot-Swap des E/A-Moduls bedeutet, dass Sie kein manuelles Takeover durchführen müssen, bevor Sie das ausgefallene E/A-Modul ersetzen.
-
Wenden Sie die Befehle auf den richtigen Controller und den richtigen E/A-Steckplatz an, wenn Sie das E/A-Modul im Hot-Swap-Verfahren austauschen:
-
Der beeinträchtigte Controller ist der Controller, an dem Sie das I/O-Modul im laufenden Betrieb austauschen.
-
Der gesunde Controller ist der HA-Partner des beeinträchtigten Controllers.
-
-
Sie können die Standort-LEDs (blau) des Speichersystems einschalten, um das betroffene Speichersystem leichter zu finden. Melden Sie sich mit SSH beim BMC an und geben Sie den
system location-led onBefehl ein.Ein Speichersystem verfügt über drei Standort-LEDs: Eine auf dem Bedienfeld und eine auf jedem Controller. Die Standort-LEDs leuchten 30 Minuten lang.
Sie können sie deaktivieren, indem Sie den Befehl eingeben
system location-led off. Wenn Sie sich nicht sicher sind, ob die LEDs leuchten oder nicht, können Sie ihren Status überprüfen, indem Sie den Befehl eingebensystem location-led show.
Schritt 1: Sicherstellen, dass das Speichersystem die Verfahrensanforderungen erfüllt
Um dieses Verfahren anzuwenden, muss auf Ihrem Speichersystem ONTAP 9.17.1 oder höher ausgeführt werden, und Ihr Speichersystem muss alle Anforderungen für die Version von ONTAP erfüllen, die auf Ihrem Speichersystem ausgeführt wird.
|
|
Wenn auf Ihrem Speichersystem nicht ONTAP 9.17.1 oder höher läuft oder es nicht alle Anforderungen für die Version von ONTAP erfüllt, auf der Ihr Speichersystem läuft, können Sie dieses Verfahren nicht verwenden, Sie müssen das "Vorgehensweise zum Ersetzen eines E/A-Moduls" verwenden. |
-
Sie führen einen Hot-Swap eines ausgefallenen Cluster- und HA-E/A-Moduls in Steckplatz 4 mit einem gleichwertigen E/A-Modul durch. Sie können den Typ des E/A-Moduls nicht ändern.
-
Der Controller mit dem ausgefallenen Cluster- und HA-I/O-Modul (der beeinträchtigte Controller) muss den gesunden Partner-Controller bereits übernommen haben. Das Takeover sollte automatisch erfolgt sein, wenn das I/O-Modul ausgefallen ist.
Bei Clustern mit zwei Knoten kann das Speichersystem nicht feststellen, welcher Controller das ausgefallene E/A-Modul besitzt, sodass entweder Controller die Übernahme einleiten könnte. Hot-Swap wird nur unterstützt, wenn der Controller mit dem ausgefallenen E/A-Modul (der beeinträchtigte Controller) das Takeover über den gesunden Controller durchgeführt hat. Das Hot-Swap des E/A-Moduls ist die einzige Möglichkeit, eine Wiederherstellung ohne Ausfall zu erreichen.
Sie können überprüfen, ob der beeinträchtigte Controller den fehlerfreien Controller erfolgreich übernommen hat, indem Sie Folgendes eingeben:
storage failover showBefehl.Wenn Sie nicht sicher sind, bei welchem Controller sich das fehlerhafte E/A-Modul befindet, wenden Sie sich an "NetApp Support" .
-
Ihre Speichersystemkonfiguration darf nur über ein Cluster- und HA-E/A-Modul in Steckplatz 4 verfügen, nicht über zwei Cluster- und HA-E/A-Module.
-
Ihr Speichersystem muss eine Clusterkonfiguration mit zwei Knoten (ohne oder mit Switch) sein.
-
Alle anderen Komponenten des Speichersystems müssen ordnungsgemäß funktionieren. Falls nicht, wenden Sie sich an "NetApp Support", bevor Sie mit diesem Verfahren fortfahren.
-
Sie führen einen Hot-Swap eines Ethernet-E/A-Moduls in einem beliebigen Steckplatz mit beliebiger Portkombination für Cluster, HA und Client gegen ein gleichwertiges E/A-Modul durch. Sie können den Typ des E/A-Moduls nicht ändern.
Ethernet-I/O-Module mit Ports, die für Speicher oder MetroCluster verwendet werden, sind nicht Hot-Swap-fähig.
-
Ihr Speichersystem (schalterlose oder geschaltete Clusterkonfiguration) kann jede für Ihr Speichersystem unterstützte Anzahl von Knoten haben.
-
Alle Knoten im Cluster müssen die gleiche ONTAP Version (ONTAP 9.18.1GA oder höher) ausführen oder unterschiedliche Patch-Level derselben ONTAP Version ausführen.
Wenn auf den Knoten in Ihrem Cluster unterschiedliche ONTAP Versionen ausgeführt werden, handelt es sich um ein Cluster mit gemischten Versionen, und Hot-Swap eines E/A-Moduls wird nicht unterstützt.
-
Die Controller in Ihrem Speichersystem können sich in einem der folgenden Zustände befinden:
-
Beide Controller können aktiv sein und I/O ausführen (Daten bereitstellen).
-
Jeder Controller kann sich im Takeover-Zustand befinden, wenn das Takeover durch das ausgefallene E/A-Modul verursacht wurde und die Controller ansonsten ordnungsgemäß funktionieren.
In bestimmten Situationen kann ONTAP aufgrund eines ausgefallenen E/A-Moduls automatisch ein Takeover eines der beiden Controller durchführen. Wenn beispielsweise das ausgefallene E/A-Modul alle Cluster-Ports enthielt (alle Cluster-Verbindungen dieses Controllers ausfallen), führt ONTAP automatisch ein Takeover durch.
-
-
Alle anderen Komponenten des Speichersystems müssen ordnungsgemäß funktionieren. Falls nicht, wenden Sie sich an "NetApp Support", bevor Sie mit diesem Verfahren fortfahren.
Schritt 2: Bereiten Sie das Speichersystem und den Steckplatz für das I/O-Modul vor
Bereiten Sie das Speichersystem und den Steckplatz für das E/A-Modul so vor, dass das defekte E/A-Modul sicher entfernt werden kann:
-
Richtig gemahlen.
-
Ziehen Sie die Kabel vom defekten E/A-Modul ab.
Beschriften Sie die Kabel, damit Sie sie später in diesem Verfahren wieder an die gleichen Anschlüsse anschließen können.
Das E/A-Modul sollte ausgefallen sein (die Ports sollten sich im Link-down-Status befinden); wenn die Verbindungen jedoch noch aktiv sind und den letzten funktionierenden Cluster-Port enthalten, löst das Abziehen der Kabel ein automatisches Takeover aus.
Warten Sie fünf Minuten nach dem Abziehen der Kabel, um sicherzustellen, dass alle Takeover oder LIF-Failover abgeschlossen sind, bevor Sie mit diesem Verfahren fortfahren.
-
Wenn AutoSupport aktiviert ist, unterdrücken Sie die automatische Erstellung eines Cases durch Aufrufen einer AutoSupport Meldung:
system node autosupport invoke -node * -type all -message MAINT=<number of hours down>hBeispielsweise unterdrückt die folgende AutoSupport Meldung die automatische Fallerstellung für zwei Stunden:
node2::> system node autosupport invoke -node * -type all -message MAINT=2h -
Je nach Version von ONTAP, die Ihr Speichersystem ausführt, und dem Status der Controller deaktivieren Sie das automatische Giveback:
ONTAP-Version Wenn… Dann… 9.17.1 oder 9.18.1RC
Wenn der beeinträchtigte Controller den gesunden Controller automatisch übernommen hat
Automatische Rückgabe deaktivieren:
-
Geben Sie den folgenden Befehl von der Konsole des beeinträchtigten Controllers ein
storage failover modify -node local -auto-giveback false -
Eingeben
ywenn die Eingabeaufforderung Möchten Sie die automatische Rückgabe deaktivieren? angezeigt wird
9.18.1GA oder später
Wenn einer der beiden Controller automatisch das Takeover seines Partners durchführte
Automatische Rückgabe deaktivieren:
-
Geben Sie den folgenden Befehl in der Konsole des Controllers ein, der die Steuerung seines Partners übernommen hat:
storage failover modify -node local -auto-giveback false -
Eingeben
ywenn die Eingabeaufforderung Möchten Sie die automatische Rückgabe deaktivieren? angezeigt wird
9.18.1GA oder später
Beide Controller sind betriebsbereit und führen E/A aus (liefern Daten)
Fahren Sie mit dem nächsten Schritt fort.
-
-
Bereiten Sie das defekte E/A-Modul für die Entfernung vor, indem Sie es außer Betrieb nehmen und ausschalten:
-
Geben Sie den folgenden Befehl ein:
system controller slot module remove -node impaired_node_name -slot slot_number -
Eingeben
ywenn die Eingabeaufforderung Möchten Sie fortfahren? angezeigt wirdBeispielsweise bereitet der folgende Befehl das defekte Modul in Steckplatz 4 auf Knoten 2 (den beeinträchtigten Controller) für die Entfernung vor und zeigt eine Meldung an, dass es sicher entfernt werden kann:
node2::> system controller slot module remove -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered off for removal. Do you want to continue? {y|n}: y The module has been successfully removed from service and powered off. It can now be safely removed. -
-
Überprüfen Sie, ob das ausgefallene E/A-Modul ausgeschaltet ist:
system controller slot module showDie Ausgabe sollte
powered-offin derstatusSpalte für das ausgefallene Modul und dessen Steckplatznummer angezeigt werden.
Schritt 3: Das defekte E/A-Modul per Hot-Swap austauschen
Tauschen Sie das defekte E/A-Modul im Hot-Swap-Verfahren gegen ein gleichwertiges E/A-Modul aus:
-
Wenn Sie nicht bereits geerdet sind, sollten Sie sich richtig Erden.
-
Entfernen Sie das defekte E/A-Modul aus dem beeinträchtigten Controller:
Drehen Sie die Flügelschraube des E/A-Moduls gegen den Uhrzeigersinn, um sie zu lösen.
Ziehen Sie das E/A-Modul mithilfe der Anschlussbeschriftungslasche links und der Rändelschraube rechts aus dem Controller.
-
Installieren Sie das Ersatz-I/O-Modul:
-
Richten Sie das E/A-Modul an den Kanten des Schlitzes aus.
-
Drücken Sie das E/A-Modul vorsichtig ganz in den Steckplatz und achten Sie darauf, dass das E/A-Modul richtig im Anschluss sitzt.
Zum Eindrücken des I/O-Moduls können Sie die Lasche links und die Rändelschraube rechts verwenden.
-
Drehen Sie die Rändelschraube im Uhrzeigersinn, um sie festzuziehen.
-
-
Verkabeln Sie das Ersatz-E/A-Modul.
Schritt 4: Bringen Sie das Ersatz-E/A-Modul online
Schalten Sie das Ersatz-I/O-Modul online, überprüfen Sie, ob die I/O-Modul-Ports erfolgreich initialisiert wurden, überprüfen Sie, ob der Steckplatz mit Strom versorgt ist, und überprüfen Sie dann, ob das I/O-Modul online und erkannt ist.
Nachdem das E/A-Modul ausgetauscht wurde und die Ports wieder in einen fehlerfreien Zustand versetzt wurden, werden die LIFs auf das ausgetauschte E/A-Modul zurückgesetzt.
-
Schalten Sie das Ersatz-E/A-Modul online:
-
Geben Sie den folgenden Befehl ein:
system controller slot module insert -node impaired_node_name -slot slot_number -
Eingeben
ywenn die Eingabeaufforderung „Möchten Sie fortfahren?“ angezeigt wirdDie Ausgabe sollte bestätigen, dass das I/O-Modul erfolgreich online geschaltet wurde (eingeschaltet, initialisiert und in Betrieb genommen).
Beispielsweise bringt der folgende Befehl Steckplatz 4 auf Knoten 2 (den beeinträchtigten Controller) online und zeigt eine Meldung an, dass der Vorgang erfolgreich war:
node2::> system controller slot module insert -node node2 -slot 4 Warning: IO_2X_100GBE_NVDA_NIC module in slot 4 of node node2 will be powered on and initialized. Do you want to continue? {y|n}: `y` The module has been successfully powered on, initialized and placed into service. -
-
Überprüfen Sie, ob jeder Port des E/A-Moduls erfolgreich initialisiert wurde:
-
Geben Sie den folgenden Befehl von der Konsole des beeinträchtigten Controllers ein:
event log show -event *hotplug.init*Es kann mehrere Minuten dauern, bis erforderliche Firmware-Updates durchgeführt und Ports initialisiert sind. Die Ausgabe sollte ein oder mehrere hotplug.init.success EMS-Ereignisse anzeigen, die darauf hinweisen, dass jeder Port auf dem E/A-Modul erfolgreich initialisiert wurde.
Beispielsweise zeigt die folgende Ausgabe, dass die Initialisierung für die I/O-Ports e4b und e4a erfolgreich war:
node2::> event log show -event *hotplug.init* Time Node Severity Event ------------------- ---------------- ------------- --------------------------- 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4b" in slot 4 succeeded 7/11/2025 16:04:06 node2 NOTICE hotplug.init.success: Initialization of ports "e4a" in slot 4 succeeded 2 entries were displayed.
-
Falls die Portinitialisierung fehlschlägt, überprüfen Sie das EMS-Log, um die nächsten Schritte zu ermitteln.
-
-
Überprüfen Sie, ob der I/O-Modul-Steckplatz eingeschaltet und betriebsbereit ist:
system controller slot module showDie Ausgabe sollte den Steckplatzstatus als
powered-onanzeigen und somit die Betriebsbereitschaft des E/A-Moduls signalisieren. -
Prüfen Sie, ob das I/O-Modul online und erkannt ist.
Geben Sie den Befehl von der Konsole des beeinträchtigten Controllers ein:
system controller config show -node local -slot slot_numberWenn das I/O-Modul erfolgreich online geschaltet wurde und erkannt wird, zeigt die Ausgabe Informationen zum I/O-Modul an, einschließlich Portinformationen für den Slot.
Beispielsweise sollten Sie eine Ausgabe ähnlich der folgenden für ein E/A-Modul in Steckplatz 4 sehen:
node2::> system controller config show -node local -slot 4 Node: node2 Sub- Device/ Slot slot Information ---- ---- ----------------------------- 4 - Dual 40G/100G Ethernet Controller CX6-DX e4a MAC Address: d0:39:ea:59:69:74 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2807GJFM-B e4b MAC Address: d0:39:ea:59:69:75 (auto-100g_cr4-fd-up) QSFP Vendor: CISCO-BIZLINK QSFP Part Number: L45593-D218-D10 QSFP Serial Number: LCC2809G26F-A Device Type: CX6-DX PSID(NAP0000000027) Firmware Version: 22.44.1700 Part Number: 111-05341 Hardware Revision: 20 Serial Number: 032403001370
Schritt 5: Wiederherstellen des Normalbetriebs des Speichersystems
Stellen Sie den Normalbetrieb Ihres Speichersystems wieder her, indem Sie den Speicher dem übernommenen Controller zurückgeben (falls erforderlich), die automatische Rückgabe wiederherstellen (falls erforderlich), überprüfen, ob sich die LIFs an ihren Heimatports befinden, und die automatische Fallerstellung von AutoSupport wieder aktivieren.
-
Je nach Version von ONTAP, die auf Ihrem Speichersystem läuft, und dem Status der Controller geben Sie den Speicher zurück und stellen die automatische Rückgabe auf dem übernommenen Controller wieder her:
ONTAP-Version Wenn… Dann… 9.17.1 oder 9.18.1RC
Wenn der beeinträchtigte Controller den gesunden Controller automatisch übernommen hat
-
Stellen Sie den intakten Controller wieder in den Normalbetrieb her, indem Sie ihm seinen Storage zurückgeben:
storage failover giveback -ofnode healthy_node_name -
Stellen Sie das automatische Giveback von der Konsole des betroffenen Controllers wieder her:
storage failover modify -node local -auto-giveback true
9.18.1GA oder später
Wenn einer der beiden Controller automatisch das Takeover seines Partners durchführte
-
Stellen Sie den übernommenen Controller wieder in den Normalbetrieb, indem Sie ihm seinen Speicher zurückgeben:
storage failover giveback -ofnode controller that was taken over_name -
Stellen Sie das automatische Giveback von der Konsole des übernommenen Controllers wieder her:
storage failover modify -node local -auto-giveback true
9.18.1GA oder später
Beide Controller sind betriebsbereit und führen E/A aus (liefern Daten)
Fahren Sie mit dem nächsten Schritt fort.
-
-
Vergewissern Sie sich, dass die logischen Schnittstellen ihrem Home-Server und ihren Ports Berichterstellung:
network interface show -is-home falseWenn eine der LIFs als falsch aufgeführt ist, stellen Sie sie auf ihre Home-Ports zurück:
network interface revert -vserver * -lif * -
Wenn AutoSupport aktiviert ist, stellen Sie die automatische Fallerstellung wieder her:
system node autosupport invoke -node * -type all -message MAINT=end
Schritt 6: Senden Sie das fehlgeschlagene Teil an NetApp zurück
Senden Sie das fehlerhafte Teil wie in den dem Kit beiliegenden RMA-Anweisungen beschrieben an NetApp zurück. "Rückgabe und Austausch von Teilen"Weitere Informationen finden Sie auf der Seite.