Erfahren Sie mehr über die HA-Paarverwaltung in ONTAP-Clustern
Die Clusterknoten werden in Hochverfügbarkeitspaaren (HA) konfiguriert, um Fehlertoleranz und unterbrechungsfreien Betrieb zu gewährleisten. Wenn ein Knoten ausfällt oder wenn Sie einen Knoten für routinemäßige Wartungsarbeiten herunterfahren müssen, kann sein Partner den Speicher übernehmen und weiterhin Daten von diesem Knoten bereitstellen. Der Partner stellt den Speicherplatz wieder zur Verfügung, sobald der Knoten wieder online ist.
Die HA-Paar-Controller-Konfiguration besteht aus einem Paar von zusammenpassenden Speichercontrollern (lokaler Knoten und Partnerknoten). Jeder dieser Knoten ist mit den Festplattengehäusen der anderen verbunden. Wenn bei einem Knoten eines HA-Paares ein Fehler auftritt und die Datenverarbeitung eingestellt wird, erkennt der Partner den Fehlerzustand des Partners und übernimmt die gesamte Datenverarbeitung von diesem Controller.
Übernahme ist der Prozess, in dem ein Node die Kontrolle über den Storage seines Partners übernimmt.
GiveBack ist der Prozess, in dem die Speicherung an den Partner zurückgeschickt wird.
Standardmäßig werden Übernahmen automatisch in einer der folgenden Situationen durchgeführt:
-
Ein Software- oder Systemfehler tritt auf einem Node auf, der zu einem Panikzustand führt. Die HA-Paar-Controller führen automatisch einen Failover auf den Partner-Node durch. Nachdem der Partner den Panikzustand wiederhergestellt und hochgefahren hat, führt der Node automatisch ein Giveback durch und stellt den normalen Betrieb des Partners wieder her.
-
Auf einem Node tritt ein Systemfehler auf, und der Node kann nicht neu gebootet werden. Wenn ein Node beispielsweise aufgrund eines Stromausfalls ausfällt, führen die HA-Paar-Controller automatisch einen Failover auf seinen Partner-Node aus und stellen Daten vom verbleibenden Storage Controller bereit.
|
|
Sollte auch der Storage für einen Node zur gleichen Zeit an Strom verlieren, ist ein Standard-Takeover nicht möglich. |
-
Heartbeat-Meldungen werden nicht vom Partner des Node empfangen. Das könnte passieren, wenn der Partner einen Hardware- oder Softwarefehler (z. B. ein Interconnect-Fehler) hat, der nicht zu einem Panik- oder Systemfehler geführt hat, aber dennoch daran gehindert wird, ihn korrekt zu funktionieren.
-
Sie beenden einen der Nodes, ohne den
-f-inhibit-takeover trueParameter oder zu verwenden.
|
|
In einem Cluster mit zwei Nodes und aktiviertem Cluster HA ‑inhibit‑takeover true bewirkt das Anhalten oder Neubooten eines Node mit dem Parameter, dass beide Nodes nicht mehr Daten bereitstellen, es sei denn, Sie deaktivieren zuerst Cluster HA und weisen dann Epsilon dem Node zu, der online bleiben soll.
|
-
Sie booten einen der Nodes ohne Verwendung des
‑inhibit‑takeover trueParameters neu. (Der‑onbootParameter desstorage failoverBefehls ist standardmäßig aktiviert.) -
Das Remote-Management-Gerät (Service Processor) erkennt den Ausfall des Partner-Node. Dies gilt nicht, wenn Sie die Hardware-gestützte Übernahme deaktivieren.
Sie können Takeovers auch manuell mit dem storage failover takeover Befehl starten.
Ab ONTAP 9.18.1 können Sie die verschlüsselte Kommunikation zwischen HA-Paarknoten konfigurieren. Weitere Informationen finden Sie unter"Konfigurieren Sie die Verschlüsselung für den ONTAP HA-Datenverkehr." .
Verbesserungen bei der Cluster-Ausfallsicherheit und Diagnose
Ab ONTAP 9.9 verbessern die folgenden Ergänzungen die Clusterbedienung:
-
Port-Überwachung und -Vermeidung: In zwei-Knoten-Cluster-Konfigurationen ohne Switches vermeidet das System Ports, die einen vollständigen Paketverlust (Verbindungsverlust) aufweisen. Ab ONTAP 9.8.1 war diese Funktionalität nur in geschalteten Konfigurationen verfügbar.
-
Automatisches Knoten-Failover: Wenn ein Knoten keine Daten über sein Cluster-Netzwerk bereitstellen kann, sollte dieser Knoten keine Festplatten besitzen. Stattdessen sollte sein HA-Partner übernehmen, wenn der Partner gesund ist.
-
Befehle zur Analyse von Verbindungsproblemen: Verwenden Sie den folgenden Befehl, um anzuzeigen, welche Cluster-Pfade Paketverlust haben:
network interface check cluster-connectivity showErfahren Sie mehr über
network interface check cluster-connectivity showin der "ONTAP-Befehlsreferenz".