Richten Sie die synchrone Replikation mit NetApp SnapMirror Active Sync und Microsoft Stretch-Clustern ein
Verwenden Sie SnapMirror Active Sync, um eine synchrone, bidirektionale Replikation zwischen Microsoft Stretch-Failover-Clustern zu konfigurieren. Dieses Verfahren umfasst die Installation eines Stretch-Failover-Clusters, die Erstellung eines Intercluster-Peerings, die Konfiguration eines Mediators mit ONTAP, die Aktivierung des symmetrischen Aktiv/Aktiv-Schutzes und die Durchführung von Cluster-Failover-Validierungstests.
Einführung
Ab ONTAP 9.15.1 unterstützt SnapMirror Active Sync symmetrische Active/Active-Bereitstellungen und ermöglicht Lese- und Schreib-E/A-Vorgänge von beiden Kopien einer geschützten LUN mit bidirektionaler synchroner Replikation. Ein Windows Stretch Cluster ist eine Erweiterung der Windows Failover Cluster-Funktion, die sich über mehrere geografische Standorte erstreckt, um hohe Verfügbarkeit und Notfallwiederherstellung zu gewährleisten. Mit SnapMirror Active Sync Symmetric Active/Active und Cluster-Anwendungen wie Windows Failover Clustering können wir eine kontinuierliche Verfügbarkeit für geschäftskritische Microsoft Hyper-V-Anwendungen erreichen, um bei unerwarteten Vorfällen RTO und RPO von Null zu erreichen. Diese Lösung bietet die folgenden Vorteile:
-
Kein Datenverlust: Stellt sicher, dass Daten synchron repliziert werden, wodurch ein Recovery Point Objective (RPO) von Null erreicht wird.
-
Hohe Verfügbarkeit und Lastausgleich: Beide Sites können Anfragen aktiv verarbeiten und so für Lastausgleich und hohe Verfügbarkeit sorgen.
-
Geschäftskontinuität: Implementieren Sie eine symmetrische Aktiv/Aktiv-Konfiguration, um sicherzustellen, dass beide Rechenzentren aktiv Anwendungen bereitstellen und im Falle eines Ausfalls nahtlos übernehmen können.
-
Verbessern Sie die Leistung: Verwenden Sie eine symmetrische Aktiv/Aktiv-Konfiguration, um die Last auf mehrere Speichersysteme zu verteilen und so die Reaktionszeiten und die Gesamtsystemleistung zu verbessern.
Dieses Dokument dokumentiert die synchrone bidirektionale Replikation der SnapMirror Active Sync-Technologie zwischen Microsoft Stretch Failover-Clustern, wodurch Anwendungsdaten mehrerer Standorte, beispielsweise MSSQL und Oracle, aktiv zugänglich und an beiden Standorten synchronisiert sind. Wenn ein Fehler auftritt, werden Anwendungen sofort auf die verbleibende aktive Site umgeleitet, ohne dass Daten oder Zugriff verloren gehen. Dies gewährleistet hohe Verfügbarkeit, Notfallwiederherstellung und geografische Redundanz.
Anwendungsfälle
Im Falle einer Störung wie beispielsweise eines Cyberangriffs, eines Stromausfalls oder einer Naturkatastrophe erfordert eine global vernetzte Geschäftsumgebung eine schnelle Wiederherstellung geschäftskritischer Anwendungsdaten ohne Datenverlust. Diese Anforderungen sind in Bereichen wie dem Finanzwesen und der Einhaltung gesetzlicher Vorschriften wie der Datenschutz-Grundverordnung (DSGVO) noch höher. Setzen Sie eine symmetrische Aktiv/Aktiv-Konfiguration ein, um Daten zwischen geografisch verteilten Standorten zu replizieren, lokalen Zugriff auf Daten zu ermöglichen und die Kontinuität bei regionalen Ausfällen sicherzustellen.
SnapMirror Active Sync bietet die folgenden Anwendungsfälle:
Bei einer SnapMirror Active Sync-Bereitstellung verfügen Sie über einen primären und einen Spiegelcluster. Ein LUN im primären Cluster (L1P) verfügt über ein Spiegelbild (L1S) auf dem sekundären Cluster. Lese- und Schreibvorgänge werden basierend auf den Hot Proximity-Einstellungen von der lokalen Site der Hosts ausgeführt.
Transparent Application Failover (TAF) basiert auf einem softwarebasierten Pfad-Failover des Host-MPIO, um einen unterbrechungsfreien Zugriff auf den Speicher zu erreichen. Beide LUN-Kopien – beispielsweise die primäre (L1P) und die Spiegelkopie (L1S) – haben dieselbe Identität (Seriennummer) und werden dem Host als lesbar und schreibbar gemeldet.
Clusteranwendungen, darunter VMware vSphere Metro Storage Cluster (vMSC), Oracle RAC und Windows Failover Clustering mit SQL, erfordern gleichzeitigen Zugriff, damit die VMs ohne Leistungseinbußen auf die andere Site umgeschaltet werden können. SnapMirror Active Sync Symmetric Active/Active bedient IO lokal mit bidirektionaler Replikation, um die Anforderungen von Clusteranwendungen zu erfüllen.
Replizieren Sie synchron mehrere Volumes für eine Anwendung zwischen Standorten an geografisch verteilten Standorten. Sie können im Falle einer Störung auf der primären Kopie automatisch ein Failover auf die sekundäre Kopie durchführen und so die Geschäftskontinuität für Tier-1-Anwendungen gewährleisten.
SnapMirror Active Sync bietet Flexibilität mit benutzerfreundlicher Granularität auf Anwendungsebene und automatischem Failover, um eine hohe Datenverfügbarkeit und schnelle Datenreplikation für Ihre geschäftskritischen Anwendungen wie Oracle, Microsoft SQL Server usw. sowohl in virtuellen als auch in physischen Umgebungen zu erreichen.
Lösungsarchitektur
Der Microsoft Stretch-Cluster verfügt an jedem Standort über zwei Hyper-V-Knoten. Diese beiden Knoten teilen sich den NetApp -Speicher und verwenden SnapMirror Active Sync Symmetric Active-Active, um die Volumes zwischen den beiden Standorten zu replizieren. Eine Konsistenzgruppe stellt sicher, dass alle Volumes eines Datensatzes stillgelegt und zum exakt gleichen Zeitpunkt erneut gesichert werden. Dies bietet einen datenkonsistenten Wiederherstellungspunkt über alle Volumes hinweg, die den Datensatz unterstützen. Der ONTAP Mediator empfängt Integritätsinformationen zu verbundenen ONTAP Clustern und -Knoten, koordiniert die Kommunikation zwischen beiden und ermittelt, ob jeder Knoten/Cluster fehlerfrei und betriebsbereit ist.
Lösungskomponenten:
-
Zwei NetApp Storage Systeme ONTAP 9.15.1: erste und zweite Fehlerdomäne
-
Eine Redhat 8.7 VM für ONTAP Mediator
-
Drei Hyper-V-Failovercluster unter Windows 2022:
-
Site1, Site 2 für die Anwendungen
-
Site 3 für Mediator
-
-
VM auf Hyper-V: Microsoft Domänencontroller, MSSQL Always On Failoverclusterinstanz, ONTAP Mediator
Installieren eines Microsoft Stretch Failoverclusters
Sie können Windows Admin Center, PowerShell oder die Server Manager-Konsole verwenden, um die Failoverclustering-Funktion und die zugehörigen PowerShell-Cmdlets zu installieren. Ausführliche Informationen zu Voraussetzungen und Schritten finden Sie unter „Erstellen eines Failoverclusters“.
Hier ist eine Schritt-für-Schritt-Anleitung zum Einrichten eines Windows Stretch Clusters:
-
Installieren Sie Windows 2022 auf allen vier Servern Hyperv1, Hyperv2, Hyperv3 und Hyperv4
-
Fügen Sie alle vier Server derselben Active Directory-Domäne hinzu: hyperv.local.
-
Installieren Sie die Windows-Funktionen Failover-Clustering, Hyper-V, Hyper-V_Powershell und MPIO auf jedem Server.
Install-WindowsFeature –Name "Failover-Clustering", "Hyper-V", "Hyper-V-Powershell", "MPIO" –IncludeManagementTools
-
Konfigurieren Sie MPIO und fügen Sie Unterstützung für iSCSI-Geräte hinzu.
-
Erstellen Sie auf dem ONTAP -Speicher von Site 1 und Site 2 zwei iSCSI-LUNs (SQLdata und SQLlog) und ordnen Sie sie der IQN-Gruppe der Windows-Server zu. Verwenden Sie den Microsoft iSCSI-Softwareinitiator, um die LUNs zu verbinden. Weitere Einzelheiten finden Sie unter"iSCSI-Konfiguration für Windows" .
-
Führen Sie den Clustervalidierungsbericht aus, um Fehler oder Warnungen zu ermitteln.
Test-Cluster –Node hyperv1, hyperv2, hyperv3, hyperv4
-
Erstellen Sie einen Failover-Cluster, weisen Sie eine statische IP-Adresse zu,
New-Cluster –Name <clustername> –Node hyperv1, hyperv2, hyperv3, hyperv4, StaticAddress <IPaddress>
-
Fügen Sie die zugeordneten iSCSI-Speicher zum Failovercluster hinzu.
-
Konfigurieren Sie einen Zeugen für das Quorum, klicken Sie mit der rechten Maustaste auf den Cluster → Weitere Aktionen → Cluster-Quorum-Einstellungen konfigurieren, wählen Sie Datenträgerzeugen.
Das folgende Diagramm zeigt vier geclusterte gemeinsam genutzte LUNs – zwei Sites „sqldata“ und „sqllog“ und einen Datenträgerzeugen im Quorum.
Eine Always On Failover Cluster Instance (FCI) ist eine SQL Server-Instanz, die über Knoten mit gemeinsam genutztem SAN-Datenträgerspeicher in einem WSFC installiert wird. Während eines Failovers überträgt der WSFC-Dienst den Besitz der Ressourcen der Instanz auf einen bestimmten Failover-Knoten. Anschließend wird die SQL Server-Instanz auf dem Failover-Knoten neu gestartet und die Datenbanken werden wie gewohnt wiederhergestellt. Weitere Einzelheiten zur Einrichtung finden Sie unter Windows Failover Clustering mit SQL. Erstellen Sie an jedem Standort zwei Hyper-V SQL FCI-VMs und legen Sie die Priorität fest. Verwenden Sie Hyperv1 und Hyperv2 als bevorzugte Besitzer für die VMs von Site 1 und Hyperv3 und Hyperv4 als bevorzugte Besitzer für die VMs von Site 2.
Intercluster-Peering erstellen
Sie müssen Peer-Beziehungen zwischen Quell- und Zielclustern erstellen, bevor Sie Snapshot-Kopien mit SnapMirror replizieren können.
-
Fügen Sie auf beiden Clustern Intercluster-Netzwerkschnittstellen hinzu
-
Mit dem Befehl „Cluster Peer Create“ können Sie eine Peer-Beziehung zwischen einem lokalen und einem Remote-Cluster erstellen. Nachdem die Peer-Beziehung erstellt wurde, können Sie „Cluster Peer Create“ auf dem Remote-Cluster ausführen, um ihn beim lokalen Cluster zu authentifizieren.
Mediator mit ONTAP konfigurieren
Der ONTAP Mediator empfängt Integritätsinformationen zu verbundenen ONTAP Clustern und -Knoten, koordiniert die Kommunikation zwischen beiden und ermittelt, ob jeder Knoten/Cluster fehlerfrei und betriebsbereit ist. SM-as ermöglicht die Replikation von Daten auf das Ziel, sobald sie auf das Quellvolume geschrieben werden. Der Mediator muss in der dritten Fehlerdomäne eingesetzt werden. Voraussetzungen
-
HW-Spezifikationen: 8 GB RAM, 2 x 2 GHz CPU, 1 GB Netzwerk (<125 ms RTT)
-
Installiertes Red Hat 8.7 OS, überprüfen"ONTAP Mediator-Version und unterstützte Linux-Version" .
-
Konfigurieren Sie den Mediator Linux-Host: Netzwerk-Setup und Firewall-Ports 31784 und 3260
-
Installieren Sie das yum-utils-Paket
-
"Registrieren Sie einen Sicherheitsschlüssel, wenn UEFI Secure Boot aktiviert ist"
-
Laden Sie das Mediator-Installationspaket von der"ONTAP Mediator-Downloadseite" .
-
Überprüfen Sie die Code-Signatur des ONTAP Mediators.
-
Führen Sie das Installationsprogramm aus und reagieren Sie wie erforderlich auf die Eingabeaufforderungen:
./ontap-mediator-1.8.0/ontap-mediator-1.8.0 -y
-
Wenn Secure Boot aktiviert ist, müssen Sie nach der Installation zusätzliche Schritte ausführen, um den Sicherheitsschlüssel zu registrieren:
-
Befolgen Sie die Anweisungen in der README-Datei, um das SCST-Kernelmodul zu signieren:
/opt/netapp/lib/ontap_mediator/ontap_mediator/SCST_mod_keys/README.module-signing
-
Suchen Sie die erforderlichen Schlüssel:
/opt/netapp/lib/ontap_mediator/ontap_mediator/SCST_mod_keys
-
-
Überprüfen der Installation
-
Bestätigen Sie die Prozesse:
systemctl status ontap_mediator mediator-scst
-
Bestätigen Sie die vom ONTAP Mediator-Dienst verwendeten Ports:
-
-
Initialisieren Sie den ONTAP Mediator für SnapMirror Active Sync mit selbstsignierten Zertifikaten
-
Suchen Sie das ONTAP Mediator CA-Zertifikat im Installationsverzeichnis der ONTAP Mediator Linux VM/Host-Software: cd /opt/netapp/lib/ontap_mediator/ontap_mediator/server_config.
-
Fügen Sie das ONTAP Mediator CA-Zertifikat zu einem ONTAP Cluster hinzu.
security certificate install -type server-ca -vserver <vserver_name>
-
-
Fügen Sie den Mediator hinzu, gehen Sie zu System Manager, Schützen > Übersicht > Mediator, geben Sie die IP-Adresse, den Benutzernamen (API-Benutzerstandard ist mediatoradmin), das Passwort und den Port 31784 des Mediators ein.
Das folgende Diagramm zeigt die Einrichtung der Intercluster-Netzwerkschnittstelle, der Cluster-Peers, des Mediators und des SVM-Peers.
Konfigurieren Sie den symmetrischen Aktiv/Aktiv-Schutz
Konsistenzgruppen erleichtern die Verwaltung der Anwendungsarbeitslast, indem sie einfach zu konfigurierende lokale und Remote-Schutzrichtlinien sowie gleichzeitige absturz- oder anwendungskonsistente Snapshot-Kopien einer Sammlung von Volumes zu einem bestimmten Zeitpunkt bereitstellen. Weitere Einzelheiten finden Sie unter"Übersicht über Konsistenzgruppen" . Für dieses Setup verwenden wir eine einheitliche Konfiguration.
-
Geben Sie beim Erstellen der Konsistenzgruppe Hostinitiatoren an, um igroups zu erstellen.
-
Aktivieren Sie das Kontrollkästchen „SnapMirror aktivieren“ und wählen Sie dann die Richtlinie „AutomatedFailoverDuplex“ aus.
-
Aktivieren Sie im angezeigten Dialogfeld das Kontrollkästchen „Initiatorgruppen replizieren“, um igroups zu replizieren. Legen Sie unter „Proximale Einstellungen bearbeiten“ proximale SVMs für Ihre Hosts fest.
-
Wählen Sie Speichern
Die Schutzbeziehung wird zwischen Quelle und Ziel hergestellt.
Durchführen eines Cluster-Failover-Validierungstests
Wir empfehlen Ihnen, geplante Failover-Tests durchzuführen, um eine Clustervalidierungsprüfung durchzuführen. Die SQL-Datenbanken oder jegliche Clustersoftware auf beiden Sites – die primäre oder gespiegelte Site – sollten während der Tests weiterhin zugänglich sein.
Zu den Anforderungen des Hyper-V-Failoverclusters gehören:
-
Die aktive Synchronisierungsbeziehung von SnapMirror muss synchronisiert sein.
-
Sie können kein geplantes Failover einleiten, wenn ein unterbrechungsfreier Vorgang ausgeführt wird. Zu den unterbrechungsfreien Vorgängen gehören Volumeverschiebungen, Aggregatverlagerungen und Speicherfailover.
-
Der ONTAP Mediator muss konfiguriert, verbunden und im Quorum sein.
-
Um den Prozess der VM-Migration zu optimieren, gehören an jedem Standort mindestens zwei Hyper-V-Clusterknoten mit CPU-Prozessoren zur selben CPU-Familie. Bei den CPUs sollte es sich um CPUs mit Unterstützung für hardwaregestützte Virtualisierung und hardwarebasierte Data Execution Prevention (DEP) handeln.
-
Um die Ausfallsicherheit zu gewährleisten, sollten Hyper-V-Clusterknoten dieselben Active Directory-Domänenmitglieder sein.
-
Hyper-V-Clusterknoten und NetApp Speicherknoten sollten über redundante Netzwerke verbunden sein, um einen einzelnen Ausfallpunkt zu vermeiden.
-
Gemeinsam genutzter Speicher, auf den alle Clusterknoten über das iSCSI-, Fibre Channel- oder SMB 3.0-Protokoll zugreifen können.
Testszenarien
Es gibt viele Möglichkeiten, ein Failover auf einem Host, Speicher oder Netzwerk auszulösen.
-
Knotenausfall Ein Failover-Clusterknoten kann die Arbeitslast eines ausgefallenen Knotens übernehmen, ein Vorgang, der als Failover bezeichnet wird. Aktion: Schalten Sie einen Hyper-V-Knoten aus. Erwartetes Ergebnis: Der andere Knoten im Cluster übernimmt die Arbeitslast. VMs werden auf den anderen Knoten migriert.
-
Ausfall einer Site. Wir können auch die gesamte Site ausfallen lassen und das Failover der primären Site auf die Spiegelsite auslösen: Aktion: Schalten Sie beide Hyper-V-Knoten an einer Site aus. Erwartetes Ergebnis: VMs am primären Standort werden zum Hyper-V-Cluster des Spiegelstandorts migriert, da SnapMirror Active Sync Symmetric Active/Active IO lokal mit bidirektionaler Replikation bedient, ohne Auswirkungen auf die Arbeitslast mit null RPO und null RTO.
-
Stoppen Sie eine SVM auf der primären Site. Aktion: Stoppen Sie die iSCSI-SVM. Erwartete Ergebnisse: Der primäre Hyper-V-Cluster hat bereits eine Verbindung zur gespiegelten Site hergestellt und mit SnapMirror Active Sync Symmetric Active/Active gibt es keine Auswirkungen auf die Arbeitslast mit null RPO und null RTO.
Beachten Sie bei den Tests Folgendes:
-
Beobachten Sie das Verhalten des Clusters und stellen Sie sicher, dass die Dienste auf die verbleibenden Knoten übertragen werden.
-
Überprüfen Sie, ob Fehler oder Dienstunterbrechungen vorliegen.
-
Stellen Sie sicher, dass der Cluster Speicherfehler verarbeiten und den Betrieb fortsetzen kann.
-
Stellen Sie sicher, dass auf die Datenbankdaten zugegriffen werden kann und die Dienste weiterhin funktionieren.
-
Stellen Sie sicher, dass die Integrität der Datenbankdaten gewahrt bleibt.
-
Überprüfen Sie, ob bestimmte Anwendungen ohne Auswirkungen auf den Benutzer auf einen anderen Knoten umgeschaltet werden können.
-
Stellen Sie sicher, dass der Cluster die Last ausgleichen und die Leistung während und nach einem Failover aufrechterhalten kann.
Zusammenfassung
SnapMirror Active Sync kann dazu beitragen, dass Anwendungsdaten mehrerer Standorte, beispielsweise MSSQL und Oracle, aktiv zugänglich und auf beiden Standorten synchronisiert sind. Wenn ein Fehler auftritt, werden Anwendungen sofort auf die verbleibende aktive Site umgeleitet, ohne dass Daten oder Zugriff verloren gehen.