Dinge zu überprüfen, bevor Sie zurückkehren
Vor dem Zurücksetzen sollten Sie den Cluster-Zustand, den Storage-Zustand und die Systemzeit überprüfen. Sie sollten auch Clusterjobs löschen, die ausgeführt werden, und SMB-Sitzungen, die nicht kontinuierlich verfügbar sind, ordnungsgemäß beenden.
Überprüfen des Cluster-Systemzustands
Bevor Sie das Cluster wiederherstellen, sollten Sie überprüfen, ob die Nodes ordnungsgemäß sind und berechtigt sind, am Cluster teilzunehmen, und dass sich das Cluster in einem Quorum befindet.
-
Überprüfen Sie, ob die Nodes im Cluster online sind und am Cluster teilnehmen können:
cluster show
cluster1::> cluster show Node Health Eligibility --------------------- ------- ------------ node0 true true node1 true true
Wenn ein Knoten fehlerhaft oder nicht geeignet ist, überprüfen Sie die EMS-Protokolle auf Fehler und ergreifen Sie Korrekturmaßnahmen.
-
Stellen Sie die Berechtigungsebene auf erweitert: + ein
set -privilege advanced
Geben Sie ein,
y
um fortzufahren. -
Überprüfen Sie die Konfigurationsdetails für jeden RDB-Prozess.
-
Die Epochen der relationalen Datenbank und Datenbank-Epochen sollten für jeden Node übereinstimmen.
-
Der Quorum-Master pro Ring sollte für alle Knoten gleich sein.
Beachten Sie, dass für jeden Ring möglicherweise ein anderer Quorum-Master vorhanden ist.
So zeigen Sie diesen RDB-Prozess an: Diesen Befehl eingeben… Managementapplikation
cluster ring show -unitname mgmt
Volume-Standortdatenbank
cluster ring show -unitname vldb
Virtual Interface Manager
cluster ring show -unitname vifmgr
SAN Management-Daemon
cluster ring show -unitname bcomd
Dieses Beispiel zeigt den Datenbankprozess für den Speicherort des Volumes:
cluster1::*> cluster ring show -unitname vldb Node UnitName Epoch DB Epoch DB Trnxs Master Online --------- -------- -------- -------- -------- --------- --------- node0 vldb 154 154 14847 node0 master node1 vldb 154 154 14847 node0 secondary node2 vldb 154 154 14847 node0 secondary node3 vldb 154 154 14847 node0 secondary 4 entries were displayed.
-
-
Zurück zur Administratorberechtigungsebene:
set -privilege admin
-
Wenn Sie in einer SAN-Umgebung arbeiten, stellen Sie sicher, dass sich jeder Knoten in einem SAN-Quorum befindet:
event log show -severity informational -message-name scsiblade.*
Die letzte scsiblade-Ereignismeldung für jeden Knoten sollte darauf hinweisen, dass sich das scsi-Blade im Quorum befindet.
cluster1::*> event log show -severity informational -message-name scsiblade.* Time Node Severity Event --------------- ---------- -------------- --------------------------- MM/DD/YYYY TIME node0 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ... MM/DD/YYYY TIME node1 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ...
Überprüfung des Storage-Zustands
Bevor Sie ein Cluster zurücksetzen, sollten Sie den Status Ihrer Festplatten, Aggregate und Volumes überprüfen.
-
Überprüfen des Festplattenstatus:
Um zu prüfen, ob… Tun Sie das… Fehlerhafte Festplatten
-
Defekte Festplatten anzeigen:
storage disk show -state broken
-
Entfernen oder ersetzen Sie alle defekten Festplatten.
Festplatten werden gewartet oder rekonstruiert
-
Zeigen Sie alle Festplatten an, die sich im Wartungs-, Ausstehenden- oder Rekonstruktionstatus befinden: `storage disk show -state maintenance
pending
reconstructing` .. Warten Sie, bis die Wartung oder Rekonstruktion abgeschlossen ist, bevor Sie fortfahren.
-
-
Überprüfen Sie, ob alle Aggregate online sind, indem Sie den Status des physischen und logischen Storage, einschließlich Storage-Aggregaten anzeigen:
storage aggregate show -state !online
Mit diesem Befehl werden die Aggregate angezeigt, die Not online sind. Alle Aggregate müssen vor und nach einem größeren Upgrade oder einer erneuten Version online sein.
cluster1::> storage aggregate show -state !online There are no entries matching your query.
-
Überprüfen Sie, ob alle Volumes online sind, indem Sie alle Volumes anzeigen, die Not online sind:
volume show -state !online
Alle Volumes müssen vor und nach einem größeren Upgrade oder einer erneuten Version online sein.
cluster1::> volume show -state !online There are no entries matching your query.
-
Vergewissern Sie sich, dass keine inkonsistenten Volumes vorhanden sind:
volume show -is-inconsistent true
Lesen Sie den Artikel "Volume zeigt WAFL inkonsistent an"der Knowledge Base, wie Sie die inkonsistenten Volumes bewältigen können.
Überprüfen der Systemzeit
Bevor Sie die Einstellungen zurücksetzen, sollten Sie überprüfen, ob NTP konfiguriert ist und ob die Zeit über das Cluster synchronisiert wird.
-
Überprüfen Sie, ob das Cluster einem NTP-Server zugeordnet ist:
cluster time-service ntp server show
-
Überprüfen Sie, ob auf jedem Node dasselbe Datum und dieselbe Uhrzeit angegeben sind:
cluster date show
cluster1::> cluster date show Node Date Timezone --------- ------------------- ------------------------- node0 4/6/2013 20:54:38 GMT node1 4/6/2013 20:54:38 GMT node2 4/6/2013 20:54:38 GMT node3 4/6/2013 20:54:38 GMT 4 entries were displayed.
Vergewissern Sie sich, dass keine Jobs ausgeführt werden
Bevor Sie die ONTAP Software zurücksetzen, müssen Sie den Status von Cluster-Jobs überprüfen. Bei beliebigen Aggregaten, Volumes, NDMP (Dump oder Restore) oder Snapshot Jobs (z. B. Erstellen, Löschen, Verschieben, Ändern, Replizieren, Und Mount-Jobs) werden ausgeführt oder in die Warteschlange gestellt. Sie müssen zulassen, dass die Jobs erfolgreich abgeschlossen werden, oder dass die in der Warteschlange befindlichen Einträge angehalten werden.
-
Prüfen Sie die Liste aller ausgeführten oder in der Warteschlange befindlichen Aggregat-, Volume- oder Snapshot Jobs:
job show
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 8629 Vol Reaper cluster1 - Queued Description: Vol Reaper Job 8630 Certificate Expiry Check cluster1 - Queued Description: Certificate Expiry Check . . .
-
Löschen Sie alle laufenden oder in der Warteschlange befindlichen Jobs für Aggregate, Volumes oder Snapshot Kopien:
job delete -id job_id
cluster1::> job delete -id 8629
-
Überprüfen Sie, ob keine Aggregat-, Volume- oder Snapshot-Jobs ausgeführt oder in eine Warteschlange verschoben werden:
job show
In diesem Beispiel wurden alle laufenden und in der Warteschlange befindlichen Jobs gelöscht:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 9944 SnapMirrorDaemon_7_2147484678 cluster1 node1 Dormant Description: Snapmirror Daemon for 7_2147484678 18377 SnapMirror Service Job cluster1 node0 Dormant Description: SnapMirror Service Job 2 entries were displayed
SMB-Sitzungen, die beendet werden sollen
Bevor Sie die Daten zurücksetzen, sollten Sie SMB-Sitzungen, die nicht kontinuierlich verfügbar sind, identifizieren und ordnungsgemäß beenden.
Kontinuierlich verfügbare SMB-Freigaben, auf die von Hyper-V oder Microsoft SQL Server Clients mit dem SMB 3.0 Protokoll zugegriffen wird, müssen vor einem Upgrade oder Downgrade nicht beendet werden.
-
Ermitteln Sie alle etablierten SMB-Sitzungen, die nicht kontinuierlich verfügbar sind:
vserver cifs session show -continuously-available No -instance
Dieser Befehl zeigt detaillierte Informationen zu SMB-Sessions an, bei denen keine kontinuierliche Verfügbarkeit vorhanden ist. Sie sollten sie beenden, bevor Sie mit der ONTAP-Herabstufung fortfahren.
cluster1::> vserver cifs session show -continuously-available No -instance Node: node1 Vserver: vs1 Session ID: 1 Connection ID: 4160072788 Incoming Data LIF IP Address: 198.51.100.5 Workstation IP address: 203.0.113.20 Authentication Mechanism: NTLMv2 Windows User: CIFSLAB\user1 UNIX User: nobody Open Shares: 1 Open Files: 2 Open Other: 0 Connected Time: 8m 39s Idle Time: 7m 45s Protocol Version: SMB2_1 Continuously Available: No 1 entry was displayed.
-
Identifizieren Sie bei Bedarf die Dateien, die für jede von Ihnen identifizierte SMB-Sitzung geöffnet sind:
vserver cifs session file show -session-id session_ID
cluster1::> vserver cifs session file show -session-id 1 Node: node1 Vserver: vs1 Connection: 4160072788 Session: 1 File File Open Hosting Continuously ID Type Mode Volume Share Available ------- --------- ---- --------------- --------------------- ------------ 1 Regular rw vol10 homedirshare No Path: \TestDocument.docx 2 Regular rw vol10 homedirshare No Path: \file1.txt 2 entries were displayed.
NVMe in-Band-Authentifizierung
Wenn Sie von ONTAP 9.12.1 oder höher auf ONTAP 9.12.0 oder früher "Deaktivieren Sie die in-Band-Authentifizierung"zurücksetzen, müssen Sie dies vor dem Zurücksetzen tun. Wenn die bandinterne Authentifizierung mit DH-HMAC-CHAP nicht deaktiviert ist, schlägt die Wiederherstellung fehl.