Vor dem Zurücksetzen eines ONTAP-Clusters müssen Systemverifizierungen durchgeführt werden
Bevor Sie ein ONTAP-Cluster zurücksetzen, sollten Sie den Clusterzustand, den Storage-Zustand und die Systemzeit überprüfen. Sie sollten außerdem überprüfen, ob auf dem Cluster keine Jobs ausgeführt werden.
Überprüfen des Cluster-Systemzustands
Bevor Sie einen ONTAP-Cluster zurücksetzen, sollten Sie überprüfen, ob die Nodes in einem ordnungsgemäßen Zustand sind und für eine Teilnahme am Cluster geeignet sind und ob das Cluster Quorum vorhanden ist.
-
Vergewissern Sie sich, dass die Nodes im Cluster online sind und am Cluster teilnehmen können:
cluster show
In diesem Beispiel sind alle Nodes in einem ordnungsgemäßen Zustand und können am Cluster teilnehmen.
cluster1::> cluster show Node Health Eligibility --------------------- ------- ------------ node0 true true node1 true true
Wenn ein Knoten fehlerhaft oder nicht geeignet ist, überprüfen Sie die EMS-Protokolle auf Fehler und ergreifen Sie Korrekturmaßnahmen.
-
Legen Sie die Berechtigungsebene auf erweitert fest:
set -privilege advanced
Geben Sie ein,
y
um fortzufahren. -
Überprüfen Sie die Konfigurationsdetails für jeden RDB-Prozess.
-
Die Epochen der relationalen Datenbank und Datenbank-Epochen sollten für jeden Node übereinstimmen.
-
Der Quorum-Master pro Ring sollte für alle Knoten gleich sein.
Beachten Sie, dass für jeden Ring möglicherweise ein anderer Quorum-Master vorhanden ist.
So zeigen Sie diesen RDB-Prozess an: Diesen Befehl eingeben… Managementapplikation
cluster ring show -unitname mgmt
Volume-Standortdatenbank
cluster ring show -unitname vldb
Virtual Interface Manager
cluster ring show -unitname vifmgr
SAN Management-Daemon
cluster ring show -unitname bcomd
Dieses Beispiel zeigt den Datenbankprozess für den Speicherort des Volumes:
cluster1::*> cluster ring show -unitname vldb Node UnitName Epoch DB Epoch DB Trnxs Master Online --------- -------- -------- -------- -------- --------- --------- node0 vldb 154 154 14847 node0 master node1 vldb 154 154 14847 node0 secondary node2 vldb 154 154 14847 node0 secondary node3 vldb 154 154 14847 node0 secondary 4 entries were displayed.
-
-
Zurück zur Administratorberechtigungsebene:
set -privilege admin
-
Wenn Sie in einer SAN-Umgebung arbeiten, vergewissern Sie sich, dass sich jeder Knoten in einem SAN-Quorum befindet:
event log show -severity informational -message-name scsiblade.*
Die letzte scsiblade-Ereignismeldung für jeden Knoten sollte darauf hinweisen, dass sich das scsi-Blade im Quorum befindet.
cluster1::*> event log show -severity informational -message-name scsiblade.* Time Node Severity Event --------------- ---------- -------------- --------------------------- MM/DD/YYYY TIME node0 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ... MM/DD/YYYY TIME node1 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ...
Überprüfung des Storage-Zustands
Bevor Sie ein ONTAP Cluster zurücksetzen, sollten Sie den Status Ihrer Festplatten, Aggregate und Volumes überprüfen.
-
Überprüfen des Festplattenstatus:
Um zu prüfen, ob… Tun Sie das… Fehlerhafte Festplatten
-
Fehlerhafte Festplatten anzeigen:
storage disk show -state broken
-
Entfernen oder ersetzen Sie alle defekten Festplatten.
Festplatten werden gewartet oder rekonstruiert
-
Anzeigen aller Datenträger in Wartungs-, Ausstehend- oder Rekonstruktionstatus:
storage disk show -state maintenance
pending
reconstructing ---- .. Warten Sie, bis die Wartung oder Rekonstruktion abgeschlossen ist, bevor Sie fortfahren.
-
-
Überprüfen Sie, ob alle Aggregate online sind, indem Sie den Status des physischen und logischen Storage einschließlich Storage-Aggregate anzeigen:
storage aggregate show -state !online
Mit diesem Befehl werden die Aggregate angezeigt, die Not online sind. Alle Aggregate müssen vor und nach einem größeren Upgrade oder einer erneuten Version online sein.
cluster1::> storage aggregate show -state !online There are no entries matching your query.
-
Überprüfen Sie, ob alle Volumes online sind, indem Sie alle Volumes anzeigen, die Not online sind:
volume show -state !online
Alle Volumes müssen vor und nach einem größeren Upgrade oder einer erneuten Version online sein.
cluster1::> volume show -state !online There are no entries matching your query.
-
Vergewissern Sie sich, dass es keine inkonsistenten Volumes gibt:
volume show -is-inconsistent true
Lesen Sie den Artikel "Volume zeigt WAFL inkonsistent an"der Knowledge Base, wie Sie die inkonsistenten Volumes bewältigen können.
Überprüfen Sie die Systemzeit
Bevor Sie ein ONTAP-Cluster zurücksetzen, sollten Sie überprüfen, ob NTP konfiguriert ist und die Zeit im Cluster synchronisiert ist.
-
Vergewissern Sie sich, dass das Cluster einem NTP-Server zugeordnet ist:
cluster time-service ntp server show
-
Vergewissern Sie sich, dass jeder Node dasselbe Datum und dieselbe Uhrzeit hat:
cluster date show
cluster1::> cluster date show Node Date Timezone --------- ------------------- ------------------------- node0 4/6/2013 20:54:38 GMT node1 4/6/2013 20:54:38 GMT node2 4/6/2013 20:54:38 GMT node3 4/6/2013 20:54:38 GMT 4 entries were displayed.
Vergewissern Sie sich, dass keine Jobs ausgeführt werden
Bevor Sie ein ONTAP-Cluster zurücksetzen, sollten Sie den Status von Cluster-Jobs überprüfen. Wenn Aggregat-, Volume-, NDMP- (Dump- oder Restore-Jobs) oder Snapshot-Jobs (wie beispielsweise Jobs zum Erstellen, Löschen, Verschieben, Ändern, Replizieren und Mounten) ausgeführt oder in die Warteschlange eingereiht werden, sollten Sie zulassen, dass die Jobs erfolgreich abgeschlossen werden oder die Einträge in der Warteschlange anhalten.
-
Prüfen Sie die Liste aller laufenden oder wartenden Aggregat-, Volume- oder Snapshot-Jobs in der Warteschlange:
job show
In diesem Beispiel gibt es zwei Jobs in der Warteschlange:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 8629 Vol Reaper cluster1 - Queued Description: Vol Reaper Job 8630 Certificate Expiry Check cluster1 - Queued Description: Certificate Expiry Check
-
Löschen aller laufenden oder in Warteschlange befindlichen Aggregat-, Volume- oder Snapshot-Kopie-Jobs:
job delete -id <job_id>
-
Vergewissern Sie sich, dass keine Aggregat-, Volume- oder Snapshot-Jobs ausgeführt oder in eine Warteschlange eingereiht werden:
job show
In diesem Beispiel wurden alle laufenden und in der Warteschlange befindlichen Jobs gelöscht:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 9944 SnapMirrorDaemon_7_2147484678 cluster1 node1 Dormant Description: Snapmirror Daemon for 7_2147484678 18377 SnapMirror Service Job cluster1 node0 Dormant Description: SnapMirror Service Job 2 entries were displayed