Verifiche del sistema da eseguire prima di ripristinare un cluster ONTAP
Prima di ripristinare un cluster ONTAP, è necessario verificare lo stato di salute del cluster, lo stato dello storage e l'ora del sistema. È inoltre necessario verificare che nel cluster non siano in esecuzione processi.
Verificare lo stato del cluster
Prima di ripristinare un cluster ONTAP, è necessario verificare che i nodi siano integri e idonei a partecipare al cluster e che il cluster sia quorum.
-
Verificare che i nodi del cluster siano online e idonei a partecipare al cluster:
cluster show
In questo esempio, tutti i nodi sono integri e idonei a partecipare al cluster.
cluster1::> cluster show Node Health Eligibility --------------------- ------- ------------ node0 true true node1 true true
Se un nodo non è integro o non è idoneo, controllare i registri EMS per verificare la presenza di errori e intraprendere un'azione correttiva.
-
Impostare il livello di privilegio su Advanced (avanzato):
set -privilege advanced
Invio
y
per continuare. -
Verificare i dettagli di configurazione per ciascun processo RDB.
-
L'epoca del database relazionale e l'epoca del database devono corrispondere per ciascun nodo.
-
Il master del quorum per squillo deve essere lo stesso per tutti i nodi.
Si noti che ogni squillo potrebbe avere un master di quorum diverso.
Per visualizzare questo processo RDB… Immettere questo comando… Applicazione di gestione
cluster ring show -unitname mgmt
Database di posizioni dei volumi
cluster ring show -unitname vldb
Virtual-Interface Manager
cluster ring show -unitname vifmgr
Daemon di gestione SAN
cluster ring show -unitname bcomd
Questo esempio mostra il processo del database di localizzazione del volume:
cluster1::*> cluster ring show -unitname vldb Node UnitName Epoch DB Epoch DB Trnxs Master Online --------- -------- -------- -------- -------- --------- --------- node0 vldb 154 154 14847 node0 master node1 vldb 154 154 14847 node0 secondary node2 vldb 154 154 14847 node0 secondary node3 vldb 154 154 14847 node0 secondary 4 entries were displayed.
-
-
Tornare al livello di privilegio admin:
set -privilege admin
-
Se si opera in un ambiente SAN, verificare che ciascun nodo si trovi in un quorum SAN:
event log show -severity informational -message-name scsiblade.*
Il messaggio di evento scsiblade più recente per ciascun nodo dovrebbe indicare che il blade scsi è in quorum.
cluster1::*> event log show -severity informational -message-name scsiblade.* Time Node Severity Event --------------- ---------- -------------- --------------------------- MM/DD/YYYY TIME node0 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ... MM/DD/YYYY TIME node1 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ...
Verificare lo stato dello storage
Prima di ripristinare un cluster ONTAP, è necessario verificare lo stato di dischi, aggregati e volumi.
-
Verificare lo stato del disco:
Per verificare la presenza di… Eseguire questa operazione… Dischi rotti
-
Visualizzare eventuali dischi rotti:
storage disk show -state broken
-
Rimuovere o sostituire eventuali dischi rotti.
Dischi in fase di manutenzione o ricostruzione
-
Visualizzare i dischi in stato di manutenzione, in sospeso o di ricostruzione:
storage disk show -state maintenance
pending
reconstructing ---- .. Prima di procedere, attendere il completamento dell'operazione di manutenzione o ricostruzione.
-
-
Verifica che tutti gli aggregati siano online visualizzando lo stato dello storage fisico e logico, inclusi gli aggregati di storage:
storage aggregate show -state !online
Questo comando visualizza gli aggregati non online. Tutti gli aggregati devono essere online prima e dopo l'esecuzione di un aggiornamento o di una revisione importante.
cluster1::> storage aggregate show -state !online There are no entries matching your query.
-
Verificare che tutti i volumi siano online visualizzando tutti i volumi non online:
volume show -state !online
Tutti i volumi devono essere online prima e dopo l'esecuzione di un aggiornamento o di una revisione importante.
cluster1::> volume show -state !online There are no entries matching your query.
-
Verificare che non vi siano volumi incoerenti:
volume show -is-inconsistent true
Consultare l'articolo della Knowledge base "Volume che mostra WAFL incoerente" su come affrontare i volumi incoerenti.
Verificare l'ora del sistema
Prima di ripristinare un cluster ONTAP, è necessario verificare che NTP sia configurato e che l'ora sia sincronizzata nel cluster.
-
Verificare che il cluster sia associato a un server NTP:
cluster time-service ntp server show
-
Verificare che ogni nodo abbia la stessa data e ora:
cluster date show
cluster1::> cluster date show Node Date Timezone --------- ------------------- ------------------------- node0 4/6/2013 20:54:38 GMT node1 4/6/2013 20:54:38 GMT node2 4/6/2013 20:54:38 GMT node3 4/6/2013 20:54:38 GMT 4 entries were displayed.
Verificare che non siano in esecuzione lavori
Prima di ripristinare un cluster ONTAP, è necessario verificare lo stato dei processi cluster. Se sono in esecuzione o in coda processi aggregati, volumi, NDMP (dump o ripristino) o Snapshot (come processi di creazione, eliminazione, spostamento, modifica, replica e montaggio), è necessario consentire il completamento corretto dei processi o arrestare le voci in coda.
-
Esaminare l'elenco di tutti i processi di aggregato, volume o Snapshot in esecuzione o in coda:
job show
In questo esempio, sono presenti due lavori in coda:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 8629 Vol Reaper cluster1 - Queued Description: Vol Reaper Job 8630 Certificate Expiry Check cluster1 - Queued Description: Certificate Expiry Check
-
Eliminare qualsiasi processo di copia Snapshot, volume o aggregato in esecuzione o in coda:
job delete -id <job_id>
-
Verificare che nessun processo di aggregazione, volume o Snapshot sia in esecuzione o in coda:
job show
In questo esempio, tutti i processi in esecuzione e in coda sono stati eliminati:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 9944 SnapMirrorDaemon_7_2147484678 cluster1 node1 Dormant Description: Snapmirror Daemon for 7_2147484678 18377 SnapMirror Service Job cluster1 node0 Dormant Description: SnapMirror Service Job 2 entries were displayed