Monitoraggio e protezione della coerenza del file system con NVFAIL
Il -nvfail
del parametro volume modify
Il comando consente a ONTAP di rilevare incoerenze della RAM non volatile (NVRAM) durante l'avvio del sistema o dopo un'operazione di switchover. Inoltre, avvisa e protegge il sistema dall'accesso e dalla modifica dei dati fino a quando il volume non può essere recuperato manualmente.
Se ONTAP rileva problemi, le istanze del database o del file system smettono di rispondere o si arrestano. ONTAP invia quindi messaggi di errore alla console per avvisare l'utente di controllare lo stato del database o del file system. È possibile abilitare NVFAIL per avvisare gli amministratori di database delle incoerenze NVRAM tra i nodi in cluster che possono compromettere la validità del database.
Dopo la perdita dei dati NVRAM durante il failover o il boot recovery, i client NFS non possono accedere ai dati da uno dei nodi fino a quando lo stato NVFAIL non viene cancellato. I client CIFS non sono interessati.
Impatto di NVFAIL sull'accesso ai volumi NFS o alle LUN
Lo stato NVFAIL viene impostato quando ONTAP rileva errori NVRAM durante l'avvio, quando si verifica un'operazione di switchover MetroCluster o durante un'operazione di takeover ha se l'opzione NVFAIL è impostata sul volume. Se all'avvio non vengono rilevati errori, il file service viene avviato normalmente. Tuttavia, se vengono rilevati errori NVRAM o l'elaborazione NVFAIL viene applicata in caso di disaster switchover, ONTAP impedisce alle istanze del database di rispondere.
Quando si attiva l'opzione NVFAIL, durante l'avvio viene eseguito uno dei processi descritti nella seguente tabella:
Se… |
Quindi… |
||
ONTAP non rileva errori NVRAM |
Il file service si avvia normalmente. |
||
ONTAP rileva errori NVRAM |
|
||
Se viene utilizzato uno dei seguenti parametri:
|
È possibile annullare l'impostazione di
|
||
ONTAP rileva gli errori NVRAM su un volume che contiene LUN |
Le LUN di quel volume vengono portate offline. Il |
Comandi per il monitoraggio degli eventi di perdita dei dati
Se si attiva l'opzione NVFAIL, si riceve una notifica quando si verifica un crash di sistema causato da incoerenze della NVRAM o uno switchover MetroCluster.
Per impostazione predefinita, il parametro NVFAIL non è attivato.
Se si desidera… |
Utilizzare questo comando… |
Creare un nuovo volume con NVFAIL attivato |
|
Attivare NVFAIL su un volume esistente |
Nota: è stato impostato il |
Visualizza se NVFAIL è attualmente abilitato per un volume specificato |
Nota: è stato impostato il |
Per ulteriori informazioni, consulta la pagina man relativa a ciascun comando.
Accesso ai volumi in stato NVFAIL dopo uno switchover
Dopo uno switchover, è necessario cancellare lo stato NVFAIL ripristinando -in-nvfailed-state
del parametro volume modify
comando per rimuovere la restrizione di accesso dei client ai dati.
Il database o il file system non deve essere in esecuzione o non deve tentare di accedere al volume interessato.
Impostazione -in-nvfailed-state
il parametro richiede privilegi di livello avanzato.
-
Ripristinare il volume utilizzando il comando di modifica del volume con il parametro -in-nvfailed-state impostato su false.
Per istruzioni sull'esame della validità del file di database, consultare la documentazione relativa al software di database specifico.
Se il database utilizza LUN, rivedere la procedura per rendere le LUN accessibili all'host dopo un errore della NVRAM.
"Monitoraggio e protezione della coerenza del file system con NVFAIL"
Ripristino delle LUN negli stati NVFAIL dopo lo switchover
Dopo uno switchover, l'host non ha più accesso ai dati sulle LUN che si trovano negli stati NVFAIL. Prima che il database abbia accesso alle LUN, è necessario eseguire diverse azioni.
Il database non deve essere in esecuzione.
-
Azzerare lo stato NVFAIL sul volume che ospita i LUN reimpostando
-in-nvfailed-state
del parametrovolume modify
comando. -
Portare online le LUN interessate.
-
Esaminare le LUN per individuare eventuali incoerenze di dati e risolverle.
Ciò potrebbe comportare il ripristino o il ripristino basato su host eseguito sul controller dello storage utilizzando SnapRestore.
-
Portare l'applicazione di database online dopo il ripristino dei LUN.