Monitoramento e proteção da consistência do sistema de arquivos usando NVFAIL
O -nvfail
parâmetro volume modify
do comando permite que o ONTAP detete inconsistências de RAM não volátil (NVRAM) quando o sistema está inicializando ou após uma operação de comutação. Ele também avisa e protege o sistema contra acesso e modificação de dados até que o volume possa ser recuperado manualmente.
Se o ONTAP detetar algum problema, as instâncias de banco de dados ou sistema de arquivos param de responder ou desligar. Em seguida, o ONTAP envia mensagens de erro para o console para alertá-lo para verificar o estado do banco de dados ou do sistema de arquivos. Você pode habilitar o NVFAIL para avisar os administradores de banco de dados sobre inconsistências do NVRAM entre nós em cluster que podem comprometer a validade do banco de dados.
Após a perda de dados do NVRAM durante a recuperação de failover ou inicialização, os clientes NFS não podem acessar dados de nenhum dos nós até que o estado NVFAIL seja limpo. Os clientes CIFS não são afetados.
Como o NVFAIL afeta o acesso a volumes NFS ou LUNs
O estado NVFAIL é definido quando o ONTAP deteta erros NVRAM durante a inicialização, quando ocorre uma operação de comutação MetroCluster ou durante uma operação de aquisição de HA se a opção NVFAIL estiver definida no volume. Se nenhum erro for detetado na inicialização, o serviço de arquivos é iniciado normalmente. No entanto, se erros do NVRAM forem detetados ou o processamento NVFAIL for aplicado em um switchover de desastre, o ONTAP interrompe as instâncias do banco de dados de responder.
Quando você ativa a opção NVFAIL, um dos processos descritos na tabela a seguir ocorre durante a inicialização:
Se… |
Então… |
||
O ONTAP não deteta erros de NVRAM |
O serviço de arquivos é iniciado normalmente. |
||
O ONTAP deteta erros do NVRAM |
|
||
Se for utilizado um dos seguintes parâmetros:
|
Você pode desmarcar a
|
||
O ONTAP deteta erros do NVRAM em um volume que contém LUNs |
Os LUNs nesse volume são colocados offline. A |
Comandos para monitorar eventos de perda de dados
Se você ativar a opção NVFAIL, receberá uma notificação quando ocorrer uma falha do sistema causada por inconsistências do NVRAM ou um switchover do MetroCluster.
Por padrão, o parâmetro NVFAIL não está habilitado.
Se você quiser… |
Use este comando… |
Crie um novo volume com NVFAIL ativado |
|
Ative NVFAIL em um volume existente |
Nota: você define a |
Indique se o NVFAIL está atualmente ativado para um volume especificado |
Nota: você define o |
Consulte a página de manual de cada comando para obter mais informações.
Acessar volumes no estado NVFAIL após um switchover
Após um switchover, você deve limpar o estado NVFAIL redefinindo o -in-nvfailed-state
parâmetro volume modify
do comando para remover a restrição de clientes para acessar dados.
O banco de dados ou o sistema de arquivos não deve estar em execução ou tentando acessar o volume afetado.
A definição -in-nvfailed-state
de parâmetro requer privilégios de nível avançado.
-
Recupere o volume usando o comando volume Modify com o parâmetro -in-nvfailed-State definido como false.
Para obter instruções sobre como examinar a validade do arquivo de banco de dados, consulte a documentação do seu software de banco de dados específico.
Se o banco de dados usar LUNs, revise as etapas para tornar os LUNs acessíveis ao host após uma falha do NVRAM.
"Monitoramento e proteção da consistência do sistema de arquivos usando NVFAIL"
Recuperação de LUNs nos estados NVFAIL após o switchover
Após um switchover, o host não tem mais acesso aos dados nos LUNs nos estados NVFAIL. Você deve executar várias ações antes que o banco de dados tenha acesso aos LUNs.
O banco de dados não deve estar em execução.
-
Limpe o estado NVFAIL no volume afetado que hospeda os LUNs redefinindo o
-in-nvfailed-state
parâmetrovolume modify
do comando. -
Coloque online os LUNs afetados.
-
Examine os LUNs para encontrar inconsistências de dados e resolva-os.
Isso pode envolver a recuperação baseada em host ou a recuperação feita no controlador de storage usando o SnapRestore.
-
Coloque o aplicativo de banco de dados on-line depois de recuperar os LUNs.