A concluir a recuperação
Execute as tarefas necessárias para concluir a recuperação de uma falha de vários controladores ou armazenamento.
Restabelecimento de armazenamentos de objetos para configurações do FabricPool
Se um dos armazenamentos de objetos em um espelho do FabricPool foi co-localizado com o local de desastre do MetroCluster e foi destruído, você deve restabelecer o armazenamento de objetos e o espelho do FabricPool.
-
Se os armazenamentos de objetos forem remotos e um site MetroCluster for destruído, você não precisará reconstruir o armazenamento de objetos e as configurações originais do armazenamento de objetos, bem como o conteúdo de dados inativos serão retidos.
-
Para obter mais informações sobre configurações do FabricPool, consulte "Gerenciamento de disco e agregados".
-
Seguir o procedimento "Substituição de um espelho FabricPool numa configuração MetroCluster" no "Gerenciamento de disco e agregados".
Verificando licenças nos nós substituídos
Você deve instalar novas licenças para os nós de substituição se os nós deficientes estiverem usando recursos do ONTAP que exigem uma licença padrão (node-locked). Para recursos com licenças padrão, cada nó no cluster deve ter sua própria chave para o recurso.
Até instalar chaves de licença, os recursos que exigem licenças padrão continuam disponíveis para o nó de substituição. No entanto, se o nó prejudicado for o único nó no cluster com uma licença para o recurso, nenhuma alteração de configuração será permitida. Além disso, o uso de recursos não licenciados no nó pode deixá-lo fora de conformidade com o contrato de licença, portanto, você deve instalar a chave de licença de substituição ou as chaves no nó de substituição o mais rápido possível.
As chaves de licença devem estar no formato de 28 carateres.
Você tem um período de carência de 90 dias para instalar as chaves de licença. Após o período de carência, todas as licenças antigas são invalidadas. Depois que uma chave de licença válida é instalada, você tem 24 horas para instalar todas as chaves antes que o período de carência termine.
Se todos os nós de um local tiverem sido substituídos (um único nó no caso de uma configuração de MetroCluster de dois nós), as chaves de licença devem ser instaladas no nó ou nós de substituição antes do switchback. |
-
Identifique as licenças no nó:
license show
O exemplo a seguir exibe as informações sobre licenças no sistema:
cluster_B::> license show (system license show) Serial Number: 1-80-00050 Owner: site1-01 Package Type Description Expiration ------- ------- ------------- ----------- Base license Cluster Base License - NFS site NFS License - CIFS site CIFS License - iSCSI site iSCSI License - FCP site FCP License - FlexClone site FlexClone License - 6 entries were displayed.
-
Verifique se as licenças são boas para o nó após o switchback:
metrocluster check license show
O exemplo a seguir exibe as licenças que são boas para o nó:
cluster_B::> metrocluster check license show Cluster Check Result ------- ------- ------------- Cluster_B negotiated-switchover-ready not-applicable NFS switchback-ready not-applicable CIFS job-schedules ok iSCSI licenses ok FCP periodic-check-enabled ok
-
Se você precisar de novas chaves de licença, obtenha chaves de licença de substituição no site de suporte da NetApp na seção meu suporte em licenças de software.
As novas chaves de licença que você precisa são geradas automaticamente e enviadas para o endereço de e-mail em arquivo. Se não receber o e-mail com as chaves de licença no prazo de 30 dias, consulte a secção "Quem contactar se tiver problemas com as minhas licenças?" no artigo da base de dados de Conhecimento "Pós-processo de substituição da placa-mãe para atualizar o licenciamento em um sistema AFF/FAS." -
Instale cada chave de licença:
system license add -license-code license-key, license-key…+
-
Remova as licenças antigas, se desejar:
-
Verifique se há licenças não utilizadas:
license clean-up -unused -simulate
-
Se a lista estiver correta, remova as licenças não utilizadas:
license clean-up -unused
-
Restaurar o gerenciamento de chaves
Se os volumes de dados estiverem criptografados, você precisará restaurar o gerenciamento de chaves. Se o volume raiz estiver criptografado, você deverá recuperar o gerenciamento de chaves.
-
Se os volumes de dados estiverem criptografados, restaure as chaves usando o comando correto para a configuração de gerenciamento de chaves.
Se você estiver usando…
Use este comando…
Gestão de chaves a bordo
security key-manager onboard sync
Para obter mais informações, "Restaurar chaves de criptografia integradas de gerenciamento de chaves"consulte .
Gerenciamento de chaves externas
security key-manager key query -node node-name
Para obter mais informações, "Restaurar chaves de criptografia de gerenciamento de chaves externas"consulte .
-
Se o volume raiz estiver encriptado, utilize o procedimento em "Recuperar o gerenciamento de chaves se o volume raiz for criptografado".
Executando um switchback
Depois de curar a configuração do MetroCluster, você pode executar a operação MetroCluster switchback. A operação de switchback do MetroCluster retorna a configuração ao seu estado operacional normal, com as máquinas virtuais de armazenamento de origem sincronizada (SVMs) no local de desastre ativas e fornecendo dados dos pools de discos locais.
-
O cluster de desastres deve ter mudado com sucesso para o cluster sobrevivente.
-
A recuperação deve ter sido realizada nos agregados de dados e raiz.
-
Os nós de cluster sobreviventes não devem estar no estado de failover de HA (todos os nós precisam estar ativos e em execução para cada par de HA).
-
Os módulos do controlador do local de desastre devem ser completamente inicializados e não no modo de aquisição de HA.
-
O agregado raiz deve ser espelhado.
-
Os links interswitches (ISLs) devem estar online.
-
Todas as licenças necessárias devem ser instaladas no sistema.
-
Confirme se todos os nós estão no estado ativado:
metrocluster node show
O exemplo a seguir exibe os nós que estão no estado habilitado:
cluster_B::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- ----------- -------------- --------- -------------------- 1 cluster_A node_A_1 configured enabled heal roots completed node_A_2 configured enabled heal roots completed cluster_B node_B_1 configured enabled waiting for switchback recovery node_B_2 configured enabled waiting for switchback recovery 4 entries were displayed.
-
Confirme se a ressincronização está concluída em todos os SVMs:
metrocluster vserver show
-
Verifique se todas as migrações automáticas de LIF que estão sendo executadas pelas operações de recuperação foram concluídas com sucesso:
metrocluster check lif show
-
Execute o switchback executando o
metrocluster switchback
comando de qualquer nó no cluster sobrevivente. -
Verifique o progresso do funcionamento do interrutor de comutação:
metrocluster show
A operação de switchback ainda está em andamento quando a saída exibe "Waiting-for-switchback":
cluster_B::> metrocluster show Cluster Entry Name State ------------------------- ------------------- ----------- Local: cluster_B Configuration state configured Mode switchover AUSO Failure Domain - Remote: cluster_A Configuration state configured Mode waiting-for-switchback AUSO Failure Domain -
A operação de comutação está concluída quando a saída exibe "normal":
cluster_B::> metrocluster show Cluster Entry Name State ------------------------- ------------------- ----------- Local: cluster_B Configuration state configured Mode normal AUSO Failure Domain - Remote: cluster_A Configuration state configured Mode normal AUSO Failure Domain -
Se um switchback levar muito tempo para terminar, você pode verificar o status das linhas de base em andamento usando o seguinte comando no nível avançado de privilégio:
metrocluster config-replication resync-status show
-
Restabelecer qualquer configuração SnapMirror ou SnapVault.
No ONTAP 8,3, você precisa restabelecer manualmente uma configuração de SnapMirror perdida após uma operação de switchback MetroCluster. No ONTAP 9.0 e mais tarde, o relacionamento é restabelecido automaticamente.
Verificando um switchback bem-sucedido
Depois de executar o switchback, você deseja confirmar que todos os agregados e máquinas virtuais de storage (SVMs) são trocados de volta e on-line.
-
Verifique se os agregados de dados comutados estão invertidos:
storage aggregate show
No exemplo a seguir, aggr_B2 no nó B2 mudou de volta:
node_B_1::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 227.1GB 227.1GB 0% online 0 node_B_2 raid_dp, mirrored, normal node_A_1::> aggr show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ ... aggr_b2 - - - unknown - node_A_1
Se o local de desastre incluiu agregados sem espelhamento e os agregados sem espelhamento não estiverem mais presentes, o agregado pode aparecer com um estado de "'desconhecido'" na saída do comando storage Aggregate show. Para remover as entradas desatualizadas para os agregados sem espelhamento, consulte o artigo da base de dados de Conhecimento "Como remover entradas agregadas sem espelhamento obsoletas em um MetroCluster após desastre em que o armazenamento foi perdido."
-
Verifique se todos os SVMs de destino de sincronização no cluster sobrevivente estão inativos (mostrando um estado de administrador "coberto") e os SVMs de origem de sincronização no cluster de desastres estão ativos e em execução:
vserver show -subtype sync-source
node_B_1::> vserver show -subtype sync-source Admin Root Name Name Vserver Type Subtype State Volume Aggregate Service Mapping ----------- ------- ---------- ---------- ---------- ---------- ------- ------- ... vs1a data sync-source running vs1a_vol node_B_2 file file aggr_b2 node_A_1::> vserver show -subtype sync-destination Admin Root Name Name Vserver Type Subtype State Volume Aggregate Service Mapping ----------- ------- ---------- ---------- ---------- ---------- ------- ------- ... cluster_A-vs1a-mc data sync-destination stopped vs1a_vol sosb_ file file aggr_b2
Os agregados de destino de sincronização na configuração do MetroCluster têm o sufixo "-mc" automaticamente anexado ao seu nome para ajudar a identificá-los.
-
Confirme se as operações de switchback foram bem-sucedidas usando o
metrocluster operation show
comando.Se o comando output mostrar…
Então…
Que o estado de operação de comutação é bem-sucedido.
O processo de switchback está concluído e você pode prosseguir com a operação do sistema.
Que a operação de switchback ou switchback-continuation-Agent é parcialmente bem-sucedida.
Execute a correção sugerida fornecida na saída do comando MetroCluster operation show.
Você deve repetir as seções anteriores para executar o switchback na direção oposta. Se o site_A fez um switchover do site_B, faça um switchover do site_A.
Espelhando os agregados de raiz dos nós de substituição
Se os discos tiverem sido substituídos, você precisará espelhar os agregados raiz dos novos nós no local de desastre.
-
No local do desastre, identifique os agregados que não são espelhados:
storage aggregate show
cluster_A::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ---------------- ------------ node_A_1_aggr0 1.49TB 74.12GB 95% online 1 node_A_1 raid4, normal node_A_2_aggr0 1.49TB 74.12GB 95% online 1 node_A_2 raid4, normal node_A_1_aggr1 1.49TB 74.12GB 95% online 1 node_A_1 raid 4, normal mirrored node_A_2_aggr1 1.49TB 74.12GB 95% online 1 node_A_2 raid 4, normal mirrored 4 entries were displayed. cluster_A::>
-
Espelhar um dos agregados de raiz:
storage aggregate mirror -aggregate root-aggregate
O exemplo a seguir mostra como o comando seleciona discos e solicita confirmação ao espelhar o agregado.
cluster_A::> storage aggregate mirror -aggregate node_A_2_aggr0 Info: Disks would be added to aggregate "node_A_2_aggr0" on node "node_A_2" in the following manner: Second Plex RAID Group rg0, 3 disks (block checksum, raid4) Position Disk Type Size ---------- ------------------------- ---------- --------------- parity 2.10.0 SSD - data 1.11.19 SSD 894.0GB data 2.10.2 SSD 894.0GB Aggregate capacity available for volume use would be 1.49TB. Do you want to continue? {y|n}: y cluster_A::>
-
Verifique se o espelhamento do agregado raiz está concluído:
storage aggregate show
O exemplo a seguir mostra que os agregados raiz são espelhados.
cluster_A::> storage aggregate show Aggregate Size Available Used% State #Vols Nodes RAID Status --------- -------- --------- ----- ------- ------ ----------- ------------ node_A_1_aggr0 1.49TB 74.12GB 95% online 1 node_A_1 raid4, mirrored, normal node_A_2_aggr0 2.24TB 838.5GB 63% online 1 node_A_2 raid4, mirrored, normal node_A_1_aggr1 1.49TB 74.12GB 95% online 1 node_A_1 raid4, mirrored, normal node_A_2_aggr1 1.49TB 74.12GB 95% online 1 node_A_2 raid4 mirrored, normal 4 entries were displayed. cluster_A::>
-
Repita estas etapas para os outros agregados de raiz.
Qualquer agregado de raiz que não tenha o status espelhado deve ser espelhado.
Reconfigurar o serviço do Mediador ONTAP (configurações IP do MetroCluster)
Se você tiver uma configuração IP do MetroCluster configurada com o serviço Mediador do ONTAP, remova e reconfigure a associação com o mediador.
-
Você deve ter o endereço IP, o nome de usuário e a senha para o serviço do Mediador ONTAP.
-
O serviço Mediador ONTAP deve ser configurado e operar no host Linux.
-
Remova a configuração do Mediador ONTAP existente:
metrocluster configuration-settings mediator remove
-
Reconfigure a configuração do Mediador ONTAP:
metrocluster configuration-settings mediator add -mediator-address mediator-IP-address
Verificando a integridade da configuração do MetroCluster
Você deve verificar a integridade da configuração do MetroCluster para verificar o funcionamento correto.
-
Verifique se o MetroCluster está configurado e no modo normal em cada cluster:
metrocluster show
cluster_A::> metrocluster show Cluster Entry Name State ------------------------- ------------------- ----------- Local: cluster_A Configuration state configured Mode normal AUSO Failure Domain auso-on-cluster-disaster Remote: cluster_B Configuration state configured Mode normal AUSO Failure Domain auso-on-cluster-disaster
-
Verifique se o espelhamento está ativado em cada nó:
metrocluster node show
cluster_A::> metrocluster node show DR Configuration DR Group Cluster Node State Mirroring Mode ----- ------- -------------- -------------- --------- -------------------- 1 cluster_A node_A_1 configured enabled normal cluster_B node_B_1 configured enabled normal 2 entries were displayed.
-
Verifique se os componentes do MetroCluster estão em bom estado:
metrocluster check run
cluster_A::> metrocluster check run Last Checked On: 10/1/2014 16:03:37 Component Result ------------------- --------- nodes ok lifs ok config-replication ok aggregates ok 4 entries were displayed. Command completed. Use the `metrocluster check show -instance` command or sub-commands in `metrocluster check` directory for detailed results. To check if the nodes are ready to do a switchover or switchback operation, run `metrocluster switchover -simulate` or `metrocluster switchback -simulate`, respectively.
-
Verifique se não existem alertas de saúde:
system health alert show
-
Simular uma operação de comutação:
-
A partir do prompt de qualquer nó, altere para o nível de privilégio avançado:
set -privilege advanced
Você precisa responder com
y
quando solicitado para continuar no modo avançado e ver o prompt do modo avançado (*>).-
Efectuar a operação de comutação com o
-simulate
parâmetro:metrocluster switchover -simulate
-
Voltar ao nível de privilégio de administrador:
set -privilege admin
-
-
Para configurações IP do MetroCluster usando o serviço Mediador ONTAP, confirme se o serviço Mediador está funcionando.
-
Verifique se os discos Mediator estão visíveis para o sistema:
storage failover mailbox-disk show
O exemplo a seguir mostra que os discos da caixa de correio foram reconhecidos.
node_A_1::*> storage failover mailbox-disk show Mailbox Node Owner Disk Name Disk UUID ------------- ------ ----- ----- ---------------- sti113-vsim-ucs626g . . local 0m.i2.3L26 7BBA77C9:AD702D14:831B3E7E:0B0730EE:00000000:00000000:00000000:00000000:00000000:00000000 local 0m.i2.3L27 928F79AE:631EA9F9:4DCB5DE6:3402AC48:00000000:00000000:00000000:00000000:00000000:00000000 local 0m.i1.0L60 B7BCDB3C:297A4459:318C2748:181565A3:00000000:00000000:00000000:00000000:00000000:00000000 . . . partner 0m.i1.0L14 EA71F260:D4DD5F22:E3422387:61D475B2:00000000:00000000:00000000:00000000:00000000:00000000 partner 0m.i2.3L64 4460F436:AAE5AB9E:D1ED414E:ABF811F7:00000000:00000000:00000000:00000000:00000000:00000000 28 entries were displayed.
-
Mude para o nível de privilégio avançado:
set -privilege advanced
-
Verifique se os LUNs da caixa de correio estão visíveis para o sistema:
storage iscsi-initiator show
A saída mostrará a presença dos LUNs da caixa de correio:
Node Type Label Target Portal Target Name Admin/Op ---- ---- -------- --------- --------- -------------------------------- -------- . . . .node_A_1 mailbox mediator 172.16.254.1 iqn.2012-05.local:mailbox.target.db5f02d6-e3d3 up/up . . . 17 entries were displayed.
-
Voltar ao nível de privilégio administrativo:
set -privilege admin
-