O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

A concluir a recuperação

02/14/2025 Colaboradores

PDFs

Execute as tarefas necessárias para concluir a recuperação de uma falha de vários controladores ou armazenamento.

Restabelecimento de armazenamentos de objetos para configurações do FabricPool

Se um dos armazenamentos de objetos em um espelho do FabricPool foi co-localizado com o local de desastre do MetroCluster e foi destruído, você deve restabelecer o armazenamento de objetos e o espelho do FabricPool.

Sobre esta tarefa

Se os armazenamentos de objetos forem remotos e um site MetroCluster for destruído, você não precisará reconstruir o armazenamento de objetos e as configurações originais do armazenamento de objetos, bem como o conteúdo de dados inativos serão retidos.
Para obter mais informações sobre configurações do FabricPool, consulte "Gerenciamento de disco e agregados".

Passo

Seguir o procedimento "Substituição de um espelho FabricPool numa configuração MetroCluster" no "Gerenciamento de disco e agregados".

Verificando licenças nos nós substituídos

Você deve instalar novas licenças para os nós de substituição se os nós deficientes estiverem usando recursos do ONTAP que exigem uma licença padrão (node-locked). Para recursos com licenças padrão, cada nó no cluster deve ter sua própria chave para o recurso.

Sobre esta tarefa

Até instalar chaves de licença, os recursos que exigem licenças padrão continuam disponíveis para o nó de substituição. No entanto, se o nó prejudicado for o único nó no cluster com uma licença para o recurso, nenhuma alteração de configuração será permitida. Além disso, o uso de recursos não licenciados no nó pode deixá-lo fora de conformidade com o contrato de licença, portanto, você deve instalar a chave de licença de substituição ou as chaves no nó de substituição o mais rápido possível.

As chaves de licença devem estar no formato de 28 carateres.

Você tem um período de carência de 90 dias para instalar as chaves de licença. Após o período de carência, todas as licenças antigas são invalidadas. Depois que uma chave de licença válida é instalada, você tem 24 horas para instalar todas as chaves antes que o período de carência termine.

Se todos os nós de um local tiverem sido substituídos (um único nó no caso de uma configuração de MetroCluster de dois nós), as chaves de licença devem ser instaladas no nó ou nós de substituição antes do switchback.

Passos

Identifique as licenças no nó:

license show

O exemplo a seguir exibe as informações sobre licenças no sistema:

cluster_B::>  license show
         (system license show)

Serial Number: 1-80-00050
Owner: site1-01
Package           Type       Description             Expiration
-------          -------     -------------           -----------
Base             license     Cluster Base License        -
NFS              site        NFS License                 -
CIFS             site        CIFS License                -
iSCSI            site        iSCSI License               -
FCP              site        FCP License                 -
FlexClone        site        FlexClone License           -

6 entries were displayed.

Verifique se as licenças são boas para o nó após o switchback:

metrocluster check license show

O exemplo a seguir exibe as licenças que são boas para o nó:

cluster_B::> metrocluster check license show

Cluster           Check                             Result
-------           -------                           -------------
Cluster_B         negotiated-switchover-ready       not-applicable
NFS               switchback-ready                  not-applicable
CIFS              job-schedules                     ok
iSCSI             licenses                          ok
FCP               periodic-check-enabled            ok

Se você precisar de novas chaves de licença, obtenha chaves de licença de substituição no site de suporte da NetApp na seção meu suporte em licenças de software.

As novas chaves de licença que você precisa são geradas automaticamente e enviadas para o endereço de e-mail em arquivo. Se não receber o e-mail com as chaves de licença no prazo de 30 dias, consulte a secção "Quem contactar se tiver problemas com as minhas licenças?" no artigo da base de dados de Conhecimento "Pós-processo de substituição da placa-mãe para atualizar o licenciamento em um sistema AFF/FAS."

Instale cada chave de licença:

system license add -license-code license-key, license-key…+
Remova as licenças antigas, se desejar:
1. Verifique se há licenças não utilizadas:
  
  license clean-up -unused -simulate
2. Se a lista estiver correta, remova as licenças não utilizadas:
  
  license clean-up -unused

Restaurar o gerenciamento de chaves

Se os volumes de dados estiverem criptografados, você precisará restaurar o gerenciamento de chaves. Se o volume raiz estiver criptografado, você deverá recuperar o gerenciamento de chaves.

Passos

Se os volumes de dados estiverem criptografados, restaure as chaves usando o comando correto para a configuração de gerenciamento de chaves.

Se você estiver usando…

Use este comando…

Gestão de chaves a bordo

security key-manager onboard sync

Para obter mais informações, "Restaurar chaves de criptografia integradas de gerenciamento de chaves"consulte .

Gerenciamento de chaves externas

security key-manager key query -node node-name

Para obter mais informações, "Restaurar chaves de criptografia de gerenciamento de chaves externas"consulte .

Se o volume raiz estiver encriptado, utilize o procedimento em "Recuperar o gerenciamento de chaves se o volume raiz for criptografado".

Executando um switchback

Depois de curar a configuração do MetroCluster, você pode executar a operação MetroCluster switchback. A operação de switchback do MetroCluster retorna a configuração ao seu estado operacional normal, com as máquinas virtuais de armazenamento de origem sincronizada (SVMs) no local de desastre ativas e fornecendo dados dos pools de discos locais.

Antes de começar

O cluster de desastres deve ter mudado com sucesso para o cluster sobrevivente.
A recuperação deve ter sido realizada nos agregados de dados e raiz.
Os nós de cluster sobreviventes não devem estar no estado de failover de HA (todos os nós precisam estar ativos e em execução para cada par de HA).
Os módulos do controlador do local de desastre devem ser completamente inicializados e não no modo de aquisição de HA.
O agregado raiz deve ser espelhado.
Os links interswitches (ISLs) devem estar online.
Todas as licenças necessárias devem ser instaladas no sistema.

Passos

Confirme se todos os nós estão no estado ativado:

metrocluster node show

O exemplo a seguir exibe os nós que estão no estado habilitado:

cluster_B::>  metrocluster node show

DR                        Configuration  DR
Group Cluster Node        State          Mirroring Mode
----- ------- ----------- -------------- --------- --------------------
1     cluster_A
              node_A_1    configured     enabled   heal roots completed
              node_A_2    configured     enabled   heal roots completed
      cluster_B
              node_B_1    configured     enabled   waiting for switchback recovery
              node_B_2    configured     enabled   waiting for switchback recovery
4 entries were displayed.

Confirme se a ressincronização está concluída em todos os SVMs:

metrocluster vserver show
Verifique se todas as migrações automáticas de LIF que estão sendo executadas pelas operações de recuperação foram concluídas com sucesso:

metrocluster check lif show
Execute o switchback executando o metrocluster switchback comando de qualquer nó no cluster sobrevivente.

Verifique o progresso do funcionamento do interrutor de comutação:

metrocluster show

A operação de switchback ainda está em andamento quando a saída exibe "Waiting-for-switchback":

cluster_B::> metrocluster show
Cluster                   Entry Name          State
------------------------- ------------------- -----------
 Local: cluster_B         Configuration state configured
                          Mode                switchover
                          AUSO Failure Domain -
Remote: cluster_A         Configuration state configured
                          Mode                waiting-for-switchback
                          AUSO Failure Domain -

A operação de comutação está concluída quando a saída exibe "normal":

cluster_B::> metrocluster show
Cluster                   Entry Name          State
------------------------- ------------------- -----------
 Local: cluster_B         Configuration state configured
                          Mode                normal
                          AUSO Failure Domain -
Remote: cluster_A         Configuration state configured
                          Mode                normal
                          AUSO Failure Domain -

Se um switchback levar muito tempo para terminar, você pode verificar o status das linhas de base em andamento usando o seguinte comando no nível avançado de privilégio:

metrocluster config-replication resync-status show

Restabelecer qualquer configuração SnapMirror ou SnapVault.

No ONTAP 8,3, você precisa restabelecer manualmente uma configuração de SnapMirror perdida após uma operação de switchback MetroCluster. No ONTAP 9.0 e mais tarde, o relacionamento é restabelecido automaticamente.

Verificando um switchback bem-sucedido

Depois de executar o switchback, você deseja confirmar que todos os agregados e máquinas virtuais de storage (SVMs) são trocados de volta e on-line.

Passos

Verifique se os agregados de dados comutados estão invertidos:

storage aggregate show

No exemplo a seguir, aggr_B2 no nó B2 mudou de volta:

node_B_1::> storage aggregate show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2    227.1GB   227.1GB    0% online       0 node_B_2   raid_dp,
                                                                   mirrored,
                                                                   normal

node_A_1::> aggr show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2          -         -     - unknown      - node_A_1

Se o local de desastre incluiu agregados sem espelhamento e os agregados sem espelhamento não estiverem mais presentes, o agregado pode aparecer com um estado de "'desconhecido'" na saída do comando storage Aggregate show. Para remover as entradas desatualizadas para os agregados sem espelhamento, consulte o artigo da base de dados de Conhecimento "Como remover entradas agregadas sem espelhamento obsoletas em um MetroCluster após desastre em que o armazenamento foi perdido."

Verifique se todos os SVMs de destino de sincronização no cluster sobrevivente estão inativos (mostrando um estado operacional "coberto"):

vserver show -subtype sync-destination

node_B_1::> vserver show -subtype sync-destination
                                 Admin    Operational  Root
Vserver       Type    Subtype    State    State        Volume    Aggregate
-----------   ------- ---------- -------- ----------   --------  ----------
...
cluster_A-vs1a-mc data sync-destination
                               running    stopped    vs1a_vol   aggr_b2

Os agregados de sincronização de destino na configuração MetroCluster têm o sufixo "'-mc" automaticamente anexado ao seu nome para ajudar a identificá-los.

Verifique se os SVMs de origem sincronizada no cluster de desastres estão ativos e em execução:

vserver show -subtype sync-source

node_A_1::> vserver show -subtype sync-source
                                  Admin    Operational  Root
Vserver        Type    Subtype    State    State        Volume     Aggregate
-----------    ------- ---------- -------- ----------   --------   ----------
...
vs1a           data    sync-source
                                  running  running    vs1a_vol  aggr_b2

Confirme se as operações de switchback foram bem-sucedidas usando o metrocluster operation show comando.

Se o comando output mostrar…

Então…

Que o estado de operação de comutação é bem-sucedido.

O processo de switchback está concluído e você pode prosseguir com a operação do sistema.

Que a operação de switchback ou switchback-continuation-Agent é parcialmente bem-sucedida.

Execute a correção sugerida fornecida na saída do comando MetroCluster operation show.

Depois de terminar

Você deve repetir as seções anteriores para executar o switchback na direção oposta. Se o site_A fez um switchover do site_B, faça um switchover do site_A.

Espelhando os agregados de raiz dos nós de substituição

Se os discos tiverem sido substituídos, você precisará espelhar os agregados raiz dos novos nós no local de desastre.

Passos

No local do desastre, identifique os agregados que não são espelhados:

storage aggregate show

cluster_A::> storage aggregate show

Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
node_A_1_aggr0
            1.49TB   74.12GB   95% online       1 node_A_1         raid4,
                                                                   normal
node_A_2_aggr0
            1.49TB   74.12GB   95% online       1 node_A_2         raid4,
                                                                   normal
node_A_1_aggr1
            1.49TB   74.12GB   95% online       1 node_A_1         raid 4, normal
                                                                   mirrored
node_A_2_aggr1
            1.49TB   74.12GB   95% online       1 node_A_2         raid 4, normal
                                                                   mirrored
4 entries were displayed.

cluster_A::>

Espelhar um dos agregados de raiz:

storage aggregate mirror -aggregate root-aggregate

O exemplo a seguir mostra como o comando seleciona discos e solicita confirmação ao espelhar o agregado.

cluster_A::> storage aggregate mirror -aggregate node_A_2_aggr0

Info: Disks would be added to aggregate "node_A_2_aggr0" on node "node_A_2" in
      the following manner:

      Second Plex

        RAID Group rg0, 3 disks (block checksum, raid4)
          Position   Disk                      Type                  Size
          ---------- ------------------------- ---------- ---------------
          parity     2.10.0                    SSD                      -
          data       1.11.19                   SSD                894.0GB
          data       2.10.2                    SSD                894.0GB

      Aggregate capacity available for volume use would be 1.49TB.

Do you want to continue? {y|n}: y

cluster_A::>

Verifique se o espelhamento do agregado raiz está concluído:

storage aggregate show

O exemplo a seguir mostra que os agregados raiz são espelhados.

cluster_A::> storage aggregate show

Aggregate     Size Available Used% State   #Vols  Nodes       RAID Status
--------- -------- --------- ----- ------- ------ ----------- ------------
node_A_1_aggr0
            1.49TB   74.12GB   95% online       1 node_A_1    raid4,
                                                              mirrored,
                                                              normal
node_A_2_aggr0
            2.24TB   838.5GB   63% online       1 node_A_2    raid4,
                                                              mirrored,
                                                              normal
node_A_1_aggr1
            1.49TB   74.12GB   95% online       1 node_A_1    raid4,
                                                              mirrored,
                                                              normal
node_A_2_aggr1
            1.49TB   74.12GB   95% online       1 node_A_2    raid4
                                                              mirrored,
                                                              normal
4 entries were displayed.

cluster_A::>

Repita estas etapas para os outros agregados de raiz.

Qualquer agregado de raiz que não tenha o status espelhado deve ser espelhado.

Reconfigurar o serviço do Mediador ONTAP (configurações IP do MetroCluster)

Se você tiver uma configuração IP do MetroCluster configurada com o serviço Mediador do ONTAP, remova e reconfigure a associação com o mediador.

Antes de começar

Você deve ter o endereço IP, o nome de usuário e a senha para o serviço do Mediador ONTAP.
O serviço Mediador ONTAP deve ser configurado e operar no host Linux.

Passos

Remova a configuração do Mediador ONTAP existente:

metrocluster configuration-settings mediator remove
Reconfigure a configuração do Mediador ONTAP:

metrocluster configuration-settings mediator add -mediator-address mediator-IP-address

Verificando a integridade da configuração do MetroCluster

Você deve verificar a integridade da configuração do MetroCluster para verificar o funcionamento correto.

Passos

Verifique se o MetroCluster está configurado e no modo normal em cada cluster:

metrocluster show

cluster_A::> metrocluster show
Cluster                   Entry Name          State
------------------------- ------------------- -----------
 Local: cluster_A         Configuration state configured
                          Mode                normal
                          AUSO Failure Domain auso-on-cluster-disaster
Remote: cluster_B         Configuration state configured
                          Mode                normal
                          AUSO Failure Domain auso-on-cluster-disaster

Verifique se o espelhamento está ativado em cada nó:

metrocluster node show

cluster_A::> metrocluster node show
DR                           Configuration  DR
Group Cluster Node           State          Mirroring Mode
----- ------- -------------- -------------- --------- --------------------
1     cluster_A
              node_A_1       configured     enabled   normal
      cluster_B
              node_B_1       configured     enabled   normal
2 entries were displayed.

Verifique se os componentes do MetroCluster estão em bom estado:

metrocluster check run

cluster_A::> metrocluster check run

Last Checked On: 10/1/2014 16:03:37

Component           Result
------------------- ---------
nodes               ok
lifs                ok
config-replication  ok
aggregates          ok
4 entries were displayed.

Command completed. Use the `metrocluster check show -instance` command or sub-commands in `metrocluster check` directory for detailed results.
To check if the nodes are ready to do a switchover or switchback operation, run `metrocluster switchover -simulate` or `metrocluster switchback -simulate`, respectively.

Verifique se não existem alertas de saúde:

system health alert show
Simular uma operação de comutação:
1. A partir do prompt de qualquer nó, altere para o nível de privilégio avançado:
  
  set -privilege advanced
Você precisa responder com y quando solicitado para continuar no modo avançado e ver o prompt do modo avançado (*>).
1. Efectuar a operação de comutação com o -simulate parâmetro:
  
  metrocluster switchover -simulate
2. Voltar ao nível de privilégio de administrador:
  
  set -privilege admin

Para configurações IP do MetroCluster usando o serviço Mediador ONTAP, confirme se o serviço Mediador está funcionando.

Verifique se os discos Mediator estão visíveis para o sistema:

storage failover mailbox-disk show

O exemplo a seguir mostra que os discos da caixa de correio foram reconhecidos.

node_A_1::*> storage failover mailbox-disk show
                 Mailbox
Node             Owner     Disk    Name        Disk UUID
-------------     ------   -----   -----        ----------------
sti113-vsim-ucs626g
.
.
     local     0m.i2.3L26      7BBA77C9:AD702D14:831B3E7E:0B0730EE:00000000:00000000:00000000:00000000:00000000:00000000
     local     0m.i2.3L27      928F79AE:631EA9F9:4DCB5DE6:3402AC48:00000000:00000000:00000000:00000000:00000000:00000000
     local     0m.i1.0L60      B7BCDB3C:297A4459:318C2748:181565A3:00000000:00000000:00000000:00000000:00000000:00000000
.
.
.
     partner   0m.i1.0L14      EA71F260:D4DD5F22:E3422387:61D475B2:00000000:00000000:00000000:00000000:00000000:00000000
     partner   0m.i2.3L64      4460F436:AAE5AB9E:D1ED414E:ABF811F7:00000000:00000000:00000000:00000000:00000000:00000000
28 entries were displayed.

Mude para o nível de privilégio avançado:

set -privilege advanced
Verifique se os LUNs da caixa de correio estão visíveis para o sistema:

storage iscsi-initiator show

A saída mostrará a presença dos LUNs da caixa de correio:

Node    Type       Label      Target Portal     Target Name                                 Admin/Op
----    ----       --------   ---------    --------- --------------------------------       --------
.
.
.
.node_A_1
               mailbox
                     mediator 172.16.254.1    iqn.2012-05.local:mailbox.target.db5f02d6-e3d3    up/up
.
.
.
17 entries were displayed.

Voltar ao nível de privilégio administrativo:

set -privilege admin

A concluir a recuperação

Creating your file...

Restabelecimento de armazenamentos de objetos para configurações do FabricPool

Verificando licenças nos nós substituídos

Restaurar o gerenciamento de chaves

Executando um switchback

Verificando um switchback bem-sucedido

Espelhando os agregados de raiz dos nós de substituição

Reconfigurar o serviço do Mediador ONTAP (configurações IP do MetroCluster)

Verificando a integridade da configuração do MetroCluster