O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Substitua um DIMM - AFF A300

12/18/2024 Colaboradores

PDFs

Você deve substituir um DIMM no controlador quando seu sistema de armazenamento encontrar erros como erros CECC excessivos (códigos de correção de erros Correctable) que são baseados em alertas do Monitor de integridade ou erros ECC incorrigíveis, geralmente causados por uma única falha de DIMM que impede o sistema de armazenamento de inicializar o ONTAP.

Todos os outros componentes do sistema devem estar funcionando corretamente; caso contrário, você deve entrar em Contato com o suporte técnico.

Você deve substituir o componente com falha por um componente FRU de substituição que você recebeu de seu provedor.

Passo 1: Desligue o controlador desativado

Encerre ou assuma o controlador afetado utilizando o procedimento adequado para a sua configuração.

Opção 1: A maioria das configurações

Para encerrar o controlador com deficiência, você deve determinar o status do controlador e, se necessário, assumir o controlador para que o controlador saudável continue fornecendo dados do armazenamento do controlador com deficiência.

Sobre esta tarefa

Se você tiver um sistema SAN, você deve ter verificado mensagens de cluster kernel-service show`evento ) para o blade SCSI do controlador afetado. O `cluster kernel-service show comando (do modo avançado priv) exibe o nome do nó, "status do quorum"desse nó, o status de disponibilidade desse nó e o status operacional desse nó.

Cada processo SCSI-blade deve estar em quórum com os outros nós no cluster. Qualquer problema deve ser resolvido antes de prosseguir com a substituição.
Se você tiver um cluster com mais de dois nós, ele deverá estar no quórum. Se o cluster não estiver em quórum ou se um controlador íntegro exibir false para qualificação e integridade, você deverá corrigir o problema antes de encerrar o controlador prejudicado; "Sincronize um nó com o cluster"consulte .

Passos

Se o AutoSupport estiver ativado, suprimir a criação automática de casos invocando uma mensagem AutoSupport: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

A seguinte mensagem AutoSupport suprime a criação automática de casos por duas horas: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
Desative a giveback automática a partir da consola do controlador saudável: storage failover modify -node local -auto-giveback false

Quando vir do pretende desativar a auto-giveback?, introduza y.

Leve o controlador prejudicado para o prompt Loader:

Se o controlador afetado estiver a apresentar… Então…

Se o controlador afetado estiver a apresentar…	Então…
O prompt Loader	Vá para a próxima etapa.
A aguardar pela giveback…	Pressione Ctrl-C e responda `y` quando solicitado.
Prompt do sistema ou prompt de senha	Assuma ou interrompa o controlador prejudicado do controlador saudável: `storage failover takeover -ofnode impaired_node_name` Quando o controlador prejudicado mostrar aguardando a giveback…, pressione Ctrl-C e responda `y`.

O prompt Loader

Vá para a próxima etapa.

A aguardar pela giveback…

Pressione Ctrl-C e responda y quando solicitado.

Prompt do sistema ou prompt de senha

Assuma ou interrompa o controlador prejudicado do controlador saudável: storage failover takeover -ofnode impaired_node_name

Quando o controlador prejudicado mostrar aguardando a giveback…, pressione Ctrl-C e responda y.

Opção 2: O controlador está em um MetroCluster de dois nós

Para desligar o controlador desativado, você deve determinar o status do controlador e, se necessário, trocar o controlador para que o controlador saudável continue fornecendo dados do armazenamento do controlador prejudicado.

Sobre esta tarefa

Você deve deixar as fontes de alimentação ligadas no final deste procedimento para fornecer energia ao controlador de integridade.

Passos

Verifique o estado do MetroCluster para determinar se o controlador afetado mudou automaticamente para o controlador saudável: metrocluster show

Dependendo se ocorreu uma mudança automática, proceda de acordo com a seguinte tabela:

Se o controlador deficiente… Então…

Se o controlador deficiente…	Então…
Mudou automaticamente	Avance para o passo seguinte.
Não mudou automaticamente	Execute uma operação de comutação planejada a partir do controlador íntegro: `metrocluster switchover`
Não mudou automaticamente, tentou mudar com o comando e o switchover `metrocluster switchover` foi vetado	Reveja as mensagens de veto e, se possível, resolva o problema e tente novamente. Se você não conseguir resolver o problema, entre em Contato com o suporte técnico.

Mudou automaticamente

Avance para o passo seguinte.

Não mudou automaticamente

Execute uma operação de comutação planejada a partir do controlador íntegro: metrocluster switchover

Não mudou automaticamente, tentou mudar com o comando e o switchover metrocluster switchover foi vetado

Reveja as mensagens de veto e, se possível, resolva o problema e tente novamente. Se você não conseguir resolver o problema, entre em Contato com o suporte técnico.

Ressincronize os agregados de dados executando o metrocluster heal -phase aggregates comando do cluster sobrevivente.
```
controller_A_1::> metrocluster heal -phase aggregates
[Job 130] Job succeeded: Heal Aggregates is successful.
```
Se a cura for vetada, você tem a opção de reemitir o metrocluster heal comando com o -override-vetoes parâmetro. Se você usar esse parâmetro opcional, o sistema substituirá quaisquer vetos de software que impeçam a operação de recuperação.

Verifique se a operação foi concluída usando o comando MetroCluster operation show.

controller_A_1::> metrocluster operation show
    Operation: heal-aggregates
      State: successful
Start Time: 7/25/2016 18:45:55
   End Time: 7/25/2016 18:45:56
     Errors: -

Verifique o estado dos agregados utilizando o storage aggregate show comando.

controller_A_1::> storage aggregate show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...

Curar os agregados raiz usando o metrocluster heal -phase root-aggregates comando.
```
mcc1A::> metrocluster heal -phase root-aggregates
[Job 137] Job succeeded: Heal Root Aggregates is successful
```
Se a recuperação for vetada, você terá a opção de reemitir o metrocluster heal comando com o parâmetro -override-vetos. Se você usar esse parâmetro opcional, o sistema substituirá quaisquer vetos de software que impeçam a operação de recuperação.

Verifique se a operação heal está concluída usando o metrocluster operation show comando no cluster de destino:

mcc1A::> metrocluster operation show
  Operation: heal-root-aggregates
      State: successful
 Start Time: 7/29/2016 20:54:41
   End Time: 7/29/2016 20:54:42
     Errors: -

No módulo do controlador desativado, desligue as fontes de alimentação.

Passo 2: Abra o módulo do controlador

Para aceder aos componentes no interior do controlador, tem de remover primeiro o módulo do controlador do sistema e, em seguida, remover a tampa do módulo do controlador.

Se você ainda não está aterrado, aterre-se adequadamente.
Solte o gancho e a alça de loop que prendem os cabos ao dispositivo de gerenciamento de cabos e, em seguida, desconete os cabos do sistema e os SFPs (se necessário) do módulo do controlador, mantendo o controle de onde os cabos estavam conetados.

Deixe os cabos no dispositivo de gerenciamento de cabos para que, ao reinstalar o dispositivo de gerenciamento de cabos, os cabos sejam organizados.
Retire e reserve os dispositivos de gerenciamento de cabos dos lados esquerdo e direito do módulo do controlador.
Desaperte o parafuso de aperto manual na pega do excêntrico no módulo do controlador.

Parafuso de aperto manual

Pega do came
Puxe a alavanca do came para baixo e comece a deslizar o módulo do controlador para fora do chassis.

Certifique-se de que suporta a parte inferior do módulo do controlador enquanto o desliza para fora do chassis.

Etapa 3: Substitua os DIMMs

Para substituir os DIMMs, localize-os dentro do controlador e siga a sequência específica de passos.

Se você ainda não está aterrado, aterre-se adequadamente.
Verifique o LED NVMEM no módulo do controlador.

Você deve executar um desligamento normal do sistema antes de substituir os componentes do sistema para evitar a perda de dados não gravados na memória não volátil (NVMEM). O LED está localizado na parte de trás do módulo do controlador. Procure o seguinte ícone:
Se o LED NVMEM não estiver piscando, não há conteúdo no NVMEM; você pode pular as etapas a seguir e prosseguir para a próxima tarefa neste procedimento.
Desligue a bateria:

O LED do NVMEM pisca enquanto separa o conteúdo da memória flash quando você interrompe o sistema. Depois que o destage estiver completo, o LED desliga-se.
- Se a energia for perdida sem um desligamento normal, o LED NVMEM pisca até que o destage esteja concluído e, em seguida, o LED se desligue.
- Se o LED estiver ligado e ligado, os dados não gravados são armazenados no NVMEM.
  
  Isso geralmente ocorre durante um desligamento não controlado depois que o Data ONTAP foi inicializado com êxito.
  1. Abra a conduta de ar da CPU e localize a bateria do NVMEM.
Patilha de bloqueio da bateria do NVMEM

Bateria NVMEM
1. Localize a ficha da bateria e aperte o clipe na face da ficha da bateria para soltar a ficha da tomada e, em seguida, desligue o cabo da bateria da tomada.
2. Aguarde alguns segundos e, em seguida, volte a ligar a bateria à tomada.
Regresse ao passo 2 deste procedimento para voltar a verificar o LED do NVMEM.
Localize os DIMMs no módulo do controlador.
Observe a orientação do DIMM no soquete para que você possa inserir o DIMM de substituição na orientação adequada.
Ejete o DIMM de seu slot, empurrando lentamente as duas abas do ejetor do DIMM em ambos os lados do DIMM e, em seguida, deslize o DIMM para fora do slot.

Segure cuidadosamente o DIMM pelas bordas para evitar a pressão nos componentes da placa de circuito DIMM.

O número e a colocação dos DIMMs do sistema dependem do modelo do sistema.

A ilustração a seguir mostra a localização dos DIMMs do sistema:
Remova o DIMM de substituição do saco de transporte antiestático, segure o DIMM pelos cantos e alinhe-o com o slot.

O entalhe entre os pinos no DIMM deve estar alinhado com a guia no soquete.
Certifique-se de que as abas do ejetor DIMM no conetor estão na posição aberta e insira o DIMM diretamente no slot.

O DIMM encaixa firmemente no slot, mas deve entrar facilmente. Caso contrário, realinhar o DIMM com o slot e reinseri-lo.

Inspecione visualmente o DIMM para verificar se ele está alinhado uniformemente e totalmente inserido no slot.
Empurre com cuidado, mas firmemente, na borda superior do DIMM até que as abas do ejetor se encaixem no lugar sobre os entalhes nas extremidades do DIMM.
Localize a tomada da ficha da bateria do NVMEM e, em seguida, aperte o grampo na face da ficha do cabo da bateria para a inserir na tomada.

Certifique-se de que a ficha fica fixa no módulo do controlador.
Feche a tampa do módulo do controlador.

Etapa 4: Reinstale o controlador

Depois de substituir um componente no módulo do controlador, tem de reinstalar o módulo do controlador no chassis do sistema.

Se você ainda não está aterrado, aterre-se adequadamente.
Alinhe a extremidade do módulo do controlador com a abertura no chassis e, em seguida, empurre cuidadosamente o módulo do controlador até meio do sistema.

Não introduza completamente o módulo do controlador no chassis até ser instruído a fazê-lo.
Recable o sistema, conforme necessário.

Se você removeu os conversores de Mídia (QSFPs ou SFPs), lembre-se de reinstalá-los se você estiver usando cabos de fibra ótica.
Conclua a reinstalação do módulo do controlador:

O módulo do controlador começa a arrancar assim que estiver totalmente assente no chassis.
1. Com a alavanca do came na posição aberta, empurre firmemente o módulo do controlador até que ele atenda ao plano médio e esteja totalmente assentado e, em seguida, feche a alavanca do came para a posição travada.
  
  Não utilize força excessiva ao deslizar o módulo do controlador para dentro do chassis para evitar danificar os conetores.
2. Aperte o parafuso de aperto manual na pega do came na parte de trás do módulo do controlador.
3. Se ainda não o tiver feito, reinstale o dispositivo de gerenciamento de cabos.
4. Prenda os cabos ao dispositivo de gerenciamento de cabos com o gancho e a alça de loop.

Etapa 5: (Somente MetroCluster de dois nós): Alterne agregados de volta

Depois de concluir a substituição da FRU em uma configuração de MetroCluster de dois nós, você pode executar a operação de switchback do MetroCluster. Isso retorna a configuração ao seu estado operacional normal, com as máquinas virtuais de armazenamento de origem sincronizada (SVMs) no site anteriormente prejudicado agora ativo e fornecendo dados dos pools de discos locais.

Esta tarefa só se aplica a configurações de MetroCluster de dois nós.

Passos

Verifique se todos os nós estão no enabled estado: metrocluster node show

cluster_B::>  metrocluster node show

DR                           Configuration  DR
Group Cluster Node           State          Mirroring Mode
----- ------- -------------- -------------- --------- --------------------
1     cluster_A
              controller_A_1 configured     enabled   heal roots completed
      cluster_B
              controller_B_1 configured     enabled   waiting for switchback recovery
2 entries were displayed.

Verifique se a ressincronização está concluída em todos os SVMs: metrocluster vserver show
Verifique se todas as migrações automáticas de LIF que estão sendo executadas pelas operações de recuperação foram concluídas com sucesso: metrocluster check lif show
Execute o switchback usando o metrocluster switchback comando de qualquer nó no cluster sobrevivente.

Verifique se a operação de comutação foi concluída: metrocluster show

A operação de switchback ainda está em execução quando um cluster está no waiting-for-switchback estado:

cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured       	switchover
Remote: cluster_A configured       	waiting-for-switchback

A operação de switchback é concluída quando os clusters estão no normal estado.:

cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured      		normal
Remote: cluster_A configured      		normal

Se um switchback estiver demorando muito tempo para terminar, você pode verificar o status das linhas de base em andamento usando o metrocluster config-replication resync-status show comando.

Restabelecer qualquer configuração SnapMirror ou SnapVault.

Passo 6: Devolva a peça com falha ao NetApp

Devolva a peça com falha ao NetApp, conforme descrito nas instruções de RMA fornecidas com o kit. Consulte a "Devolução de peças e substituições" página para obter mais informações.

Substitua um DIMM - AFF A300

Creating your file...

Passo 1: Desligue o controlador desativado

Passo 2: Abra o módulo do controlador

Etapa 3: Substitua os DIMMs

Etapa 4: Reinstale o controlador

Etapa 5: (Somente MetroCluster de dois nós): Alterne agregados de volta

Passo 6: Devolva a peça com falha ao NetApp