Substitua um DIMM - AFF A900
Você deve substituir um DIMM no controlador quando seu sistema de armazenamento encontrar erros como erros CECC excessivos (códigos de correção de erros Correctable) que são baseados em alertas do Monitor de integridade ou erros ECC incorrigíveis, geralmente causados por uma única falha de DIMM que impede o sistema de armazenamento de inicializar o ONTAP.
Todos os outros componentes do sistema devem estar funcionando corretamente; caso contrário, você deve entrar em Contato com o suporte técnico.
Você deve substituir o componente com falha por um componente FRU de substituição que você recebeu de seu provedor.
Passo 1: Desligue o controlador desativado
Encerre ou assuma o controlador afetado utilizando uma das seguintes opções.
Para encerrar o controlador com deficiência, você deve determinar o status do controlador e, se necessário, assumir o controlador para que o controlador saudável continue fornecendo dados do armazenamento do controlador com deficiência.
-
Se você tiver um sistema SAN, você deve ter verificado mensagens de
cluster kernel-service show`evento ) para o blade SCSI do controlador afetado. O `cluster kernel-service show
comando (do modo avançado priv) exibe o nome do nó, "status do quorum"desse nó, o status de disponibilidade desse nó e o status operacional desse nó.Cada processo SCSI-blade deve estar em quórum com os outros nós no cluster. Qualquer problema deve ser resolvido antes de prosseguir com a substituição.
-
Se você tiver um cluster com mais de dois nós, ele deverá estar no quórum. Se o cluster não estiver em quórum ou se um controlador íntegro exibir false para qualificação e integridade, você deverá corrigir o problema antes de encerrar o controlador prejudicado; "Sincronize um nó com o cluster"consulte .
-
Se o AutoSupport estiver ativado, suprimir a criação automática de casos invocando uma mensagem AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
A seguinte mensagem AutoSupport suprime a criação automática de casos por duas horas:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Desative a giveback automática a partir da consola do controlador saudável:
storage failover modify -node local -auto-giveback false
Quando vir do pretende desativar a auto-giveback?, introduza y
. -
Leve o controlador prejudicado para o prompt Loader:
Se o controlador afetado estiver a apresentar… Então… O prompt Loader
Vá para a próxima etapa.
A aguardar pela giveback…
Pressione Ctrl-C e responda
y
quando solicitado.Prompt do sistema ou prompt de senha
Assuma ou interrompa o controlador prejudicado do controlador saudável:
storage failover takeover -ofnode impaired_node_name
Quando o controlador prejudicado mostrar aguardando a giveback…, pressione Ctrl-C e responda
y
.
Não use este procedimento se o sistema estiver em uma configuração de MetroCluster de dois nós. |
Para encerrar o controlador com deficiência, você deve determinar o status do controlador e, se necessário, assumir o controlador para que o controlador saudável continue fornecendo dados do armazenamento do controlador com deficiência.
-
Se você tiver um cluster com mais de dois nós, ele deverá estar no quórum. Se o cluster não estiver em quórum ou se um controlador íntegro exibir false para qualificação e integridade, você deverá corrigir o problema antes de encerrar o controlador prejudicado; "Sincronize um nó com o cluster"consulte .
-
Se você tiver uma configuração MetroCluster, você deve ter confirmado que o estado de configuração do MetroCluster está configurado e que os nós estão em um estado ativado e normal (
metrocluster node show
).
-
Se o AutoSupport estiver ativado, suprimir a criação automática de casos invocando uma mensagem AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
A seguinte mensagem AutoSupport suprime a criação automática de casos por duas horas:
cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
-
Desative a giveback automática a partir da consola do controlador saudável:
storage failover modify –node local -auto-giveback false
-
Leve o controlador prejudicado para o prompt Loader:
Se o controlador afetado estiver a apresentar… Então… O prompt Loader
Vá para a próxima etapa.
A aguardar pela giveback…
Pressione Ctrl-C e responda
y
quando solicitado.Prompt do sistema ou prompt de senha (digite a senha do sistema)
Assuma ou interrompa o controlador prejudicado do controlador saudável:
storage failover takeover -ofnode impaired_node_name
Quando o controlador prejudicado mostrar aguardando a giveback…, pressione Ctrl-C e responda
y
.
Passo 2: Remova o módulo do controlador
Para aceder aos componentes no interior do controlador, tem de remover primeiro o módulo do controlador do sistema e, em seguida, remover a tampa do módulo do controlador.
-
Se você ainda não está aterrado, aterre-se adequadamente.
-
Desconete os cabos do módulo do controlador desativado e mantenha o controle de onde os cabos foram conetados.
-
Deslize o botão terra cotta na pega do came para baixo até que este se destranque.
Animação - Remover o controladorBotão de libertação do manípulo do excêntrico
Pega do came
-
Rode o manípulo do excêntrico de forma a desengatar completamente o módulo do controlador do chassis e, em seguida, deslize o módulo do controlador para fora do chassis.
Certifique-se de que suporta a parte inferior do módulo do controlador enquanto o desliza para fora do chassis.
-
Coloque a tampa do módulo do controlador para cima sobre uma superfície estável e plana, pressione o botão azul na tampa, deslize a tampa para a parte traseira do módulo do controlador e, em seguida, gire a tampa para cima e levante-a do módulo do controlador.
Botão de bloqueio da tampa do módulo do controlador
Etapa 3: Substitua os DIMMs
Para substituir os DIMMs, localize-os dentro do controlador e siga a sequência específica de passos.
O CONTROLADOR Ver2 tem menos soquetes DIMM. Não há redução no número de DIMMs suportados ou alteração na numeração do soquete DIMM. Ao mover os DIMMs para o novo módulo do controlador, instale os DIMMs no mesmo número/local do soquete que o módulo do controlador prejudicado. Consulte o diagrama do mapa da FRU no módulo do controlador Ver2 para ver as localizações dos soquetes DIMM. |
-
Se você ainda não está aterrado, aterre-se adequadamente.
-
Localize os DIMMs no módulo do controlador.
-
Ejete o DIMM de seu slot, empurrando lentamente as duas abas do ejetor do DIMM em ambos os lados do DIMM e, em seguida, deslize o DIMM para fora do slot.
Segure cuidadosamente o DIMM pelas bordas para evitar a pressão nos componentes da placa de circuito DIMM. Animação - Substituir DIMMPatilhas do ejetor DIMM
DIMM
-
Remova o DIMM de substituição do saco de transporte antiestático, segure o DIMM pelos cantos e alinhe-o com o slot.
O entalhe entre os pinos no DIMM deve estar alinhado com a guia no soquete.
-
Certifique-se de que as abas do ejetor DIMM no conetor estão na posição aberta e insira o DIMM diretamente no slot.
O DIMM encaixa firmemente no slot, mas deve entrar facilmente. Caso contrário, realinhar o DIMM com o slot e reinseri-lo.
Inspecione visualmente o DIMM para verificar se ele está alinhado uniformemente e totalmente inserido no slot. -
Empurre com cuidado, mas firmemente, na borda superior do DIMM até que as abas do ejetor se encaixem no lugar sobre os entalhes nas extremidades do DIMM.
-
Feche a tampa do módulo do controlador.
Passo 4: Instale o controlador
Depois de instalar os componentes no módulo do controlador, tem de instalar o módulo do controlador novamente no chassis do sistema e arrancar o sistema operativo.
Para pares de HA com dois módulos de controlador no mesmo chassi, a sequência em que você instala o módulo de controlador é especialmente importante porque ele tenta reiniciar assim que você o senta completamente no chassi.
-
Se você ainda não está aterrado, aterre-se adequadamente.
-
Se ainda não o tiver feito, substitua a tampa no módulo do controlador.
Botão de bloqueio da tampa do módulo do controlador
-
Alinhe a extremidade do módulo do controlador com a abertura no chassis e, em seguida, empurre cuidadosamente o módulo do controlador até meio do sistema.
Animação - Instalar controladorBotão de libertação do manípulo do excêntrico
Pega do came
Não introduza completamente o módulo do controlador no chassis até ser instruído a fazê-lo. -
Faça o cabeamento apenas das portas de gerenciamento e console, para que você possa acessar o sistema para executar as tarefas nas seções a seguir.
Você conetará o resto dos cabos ao módulo do controlador posteriormente neste procedimento. -
Conclua a reinstalação do módulo do controlador:
-
Se ainda não o tiver feito, reinstale o dispositivo de gerenciamento de cabos.
-
Empurre firmemente o módulo do controlador para dentro do chassi até que ele atenda ao plano médio e esteja totalmente assentado.
Os trincos de bloqueio sobem quando o módulo do controlador está totalmente assente.
Não utilize força excessiva ao deslizar o módulo do controlador para dentro do chassis para evitar danificar os conetores.
O módulo do controlador começa a arrancar assim que estiver totalmente assente no chassis. Esteja preparado para interromper o processo de inicialização.
-
Rode os trincos de bloqueio para cima, inclinando-os de forma a que estes limpem os pinos de bloqueio e, em seguida, baixe-os para a posição de bloqueio.
-
Interrompa o processo de inicialização pressionando
Ctrl-C
quando você vir pressione Ctrl-C para o Menu de inicialização. -
Selecione a opção para iniciar no modo Manutenção a partir do menu apresentado.
-
Etapa 5: Execute o diagnóstico no nível do sistema
Depois de instalar um novo DIMM, você deve executar o diagnóstico.
O sistema deve estar no prompt DO Loader para iniciar o Diagnóstico do nível do sistema.
Todos os comandos nos procedimentos de diagnóstico são emitidos a partir do controlador onde o componente está sendo substituído.
-
Se o controlador a ser atendido não estiver no prompt Loader, execute as seguintes etapas:
-
Selecione a opção modo de manutenção no menu apresentado.
-
Depois de o controlador arrancar para o modo de manutenção, interrompa o controlador:
halt
Depois de emitir o comando, você deve esperar até que o sistema pare no prompt DO Loader.
Durante o processo de inicialização, você pode responder com segurança y
aos prompts.-
Se aparecer uma mensagem avisando que ao entrar no modo Manutenção em uma configuração HA, você deve garantir que o controlador saudável permaneça inativo.
-
-
-
No prompt DO Loader, acesse os drivers especiais especificamente projetados para que o diagnóstico no nível do sistema funcione corretamente:
boot_diags
Durante o processo de inicialização, você pode responder com segurança
y
aos prompts até que o prompt do modo de manutenção (*>) seja exibido. -
Execute o diagnóstico na memória do sistema:
sldiag device run -dev mem
-
Verifique se nenhum problema de hardware resultou da substituição dos DIMMs:
sldiag device status -dev mem -long -state failed
O diagnóstico no nível do sistema retorna ao prompt se não houver falhas de teste ou lista o status completo das falhas resultantes do teste do componente.
-
Prossiga com base no resultado do passo anterior:
Se o diagnóstico do nível do sistema testar… Então… Foram concluídas sem falhas
-
Limpar os registos de estado:
sldiag device clearstatus
-
Verifique se o log foi limpo:
sldiag device status
A seguinte resposta padrão é exibida:
SLDIAG: Nenhuma mensagem de registo está presente.
-
Sair do modo de manutenção:
halt
O controlador exibe o prompt Loader.
-
Inicialize o controlador a partir do prompt Loader:
bye
-
Volte a colocar o controlador em funcionamento normal:
Se o seu controlador estiver em… Então… Um par de HA
Execute uma devolução:
storage failover giveback -ofnode replacement_node_name
Nota: se você desativou o giveback automático, reative-o com o comando de modificação de failover de armazenamento.Resultou em algumas falhas de teste
Determine a causa do problema:
-
Sair do modo de manutenção:
halt
Depois de emitir o comando, aguarde até que o sistema pare no prompt DO Loader.
-
Verifique se você observou todas as considerações identificadas para executar diagnósticos no nível do sistema, se os cabos estão bem conetados e se os componentes de hardware estão instalados corretamente no sistema de armazenamento.
-
Inicialize o módulo do controlador que você está fazendo manutenção, interrompendo a inicialização pressionando
Ctrl-C
quando solicitado para acessar o menu Boot:-
Se tiver dois módulos de controlador no chassis, coloque totalmente o módulo de controlo que está a efetuar a manutenção no chassis.
O módulo do controlador arranca quando está totalmente encaixado.
-
Se tiver um módulo de controlador no chassis, ligue as fontes de alimentação e, em seguida, ligue-as.
-
-
Selecione Boot to maintenance mode (Inicializar para o modo de manutenção) no menu.
-
Saia do modo Manutenção inserindo o seguinte comando:
halt
Depois de emitir o comando, aguarde até que o sistema pare no prompt DO Loader.
-
Volte a executar o teste de diagnóstico ao nível do sistema.
-
Passo 6: Devolva a peça com falha ao NetApp
Devolva a peça com falha ao NetApp, conforme descrito nas instruções de RMA fornecidas com o kit. Consulte a "Devolução de peças e substituições" página para obter mais informações.