Skip to main content
Uma versão mais recente deste produto está disponível.
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Substitua DIMMs em nós de computação

Colaboradores

Você pode substituir um módulo de memória dupla (DIMM) com defeito nos nós de computação do NetApp HCI em vez de substituir o nó inteiro.

O que você vai precisar
  • Antes de iniciar este procedimento, deverá contactar o suporte da NetApp e receber uma peça de substituição. O suporte será envolvido durante a instalação da substituição. Se ainda não o fez, "Suporte" contacte .

  • Você planejou o tempo de inatividade do sistema, porque precisa desligar ou desligar o nó e inicializar o nó para o modo de Segurança NetApp para acessar a interface do usuário de terminal (TUI).

Sobre esta tarefa

Este procedimento se aplica aos seguintes modelos de nós de computação:

  • H410C nós. Um nó H410C é inserido em um chassi 2U NetApp HCI.

  • H610C nó. Um nó H610C está integrado no chassi.

  • H615C nó. Um nó H615C está integrado no chassi.

    Importante Os nós de H410C e H615C incluem DIMMs de diferentes fornecedores. Certifique-se de que você não misture DIMMs de diferentes fornecedores em um chassi.
    Observação Os termos "chassis" e "nó" são usados alternadamente no caso de H610C e H615C, porque o nó e o chassi não são componentes separados.

Aqui estão as etapas envolvidas na substituição de DIMMs em nós de computação:

Prepare-se para substituir o DIMM

Quando ocorrem problemas com o DIMM, o VMware ESXi exibe alertas, como Memory Configuration Error , Memory Uncorrectable ECC, Memory Transition to Critical e Memory Critical Overtemperature. Mesmo que os alertas desapareçam após algum tempo, o problema de hardware pode persistir. Você deve diagnosticar e resolver o DIMM com defeito. Você pode obter informações sobre o DIMM defeituoso do vCenter Server. Se você precisar de mais informações do que as disponíveis no vCenter Server, execute a verificação de hardware na TUI.

Passos
  1. Acesse o nó efetuando login no vCenter Server.

  2. Clique com o botão direito do rato no nó que está a reportar o erro e selecione a opção para colocar o nó no modo de manutenção.

  3. Migre as máquinas virtuais (VMs) para outro host disponível.

    Observação Consulte a documentação da VMware para obter as etapas de migração.
  4. Desligue o nó de computação.

    Observação Se você tiver as informações sobre qual DIMM precisa ser substituído e não precisar acessar a TUI, ignore as etapas a seguir nesta seção.
  5. Conete um teclado, vídeo e Mouse (KVM) na parte traseira do nó que relatou o erro.

  6. Pressione o botão liga/desliga na parte frontal do nó. Leva aproximadamente seis minutos para o nó arrancar. O ecrã apresenta um menu de arranque.

  7. Identifique o slot que registrou o erro da seguinte forma:

    1. Para H615C, faça o seguinte:

      1. Faça login na IU do BMC.

      2. Selecione Logs & Reports > IPMI Event Log.

      3. No log de eventos, localize o erro de memória e identifique o slot no qual o erro é registrado.

        Mostra o erro de memória incorrigível na IU do BMC para H615C nós
  8. Para nós H410C e H615C, execute as etapas para identificar o número de peça do fabricante do DIMM.

    Importante Os nós H410C e H615C incluem DIMMs de diferentes fabricantes. Você não deve misturar diferentes tipos de DIMM no mesmo chassi. Você deve identificar o fabricante do DIMM com defeito e solicitar uma substituição do mesmo tipo.
    1. Faça login no BMC para iniciar o console no nó.

    2. Pressione F2 no teclado para acessar o menu Personalizar sistema/Exibir logs.

    3. Digite a senha quando solicitado.

      Observação A senha deve corresponder ao que você configurou no mecanismo de implantação do NetApp ao configurar o NetApp HCI.
    Mostra a janela para introduzir a palavra-passe para iniciar sessão na consola no nó.
    1. No menu Personalização do sistema, pressione a seta para baixo para navegar até Opções de solução de problemas e pressione Enter.

      Apresenta o menu System Customization (Personalização do sistema).
    2. No menu Opções do modo de solução de problemas, use a seta para cima ou para baixo para ativar o shell ESXi e o SSH, que estão desativados por padrão.

    3. Pressione a tecla <Esc> duas vezes para sair das Opções de solução de problemas.

    4. Execute o smbiosDump comando usando uma das seguintes opções:

      Opção Passos

      Opção A

      1. Conete-se ao host ESXi (nó de computação) usando o endereço IP do host e as credenciais raiz definidas.

      2. Executar o smbiosDump comando. Veja a seguinte saída de amostra:

      `Memory Device:#30
      Location: "P1-DIMMA1"
      Bank: "P0_Node0_Channel0_Dimm0"
      Manufacturer:"Samsung"
      Serial: "38EB8380"
      Asset Tag: "P1-DIMMA1_AssetTag (date:18/15)"
      Part Number: "M393A4K40CB2-CTD"
      Memory Array: #29
      Form Factor: 0x09(DIMM)
      Type: 0x1a (DDR4)
      Type Detail: 0x0080 (Synchronous)
      Data Width: 64 bits (+8 ECC bits)
      Size: 32 GB`

      Opção B

      1. Pressione Alt F1 para inserir shell e faça login no nó para executar o comando.

  9. Entre em Contato com o suporte da NetApp para obter ajuda com as próximas etapas. O suporte da NetApp requer as seguintes informações para processar uma substituição de peças:

    • Número de série do nó

    • Nome do cluster

    • Registo de eventos do sistema a partir da IU do BMC (Registos e relatórios > Registo de eventos IPMI> Transferir registos de eventos)

    • Saída do smbiosDump comando

Substitua o DIMM do chassi

Antes de remover fisicamente e substituir o DIMM defeituoso no chassi, verifique se você executou todos os "etapas preparatórias".

Importante Os DIMMs devem ser substituídos nos mesmos slots dos quais foram removidos.
Passos
  1. Desligue o chassis ou nó.

    Observação Para um chassi de H610CU ou H615CU, desligue o chassi. Para H410C nós em um chassi de quatro nós 2U, desligue somente o nó com o DIMM defeituoso.
  2. Remova os cabos de alimentação e os cabos de rede, deslize cuidadosamente o nó ou o chassi para fora do rack e coloque-o em uma superfície plana e antiestática.

    Dica Considere usar braçadeiras de torção para cabos.
  3. Coloque proteção antiestática antes de abrir a tampa do chassi para substituir o DIMM.

  4. Execute as etapas relevantes para o modelo do nó:

    Modelo de nó Passos

    H410C

    1. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui estão imagens de exemplo mostrando os números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe do nó H410C.
      Mostra uma visão geral dos números de slot DIMM na placa-mãe de H410C nós.
    2. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima. Aqui está uma imagem de exemplo mostrando os clipes de retenção:

      Mostra os clipes de retenção dos DIMMs no nó H410C.
    3. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    4. Instale o nó no chassi do NetApp HCI, garantindo que o nó clique quando você o coloca no lugar.

    H610C

    1. Levante a tampa conforme ilustrado na imagem seguinte:

      Mostra a tampa levantada no nó H610C.
    2. Desaperte os quatro parafusos de bloqueio azuis na parte de trás do nó. Aqui está uma imagem de exemplo mostrando a localização de dois parafusos de bloqueio; você encontrará os outros dois do outro lado do nó:

      Mostra os parafusos de bloqueio na parte de trás do nó H610C.
    3. Remova ambas as placas PCI.

    4. Remova a GPU e a tampa do fluxo de ar.

    5. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui está uma imagem de exemplo mostrando a localização dos números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe H610C.
    6. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima.

    7. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    8. Substitua todos os componentes que você removeu: GPU, tampa do fluxo de ar e placas PCI.

    9. Aperte os parafusos de bloqueio.

    10. Volte a colocar a tampa no nó.

    11. Instale o chassi H610C no rack, certificando-se de que o chassi clica quando você o desliza no lugar.

    H615C

    1. Levante a tampa conforme ilustrado na imagem seguinte:

      Mostra a tampa levantada no nó H615C.
    2. Remova a GPU (se o nó H615C tiver a GPU instalada) e a tampa do fluxo de ar.

      Mostra a tampa do fluxo de ar removida no nó H615C.
    3. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui está uma imagem de exemplo mostrando a localização dos números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe H615C.
    4. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima.

    5. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    6. Volte a colocar a cobertura do fluxo de ar.

    7. Volte a colocar a tampa no nó.

    8. Instale o chassi H610C no rack, certificando-se de que o chassi clica quando você o desliza no lugar.

  5. Insira os cabos de alimentação e de rede. Certifique-se de que todas as luzes da porta se acendem.

  6. Pressione o botão liga/desliga na parte frontal do nó se ele não ligar automaticamente ao instalá-lo.

  7. Depois que o nó for exibido no vSphere, clique com o botão direito do Mouse no nome e retire o nó do modo de manutenção.

  8. Verifique as informações do hardware da seguinte forma:

    1. Inicie sessão na IU do controlador de gestão de base (BMC).

    2. Selecione sistema > informações de hardware e verifique os DIMMs listados.

O que vem a seguir

Depois que o nó retornar à operação normal, no vCenter, verifique a guia Resumo para garantir que a capacidade de memória seja conforme o esperado.

Observação Se o DIMM não estiver instalado corretamente, o nó funcionará normalmente, mas com capacidade de memória inferior à esperada.
Dica Após o procedimento de substituição do DIMM, você pode limpar os avisos e erros na guia Status do hardware no vCenter. Você pode fazer isso se quiser apagar o histórico de erros relacionados ao hardware que você substituiu. "Saiba mais".