Skip to main content
NetApp HCI
1.10
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Substitua DIMMs em nós de computação

Colaboradores netapp-pcarriga netapp-dbagwell

Você pode substituir um módulo de memória dupla (DIMM) com defeito nos nós de computação do NetApp HCI em vez de substituir o nó inteiro.

O que você vai precisar
  • Antes de iniciar este procedimento, deverá contactar o suporte da NetApp e receber uma peça de substituição. O suporte será envolvido durante a instalação da substituição. Se ainda não o fez, "Suporte" contacte .

  • Você planejou o tempo de inatividade do sistema, porque precisa desligar ou desligar o nó e inicializar o nó para o modo de Segurança NetApp para acessar a interface do usuário de terminal (TUI).

Sobre esta tarefa

Este procedimento se aplica aos seguintes modelos de nós de computação:

  • H410C nós. Um nó H410C é inserido em um chassi 2U NetApp HCI.

  • H610C nó. Um nó H610C está integrado no chassi.

  • H615C nó. Um nó H615C está integrado no chassi.

    Importante Os nós de H410C e H615C incluem DIMMs de diferentes fornecedores. Certifique-se de que você não misture DIMMs de diferentes fornecedores em um chassi.
    Observação Os termos "chassis" e "nó" são usados alternadamente no caso de H610C e H615C, porque o nó e o chassi não são componentes separados.

Aqui estão as etapas envolvidas na substituição de DIMMs em nós de computação:

Prepare-se para substituir o DIMM

Quando ocorrem problemas com o DIMM, o VMware ESXi exibe alertas, como Memory Configuration Error , Memory Uncorrectable ECC, Memory Transition to Critical e Memory Critical Overtemperature. Mesmo que os alertas desapareçam após algum tempo, o problema de hardware pode persistir. Você deve diagnosticar e resolver o DIMM com defeito. Você pode obter informações sobre o DIMM defeituoso do vCenter Server. Se você precisar de mais informações do que as disponíveis no vCenter Server, execute a verificação de hardware na TUI.

Passos
  1. Identifique o slot que registrou o erro da seguinte forma:

    1. Para H615C, faça o seguinte:

      1. Faça login na IU do BMC.

      2. Selecione Logs & Reports > IPMI Event Log.

      3. No log de eventos, localize o erro de memória e identifique o slot no qual o erro é registrado.

        Mostra o erro de memória incorrigível na IU do BMC para H615C nós
    2. Para H410C, faça o seguinte:

      1. Faça login na IU do BMC.

      2. Selecione Server Health (Saúde do servidor) > Health Event Log (Registo de eventos de saúde).

      3. No log de eventos, localize o erro de memória e identifique o slot no qual o erro é registrado.

        Mostra o erro de memória na IU do BMC para o nó H410C.
  2. Execute as etapas para identificar o número de peça do fabricante do DIMM.

    Importante Os nós H410C e H615C incluem DIMMs de diferentes fabricantes. Você não deve misturar diferentes tipos de DIMM no mesmo chassi. Você deve identificar o fabricante do DIMM com defeito e solicitar uma substituição do mesmo tipo.
    1. Faça login no BMC para iniciar o console no nó.

    2. Pressione F2 no teclado para acessar o menu Personalizar sistema/Exibir logs.

    3. Digite a senha quando solicitado.

      Observação A senha deve corresponder ao que você configurou no mecanismo de implantação do NetApp ao configurar o NetApp HCI.
    Mostra a janela para introduzir a palavra-passe para iniciar sessão na consola no nó.
    1. No menu Personalização do sistema, pressione a seta para baixo para navegar até Opções de solução de problemas e pressione Enter.

      Apresenta o menu System Customization (Personalização do sistema).
    2. No menu Opções do modo de solução de problemas, use a seta para cima ou para baixo para ativar o shell ESXi e o SSH, que estão desativados por padrão.

    3. Pressione a tecla <Esc> duas vezes para sair das Opções de solução de problemas.

    4. Execute o smbiosDump comando usando uma das seguintes opções:

      Opção Passos

      Opção A

      1. Conete-se ao host ESXi (nó de computação) usando o endereço IP do host e as credenciais raiz definidas.

      2. Executar o smbiosDump comando. Veja a seguinte saída de amostra:

      `Memory Device:#30
      Location: "P1-DIMMA1"
      Bank: "P0_Node0_Channel0_Dimm0"
      Manufacturer:"Samsung"
      Serial: "38EB8380"
      Asset Tag: "P1-DIMMA1_AssetTag (date:18/15)"
      Part Number: "M393A4K40CB2-CTD"
      Memory Array: #29
      Form Factor: 0x09(DIMM)
      Type: 0x1a (DDR4)
      Type Detail: 0x0080 (Synchronous)
      Data Width: 64 bits (+8 ECC bits)
      Size: 32 GB`

      Opção B

      1. Pressione Alt F1 para inserir shell e faça login no nó para executar o comando.

  3. Entre em Contato com o suporte da NetApp para obter ajuda com as próximas etapas. O suporte da NetApp requer as seguintes informações para processar uma substituição de peças:

    • Número de série do nó

    • Nome do cluster

    • Detalhes do log de eventos do sistema a partir da IU do BMC

    • Saída do smbiosDump comando

Substitua o DIMM do chassi

Antes de remover fisicamente e substituir o DIMM defeituoso no chassi, verifique se você executou todos os "etapas preparatórias".

Importante Os DIMMs devem ser substituídos nos mesmos slots dos quais foram removidos.
Passos
  1. Acesse o nó efetuando login no vCenter Server.

  2. Clique com o botão direito do rato no nó que está a reportar o erro e selecione a opção para colocar o nó no modo de manutenção.

  3. Migre as máquinas virtuais (VMs) para outro host disponível.

    Observação Consulte a documentação da VMware para obter as etapas de migração.
  4. Desligue o chassis ou nó.

    Observação Para um chassi de H610CU ou H615CU, desligue o chassi. Para H410C nós em um chassi de quatro nós 2U, desligue somente o nó com o DIMM defeituoso.
  5. Remova os cabos de alimentação e os cabos de rede, deslize cuidadosamente o nó ou o chassi para fora do rack e coloque-o em uma superfície plana e antiestática.

    Dica Considere usar braçadeiras de torção para cabos.
  6. Coloque proteção antiestática antes de abrir a tampa do chassi para substituir o DIMM.

  7. Execute as etapas relevantes para o modelo do nó:

    Modelo de nó Passos

    H410C

    1. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui estão imagens de exemplo mostrando os números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe do nó H410C.
      Mostra uma visão geral dos números de slot DIMM na placa-mãe de H410C nós.
    2. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima. Aqui está uma imagem de exemplo mostrando os clipes de retenção:

      Mostra os clipes de retenção dos DIMMs no nó H410C.
    3. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    4. Instale o nó no chassi do NetApp HCI, garantindo que o nó clique quando você o coloca no lugar.

    H610C

    1. Levante a tampa conforme ilustrado na imagem seguinte:

      Mostra a tampa levantada no nó H610C.
    2. Desaperte os quatro parafusos de bloqueio azuis na parte de trás do nó. Aqui está uma imagem de exemplo mostrando a localização de dois parafusos de bloqueio; você encontrará os outros dois do outro lado do nó:

      Mostra os parafusos de bloqueio na parte de trás do nó H610C.
    3. Remova ambas as placas PCI.

    4. Remova a GPU e a tampa do fluxo de ar.

    5. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui está uma imagem de exemplo mostrando a localização dos números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe H610C.
    6. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima.

    7. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    8. Substitua todos os componentes que você removeu: GPU, tampa do fluxo de ar e placas PCI.

    9. Aperte os parafusos de bloqueio.

    10. Volte a colocar a tampa no nó.

    11. Instale o chassi H610C no rack, certificando-se de que o chassi clica quando você o desliza no lugar.

    H615C

    1. Levante a tampa conforme ilustrado na imagem seguinte:

      Mostra a tampa levantada no nó H615C.
    2. Remova a GPU (se o nó H615C tiver a GPU instalada) e a tampa do fluxo de ar.

      Mostra a tampa do fluxo de ar removida no nó H615C.
    3. Localize o DIMM com falha, combinando o número/ID do slot que você anotou anteriormente com a numeração na placa-mãe. Aqui está uma imagem de exemplo mostrando a localização dos números de slot DIMM na placa-mãe:

      Mostra os números do slot DIMM na placa-mãe H615C.
    4. Pressione os dois grampos de fixação para fora e puxe cuidadosamente o DIMM para cima.

    5. Instale o DIMM de substituição corretamente. Quando você insere o DIMM no slot corretamente, os dois clipes ficam presos no lugar.

      Importante Certifique-se de tocar apenas nas extremidades traseiras do DIMM. Se você pressionar outras partes do DIMM, isso pode resultar em danos ao hardware.
    6. Volte a colocar a cobertura do fluxo de ar.

    7. Volte a colocar a tampa no nó.

    8. Instale o chassi H610C no rack, certificando-se de que o chassi clica quando você o desliza no lugar.

  8. Insira os cabos de alimentação e de rede. Certifique-se de que todas as luzes da porta se acendem.

  9. Pressione o botão liga/desliga na parte frontal do nó se ele não ligar automaticamente ao instalá-lo.

  10. Depois que o nó for exibido no vSphere, clique com o botão direito do Mouse no nome e retire o nó do modo de manutenção.

  11. Verifique as informações do hardware da seguinte forma:

    1. Inicie sessão na IU do controlador de gestão de base (BMC).

    2. Selecione sistema > informações de hardware e verifique os DIMMs listados.

O que vem a seguir

Depois que o nó retornar à operação normal, no vCenter, verifique a guia Resumo para garantir que a capacidade de memória seja conforme o esperado.

Observação Se o DIMM não estiver instalado corretamente, o nó funcionará normalmente, mas com capacidade de memória inferior à esperada.
Dica Após o procedimento de substituição do DIMM, você pode limpar os avisos e erros na guia Status do hardware no vCenter. Você pode fazer isso se quiser apagar o histórico de erros relacionados ao hardware que você substituiu. "Saiba mais".