Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Sostituire i DIMM nei nodi di calcolo

Collaboratori

È possibile sostituire un modulo DIMM (Dual Inline Memory Module) guasto nei nodi di calcolo NetApp HCI invece di sostituire l'intero nodo.

Di cosa hai bisogno
  • Prima di iniziare questa procedura, dovresti aver contattato il supporto NetApp e aver ricevuto una parte di ricambio. Durante l'installazione della sostituzione verrà fornito supporto. Se non l'hai già fatto, contatta "Supporto".

  • Hai pianificato il downtime del sistema, perché devi spegnere o spegnere e riaccendere il nodo e avviare il nodo in NetApp Safe Mode per accedere all'interfaccia utente del terminale (TUI).

A proposito di questa attività

Questa procedura si applica ai seguenti modelli di nodi di calcolo:

  • Nodi H410C. Un nodo H410C viene inserito in uno chassis NetApp HCI 2U.

  • Nodo H610C. Nel telaio è integrato un nodo H610C.

  • Nodo H615C. Nel telaio è integrato un nodo H615C.

    Importante I nodi H410C e H615C includono DIMM di diversi vendor. Assicurarsi di non combinare DIMM di vendor diversi in un unico chassis.
    Nota I termini "chassis" e "nodo" sono utilizzati in modo intercambiabile nel caso di H610C e H615C, perché il nodo e lo chassis non sono componenti separati.

Di seguito sono riportati i passaggi necessari per sostituire i DIMM nei nodi di calcolo:

Preparare la sostituzione del DIMM

Quando si verificano problemi con il DIMM, VMware ESXi visualizza avvisi, ad esempio Memory Configuration Error, Memory Uncorrectable ECC, Memory Transition to Critical, e. Memory Critical Overtemperature. Anche se gli avvisi scompaiono dopo qualche istante, il problema hardware potrebbe persistere. Eseguire la diagnosi e risolvere il problema del DIMM guasto. È possibile ottenere informazioni sul DIMM guasto da vCenter Server. Se sono necessarie ulteriori informazioni rispetto a quelle disponibili da vCenter Server, è necessario eseguire il check dell'hardware nell'interfaccia telefonica utente (TUI).

Fasi
  1. Identificare lo slot che ha registrato l'errore come segue:

    1. Per H615C, procedere come indicato di seguito:

      1. Accedere all'interfaccia utente BMC.

      2. Selezionare Log & Report > IPMI Event Log.

      3. Nel registro eventi, individuare l'errore di memoria e identificare lo slot in cui viene registrato l'errore.

        Mostra l'errore di memoria non correggibile nell'interfaccia utente BMC per i nodi H615C
    2. Per H410C, procedere come indicato di seguito:

      1. Accedere all'interfaccia utente BMC.

      2. Selezionare Server Health > Health Event Log.

      3. Nel registro eventi, individuare l'errore di memoria e identificare lo slot in cui viene registrato l'errore.

        Mostra l'errore di memoria nell'interfaccia utente BMC per il nodo H410C.
  2. Eseguire la procedura per identificare il codice del produttore del modulo DIMM.

    Importante I nodi H410C e H615C includono DIMM di diversi produttori. Non utilizzare tipi di DIMM diversi nello stesso chassis. Identificare il produttore del modulo DIMM guasto e ordinare un modulo sostitutivo dello stesso tipo.
    1. Accedere a BMC per avviare la console sul nodo.

    2. Premere F2 sulla tastiera per accedere al menu Customize System/View Logs (Personalizza sistema/Visualizza registri).

    3. Inserire la password quando richiesto.

      Nota La password deve corrispondere a quella configurata nel motore di implementazione NetApp al momento della configurazione di NetApp HCI.
    Mostra la finestra per inserire la password per accedere alla console sul nodo.
    1. Dal menu System Customization (Personalizzazione sistema), premere la freccia verso il basso per passare a Troubleshooting Options (Opzioni di risoluzione dei problemi), quindi premere Invio.

      Mostra il menu System Customization (Personalizzazione sistema).
    2. Dal menu Troubleshooting Mode Options (Opzioni modalità di risoluzione dei problemi), utilizzare la freccia su o giù per attivare la shell ESXi e SSH, che sono disabilitati per impostazione predefinita.

    3. Premere due volte il tasto <Esc> per uscire dalle opzioni di risoluzione dei problemi.

    4. Eseguire smbiosDump utilizzare una delle seguenti opzioni:

      Opzione Fasi

      Opzione A.

      1. Connettersi all'host ESXi (nodo di calcolo) utilizzando l'indirizzo IP dell'host e le credenziali root definite.

      2. Eseguire smbiosDump comando. Vedere il seguente esempio di output:

      `Memory Device:#30
      Location: "P1-DIMMA1"
      Bank: "P0_Node0_Channel0_Dimm0"
      Manufacturer:"Samsung"
      Serial: "38EB8380"
      Asset Tag: "P1-DIMMA1_AssetTag (date:18/15)"
      Part Number: "M393A4K40CB2-CTD"
      Memory Array: #29
      Form Factor: 0x09(DIMM)
      Type: 0x1a (DDR4)
      Type Detail: 0x0080 (Synchronous)
      Data Width: 64 bits (+8 ECC bits)
      Size: 32 GB`

      Opzione B

      1. Premere Alt + F1 per inserire la shell e accedere al nodo per eseguire il comando.

  3. Contatta il supporto NetApp per ricevere assistenza sui passi successivi. Il supporto NetApp richiede le seguenti informazioni per elaborare la sostituzione di una parte:

    • Numero di serie del nodo

    • Nome del cluster

    • Dettagli del registro eventi di sistema dall'interfaccia utente BMC

    • Output da smbiosDump comando

Sostituire il modulo DIMM dal telaio

Prima di rimuovere e sostituire fisicamente il modulo DIMM guasto nel telaio, assicurarsi di aver eseguito tutte le operazioni "fasi preparatorie".

Importante I DIMM devono essere sostituiti negli stessi slot da cui sono stati rimossi.
Fasi
  1. Accedere al nodo accedendo a vCenter Server.

  2. Fare clic con il pulsante destro del mouse sul nodo che segnala l'errore e selezionare l'opzione per impostare il nodo in modalità di manutenzione.

  3. Migrare le macchine virtuali (VM) su un altro host disponibile.

    Nota Consultare la documentazione VMware per le fasi della migrazione.
  4. Spegnere lo chassis o il nodo.

    Nota Per uno chassis H610C o H615C, spegnere lo chassis. Per i nodi H410C in uno chassis 2U a quattro nodi, spegnere solo il nodo con il DIMM guasto.
  5. Rimuovere i cavi di alimentazione e di rete, estrarre con cautela il nodo o lo chassis dal rack e posizionarlo su una superficie piana e antistatica.

    Suggerimento Prendere in considerazione l'utilizzo di fascette per cavi.
  6. Applicare una protezione antistatica prima di aprire il coperchio dello chassis per sostituire il DIMM.

  7. Eseguire i passaggi relativi al modello di nodo:

    Modello di nodo Fasi

    H410C

    1. Individuare il DIMM guasto facendo corrispondere il numero/ID dello slot annotato in precedenza con la numerazione sulla scheda madre. Di seguito sono riportate immagini di esempio che mostrano i numeri degli slot DIMM sulla scheda madre:

      Mostra i numeri degli slot DIMM sulla scheda madre del nodo H410C.
      La mostra una vista ravvicinata dei numeri degli slot DIMM sulla scheda madre del nodo H410C.
    2. Spingere i due fermi verso l'esterno ed estrarre con cautela il modulo DIMM. Ecco un'immagine di esempio che mostra i fermi di fissaggio:

      La mostra i fermi di fissaggio dei DIMM nel nodo H410C.
    3. Installare correttamente il modulo DIMM sostitutivo. Quando si inserisce correttamente il DIMM nello slot, i due fermi si bloccano in posizione.

      Importante Assicurarsi di toccare solo le estremità posteriori del DIMM. Se si premono altre parti del DIMM, l'hardware potrebbe danneggiarsi.
    4. Installare il nodo nello chassis NetApp HCI, assicurandosi che il nodo scatti quando lo si inserisce in posizione.

    H610C

    1. Sollevare il coperchio come mostrato nell'immagine seguente:

      Mostra il coperchio sollevato sul nodo H610C.
    2. Allentare le quattro viti di bloccaggio blu sul retro del nodo. Di seguito è riportato un esempio di immagine che mostra la posizione delle due viti di bloccaggio; le altre due si trovano sull'altro lato del nodo:

      La mostra le viti di bloccaggio sul retro del nodo H610C.
    3. Rimuovere entrambi gli spazi vuoti della scheda PCI.

    4. Rimuovere la GPU e il coperchio del flusso d'aria.

    5. Individuare il DIMM guasto facendo corrispondere il numero/ID dello slot annotato in precedenza con la numerazione sulla scheda madre. Di seguito è riportato un esempio di immagine che mostra la posizione dei numeri degli slot DIMM sulla scheda madre:

      Mostra i numeri degli slot DIMM sulla scheda madre H610C.
    6. Spingere i due fermi verso l'esterno ed estrarre con cautela il modulo DIMM.

    7. Installare correttamente il modulo DIMM sostitutivo. Quando si inserisce correttamente il DIMM nello slot, i due fermi si bloccano in posizione.

      Importante Assicurarsi di toccare solo le estremità posteriori del DIMM. Se si premono altre parti del DIMM, l'hardware potrebbe danneggiarsi.
    8. Sostituire tutti i componenti rimossi: GPU, coperchio del flusso d'aria e protezioni PCI.

    9. Serrare le viti di bloccaggio.

    10. Rimettere il coperchio sul nodo.

    11. Installare lo chassis H610C nel rack, assicurandosi che scatti quando lo si inserisce in posizione.

    H615C

    1. Sollevare il coperchio come mostrato nell'immagine seguente:

      La mostra il coperchio sollevato sul nodo H615C.
    2. Rimuovere la GPU (se nel nodo H615C è installata la GPU) e il coperchio del flusso d'aria.

      La mostra il coperchio del flusso d'aria rimosso sul nodo H615C.
    3. Individuare il DIMM guasto facendo corrispondere il numero/ID dello slot annotato in precedenza con la numerazione sulla scheda madre. Di seguito è riportato un esempio di immagine che mostra la posizione dei numeri degli slot DIMM sulla scheda madre:

      Mostra i numeri degli slot DIMM sulla scheda madre H615C.
    4. Spingere i due fermi verso l'esterno ed estrarre con cautela il modulo DIMM.

    5. Installare correttamente il modulo DIMM sostitutivo. Quando si inserisce correttamente il DIMM nello slot, i due fermi si bloccano in posizione.

      Importante Assicurarsi di toccare solo le estremità posteriori del DIMM. Se si premono altre parti del DIMM, l'hardware potrebbe danneggiarsi.
    6. Riposizionare il coperchio del flusso d'aria.

    7. Rimettere il coperchio sul nodo.

    8. Installare lo chassis H610C nel rack, assicurandosi che scatti quando lo si inserisce in posizione.

  8. Inserire i cavi di alimentazione e di rete. Assicurarsi che tutti i LED delle porte si accendano.

  9. Premere il pulsante di accensione nella parte anteriore del nodo se non si accende automaticamente quando viene installato.

  10. Una volta visualizzato il nodo in vSphere, fare clic con il pulsante destro del mouse sul nome e uscire dalla modalità di manutenzione.

  11. Verificare le informazioni sull'hardware come indicato di seguito:

    1. Accedere all'interfaccia utente del BMC (Baseboard Management Controller).

    2. Selezionare sistema > informazioni hardware e controllare i DIMM elencati.

Cosa succederà

Una volta ripristinato il normale funzionamento del nodo, in vCenter, selezionare la scheda Summary (Riepilogo) per verificare che la capacità di memoria sia quella prevista.

Nota Se il DIMM non è installato correttamente, il nodo funziona normalmente ma con una capacità di memoria inferiore al previsto.
Suggerimento Dopo la procedura di sostituzione del modulo DIMM, è possibile eliminare gli avvisi e gli errori nella scheda hardware Status (Stato hardware) di vCenter. È possibile eseguire questa operazione se si desidera cancellare la cronologia degli errori relativi all'hardware sostituito. "Scopri di più".