Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Sostituire il modulo NVRAM o i DIMM NVRAM - AFF A700

Collaboratori

Il modulo NVRAM è composto da NVRAM10 e DIMM e fino a due moduli NVMe SSD Flash cache (FlashCache o moduli di caching) per modulo NVRAM. È possibile sostituire un modulo NVRAM guasto o i DIMM all'interno del modulo NVRAM.

Per sostituire un modulo NVRAM guasto, rimuoverlo dallo chassis, rimuovere il modulo FlashCache o i moduli dal modulo NVRAM, spostare i DIMM nel modulo sostitutivo, reinstallare il modulo FlashCache o i moduli e installare il modulo NVRAM sostitutivo nello chassis.

Poiché l'ID di sistema deriva dal modulo NVRAM, in caso di sostituzione del modulo, i dischi appartenenti al sistema vengono riassegnati al nuovo ID di sistema.

Prima di iniziare
  • Tutti gli shelf di dischi devono funzionare correttamente.

  • Se il sistema si trova in una coppia ha, il nodo partner deve essere in grado di assumere il nodo associato al modulo NVRAM da sostituire.

  • Questa procedura utilizza la seguente terminologia:

    • Il nodo alterato è il nodo su cui si esegue la manutenzione.

    • Il nodo healthy è il partner ha del nodo compromesso.

  • Questa procedura include la procedura per la riassegnazione automatica o manuale dei dischi al modulo controller associato al nuovo modulo NVRAM. È necessario riassegnare i dischi quando richiesto nella procedura. Il completamento della riassegnazione del disco prima del giveback può causare problemi.

  • È necessario sostituire il componente guasto con un componente FRU sostitutivo ricevuto dal provider.

  • Non è possibile modificare dischi o shelf di dischi come parte di questa procedura.

Fase 1: Spegnere il controller compromesso

Arrestare o sostituire il controller compromesso utilizzando una delle seguenti opzioni.

Opzione 1: La maggior parte dei sistemi

Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, assumere il controllo del controller in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.

A proposito di questa attività
  • Se si dispone di un sistema SAN, è necessario aver controllato i messaggi di evento cluster kernel-service show) per il blade SCSI del controller danneggiato. Il cluster kernel-service show comando (dalla modalità avanzata precedente) visualizza il nome del nodo, "stato quorum" di quel nodo, lo stato di disponibilità di quel nodo e lo stato operativo di quel nodo.

    Ogni processo SCSI-blade deve essere in quorum con gli altri nodi del cluster. Eventuali problemi devono essere risolti prima di procedere con la sostituzione.

  • Se si dispone di un cluster con più di due nodi, questo deve trovarsi in quorum. Se il cluster non è in quorum o un controller integro mostra false per idoneità e salute, è necessario correggere il problema prima di spegnere il controller compromesso; vedere "Sincronizzare un nodo con il cluster".

Fasi
  1. Se AutoSupport è attivato, sospendere la creazione automatica dei casi richiamando un messaggio AutoSupport: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    Il seguente messaggio AutoSupport elimina la creazione automatica del caso per due ore: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Disattivare il giveback automatico dalla console del controller integro: storage failover modify -node local -auto-giveback false

    Nota Quando viene visualizzato Vuoi disattivare il giveback automatico?, inserisci y.
  3. Portare la centralina danneggiata al prompt DEL CARICATORE:

    Se il controller non utilizzato visualizza…​ Quindi…​

    Il prompt DEL CARICATORE

    Passare alla fase successiva.

    In attesa di un giveback…​

    Premere Ctrl-C, quindi rispondere y quando richiesto.

    Prompt di sistema o prompt della password

    Assumere il controllo o arrestare il controller compromesso dal controller integro: storage failover takeover -ofnode impaired_node_name

    Quando il controller non utilizzato visualizza Waiting for giveback…​ (in attesa di giveback…​), premere Ctrl-C e rispondere y.

Opzione 2: Controller in un MetroCluster a due nodi

Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, sostituirlo in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.

A proposito di questa attività
  • Al termine di questa procedura, è necessario lasciare accesi gli alimentatori per alimentare il controller integro.

Fasi
  1. Controllare lo stato MetroCluster per determinare se il controller compromesso è passato automaticamente al controller integro: metrocluster show

  2. A seconda che si sia verificato uno switchover automatico, procedere come indicato nella seguente tabella:

    Se il controller è compromesso…​ Quindi…​

    Si è attivata automaticamente

    Passare alla fase successiva.

    Non si è attivato automaticamente

    Eseguire un'operazione di switchover pianificata dal controller integro: metrocluster switchover

    Non è stato attivato automaticamente, si è tentato di eseguire lo switchover con metrocluster switchover e lo switchover è stato vetoed

    Esaminare i messaggi di veto e, se possibile, risolvere il problema e riprovare. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

  3. Risincronizzare gli aggregati di dati eseguendo metrocluster heal -phase aggregates dal cluster esistente.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal con il -override-vetoes parametro. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

  4. Verificare che l'operazione sia stata completata utilizzando il comando MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Controllare lo stato degli aggregati utilizzando storage aggregate show comando.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Riparare gli aggregati root utilizzando metrocluster heal -phase root-aggregates comando.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal comando con il parametro -override-vetoes. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

  7. Verificare che l'operazione di riparazione sia completa utilizzando metrocluster operation show sul cluster di destinazione:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sul modulo controller guasto, scollegare gli alimentatori.

Fase 2: Sostituire il modulo NVRAM

Per sostituire il modulo NVRAM, posizionarlo nello slot 6 dello chassis e seguire la sequenza di passaggi specifica.

Fasi
  1. Se non si è già collegati a terra, mettere a terra l'utente.

  2. Spostare il modulo FlashCache dal vecchio modulo NVRAM al nuovo modulo NVRAM:

    Sostituire il modulo di caching

    Numero di didascalia 1

    Pulsante di rilascio arancione (grigio sui moduli FlashCache vuoti)

    Numero di didascalia 2

    Handle di FlashCache Cam

    1. Premere il pulsante arancione sulla parte anteriore del modulo FlashCache.

      Nota Il pulsante di rilascio sui moduli FlashCache vuoti è grigio.
    2. Ruotare la maniglia della camma verso l'esterno fino a quando il modulo inizia a scorrere fuori dal vecchio modulo NVRAM.

    3. Afferrare la maniglia della camma del modulo ed estrarla dal modulo NVRAM e inserirla nella parte anteriore del nuovo modulo NVRAM.

    4. Spingere delicatamente il modulo FlashCache fino in fondo nel modulo NVRAM, quindi ruotare la maniglia della camma in posizione chiusa fino a bloccare il modulo in posizione.

  3. Rimuovere il modulo NVRAM di destinazione dal telaio:

    1. Premere il tasto contrassegnato e numerato CAM.

      Il pulsante CAM si allontana dal telaio.

    2. Ruotare il fermo della camma verso il basso fino a portarlo in posizione orizzontale.

      Il modulo NVRAM si disinnesta dal telaio e si sposta di alcuni centimetri.

    3. Rimuovere il modulo NVRAM dallo chassis tirando le linguette di estrazione sui lati del lato anteriore del modulo.

      Rimuovere il modulo NVRAM

    Numero di didascalia 1

    Latch i/o Cam intestato e numerato

    Numero di didascalia 2

    Fermo i/o completamente sbloccato

  4. Posizionare il modulo NVRAM su una superficie stabile e rimuovere il coperchio dal modulo NVRAM premendo verso il basso il pulsante di bloccaggio blu sul coperchio, quindi, tenendo premuto il pulsante blu, estrarre il coperchio dal modulo NVRAM.

    Rimuovere il contenuto del modulo NVRAM

    Numero di didascalia 1

    Pulsante di bloccaggio del coperchio

    Numero di didascalia 2

    Schede di espulsione DIMM e DIMM

  5. Rimuovere i DIMM, uno alla volta, dal vecchio modulo NVRAM e installarli nel modulo NVRAM sostitutivo.

  6. Chiudere il coperchio del modulo.

  7. Installare il modulo NVRAM sostitutivo nel telaio:

    1. Allineare il modulo con i bordi dell'apertura dello chassis nello slot 6.

    2. Far scorrere delicatamente il modulo nello slot fino a quando il dispositivo di chiusura della camma i/o con lettere e numeri inizia a innestarsi nel perno della camma i/o, quindi spingere il dispositivo di chiusura della camma i/o fino in fondo per bloccare il modulo in posizione.

Fase 3: Sostituire un DIMM NVRAM

Per sostituire i DIMM NVRAM nel modulo NVRAM, rimuovere il modulo NVRAM, aprire il modulo e sostituire il DIMM di destinazione.

Fasi
  1. Se non si è già collegati a terra, mettere a terra l'utente.

  2. Rimuovere il modulo NVRAM di destinazione dal telaio:

    1. Premere il tasto contrassegnato e numerato CAM.

      Il pulsante CAM si allontana dal telaio.

    2. Ruotare il fermo della camma verso il basso fino a portarlo in posizione orizzontale.

      Il modulo NVRAM si disinnesta dal telaio e si sposta di alcuni centimetri.

    3. Rimuovere il modulo NVRAM dallo chassis tirando le linguette di estrazione sui lati del lato anteriore del modulo.

      Rimuovere il modulo NVRAM

    Numero di didascalia 1

    Latch i/o Cam intestato e numerato

    Numero di didascalia 2

    Fermo i/o completamente sbloccato

  3. Posizionare il modulo NVRAM su una superficie stabile e rimuovere il coperchio dal modulo NVRAM premendo verso il basso il pulsante di bloccaggio blu sul coperchio, quindi, tenendo premuto il pulsante blu, estrarre il coperchio dal modulo NVRAM.

    Rimuovere il contenuto del modulo NVRAM

    Numero di didascalia 1

    Pulsante di bloccaggio del coperchio

    Numero di didascalia 2

    Schede di espulsione DIMM e DIMM

  4. Individuare il modulo DIMM da sostituire all'interno del modulo NVRAM, quindi rimuoverlo premendo verso il basso le linguette di bloccaggio del modulo DIMM ed estraendolo dallo zoccolo.

  5. Installare il modulo DIMM sostitutivo allineandolo allo zoccolo e spingendolo delicatamente nello zoccolo fino a quando le linguette di bloccaggio non si bloccano in posizione.

  6. Chiudere il coperchio del modulo.

  7. Installare il modulo NVRAM sostitutivo nel telaio:

    1. Allineare il modulo con i bordi dell'apertura dello chassis nello slot 6.

    2. Far scorrere delicatamente il modulo nello slot fino a quando il dispositivo di chiusura della camma i/o con lettere e numeri inizia a innestarsi nel perno della camma i/o, quindi spingere il dispositivo di chiusura della camma i/o fino in fondo per bloccare il modulo in posizione.

Fase 4: Riavviare il controller dopo la sostituzione della FRU

Dopo aver sostituito la FRU, è necessario riavviare il modulo controller.

Fase
  1. Per avviare ONTAP dal prompt DEL CARICATORE, immettere bye.

Fase 5: Riassegnare i dischi

A seconda che si disponga di una coppia ha o di una configurazione MetroCluster a due nodi, è necessario verificare la riassegnazione dei dischi al nuovo modulo controller o riassegnare manualmente i dischi.

Selezionare una delle seguenti opzioni per istruzioni su come riassegnare i dischi al nuovo controller.

Opzione 1: Verifica ID (coppia ha)
Verificare la modifica dell'ID di sistema su un sistema ha

È necessario confermare la modifica dell'ID di sistema quando si avvia il nodo replacement e verificare che la modifica sia stata implementata.

Avvertenza La riassegnazione del disco è necessaria solo quando si sostituisce il modulo NVRAM e non si applica alla sostituzione del DIMM NVRAM.
Fasi
  1. Se il nodo sostitutivo è in modalità manutenzione (che mostra il *> Uscire dalla modalità di manutenzione e passare al prompt DEL CARICATORE: halt

  2. Dal prompt DEL CARICATORE sul nodo sostitutivo, avviare il nodo, immettendo y Se viene richiesto di ignorare l'ID di sistema a causa di una mancata corrispondenza dell'ID di sistema.

    boot_ontap bye

    Il nodo viene riavviato, se è impostato l'autoboot.

  3. Attendere il Waiting for giveback…​ Viene visualizzato sulla console del nodo replacement e quindi, dal nodo integro, verificare che il nuovo ID di sistema del partner sia stato assegnato automaticamente: storage failover show

    Nell'output del comando, viene visualizzato un messaggio che indica che l'ID del sistema è stato modificato sul nodo con problemi, mostrando i vecchi e i nuovi ID corretti. Nell'esempio seguente, il node2 è stato sostituito e ha un nuovo ID di sistema pari a 151759706.

    node1> `storage failover show`
                                        Takeover
    Node              Partner           Possible     State Description
    ------------      ------------      --------     -------------------------------------
    node1             node2             false        System ID changed on partner (Old:
                                                      151759755, New: 151759706), In takeover
    node2             node1             -            Waiting for giveback (HA mailboxes)
  4. Dal nodo integro, verificare che tutti i coredump siano salvati:

    1. Passare al livello di privilegio avanzato: set -privilege advanced

      Puoi rispondere Y quando viene richiesto di passare alla modalità avanzata. Viene visualizzato il prompt della modalità avanzata (*>).

    2. Salva i coredump: system node run -node local-node-name partner savecore

    3. Attendere il completamento del comando `savecore`prima di emettere il giveback.

      È possibile immettere il seguente comando per monitorare l'avanzamento del comando savecore: system node run -node local-node-name partner savecore -s

    4. Tornare al livello di privilegio admin: set -privilege admin

  5. Restituire il nodo:

    1. Dal nodo integro, restituire lo storage del nodo sostituito: storage failover giveback -ofnode replacement_node_name

      Il nodo replacement riprende lo storage e completa l'avvio.

      Se viene richiesto di ignorare l'ID di sistema a causa di una mancata corrispondenza dell'ID di sistema, immettere y.

      Nota Se il giveback viene vetoed, puoi prendere in considerazione la possibilità di ignorare i veti.
    1. Una volta completato il giveback, verificare che la coppia ha sia in buone condizioni e che sia possibile effettuare il takeover: storage failover show

      L'output di storage failover show il comando non deve includere System ID changed on partner messaggio.

  6. Verificare che i dischi siano stati assegnati correttamente: storage disk show -ownership

    I dischi appartenenti al nodo replacement devono mostrare il nuovo ID di sistema. Nell'esempio seguente, i dischi di proprietà di node1 ora mostrano il nuovo ID di sistema, 1873775277:

    node1> `storage disk show -ownership`
    
    Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
    ----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
    1.0.0  aggr0_1  node1 node1  -        1873775277 1873775277  -       1873775277 Pool0
    1.0.1  aggr0_1  node1 node1           1873775277 1873775277  -       1873775277 Pool0
    .
    .
    .
  7. Se il sistema si trova in una configurazione MetroCluster, monitorare lo stato del nodo: metrocluster node show

    La configurazione MetroCluster impiega alcuni minuti dopo la sostituzione per tornare a uno stato normale, in cui ogni nodo mostra uno stato configurato, con mirroring DR abilitato e una modalità normale. Il metrocluster node show -fields node-systemid L'output del comando visualizza il vecchio ID di sistema fino a quando la configurazione MetroCluster non torna allo stato normale.

  8. Se il nodo si trova in una configurazione MetroCluster, a seconda dello stato MetroCluster, verificare che il campo DR home ID (ID origine DR) indichi il proprietario originale del disco se il proprietario originale è un nodo del sito di emergenza.

    Ciò è necessario se si verificano entrambe le seguenti condizioni:

  9. Se il sistema si trova in una configurazione MetroCluster, verificare che ciascun nodo sia configurato: metrocluster node show - fields configuration-state

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  10. Verificare che i volumi previsti siano presenti per ciascun nodo: vol show -node node-name

  11. Se al riavvio è stato disattivato il Takeover automatico, attivarlo dal nodo integro: storage failover modify -node replacement-node-name -onreboot true

Opzione 2: Riassegnare l'ID (configurazione MetroCluster)
Riassegnare l'ID di sistema in una configurazione MetroCluster a due nodi

In una configurazione MetroCluster a due nodi che esegue ONTAP, è necessario riassegnare manualmente i dischi all'ID di sistema del nuovo controller prima di riportare il sistema alla normale condizione operativa.

A proposito di questa attività

Questa procedura si applica solo ai sistemi in una configurazione MetroCluster a due nodi che esegue ONTAP.

Assicurarsi di eseguire i comandi di questa procedura sul nodo corretto:

  • Il nodo alterato è il nodo su cui si esegue la manutenzione.

  • Il nodo replacement è il nuovo nodo che ha sostituito il nodo compromesso come parte di questa procedura.

  • Il nodo healthy è il partner DR del nodo compromesso.

Fasi
  1. Se non lo si è già fatto, riavviare il nodo replacement e interrompere il processo di avvio immettendo Ctrl-C, Quindi selezionare l'opzione per avviare la modalità di manutenzione dal menu visualizzato.

    È necessario immettere Y Quando viene richiesto di sostituire l'ID di sistema a causa di una mancata corrispondenza dell'ID di sistema.

  2. Visualizzare i vecchi ID di sistema dal nodo integro: `metrocluster node show -fields node-systemid,dr-partner-systemid`

    In questo esempio, Node_B_1 è il nodo precedente, con il vecchio ID di sistema 118073209:

    dr-group-id cluster         node                 node-systemid dr-partner-systemid
     ----------- --------------------- -------------------- ------------- -------------------
     1           Cluster_A             Node_A_1             536872914     118073209
     1           Cluster_B             Node_B_1             118073209     536872914
     2 entries were displayed.
  3. Visualizzare il nuovo ID di sistema al prompt della modalità di manutenzione sul nodo non valido: disk show

    In questo esempio, il nuovo ID di sistema è 118065481:

    Local System ID: 118065481
        ...
        ...
  4. Riassegnare la proprietà del disco (per i sistemi FAS) o la proprietà del LUN (per i sistemi FlexArray), utilizzando le informazioni sull'ID di sistema ottenute dal comando disk show: disk reassign -s old system ID

    Nel caso dell'esempio precedente, il comando è: disk reassign -s 118073209

    Puoi rispondere Y quando viene richiesto di continuare.

  5. Verificare che i dischi (o LUN FlexArray) siano stati assegnati correttamente: disk show -a

    Verificare che i dischi appartenenti al nodo replacement mostrino il nuovo ID di sistema per il nodo replacement. Nell'esempio seguente, i dischi di proprietà del sistema-1 ora mostrano il nuovo ID di sistema, 118065481:

    *> disk show -a
    Local System ID: 118065481
    
      DISK     OWNER                 POOL   SERIAL NUMBER  HOME
    -------    -------------         -----  -------------  -------------
    disk_name   system-1  (118065481) Pool0  J8Y0TDZC       system-1  (118065481)
    disk_name   system-1  (118065481) Pool0  J8Y09DXC       system-1  (118065481)
    .
    .
    .
  6. Dal nodo integro, verificare che tutti i coredump siano salvati:

    1. Passare al livello di privilegio avanzato: set -privilege advanced

      Puoi rispondere Y quando viene richiesto di passare alla modalità avanzata. Viene visualizzato il prompt della modalità avanzata (*>).

    2. Verificare che i coredump siano salvati: system node run -node local-node-name partner savecore

      Se l'output del comando indica che il salvataggio è in corso, attendere il completamento del salvataggio prima di emettere il giveback. È possibile monitorare l'avanzamento del salvataggio utilizzando system node run -node local-node-name partner savecore -s command</info>.

    3. Tornare al livello di privilegio admin: set -privilege admin

  7. Se il nodo replacement è in modalità Maintenance (con il prompt *>), uscire dalla modalità Maintenance (manutenzione) e passare al prompt DEL CARICATORE: halt

  8. Avviare il nodo replacement: boot_ontap

  9. Una volta avviato il nodo replacement, eseguire uno switchback: metrocluster switchback

  10. Verificare la configurazione di MetroCluster: metrocluster node show - fields configuration-state

    node1_siteA::> metrocluster node show -fields configuration-state
    
    dr-group-id            cluster node           configuration-state
    -----------            ---------------------- -------------- -------------------
    1 node1_siteA          node1mcc-001           configured
    1 node1_siteA          node1mcc-002           configured
    1 node1_siteB          node1mcc-003           configured
    1 node1_siteB          node1mcc-004           configured
    
    4 entries were displayed.
  11. Verificare il funzionamento della configurazione MetroCluster in Data ONTAP:

    1. Verificare la presenza di eventuali avvisi sullo stato di salute su entrambi i cluster: system health alert show

    2. Verificare che MetroCluster sia configurato e in modalità normale: metrocluster show

    3. Eseguire un controllo MetroCluster: metrocluster check run

    4. Visualizzare i risultati del controllo MetroCluster: metrocluster check show

    5. Eseguire Config Advisor. Accedere alla pagina Config Advisor sul sito del supporto NetApp all'indirizzo "support.netapp.com/NOW/download/tools/config_advisor/".

      Dopo aver eseguito Config Advisor, esaminare l'output dello strumento e seguire le raccomandazioni nell'output per risolvere eventuali problemi rilevati.

  12. Simulare un'operazione di switchover:

    1. Dal prompt di qualsiasi nodo, passare al livello di privilegio avanzato: set -privilege advanced

      Devi rispondere con y quando viene richiesto di passare alla modalità avanzata e di visualizzare il prompt della modalità avanzata (*>).

    2. Eseguire l'operazione di switchback con il parametro -simulate: metrocluster switchover -simulate

    3. Tornare al livello di privilegio admin: set -privilege admin

Fase 6: Restituire la parte guasta a NetApp

Restituire la parte guasta a NetApp, come descritto nelle istruzioni RMA fornite con il kit. Vedere la "Restituzione e sostituzione delle parti" pagina per ulteriori informazioni.