La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Sostituisci il modulo NVDIMM nel sistema AFF A400

07/23/2026 Collaboratori

PDF

Sostituisci il modulo NVDIMM nel tuo sistema AFF A400 quando il sistema rileva che la durata della memoria flash sta per terminare o che il modulo NVDIMM non è in buone condizioni. La mancata sostituzione può causare un system panic.

È necessario sostituire il modulo NVDIMM nel modulo controller quando il sistema registra che la durata della memoria flash è quasi terminata o che il modulo NVDIMM identificato non funziona in generale; in caso contrario, si verifica un errore di sistema.

Tutti gli altri componenti del sistema devono funzionare correttamente; in caso contrario, contattare il supporto tecnico.

È necessario sostituire il componente guasto con un componente FRU sostitutivo ricevuto dal provider.

Fase 1: Spegnere il controller compromesso

Arrestare o sostituire il controller con problemi utilizzando la procedura appropriata per la configurazione.

Opzione 1: La maggior parte delle configurazioni

Prendere il controllo e arrestare il controller non funzionante in modo che il controller funzionante continui a fornire dati dalla memoria del controller non funzionante. Per fare questo, si sopprime la creazione automatica dei casi in AutoSupport, si disabilita il giveback automatico e si porta il controller non funzionante al prompt LOADER. Il prompt LOADER è lo stato di arresto sicuro da cui è possibile sostituire la FRU.

A proposito di questa attività

Se si dispone di un sistema SAN, è necessario aver controllato i messaggi di evento cluster kernel-service show) per il blade SCSI del controller danneggiato. Il cluster kernel-service show comando (dalla modalità avanzata precedente) visualizza il nome del nodo, "stato quorum" di quel nodo, lo stato di disponibilità di quel nodo e lo stato operativo di quel nodo.

Ogni processo SCSI-blade deve essere in quorum con gli altri nodi del cluster. Eventuali problemi devono essere risolti prima di procedere con la sostituzione.
Se si dispone di un cluster con più di due nodi, questo deve trovarsi in quorum. Se il cluster non è in quorum o un controller integro mostra false per idoneità e salute, è necessario correggere il problema prima di spegnere il controller compromesso; vedere "Sincronizzare un nodo con il cluster".

Fasi

Se AutoSupport è attivato, eliminare la creazione automatica del caso richiamando un messaggio AutoSupport:

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

Ciò impedisce l'apertura automatica di richieste di assistenza durante la finestra di manutenzione. La durata massima della soppressione è di 72 ore. Se la manutenzione termina prima del termine, è possibile riattivare la creazione di richieste di assistenza richiamando un AutoSupport messaggio con MAINT=END. Per ulteriori informazioni, consultare "Come disabilitare la creazione automatica di casi durante le finestre di manutenzione programmate".

Il seguente messaggio AutoSupport elimina la creazione automatica del caso per due ore:

cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
Disattiva la restituzione automatica:
1. Immettere il seguente comando dalla console del controller funzionante:
  
  storage failover modify -node impaired_node_name -auto-giveback false
2. Entra y quando vedi il messaggio Vuoi disattivare la restituzione automatica?

Portare la centralina danneggiata al prompt DEL CARICATORE:

Se il controller non utilizzato visualizza… Quindi…

Se il controller non utilizzato visualizza…	Quindi…
Il prompt DEL CARICATORE	Passare alla fase successiva.
In attesa di un giveback…	Premere Ctrl-C, quindi rispondere `y` quando richiesto.
Prompt di sistema o prompt della password	Assumere il controllo o arrestare il controller compromesso dal controller integro: `storage failover takeover -ofnode impaired_node_name -halt true` Il parametro -halt true consente di visualizzare il prompt di Loader.

Il prompt DEL CARICATORE

Passare alla fase successiva.

In attesa di un giveback…

Premere Ctrl-C, quindi rispondere y quando richiesto.

Prompt di sistema o prompt della password

Assumere il controllo o arrestare il controller compromesso dal controller integro:

storage failover takeover -ofnode impaired_node_name -halt true

Il parametro -halt true consente di visualizzare il prompt di Loader.

Opzione 2: Controller in un MetroCluster a due nodi

Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, sostituirlo in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.

A proposito di questa attività

Al termine di questa procedura, è necessario lasciare accesi gli alimentatori per alimentare il controller integro.

Fasi

Controllare lo stato MetroCluster per determinare se il controller compromesso è passato automaticamente al controller integro: metrocluster show

A seconda che si sia verificato uno switchover automatico, procedere come indicato nella seguente tabella:

Se il controller è compromesso… Quindi…

Se il controller è compromesso…	Quindi…
Si è attivata automaticamente	Passare alla fase successiva.
Non si è attivato automaticamente	Eseguire un'operazione di switchover pianificata dal controller integro: `metrocluster switchover`
Non è stato attivato automaticamente, si è tentato di eseguire lo switchover con `metrocluster switchover` e lo switchover è stato vetoed	Esaminare i messaggi di veto e, se possibile, risolvere il problema e riprovare. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Si è attivata automaticamente

Passare alla fase successiva.

Non si è attivato automaticamente

Eseguire un'operazione di switchover pianificata dal controller integro: metrocluster switchover

Non è stato attivato automaticamente, si è tentato di eseguire lo switchover con metrocluster switchover e lo switchover è stato vetoed

Esaminare i messaggi di veto e, se possibile, risolvere il problema e riprovare. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Risincronizzare gli aggregati di dati eseguendo metrocluster heal -phase aggregates dal cluster esistente.
```
controller_A_1::> metrocluster heal -phase aggregates
[Job 130] Job succeeded: Heal Aggregates is successful.
```
Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal con il -override-vetoes parametro. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

Verificare che l'operazione sia stata completata utilizzando il comando MetroCluster Operation show.

controller_A_1::> metrocluster operation show
    Operation: heal-aggregates
      State: successful
Start Time: 7/25/2016 18:45:55
   End Time: 7/25/2016 18:45:56
     Errors: -

Controllare lo stato degli aggregati utilizzando storage aggregate show comando.

controller_A_1::> storage aggregate show
Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
...
aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...

Riparare gli aggregati root utilizzando metrocluster heal -phase root-aggregates comando.
```
mcc1A::> metrocluster heal -phase root-aggregates
[Job 137] Job succeeded: Heal Root Aggregates is successful
```
Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal comando con il parametro -override-vetoes. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

Verificare che l'operazione di riparazione sia completa utilizzando metrocluster operation show sul cluster di destinazione:

mcc1A::> metrocluster operation show
  Operation: heal-root-aggregates
      State: successful
 Start Time: 7/29/2016 20:54:41
   End Time: 7/29/2016 20:54:42
     Errors: -

Sul modulo controller guasto, scollegare gli alimentatori.

Fase 2: Rimuovere il modulo controller

Per accedere ai componenti all'interno del modulo controller, è necessario rimuovere il modulo controller dallo chassis.

Per rimuovere il modulo controller dal telaio, è possibile utilizzare le seguenti animazioni, illustrazioni o istruzioni scritte.

Animazione - rimuovere il modulo controller

Numero di didascalia 1

Fermi di bloccaggio

Numero di didascalia 2

Il controller si sposta leggermente fuori dallo chassis

Se non si è già collegati a terra, mettere a terra l'utente.
Rilasciare i fermi dei cavi di alimentazione, quindi scollegare i cavi dagli alimentatori.
Allentare il gancio e la fascetta che fissano i cavi al dispositivo di gestione dei cavi, quindi scollegare i cavi di sistema e gli SFP (se necessario) dal modulo controller, tenendo traccia del punto in cui sono stati collegati i cavi.

Lasciare i cavi nel dispositivo di gestione dei cavi in modo che quando si reinstalla il dispositivo di gestione dei cavi, i cavi siano organizzati.
Rimuovere il dispositivo di gestione dei cavi dal modulo controller e metterlo da parte.
Premere verso il basso entrambi i fermi di bloccaggio, quindi ruotare entrambi i fermi verso il basso contemporaneamente.

Il modulo controller si sposta leggermente fuori dallo chassis.
Estrarre il modulo controller dal telaio.

Assicurarsi di sostenere la parte inferiore del modulo controller mentre lo si sposta fuori dallo chassis.
Posizionare il modulo controller su una superficie piana e stabile.

Fase 3: Sostituire il modulo NVDIMM

Per sostituire il modulo NVDIMM, posizionarlo nel modulo controller utilizzando la mappa FRU sulla parte superiore del condotto dell'aria o la mappa FRU sulla parte superiore del riser dello slot 1.

Il LED NVDIMM lampeggia durante la destaging del contenuto quando si arresta il sistema. Una volta completata la destage, il LED si spegne.
Sebbene il contenuto del modulo NVDIMM sia crittografato, è consigliabile cancellare il contenuto del modulo NVDIMM prima di sostituirlo. Per ulteriori informazioni, consultare "Dichiarazione di volatilità" Sul sito di supporto NetApp.

Per visualizzare la Dichiarazione di volatilità del sistema, è necessario accedere al sito di supporto NetApp.

Per sostituire il modulo NVDIMM, è possibile utilizzare la seguente animazione, illustrazione o procedura scritta.

L'animazione mostra gli slot vuoti per i socket senza DIMM. Questi socket vuoti sono popolati con spazi vuoti.

Animazione - sostituire il modulo NVDIMM

Numero di didascalia 1

Linguette di bloccaggio DIMM

Numero di didascalia 2

DIMM

Numero di didascalia 3

Socket DIMM

Aprire il condotto dell'aria e individuare il modulo NVDIMM nello slot 11 del modulo controller.

Il modulo NVDIMM è molto diverso dai DIMM di sistema.
Estrarre il modulo NVDIMM dal relativo slot spingendo lentamente verso l'esterno le due linguette di espulsione del modulo NVDIMM su entrambi i lati del modulo, quindi estrarre il modulo NVDIMM dallo zoccolo e metterlo da parte.

Tenere il modulo NVDIMM dai bordi con cautela per evitare di esercitare pressione sui componenti della scheda a circuiti stampati del modulo NVDIMM.
Rimuovere il modulo NVDIMM di ricambio dalla confezione antistatica, tenere il modulo NVDIMM per gli angoli, quindi allinearlo allo slot.

La tacca tra i pin del modulo NVDIMM deve allinearsi con la linguetta del connettore.
Individuare lo slot in cui si desidera installare il modulo NVDIMM.
Inserire il modulo NVDIMM nello slot.

Il modulo NVDIMM si inserisce saldamente nello slot, ma dovrebbe essere inserito facilmente. In caso contrario, riallineare il modulo NVDIMM con lo slot e reinserirlo.

Esaminare visivamente il modulo NVDIMM per verificare che sia allineato e inserito completamente nello slot.
Spingere con cautela, ma con decisione, il bordo superiore del modulo NVDIMM fino a quando le linguette dell'espulsore non scattano in posizione sulle tacche alle estremità del modulo NVDIMM.
Chiudere il condotto dell'aria.

Fase 4: Installare il modulo controller

Dopo aver sostituito il componente nel modulo controller, è necessario reinstallare il modulo controller nel telaio e avviarlo in modalità manutenzione.

In caso contrario, chiudere il condotto dell'aria.
Allineare l'estremità del modulo controller con l'apertura dello chassis, quindi spingere delicatamente il modulo controller a metà nel sistema.

Non inserire completamente il modulo controller nel telaio fino a quando non viene richiesto.
Cablare solo le porte di gestione e console, in modo da poter accedere al sistema per eseguire le attività descritte nelle sezioni seguenti.

I cavi rimanenti verranno collegati al modulo controller più avanti in questa procedura.
Completare l'installazione del modulo controller:
1. Utilizzando i fermi di bloccaggio, spingere con decisione il modulo controller nel telaio fino a quando i fermi di bloccaggio non iniziano a sollevarsi.
  
  Non esercitare una forza eccessiva quando si fa scorrere il modulo controller nel telaio per evitare di danneggiare i connettori.
2. Inserire completamente il modulo controller nel telaio ruotando i fermi di bloccaggio verso l'alto, inclinandoli in modo da liberare i perni di bloccaggio, spingere delicatamente il controller fino in fondo, quindi abbassare i fermi di bloccaggio in posizione di blocco.
3. Inserire i cavi di alimentazione negli alimentatori, reinstallare il collare di bloccaggio del cavo di alimentazione, quindi collegare gli alimentatori alla fonte di alimentazione.
  
  Il modulo controller inizia ad avviarsi non appena viene ripristinata l'alimentazione. Prepararsi ad interrompere il processo di avvio.
4. Se non è già stato fatto, reinstallare il dispositivo di gestione dei cavi.
5. Interrompere il normale processo di avvio e avviare IL CARICATORE premendo Ctrl-C.
  
  Se il sistema si arresta nel menu di avvio, selezionare l'opzione per avviare IL CARICATORE.
6. Al prompt DEL CARICATORE, immettere bye Per reinizializzare le schede PCIe e altri componenti.

Fase 5: Ripristinare il funzionamento del modulo controller

È necessario recuperare il sistema, restituire il modulo controller e riabilitare il giveback automatico.

Ricable il sistema, come necessario.

Se sono stati rimossi i convertitori multimediali (QSFP o SFP), ricordarsi di reinstallarli se si utilizzano cavi in fibra ottica.
Riportare il controller al funzionamento normale restituendo lo storage: storage failover giveback -ofnode impaired_node_name
Se il giveback automatico è stato disattivato, riabilitarlo: storage failover modify -node local -auto-giveback true

Fase 6: Switch back aggregates in una configurazione MetroCluster a due nodi

Questa attività si applica solo alle configurazioni MetroCluster a due nodi.

Fasi

Verificare che tutti i nodi si trovino in enabled stato: metrocluster node show

cluster_B::>  metrocluster node show

DR                           Configuration  DR
Group Cluster Node           State          Mirroring Mode
----- ------- -------------- -------------- --------- --------------------
1     cluster_A
              controller_A_1 configured     enabled   heal roots completed
      cluster_B
              controller_B_1 configured     enabled   waiting for switchback recovery
2 entries were displayed.

Verificare che la risincronizzazione sia completa su tutte le SVM: metrocluster vserver show
Verificare che tutte le migrazioni LIF automatiche eseguite dalle operazioni di riparazione siano state completate correttamente: metrocluster check lif show
Eseguire lo switchback utilizzando metrocluster switchback comando da qualsiasi nodo del cluster esistente.
Verificare che l'operazione di switchback sia stata completata: metrocluster show

L'operazione di switchback è ancora in esecuzione quando un cluster si trova in waiting-for-switchback stato:
```
cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured       	switchover
Remote: cluster_A configured       	waiting-for-switchback
```
L'operazione di switchback è completa quando i cluster si trovano in normal stato:
```
cluster_B::> metrocluster show
Cluster              Configuration State    Mode
--------------------	------------------- 	---------
 Local: cluster_B configured      		normal
Remote: cluster_A configured      		normal
```
Se il completamento di uno switchback richiede molto tempo, è possibile verificare lo stato delle linee di base in corso utilizzando metrocluster config-replication resync-status show comando.
Ripristinare le configurazioni SnapMirror o SnapVault.

Fase 7: Restituire il componente guasto a NetApp

Restituire la parte guasta a NetApp, come descritto nelle istruzioni RMA fornite con il kit. Vedere la "Restituzione e sostituzione delle parti" pagina per ulteriori informazioni.

Sostituisci il modulo NVDIMM nel sistema AFF A400

Creating your file...

Fase 1: Spegnere il controller compromesso

Fase 2: Rimuovere il modulo controller

Fase 3: Sostituire il modulo NVDIMM

Fase 4: Installare il modulo controller

Fase 5: Ripristinare il funzionamento del modulo controller

Fase 6: Switch back aggregates in una configurazione MetroCluster a due nodi

Fase 7: Restituire il componente guasto a NetApp