Sostituire un modulo DIMM - ASA A900
È necessario sostituire un modulo DIMM nel controller quando il sistema di archiviazione rileva errori quali la presenza di un numero eccessivo di codici di correzione degli errori CECC (Correctable Error Correction Codes) basati su avvisi di Health Monitor o errori ECC non correggibili, in genere causati da un singolo errore del modulo DIMM che impedisce al sistema di archiviazione di avviare ONTAP.
Tutti gli altri componenti del sistema devono funzionare correttamente; in caso contrario, contattare il supporto tecnico.
È necessario sostituire il componente guasto con un componente FRU sostitutivo ricevuto dal provider.
Fase 1: Spegnere il controller compromesso
Arrestare o sostituire il controller compromesso utilizzando una delle seguenti opzioni.
Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, assumere il controllo del controller in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.
-
Se si dispone di un sistema SAN, è necessario aver controllato i messaggi di evento
cluster kernel-service show
) per il blade SCSI del controller danneggiato. Ilcluster kernel-service show
comando (dalla modalità avanzata precedente) visualizza il nome del nodo, "stato quorum" di quel nodo, lo stato di disponibilità di quel nodo e lo stato operativo di quel nodo.Ogni processo SCSI-blade deve essere in quorum con gli altri nodi del cluster. Eventuali problemi devono essere risolti prima di procedere con la sostituzione.
-
Se si dispone di un cluster con più di due nodi, questo deve trovarsi in quorum. Se il cluster non è in quorum o un controller integro mostra false per idoneità e salute, è necessario correggere il problema prima di spegnere il controller compromesso; vedere "Sincronizzare un nodo con il cluster".
-
Se AutoSupport è attivato, sospendere la creazione automatica dei casi richiamando un messaggio AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
Il seguente messaggio AutoSupport elimina la creazione automatica del caso per due ore:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
Disattivare il giveback automatico dalla console del controller integro:
storage failover modify -node local -auto-giveback false
Quando viene visualizzato Vuoi disattivare il giveback automatico?, inserisci y
. -
Portare la centralina danneggiata al prompt DEL CARICATORE:
Se il controller non utilizzato visualizza… Quindi… Il prompt DEL CARICATORE
Passare alla fase successiva.
In attesa di un giveback…
Premere Ctrl-C, quindi rispondere
y
quando richiesto.Prompt di sistema o prompt della password
Assumere il controllo o arrestare il controller compromesso dal controller integro:
storage failover takeover -ofnode impaired_node_name
Quando il controller non utilizzato visualizza Waiting for giveback… (in attesa di giveback…), premere Ctrl-C e rispondere
y
.
Non utilizzare questa procedura se il sistema si trova in una configurazione MetroCluster a due nodi. |
Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, assumere il controllo del controller in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.
-
Se si dispone di un cluster con più di due nodi, questo deve trovarsi in quorum. Se il cluster non è in quorum o un controller integro mostra false per idoneità e salute, è necessario correggere il problema prima di spegnere il controller compromesso; vedere "Sincronizzare un nodo con il cluster".
-
Se si dispone di una configurazione MetroCluster, è necessario confermare che lo stato di configurazione MetroCluster è configurato e che i nodi sono in uno stato abilitato e normale (
metrocluster node show
).
-
Se AutoSupport è attivato, eliminare la creazione automatica del caso richiamando un messaggio AutoSupport:
system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh
Il seguente messaggio AutoSupport elimina la creazione automatica del caso per due ore:
cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
-
Disattivare il giveback automatico dalla console del controller integro:
storage failover modify –node local -auto-giveback false
-
Portare la centralina danneggiata al prompt DEL CARICATORE:
Se il controller non utilizzato visualizza… Quindi… Il prompt DEL CARICATORE
Passare alla fase successiva.
In attesa di un giveback…
Premere Ctrl-C, quindi rispondere
y
quando richiesto.Prompt di sistema o prompt della password (inserire la password di sistema)
Assumere il controllo o arrestare il controller compromesso dal controller integro:
storage failover takeover -ofnode impaired_node_name
Quando il controller non utilizzato visualizza Waiting for giveback… (in attesa di giveback…), premere Ctrl-C e rispondere
y
.
Fase 2: Rimuovere il modulo controller
Per accedere ai componenti all'interno del controller, rimuovere prima il modulo controller dal sistema, quindi rimuovere il coperchio sul modulo controller.
-
Se non si è già collegati a terra, mettere a terra l'utente.
-
Scollegare i cavi dal modulo controller guasto e tenere traccia del punto in cui sono stati collegati i cavi.
-
Far scorrere verso il basso il pulsante terra cotta sulla maniglia della camma fino a sbloccarla.
Animazione - rimuovere il controllerPulsante di rilascio della maniglia della camma
Maniglia CAM
-
Ruotare la maniglia della camma in modo da disimpegnare completamente il modulo controller dal telaio, quindi estrarre il modulo controller dal telaio.
Assicurarsi di sostenere la parte inferiore del modulo controller mentre lo si sposta fuori dallo chassis.
-
Posizionare il coperchio del modulo controller con il lato rivolto verso l'alto su una superficie stabile e piana, premere il pulsante blu sul coperchio, far scorrere il coperchio sul retro del modulo controller, quindi sollevare il coperchio ed estrarlo dal modulo controller.
Pulsante di bloccaggio del coperchio del modulo controller
Fase 3: Sostituire i DIMM
Per sostituire i moduli DIMM, individuarli all'interno del controller e seguire la sequenza di passaggi specifica.
Il controller ver2 dispone di un numero inferiore di socket DIMM. Non vi è alcuna riduzione nel numero di DIMM supportati o modifica nella numerazione dei socket DIMM. Quando si spostano i moduli DIMM nel nuovo modulo controller, installare i moduli DIMM nello stesso numero/posizione del modulo controller danneggiato. Vedere il diagramma della mappa FRU sul modulo controller ver2 per le posizioni dei socket DIMM. |
-
Se non si è già collegati a terra, mettere a terra l'utente.
-
Individuare i DIMM sul modulo controller.
-
Estrarre il modulo DIMM dal relativo slot spingendo lentamente verso l'esterno le due linguette di espulsione dei moduli DIMM su entrambi i lati del modulo, quindi estrarre il modulo DIMM dallo slot.
Tenere il modulo DIMM per i bordi in modo da evitare di esercitare pressione sui componenti della scheda a circuiti stampati del modulo DIMM. Animazione - sostituire il DIMMSchede di espulsione DIMM
DIMM
-
Rimuovere il modulo DIMM di ricambio dalla confezione antistatica, tenerlo per gli angoli e allinearlo allo slot.
La tacca tra i pin del DIMM deve allinearsi con la linguetta dello zoccolo.
-
Assicurarsi che le linguette di espulsione del modulo DIMM sul connettore siano aperte, quindi inserire il modulo DIMM correttamente nello slot.
Il DIMM si inserisce saldamente nello slot, ma dovrebbe essere inserito facilmente. In caso contrario, riallineare il DIMM con lo slot e reinserirlo.
Esaminare visivamente il DIMM per verificare che sia allineato in modo uniforme e inserito completamente nello slot. -
Spingere con cautela, ma con decisione, il bordo superiore del DIMM fino a quando le linguette dell'espulsore non scattano in posizione sulle tacche alle estremità del DIMM.
-
Chiudere il coperchio del modulo controller.
Fase 4: Installare il controller
Dopo aver installato i componenti nel modulo controller, è necessario installare nuovamente il modulo controller nel telaio del sistema e avviare il sistema operativo.
Per le coppie ha con due moduli controller nello stesso chassis, la sequenza in cui si installa il modulo controller è particolarmente importante perché tenta di riavviarsi non appena lo si installa completamente nello chassis.
-
Se non si è già collegati a terra, mettere a terra l'utente.
-
Se non è già stato fatto, riposizionare il coperchio sul modulo controller.
Pulsante di bloccaggio del coperchio del modulo controller
-
Allineare l'estremità del modulo controller con l'apertura dello chassis, quindi spingere delicatamente il modulo controller a metà nel sistema.
Animazione - Installazione del controllerPulsante di rilascio della maniglia della camma
Maniglia CAM
Non inserire completamente il modulo controller nel telaio fino a quando non viene richiesto. -
Cablare solo le porte di gestione e console, in modo da poter accedere al sistema per eseguire le attività descritte nelle sezioni seguenti.
I cavi rimanenti verranno collegati al modulo controller più avanti in questa procedura. -
Completare la reinstallazione del modulo controller:
-
Se non è già stato fatto, reinstallare il dispositivo di gestione dei cavi.
-
Spingere con decisione il modulo controller nello chassis fino a quando non raggiunge la scheda intermedia e non è completamente inserito.
I fermi di bloccaggio si sollevano quando il modulo controller è completamente inserito.
Non esercitare una forza eccessiva quando si fa scorrere il modulo controller nel telaio per evitare di danneggiare i connettori.
Il modulo controller inizia ad avviarsi non appena viene inserito completamente nello chassis. Prepararsi ad interrompere il processo di avvio.
-
Ruotare i fermi di bloccaggio verso l'alto, inclinandoli in modo da liberare i perni di bloccaggio, quindi abbassarli in posizione di blocco.
-
Interrompere il processo di avvio premendo
Ctrl-C
Quando viene visualizzato, premere Ctrl-C per il menu di avvio. -
Selezionare l'opzione per avviare la modalità di manutenzione dal menu visualizzato.
-
Fase 5: Eseguire la diagnostica a livello di sistema
Dopo aver installato un nuovo DIMM, eseguire la diagnostica.
Per avviare la diagnostica a livello di sistema, il sistema deve essere al prompt DEL CARICATORE.
Tutti i comandi delle procedure diagnostiche vengono emessi dalla centralina in cui viene sostituito il componente.
-
Se il controller da sottoporre a manutenzione non viene visualizzato al prompt DEL CARICATORE, attenersi alla seguente procedura:
-
Selezionare l'opzione Maintenance mode (modalità manutenzione) dal menu visualizzato.
-
Una volta avviato il controller in modalità di manutenzione, arrestare il controller:
halt
Dopo aver eseguito il comando, attendere che il sistema si arresti al prompt DEL CARICATORE.
Durante il processo di avvio, è possibile rispondere in modo sicuro y
a prompt.-
Se viene visualizzato un messaggio che avvisa che quando si accede alla modalità di manutenzione in una configurazione ha, è necessario assicurarsi che il controller integro rimanga inattivo.
-
-
-
Al prompt DEL CARICATORE, accedere ai driver speciali progettati appositamente per la diagnostica a livello di sistema per funzionare correttamente:
boot_diags
Durante il processo di avvio, è possibile rispondere in modo sicuro
y
Fino a visualizzare il prompt della modalità di manutenzione (*>). -
Eseguire la diagnostica sulla memoria di sistema:
sldiag device run -dev mem
-
Verificare che la sostituzione dei DIMM non abbia causato problemi hardware:
sldiag device status -dev mem -long -state failed
La diagnostica a livello di sistema riporta al prompt se non ci sono errori di test o elenca lo stato completo degli errori risultanti dal test del componente.
-
Procedere in base al risultato del passaggio precedente:
Se il test di diagnostica a livello di sistema… Quindi… Sono stati completati senza guasti
-
Cancellare i registri di stato:
sldiag device clearstatus
-
Verificare che il registro sia stato cancellato:
sldiag device status
Viene visualizzata la seguente risposta predefinita:
SLDIAG: Nessun messaggio di log presente.
-
Uscire dalla modalità di manutenzione:
halt
Il controller visualizza il prompt DEL CARICATORE.
-
Avviare il controller dal prompt DEL CARICATORE:
bye
-
Riportare il controller al funzionamento normale:
Se il controller si trova in… Quindi… Una coppia ha
Eseguire un give back:
storage failover giveback -ofnode replacement_node_name
Nota: se è stato disattivato il giveback automatico, riattivarlo con il comando di modifica del failover dello storage.Ha causato alcuni errori di test
Determinare la causa del problema:
-
Uscire dalla modalità di manutenzione:
halt
Dopo aver inviato il comando, attendere che il sistema si arresti al prompt DEL CARICATORE.
-
Verificare di aver osservato tutte le considerazioni identificate per l'esecuzione della diagnostica a livello di sistema, che i cavi siano collegati saldamente e che i componenti hardware siano installati correttamente nel sistema di storage.
-
Avviare il modulo controller che si sta eseguendo la manutenzione, interrompendo l'avvio premendo
Ctrl-C
Quando viene richiesto di accedere al menu di avvio:-
Se nello chassis sono presenti due moduli controller, inserire completamente il modulo controller che si sta eseguendo la manutenzione nello chassis.
Il modulo controller si avvia quando è completamente inserito.
-
Se si dispone di un modulo controller nello chassis, collegare gli alimentatori e accenderli.
-
-
Selezionare Boot to maintenance mode (Avvia alla modalità di manutenzione) dal menu.
-
Uscire dalla modalità di manutenzione immettendo il seguente comando:
halt
Dopo aver inviato il comando, attendere che il sistema si arresti al prompt DEL CARICATORE.
-
Eseguire nuovamente il test diagnostico a livello di sistema.
-
Fase 6: Restituire la parte guasta a NetApp
Restituire la parte guasta a NetApp, come descritto nelle istruzioni RMA fornite con il kit. Vedere la "Restituzione e sostituzione delle parti" pagina per ulteriori informazioni.