Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Spegnere i controller - AFF C400

Collaboratori

Arrestare o sostituire il controller con problemi utilizzando la procedura appropriata per la configurazione.

Opzione 1: Spegnere i controller quando si sostituisce uno chassis

Spegnere i controller per eseguire la manutenzione dello chassis.

Questa procedura si applica ai sistemi con configurazioni a due nodi. Se si dispone di un sistema con più di due nodi, vedere "Come eseguire un arresto e un'accensione regolari di una coppia ha in un cluster a quattro nodi".

Prima di iniziare
  • Impedire a tutti i client/host di accedere ai dati sul sistema NetApp.

  • Sospendere i processi di backup esterni.

  • Assicurarsi di disporre delle autorizzazioni e delle credenziali necessarie:

    • Credenziali dell'amministratore locale per ONTAP.

    • Passphrase per la gestione delle chiavi integrata di NetApp (OKM) a livello del cluster se si utilizza la crittografia storage o NVE/NAE.

    • Accessibilità BMC per ciascun controller.

  • Assicurarsi di disporre degli strumenti e delle attrezzature necessarie per la sostituzione.

  • Come Best practice prima dello spegnimento, è necessario:

Fasi
  1. Accedere al cluster tramite SSH o da qualsiasi nodo del cluster utilizzando un cavo della console locale e un laptop/console.

  2. Disattivare AutoSupport e indicare per quanto tempo si prevede che il sistema non sia in linea:

    system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  3. Identificare l'indirizzo SP/BMC di tutti i nodi:

    system service-processor show -node * -fields address

  4. Uscire dalla shell del cluster: exit

  5. Accedere a SP/BMC tramite SSH utilizzando l'indirizzo IP di uno qualsiasi dei nodi elencati nell'output del passaggio precedente.

    Se stai utilizzando una console/laptop, accedi al controller usando le stesse credenziali di amministratore del cluster.

    Nota Aprire una sessione SSH per ogni connessione SP/BMC in modo da poter monitorare l'avanzamento.
  6. Arrestare i due nodi situati nel telaio danneggiato:

    system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

    Nota Per i cluster che utilizzano SnapMirror Synchronous che operano in modalità StrictSync: system node halt -node <node1>,<node2> -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
  7. Immettere y per ogni controller nel cluster quando viene visualizzato Warning: Are you sure you want to halt node "cluster <node-name> number"? {y|n}:

  8. Attendere che ogni controller si arresti e visualizzi il prompt DEL CARICATORE.

Opzione 2: Spegnere un controller in una configurazione MetroCluster a due nodi

Per spegnere il controller compromesso, è necessario determinare lo stato del controller e, se necessario, sostituirlo in modo che il controller integro continui a servire i dati provenienti dallo storage del controller compromesso.

A proposito di questa attività
  • Al termine di questa procedura, è necessario lasciare accesi gli alimentatori per alimentare il controller integro.

Fasi
  1. Controllare lo stato MetroCluster per determinare se il controller compromesso è passato automaticamente al controller integro: metrocluster show

  2. A seconda che si sia verificato uno switchover automatico, procedere come indicato nella seguente tabella:

    Se il controller è compromesso…​ Quindi…​

    Si è attivata automaticamente

    Passare alla fase successiva.

    Non si è attivato automaticamente

    Eseguire un'operazione di switchover pianificata dal controller integro: metrocluster switchover

    Non è stato attivato automaticamente, si è tentato di eseguire lo switchover con metrocluster switchover e lo switchover è stato vetoed

    Esaminare i messaggi di veto e, se possibile, risolvere il problema e riprovare. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

  3. Risincronizzare gli aggregati di dati eseguendo metrocluster heal -phase aggregates dal cluster esistente.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal con il -override-vetoes parametro. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

  4. Verificare che l'operazione sia stata completata utilizzando il comando MetroCluster Operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Controllare lo stato degli aggregati utilizzando storage aggregate show comando.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Riparare gli aggregati root utilizzando metrocluster heal -phase root-aggregates comando.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Se la riparazione è vetoed, si ha la possibilità di riemettere il metrocluster heal comando con il parametro -override-vetoes. Se si utilizza questo parametro opzionale, il sistema sovrascrive qualsiasi veto soft che impedisca l'operazione di riparazione.

  7. Verificare che l'operazione di riparazione sia completa utilizzando metrocluster operation show sul cluster di destinazione:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. Sul modulo controller guasto, scollegare gli alimentatori.