Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Recovery Storage Node Down per più di 15 giorni

Collaboratori

Se un singolo nodo di storage è stato offline e non connesso ad altri nodi di storage per più di 15 giorni, è necessario ricostruire Cassandra sul nodo.

Di cosa hai bisogno
  • È stato verificato che non è in corso la decommissionamento di un nodo di storage oppure che la procedura di decommissionamento del nodo è stata sospesa. (In Grid Manager, selezionare MANUTENZIONE > attività > smantellamento).

  • Hai verificato che non è in corso un'espansione. (In Grid Manager, selezionare MANUTENZIONE > attività > espansione).

A proposito di questa attività

I nodi di storage dispongono di un database Cassandra che include metadati a oggetti. Se un nodo di storage non è stato in grado di comunicare con altri nodi di storage per più di 15 giorni, StorageGRID presume che il database Cassandra del nodo sia obsoleta. Il nodo di storage non può ricongiungersi alla griglia fino a quando Cassandra non viene ricostruita utilizzando le informazioni provenienti da altri nodi di storage.

Utilizzare questa procedura per ricostruire Cassandra solo se un singolo nodo di storage non è attivo. Contattare il supporto tecnico se altri nodi di storage sono offline o se Cassandra è stato ricostruito su un altro nodo di storage negli ultimi 15 giorni; ad esempio, Cassandra potrebbe essere stato ricostruito come parte delle procedure per ripristinare i volumi di storage guasti o per ripristinare un nodo di storage guasto.

Avvertenza Se più di un nodo di storage si è guastato (o non è in linea), contattare il supporto tecnico. Non eseguire la seguente procedura di ripristino. Potrebbe verificarsi una perdita di dati.
Avvertenza Se si tratta del secondo guasto del nodo di storage in meno di 15 giorni dopo un guasto o un ripristino del nodo di storage, contattare il supporto tecnico. Non eseguire la seguente procedura di ripristino. Potrebbe verificarsi una perdita di dati.
Nota Se più di un nodo di storage in un sito si è guastato, potrebbe essere necessaria una procedura di ripristino del sito. Contattare il supporto tecnico.
Fasi
  1. Se necessario, accendere il nodo di storage che deve essere ripristinato.

  2. Accedere al nodo Grid:

    1. Immettere il seguente comando: ssh admin@grid_node_IP

    2. Immettere la password elencata in Passwords.txt file.

    3. Immettere il seguente comando per passare a root: su -

    4. Immettere la password elencata in Passwords.txt file.

    Una volta effettuato l'accesso come root, il prompt cambia da $ a. #.+

Nota Se non si riesce ad accedere al nodo Grid, il disco di sistema potrebbe non essere intatto. Passare alla procedura per ripristino in caso di guasto al disco di sistema.
  1. Eseguire i seguenti controlli sul nodo di storage:

    1. Eseguire questo comando: nodetool status

      L'output deve essere Connection refused

    2. In Grid Manager, selezionare SUPPORT Tools Grid topology.

    3. Selezionare Site Storage Node SSM Services. Verificare che venga visualizzato il servizio Cassandra Not Running.

    4. Selezionare Storage Node SSM Resources. Verificare che non vi sia stato di errore nella sezione Volumes (volumi).

    5. Eseguire questo comando: grep -i Cassandra /var/local/log/servermanager.log

      Nell'output dovrebbe essere visualizzato il seguente messaggio:

    Cassandra not started because it has been offline for more than 15 day grace period - rebuild Cassandra
  2. Eseguire questo comando e monitorare l'output dello script: check-cassandra-rebuild

    • Se i servizi di storage sono in esecuzione, viene richiesto di interromperli. Immettere: Y

    • Esaminare gli avvisi nello script. Se non sono applicabili, confermare che si desidera ricostruire Cassandra. Immettere: Y

      Nota Alcune procedure di ripristino StorageGRID utilizzano Reaper gestire le riparazioni Cassandra. Le riparazioni vengono eseguite automaticamente non appena vengono avviati i servizi correlati o richiesti. Si potrebbe notare un output di script che menziona “reaper” o “Cassandra repair”. Se viene visualizzato un messaggio di errore che indica che la riparazione non è riuscita, eseguire il comando indicato nel messaggio di errore.
  3. Al termine della ricostruzione, eseguire i seguenti controlli:

    1. In Grid Manager, selezionare SUPPORT Tools Grid topology.

    2. Selezionare Site recuperato nodo di storage SSM servizi.

    3. Verificare che tutti i servizi siano in esecuzione.

    4. Selezionare DDS Data Store.

    5. Verificare che lo stato Data Store Status sia “Up” e che lo stato Data Store state sia “Normal”.