Monitorare lo stato del sistema
Monitorare quotidianamente lo stato di salute generale del sistema StorageGRID.
Il sistema StorageGRID può continuare a funzionare quando le parti della griglia non sono disponibili. I potenziali problemi indicati da avvisi o allarmi (sistema legacy) non sono necessariamente problemi con le operazioni del sistema. Esaminare i problemi riepilogati nella scheda di stato dello stato di salute del pannello di controllo di Grid Manager.
Per ricevere notifiche di avvisi non appena vengono attivati, è possibile "imposta le notifiche via email per gli avvisi" oppure "Configurare i trap SNMP".
In caso di problemi, vengono visualizzati collegamenti che consentono di visualizzare ulteriori dettagli:
Collegamento | Viene visualizzato quando… |
---|---|
Dettagli della griglia |
Tutti i nodi sono disconnessi (stato di connessione sconosciuto o amministrativamente inattivo). |
Avvisi correnti (critici, maggiori, minori) |
Gli avvisi sono attualmente attivo. |
Avvisi risolti di recente |
Avvisi attivati la settimana scorsa sono ora risolti. |
Licenza |
Si è verificato un problema con la licenza software per questo sistema StorageGRID. È possibile "aggiornare le informazioni sulla licenza in base alle necessità". |
Monitorare gli stati di connessione del nodo
Se uno o più nodi sono disconnessi dalla rete, potrebbero verificarsi problemi con le operazioni critiche di StorageGRID. Monitorare gli stati di connessione dei nodi e risolvere tempestivamente eventuali problemi.
Icona | Descrizione | Azione richiesta |
---|---|---|
|
Non connesso - Sconosciuto Per un motivo sconosciuto, un nodo viene disconnesso o i servizi sul nodo vengono inaspettatamente disattivi. Ad esempio, un servizio sul nodo potrebbe essere stato arrestato o il nodo potrebbe aver perso la connessione di rete a causa di un'interruzione dell'alimentazione o di un'interruzione imprevista. Potrebbe essere attivato anche l'avviso Impossibile comunicare con il nodo. Potrebbero essere attivi anche altri avvisi. |
Richiede un'attenzione immediata. Selezionare ciascun avviso e seguire le azioni consigliate. Ad esempio, potrebbe essere necessario riavviare un servizio che ha arrestato o riavviato l'host per il nodo. Nota: Un nodo potrebbe apparire come sconosciuto durante le operazioni di shutdown gestite. In questi casi, è possibile ignorare lo stato Unknown (Sconosciuto). |
|
Non connesso - amministrazione non attiva Per un motivo previsto, il nodo non è connesso alla rete. Ad esempio, il nodo o i servizi sul nodo sono stati normalmente spenti, il nodo è in fase di riavvio o il software è in fase di aggiornamento. Potrebbero essere attivi anche uno o più avvisi. In base al problema sottostante, questi nodi tornano spesso online senza alcun intervento. |
Determinare se eventuali avvisi influiscono su questo nodo. Se sono attivi uno o più avvisi, selezionare ciascun avviso e seguire le azioni consigliate. |
|
Connesso Il nodo è collegato alla rete. |
Non è richiesta alcuna azione. |
Visualizzare gli avvisi correnti e risolti
Current alerts (Avvisi correnti): Quando viene attivato un avviso, viene visualizzata un'icona di avviso sul dashboard. Nella pagina nodi viene visualizzata anche un'icona di avviso per il nodo. Se "le notifiche e-mail di avviso sono configurate", viene inviata anche una notifica via email, a meno che l'avviso non sia stato tacitato.
Avvisi risolti: È possibile cercare e visualizzare una cronologia degli avvisi risolti.
Facoltativamente, hai guardato il video: "Video: Panoramica degli avvisi per StorageGRID 11.7"
La seguente tabella descrive le informazioni visualizzate in Grid Manager per gli avvisi correnti e risolti.
Intestazione di colonna | Descrizione |
---|---|
Nome o titolo |
Il nome dell'avviso e la relativa descrizione. |
Severità |
La severità dell'avviso. Per gli avvisi correnti, se sono raggruppati più avvisi, la riga del titolo mostra il numero di istanze di tale avviso che si verificano a ogni livello di gravità. Critico: Si verifica una condizione anomala che ha interrotto le normali operazioni di un nodo o servizio StorageGRID. È necessario risolvere immediatamente il problema sottostante. Se il problema non viene risolto, potrebbero verificarsi interruzioni del servizio e perdita di dati. Major: Si verifica una condizione anomala che influisce sulle operazioni correnti o si avvicina alla soglia per un avviso critico. È necessario analizzare gli avvisi principali e risolvere eventuali problemi sottostanti per assicurarsi che le condizioni anomale non interrompano il normale funzionamento di un nodo o servizio StorageGRID. Minore: Il sistema funziona normalmente, ma esiste una condizione anomala che potrebbe influire sulla capacità di funzionamento del sistema se continua. È necessario monitorare e risolvere gli avvisi minori che non vengono risolti da soli per garantire che non causino problemi più gravi. |
Tempo di attivazione |
Current alerts (Avvisi correnti): La data e l'ora in cui l'avviso è stato attivato nell'ora locale e in UTC. Se vengono raggruppati più avvisi, la riga del titolo mostra l'ora dell'istanza più recente dell'avviso (NEST) e l'istanza più vecchia dell'avviso (OLDEST). Resolved alerts (Avvisi risolti): Quanto tempo fa è stato attivato l'avviso. |
Sito/nodo |
Il nome del sito e del nodo in cui si è verificato o si è verificato l'avviso. |
Stato |
Se l'avviso è attivo, tacitato o risolto. Se vengono raggruppati più avvisi e nell'elenco a discesa viene selezionato tutti gli avvisi, la riga del titolo mostra quante istanze di tale avviso sono attive e quante istanze sono state tacitati. |
Tempo risolto (solo avvisi risolti) |
Quanto tempo fa l'avviso è stato risolto. |
Valori correnti o valori di dati |
Il valore della metrica che ha causato l'attivazione dell'avviso. Per alcuni avvisi, vengono visualizzati valori aggiuntivi che consentono di comprendere e analizzare l'avviso. Ad esempio, i valori visualizzati per un avviso Low Object Data Storage includono la percentuale di spazio su disco utilizzato, la quantità totale di spazio su disco e la quantità di spazio su disco utilizzata. Nota: se vengono raggruppati più avvisi correnti, i valori correnti non vengono visualizzati nella riga del titolo. |
Valori attivati (solo avvisi risolti) |
Il valore della metrica che ha causato l'attivazione dell'avviso. Per alcuni avvisi, vengono visualizzati valori aggiuntivi che consentono di comprendere e analizzare l'avviso. Ad esempio, i valori visualizzati per un avviso Low Object Data Storage includono la percentuale di spazio su disco utilizzato, la quantità totale di spazio su disco e la quantità di spazio su disco utilizzata. |
-
Selezionare il collegamento Avvisi correnti o Avvisi risolti per visualizzare un elenco di avvisi in tali categorie. È inoltre possibile visualizzare i dettagli di un avviso selezionando nodi > nodo > Panoramica e selezionando l'avviso dalla tabella Avvisi.
Per impostazione predefinita, gli avvisi correnti vengono visualizzati come segue:
-
Vengono visualizzati per primi gli avvisi attivati più di recente.
-
Più avvisi dello stesso tipo vengono visualizzati come gruppo.
-
Gli avvisi che sono stati tacitati non vengono visualizzati.
-
Per un avviso specifico su un nodo specifico, se le soglie vengono raggiunte per più di una severità, viene visualizzato solo l'allarme più grave. Ovvero, se vengono raggiunte soglie di allarme per i livelli di severità minori, maggiori e critici, viene visualizzato solo l'avviso critico.
La pagina degli avvisi correnti viene aggiornata ogni due minuti.
-
-
Per espandere i gruppi di avvisi, selezionare il cart inferiore . Per chiudere i singoli avvisi in un gruppo, selezionare il caret up oppure selezionare il nome del gruppo.
-
Per visualizzare singoli avvisi invece di gruppi di avvisi, deselezionare la casella di controllo Group alerts (Avvisi di gruppo).
-
Per ordinare gli avvisi o i gruppi di avvisi correnti, selezionare le frecce su/giù in ogni intestazione di colonna.
-
Quando si seleziona Group alerts (Avvisi di gruppo), vengono ordinati sia i gruppi di avvisi che i singoli avvisi all'interno di ciascun gruppo. Ad esempio, è possibile ordinare gli avvisi in un gruppo in base all'ora * attivata per trovare l'istanza più recente di un avviso specifico.
-
Quando l'opzione Group alerts (Avvisi di gruppo) viene deselezionata, viene ordinato l'intero elenco di avvisi. Ad esempio, è possibile ordinare tutti gli avvisi in base a nodo/sito per visualizzare tutti gli avvisi relativi a un nodo specifico.
-
-
Per filtrare gli avvisi correnti in base allo stato (tutti gli avvisi, attivi o silenziati, utilizzare il menu a discesa nella parte superiore della tabella.
-
Per ordinare gli avvisi risolti:
-
Selezionare un periodo di tempo dal menu a discesa quando attivato.
-
Selezionare una o più severità dal menu a discesa severità.
-
Selezionare una o più regole di avviso predefinite o personalizzate dal menu a discesa regola di avviso per filtrare gli avvisi risolti correlati a una regola di avviso specifica.
-
Selezionare uno o più nodi dal menu a discesa nodo per filtrare gli avvisi risolti relativi a un nodo specifico.
-
-
Per visualizzare i dettagli di un avviso specifico, selezionarlo. Una finestra di dialogo fornisce dettagli e azioni consigliate per l'avviso selezionato.
-
(Facoltativo) per un avviso specifico, selezionare Silence this alert (tacita questo avviso) per tacitare la regola che ha causato l'attivazione dell'avviso.
Per tacitare una regola di avviso, è necessario disporre dell'autorizzazione Manage alerts (Gestisci avvisi) o Root access (accesso root).
Prestare attenzione quando si decide di tacitare una regola di avviso. Se una regola di avviso viene tacitata, è possibile che non si rilevi un problema sottostante fino a quando non si impedisce il completamento di un'operazione critica. -
Per visualizzare le condizioni correnti della regola di avviso:
-
Dai dettagli dell'avviso, selezionare View conditions (Visualizza condizioni).
Viene visualizzata una finestra a comparsa che elenca l'espressione Prometheus per ogni severità definita.
-
Per chiudere la finestra a comparsa, fare clic in un punto qualsiasi all'esterno della finestra a comparsa.
-
-
Facoltativamente, selezionare Edit rule (Modifica regola) per modificare la regola di avviso che ha causato l'attivazione dell'avviso.
Per modificare una regola di avviso, è necessario disporre dell'autorizzazione Manage alerts (Gestisci avvisi) o Root access (accesso root).
Prestare attenzione quando si decide di modificare una regola di avviso. Se si modificano i valori di attivazione, potrebbe non essere rilevato un problema sottostante fino a quando non viene impedita l'esecuzione di un'operazione critica. -
Per chiudere i dettagli dell'avviso, selezionare Chiudi.