Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Riferimenti agli avvisi

Collaboratori

La tabella seguente elenca tutti gli avvisi StorageGRID predefiniti. Se necessario, è possibile creare regole di avviso personalizzate per adattarsi al proprio approccio di gestione del sistema.

Consultare le informazioni su Metriche Prometheus comunemente utilizzate per informazioni sulle metriche utilizzate in alcuni di questi avvisi.

Nome dell'avviso Descrizione e azioni consigliate

Batteria dell'appliance scaduta

La batteria del controller di storage dell'appliance è scaduta.

  1. Sostituire la batteria. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage:

  2. Se l'avviso persiste, contattare il supporto tecnico.

Batteria dell'appliance guasta

La batteria del controller di storage dell'appliance si è guastata.

  1. Sostituire la batteria. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage:

  2. Se l'avviso persiste, contattare il supporto tecnico.

La capacità appresa della batteria dell'appliance non è sufficiente

La capacità appresa della batteria nel controller di storage dell'appliance non è sufficiente.

  1. Sostituire la batteria. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage:

  2. Se l'avviso persiste, contattare il supporto tecnico.

Batteria dell'apparecchio quasi scaduta

La batteria del controller di storage dell'appliance sta per scadere.

  1. Sostituire la batteria al più presto. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage:

  2. Se l'avviso persiste, contattare il supporto tecnico.

Batteria dell'apparecchio rimossa

La batteria nel controller di storage dell'appliance non è presente.

  1. Installare una batteria. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage:

  2. Se l'avviso persiste, contattare il supporto tecnico.

Batteria dell'apparecchio troppo calda

La batteria del controller di storage dell'apparecchio è surriscaldata.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Esaminare i possibili motivi dell'aumento della temperatura, ad esempio un guasto alla ventola o all'HVAC.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Errore di comunicazione BMC dell'appliance

La comunicazione con il BMC (Baseboard Management Controller) è stata persa.

  1. Verificare che il BMC funzioni correttamente. Selezionare NODES, quindi selezionare la scheda hardware per il nodo dell'appliance. Individuare il campo Compute Controller BMC IP (IP BMC controller di calcolo) e individuare l'IP desiderato.

  2. Tentare di ripristinare le comunicazioni BMC posizionando il nodo in modalità di manutenzione, quindi spegnendo e riaccendendo l'appliance. Consultare le istruzioni per l'apparecchio:

  3. Se l'avviso persiste, contattare il supporto tecnico.

Periferica di backup della cache dell'appliance non riuscita

Si è verificato un errore in una periferica di backup della cache persistente.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Contattare il supporto tecnico.

Capacità insufficiente del dispositivo di backup della cache dell'appliance

La capacità della periferica di backup della cache è insufficiente.

Contattare il supporto tecnico.

Dispositivo di backup cache dell'appliance protetto da scrittura

Una periferica di backup della cache è protetta da scrittura.

Contattare il supporto tecnico.

Mancata corrispondenza delle dimensioni della memoria cache dell'appliance

I due controller dell'appliance hanno dimensioni della cache diverse.

Contattare il supporto tecnico.

Temperatura dello chassis del controller di calcolo dell'appliance troppo alta

La temperatura del controller di calcolo in un'appliance StorageGRID ha superato una soglia nominale.

  1. Verificare l'eventuale presenza di condizioni di surriscaldamento dei componenti hardware e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Temperatura CPU del controller di calcolo dell'appliance troppo alta

La temperatura della CPU nel controller di calcolo di un'appliance StorageGRID ha superato una soglia nominale.

  1. Verificare l'eventuale presenza di condizioni di surriscaldamento dei componenti hardware e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Il controller di calcolo dell'appliance richiede attenzione

È stato rilevato un guasto hardware nel controller di calcolo di un'appliance StorageGRID.

  1. Verificare la presenza di errori nei componenti hardware e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Si è verificato un problema nell'alimentatore A del controller di calcolo dell'appliance

Si è verificato un problema nell'alimentatore A del controller di calcolo. Questo avviso potrebbe indicare che l'alimentatore è guasto o che si è verificato un problema nell'alimentazione.

  1. Verificare la presenza di errori nei componenti hardware e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Si è verificato un problema nell'alimentatore B del controller di calcolo dell'appliance

L'alimentazione B nel controller di calcolo presenta un problema.

Questo avviso potrebbe indicare che l'alimentatore è guasto o che si è verificato un problema di alimentazione.

  1. Verificare la presenza di errori nei componenti hardware e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Il servizio di monitoraggio dell'hardware di calcolo dell'appliance si è bloccato

Il servizio che monitora lo stato dell'hardware dello storage ha smesso di riportare i dati.

  1. Controllare lo stato del servizio di stato del sistema eos nel sistema operativo di base.

  2. Se il servizio si trova in uno stato di arresto o di errore, riavviarlo.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Rilevato guasto nel Fibre Channel dell'appliance

È stato rilevato un problema di collegamento Fibre Channel tra lo storage controller dell'appliance e il controller di calcolo.

Questo avviso potrebbe indicare la presenza di un problema relativo alla connessione Fibre Channel tra lo storage e i controller di calcolo nell'appliance.

  1. Verificare la presenza di errori nei componenti hardware (NODI nodo appliance hardware). Se lo stato di uno dei componenti non è “nominale”, eseguire le seguenti operazioni:

    1. Verificare che i cavi Fibre Channel tra i controller siano collegati correttamente.

    2. Assicurarsi che i cavi Fibre Channel siano privi di piegature eccessive.

    3. Verificare che i moduli SFP+ siano inseriti correttamente.

      Nota: se il problema persiste, il sistema StorageGRID potrebbe disattivare automaticamente la connessione problematica.

  2. Se necessario, sostituire i componenti. Consultare le istruzioni per l'apparecchio:

Errore della porta HBA Fibre Channel dell'appliance

Una porta HBA Fibre Channel si sta guastando o si è guastata.

Contattare il supporto tecnico.

Unità flash cache dell'appliance non ottimali

I dischi utilizzati per la cache SSD non sono ottimali.

  1. Sostituire le unità cache SSD. Consultare le istruzioni per l'apparecchio:

  2. Se l'avviso persiste, contattare il supporto tecnico.

Interconnessione dell'appliance/contenitore della batteria rimosso

Il contenitore di interconnessione/batteria non è presente.

  1. Sostituire la batteria. La procedura per la sostituzione di un controller di storage include la procedura per la rimozione e la sostituzione della batteria. Consultare le istruzioni relative all'appliance di storage.

  2. Se l'avviso persiste, contattare il supporto tecnico.

Porta LACP dell'appliance mancante

Una porta su un'appliance StorageGRID non partecipa al bond LACP.

  1. Controllare la configurazione dello switch. Assicurarsi che l'interfaccia sia configurata nel gruppo di aggregazione dei collegamenti corretto.

  2. Se l'avviso persiste, contattare il supporto tecnico.

Alimentatore generale dell'appliance degradato

La potenza di un'appliance StorageGRID è diversa dalla tensione di esercizio consigliata.

  1. Controllare lo stato degli alimentatori A e B per determinare quale alimentatore funziona in modo anomalo e seguire le azioni consigliate:

    • Se si dispone di SG100, SG1000 o SG6000, utilizzare BMC.

    • Se si dispone di un sistema SG5600 o SG5700, utilizzare Gestore di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Guasto del controller dello storage dell'appliance A.

Si è verificato un errore nel controller storage A di un'appliance StorageGRID.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Guasto del controller storage dell'appliance B.

Il controller dello storage B in un'appliance StorageGRID si è guastato.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Guasto al disco del controller dello storage dell'appliance

Uno o più dischi di un'appliance StorageGRID si sono guastati o non sono ottimali.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Problema hardware del controller dello storage dell'appliance

Il software SANtricity segnala "richiede attenzione" per un componente di un'appliance StorageGRID.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Guasto all'alimentazione Del controller dello storage dell'appliance A.

L'alimentazione A di un'appliance StorageGRID non è conforme alla tensione di esercizio consigliata.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Guasto all'alimentazione B del controller storage dell'appliance

L'alimentazione B di un apparecchio StorageGRID non è conforme alla tensione di esercizio consigliata.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Il servizio di monitoraggio hardware dello storage dell'appliance si è bloccato

Il servizio che monitora lo stato dell'hardware dello storage ha smesso di riportare i dati.

  1. Controllare lo stato del servizio di stato del sistema eos nel sistema operativo di base.

  2. Se il servizio si trova in uno stato di arresto o di errore, riavviarlo.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Gli shelf di storage delle appliance sono degradati

Lo stato di uno dei componenti dello shelf di storage di un'appliance di storage è degradato.

  1. Utilizzare Gestione di sistema di SANtricity per controllare i componenti hardware e seguire le azioni consigliate.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Temperatura dell'apparecchio superata

La temperatura nominale o massima del controller di storage dell'appliance è stata superata.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Esaminare i possibili motivi dell'aumento della temperatura, ad esempio un guasto alla ventola o all'HVAC.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Sensore di temperatura dell'apparecchio rimosso

È stato rimosso un sensore di temperatura. Contattare il supporto tecnico.

Errore compattatore automatico Cassandra

Si è verificato un errore nel compattatore automatico Cassandra.

Il compattatore automatico Cassandra è presente su tutti i nodi di storage e gestisce le dimensioni del database Cassandra per la sovrascrittura e l'eliminazione di carichi di lavoro pesanti. Anche se questa condizione persiste, alcuni carichi di lavoro sperimenteranno un consumo inaspettatamente elevato di metadati.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Contattare il supporto tecnico.

I registri di controllo vengono aggiunti alla coda in-memory

Il nodo non può inviare i log al server syslog locale e la coda in-memory si sta riempiendo.

  1. Assicurarsi che il servizio rsyslog sia in esecuzione sul nodo.

  2. Se necessario, riavviare il servizio rsyslog sul nodo utilizzando il comando service rsyslog restart.

  3. Se non è possibile riavviare il servizio rsyslog e non si salvano messaggi di audit sui nodi di amministrazione, contattare il supporto tecnico. Se questa condizione non viene corretta, i registri di controllo andranno persi.

Metriche del compattatore automatico Cassandra non aggiornate

Le metriche che descrivono il compattatore automatico Cassandra non sono aggiornate.

Il compattatore automatico Cassandra è presente su tutti i nodi di storage e gestisce le dimensioni del database Cassandra per la sovrascrittura e l'eliminazione di carichi di lavoro pesanti. Mentre questo avviso persiste, alcuni carichi di lavoro sperimenteranno un consumo inaspettatamente elevato di metadati.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Contattare il supporto tecnico.

Errore di comunicazione Cassandra

I nodi che eseguono il servizio Cassandra hanno problemi di comunicazione tra loro.

Questo avviso indica che qualcosa sta interferendo con le comunicazioni da nodo a nodo. Potrebbe esserci un problema di rete o il servizio Cassandra potrebbe essere inattivo su uno o più nodi di storage.

  1. Determinare se è presente un altro avviso che interessa uno o più nodi di storage. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Verificare la presenza di un problema di rete che potrebbe interessare uno o più nodi di storage.

  3. Selezionare SUPPORT > Tools > Grid topology.

  4. Per ciascun nodo di storage del sistema, selezionare SSM servizi. Assicurarsi che lo stato del servizio Cassandra sia "in esecuzione".

  5. Se Cassandra non è in esecuzione, seguire la procedura descritta in avvio o riavvio di un servizio.

  6. Se tutte le istanze del servizio Cassandra sono in esecuzione e l'avviso non viene risolto, contattare il supporto tecnico.

Le compaction di Cassandra sono sovraccaricate

Il processo di compattazione Cassandra è sovraccarico.

In caso di sovraccarico del processo di compattazione, le prestazioni di lettura potrebbero essere ridotte e la RAM potrebbe essere consuicata. Anche il servizio Cassandra potrebbe non rispondere o bloccarsi.

  1. Riavviare il servizio Cassandra seguendo la procedura descritta in riavvio di un servizio.

  2. Se l'avviso persiste, contattare il supporto tecnico.

Metriche di riparazione Cassandra non aggiornate

Le metriche che descrivono i lavori di riparazione Cassandra non sono aggiornate. Se questa condizione persiste per più di 48 ore, le query del client, come gli elenchi dei bucket, potrebbero mostrare i dati cancellati.

  1. Riavviare il nodo. Da Grid Manager, selezionare NODES, selezionare il nodo e selezionare la scheda Tasks (attività).

  2. Se l'avviso persiste, contattare il supporto tecnico.

Il processo di riparazione di Cassandra è lento

Il progresso delle riparazioni del database Cassandra è lento.

Quando le riparazioni del database sono lente, le operazioni di coerenza dei dati Cassandra vengono ostacolate. Se questa condizione persiste per più di 48 ore, le query del client, come gli elenchi dei bucket, potrebbero mostrare i dati cancellati.

  1. Verificare che tutti i nodi di storage siano online e che non siano presenti avvisi relativi alla rete.

  2. Monitorare questo avviso per un massimo di 2 giorni per verificare se il problema si risolve da solo.

  3. Se le riparazioni del database continuano a procedere lentamente, contattare il supporto tecnico.

Servizio di riparazione Cassandra non disponibile

Il servizio di riparazione Cassandra non è disponibile.

Il servizio di riparazione Cassandra esiste su tutti i nodi di storage e fornisce funzioni di riparazione critiche per il database Cassandra. Se questa condizione persiste per più di 48 ore, le query del client, come gli elenchi dei bucket, potrebbero mostrare i dati cancellati.

  1. Selezionare SUPPORT > Tools > Grid topology.

  2. Per ciascun nodo di storage del sistema, selezionare SSM servizi. Assicurarsi che lo stato del servizio Cassandra Reaper sia "in esecuzione".

  3. Se Cassandra Reaper non è in esecuzione, seguire la procedura descritta in avvio o riavvio di un servizio.

  4. Se tutte le istanze del servizio Cassandra Reaper sono in esecuzione e l'avviso non viene risolto, contattare il supporto tecnico.

Tabella Cassandra corrotta

Cassandra ha rilevato un danneggiamento della tabella.

Cassandra si riavvia automaticamente se rileva la corruzione della tabella.

Contattare il supporto tecnico.

Errore di connettività del pool di cloud storage

Il controllo dello stato di salute dei Cloud Storage Pools ha rilevato uno o più nuovi errori.

  1. Accedere alla sezione Cloud Storage Pools della pagina Storage Pools.

  2. Esaminare la colonna Last Error (ultimo errore) per determinare quale pool di storage cloud presenta un errore.

  3. Consultare le istruzioni per gestione degli oggetti con la gestione del ciclo di vita delle informazioni.

Lease DHCP scaduto

Il lease DHCP su un'interfaccia di rete è scaduto. Se il lease DHCP è scaduto, seguire le azioni consigliate:

  1. Assicurarsi che vi sia connettività tra questo nodo e il server DHCP sull'interfaccia interessata.

  2. Assicurarsi che siano disponibili indirizzi IP da assegnare nella subnet interessata sul server DHCP.

  3. Assicurarsi che vi sia una prenotazione permanente per l'indirizzo IP configurato nel server DHCP. In alternativa, utilizzare lo strumento Modifica IP StorageGRID per assegnare un indirizzo IP statico esterno al pool di indirizzi DHCP. Vedere istruzioni per il ripristino e la manutenzione.

Il lease DHCP sta per scadere

Il lease DHCP su un'interfaccia di rete sta per scadere.

Per impedire la scadenza del lease DHCP, seguire le azioni consigliate:

  1. Assicurarsi che vi sia connettività tra questo nodo e il server DHCP sull'interfaccia interessata.

  2. Assicurarsi che siano disponibili indirizzi IP da assegnare nella subnet interessata sul server DHCP.

  3. Assicurarsi che vi sia una prenotazione permanente per l'indirizzo IP configurato nel server DHCP. In alternativa, utilizzare lo strumento Modifica IP StorageGRID per assegnare un indirizzo IP statico esterno al pool di indirizzi DHCP. Vedere istruzioni per il ripristino e la manutenzione.

Server DHCP non disponibile

Il server DHCP non è disponibile.

Il nodo StorageGRID non è in grado di contattare il server DHCP. Il lease DHCP per l'indirizzo IP del nodo non può essere validato.

  1. Assicurarsi che vi sia connettività tra questo nodo e il server DHCP sull'interfaccia interessata.

  2. Assicurarsi che siano disponibili indirizzi IP da assegnare nella subnet interessata sul server DHCP.

  3. Assicurarsi che vi sia una prenotazione permanente per l'indirizzo IP configurato nel server DHCP. In alternativa, utilizzare lo strumento Modifica IP StorageGRID per assegnare un indirizzo IP statico esterno al pool di indirizzi DHCP. Vedere istruzioni per il ripristino e la manutenzione.

L'i/o del disco è molto lento

L'i/o del disco molto lento potrebbe influire sulle prestazioni di StorageGRID.

  1. Se il problema riguarda un nodo dell'appliance di storage, utilizzare Gestione di sistema di SANtricity per verificare la presenza di dischi difettosi, dischi con guasti previsti o riparazioni dei dischi in corso. Controllare inoltre lo stato dei collegamenti Fibre Channel o SAS tra i controller di calcolo e storage dell'appliance per verificare se i collegamenti sono inattivi o mostrano tassi di errore eccessivi.

  2. Esaminare il sistema storage che ospita i volumi di questo nodo per determinare e correggere la causa principale del rallentamento dell'i/O.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Nota: i nodi interessati potrebbero disattivare i servizi e riavviarsi per evitare di influire sulle prestazioni complessive della griglia. Quando la condizione sottostante viene cancellata e questi nodi rilevano le normali prestazioni i/o, tornano automaticamente al servizio completo.

Errore di ribilanciamento EC

Il processo di ribilanciamento dei dati con codifica di cancellazione tra i nodi di storage non è riuscito o è stato messo in pausa dall'utente.

  1. Assicurarsi che tutti i nodi di storage del sito da ribilanciare siano online e disponibili.

  2. Assicurarsi che non vi siano errori di volume nel sito in fase di ribilanciamento. In caso affermativo, terminare il lavoro di ribilanciamento EC in modo da poter eseguire un lavoro di riparazione.

    'rebalance-data terminate --job-id <ID>'

  3. Assicurarsi che non vi siano guasti al servizio sul sito in fase di ribilanciamento. Se un servizio non è in esecuzione, seguire la procedura per avviare o riavviare un servizio nelle istruzioni di ripristino e manutenzione.

  4. Dopo aver risolto eventuali problemi, riavviare il processo eseguendo il seguente comando sul nodo di amministrazione primario:

    'rebalance-data start --job-id <ID>'

  5. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Errore di riparazione EC

Un lavoro di riparazione per i dati con codifica di cancellazione non è riuscito o è stato interrotto.

  1. Assicurarsi che siano disponibili volumi o nodi di storage sufficienti per sostituire il nodo o il volume di storage guasto.

  2. Assicurarsi che siano disponibili nodi di storage sufficienti per soddisfare la policy ILM attiva.

  3. Assicurarsi che non vi siano problemi di connettività di rete.

  4. Dopo aver risolto eventuali problemi, riavviare il processo eseguendo il seguente comando sul nodo di amministrazione primario:

    'repair-data start-ec-node-repair --repair-id <ID>'

  5. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Riparazione EC in stallo

Un lavoro di riparazione per i dati con codifica di cancellazione si è bloccato.

  1. Assicurarsi che siano disponibili volumi o nodi di storage sufficienti per sostituire il nodo o il volume di storage guasto.

  2. Assicurarsi che non vi siano problemi di connettività di rete.

  3. Dopo aver risolto eventuali problemi, controllare se l'avviso è stato risolto. Per visualizzare un report più dettagliato sull'avanzamento della riparazione, eseguire il seguente comando sul nodo di amministrazione principale:

    'repair-data show-ec-repair-status --repair-id <ID>'

  4. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Errore di notifica e-mail

Impossibile inviare la notifica via email per un avviso.

Questo avviso viene attivato quando una notifica e-mail di avviso non riesce o non è possibile inviare un'e-mail di prova (inviata dalla pagina ALERTS Email setup).

  1. Accedere a Grid Manager dal nodo Admin elencato nella colonna Sito/nodo dell'avviso.

  2. Accedere alla pagina ALERTS email setup, controllare le impostazioni e modificarle se necessario.

  3. Fare clic su Send Test Email (Invia email di prova) e controllare la posta in arrivo di un destinatario del test. Se non è possibile inviare l'e-mail di prova, potrebbe essere attivata una nuova istanza di questo avviso.

  4. Se non è stato possibile inviare l'e-mail di prova, verificare che il server e-mail sia in linea.

  5. Se il server funziona, selezionare SUPPORT Tools Logs e raccogliere il log per il nodo di amministrazione. Specificare un periodo di tempo di 15 minuti prima e dopo l'ora dell'avviso.

  6. Estrarre l'archivio scaricato ed esaminare il contenuto di prometheus.log (_/GID<gid><time_stamp>/<site_node>/<time_stamp>/metrics/prometheus.log).

  7. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Scadenza dei certificati client configurati nella pagina certificati

Uno o più certificati client configurati nella pagina certificati stanno per scadere.

  1. In Grid Manager, selezionare CONFIGURATION Security Certificates, quindi selezionare la scheda Client.

  2. Seleziona un certificato che scadrà a breve.

  3. Selezionare Allega nuovo certificato a. caricare o generare un nuovo certificato.

  4. Ripetere questa procedura per ogni certificato che scadrà a breve.

Scadenza del certificato endpoint del bilanciamento del carico

Uno o più certificati endpoint per il bilanciamento del carico stanno per scadere.

  1. Selezionare CONFIGURATION > Network > Load Balancer Endpoints.

  2. Selezionare un endpoint con un certificato che scadrà a breve.

  3. Selezionare Edit endpoint (Modifica endpoint) per caricare o generare un nuovo certificato.

  4. Ripetere questi passaggi per ogni endpoint con un certificato scaduto o che scadrà a breve.

Per ulteriori informazioni sulla gestione degli endpoint del bilanciamento del carico, vedere Istruzioni per l'amministrazione di StorageGRID.

Scadenza del certificato del server per l'interfaccia di gestione

Il certificato del server utilizzato per l'interfaccia di gestione sta per scadere.

  1. Selezionare CONFIGURAZIONE sicurezza certificati.

  2. Nella scheda Global, selezionare Management interface certificate.

  3. Caricare un nuovo certificato dell'interfaccia di gestione.

Scadenza del certificato server globale per S3 e Swift API

Il certificato del server utilizzato per accedere agli endpoint API dello storage sta per scadere.

  1. Selezionare CONFIGURAZIONE sicurezza certificati.

  2. Nella scheda Global, selezionare S3 and Swift API certificate.

  3. Caricare un nuovo certificato API S3 e Swift.

Scadenza del certificato CA syslog esterno

Il certificato dell'autorità di certificazione (CA) utilizzato per firmare il certificato del server syslog esterno sta per scadere.

  1. Aggiornare il certificato CA sul server syslog esterno.

  2. Ottenere una copia del certificato CA aggiornato.

  3. Da Grid Manager, andare a CONFIGURAZIONE monitoraggio Audit e server syslog.

  4. Selezionare Modifica server syslog esterno.

  5. Selezionare Sfoglia per caricare il nuovo certificato.

  6. Completare la configurazione guidata per salvare il nuovo certificato e la nuova chiave.

Scadenza del certificato client syslog esterno

Il certificato client per un server syslog esterno sta per scadere.

  1. Da Grid Manager, andare a CONFIGURAZIONE monitoraggio Audit e server syslog.

  2. Selezionare Modifica server syslog esterno.

  3. Selezionare Sfoglia per caricare il nuovo certificato.

  4. Selezionare Sfoglia per caricare la nuova chiave privata.

  5. Completare la configurazione guidata per salvare il nuovo certificato e la nuova chiave.

Scadenza del certificato del server syslog esterno

Il certificato del server presentato dal server syslog esterno sta per scadere.

  1. Aggiornare il certificato del server sul server syslog esterno.

  2. Se in precedenza si utilizzava l'API Grid Manager per fornire un certificato server per la convalida del certificato, caricare il certificato server aggiornato utilizzando l'API.

Errore di inoltro del server syslog esterno

Il nodo non può inoltrare i log al server syslog esterno.

  1. Da Grid Manager, andare a CONFIGURAZIONE monitoraggio Audit e server syslog.

  2. Selezionare Modifica server syslog esterno.

  3. Avanzare attraverso la Configurazione guidata fino a quando non si è in grado di selezionare Invia messaggi di prova.

  4. Selezionare Send test messages (Invia messaggi di test) per determinare perché i log non possono essere inoltrati al server syslog esterno.

  5. Risolvere eventuali problemi segnalati.

Mancata corrispondenza MTU rete griglia

L'impostazione MTU (Maximum Transmission Unit) per l'interfaccia Grid Network (eth0) differisce significativamente tra i nodi della griglia.

Le differenze nelle impostazioni MTU potrebbero indicare che alcune, ma non tutte, reti eth0 sono configurate per i frame jumbo. Una mancata corrispondenza delle dimensioni MTU superiore a 1000 potrebbe causare problemi di performance di rete.

Consultare le istruzioni per l'avviso di mancata corrispondenza MTU della rete griglia in Risolvere i problemi di rete, hardware e piattaforma.

Elevato utilizzo di heap Java

Viene utilizzata una percentuale elevata di spazio heap Java.

Se l'heap Java diventa pieno, i servizi di metadati potrebbero non essere disponibili e le richieste del client potrebbero non riuscire.

  1. Esaminare l'attività ILM sulla dashboard. Questo avviso potrebbe essere risolto da solo quando il carico di lavoro ILM diminuisce.

  2. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  3. Se l'avviso persiste, contattare il supporto tecnico.

Latenza elevata per le query sui metadati

Il tempo medio per le query dei metadati Cassandra è troppo lungo.

Un aumento della latenza delle query può essere causato da una modifica dell'hardware, ad esempio la sostituzione di un disco, una modifica del carico di lavoro, ad esempio un aumento improvviso delle attività di acquisizione, o una modifica della rete, ad esempio un problema di comunicazione tra nodi e siti.

  1. Determinare se sono state apportate modifiche all'hardware, al carico di lavoro o alla rete durante l'aumento della latenza della query.

  2. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Errore di sincronizzazione della federazione delle identità

Impossibile sincronizzare utenti e gruppi federati dall'origine dell'identità.

  1. Verificare che il server LDAP configurato sia in linea e disponibile.

  2. Esaminare le impostazioni nella pagina Identity Federation (Federazione identità). Verificare che tutti i valori siano aggiornati. Vedere USA la federazione delle identità Nelle istruzioni per l'amministrazione di StorageGRID.

  3. Fare clic su Test Connection (verifica connessione) per convalidare le impostazioni del server LDAP.

  4. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Errore di sincronizzazione della federazione delle identità per un tenant

Impossibile sincronizzare utenti e gruppi federati dall'origine dell'identità configurata da un tenant.

  1. Accedi al tenant manager.

  2. Verificare che il server LDAP configurato dal tenant sia online e disponibile.

  3. Esaminare le impostazioni nella pagina Identity Federation (Federazione identità). Verificare che tutti i valori siano aggiornati. Vedere USA la federazione delle identità nelle istruzioni per l'utilizzo di un account tenant.

  4. Fare clic su Test Connection (verifica connessione) per convalidare le impostazioni del server LDAP.

  5. Se non si riesce a risolvere il problema, contattare il supporto tecnico.

Posizionamento ILM non raggiungibile

Non è possibile ottenere un'istruzione di posizionamento in una regola ILM per determinati oggetti.

Questo avviso indica che un nodo richiesto da un'istruzione di posizionamento non è disponibile o che una regola ILM non è configurata correttamente. Ad esempio, una regola potrebbe specificare un numero di copie replicate maggiore rispetto ai nodi di storage.

  1. Assicurarsi che tutti i nodi siano online.

  2. Se tutti i nodi sono in linea, rivedere le istruzioni di posizionamento in tutte le regole ILM che utilizzano il criterio ILM attivo. Verificare che siano presenti istruzioni valide per tutti gli oggetti. Vedere istruzioni per la gestione degli oggetti con la gestione del ciclo di vita delle informazioni.

  3. Se necessario, aggiornare le impostazioni delle regole e attivare un nuovo criterio.

    Nota: l'eliminazione dell'avviso potrebbe richiedere fino a 1 giorno.

  4. Se il problema persiste, contattare il supporto tecnico.

Nota: questo avviso potrebbe essere visualizzato durante un aggiornamento e potrebbe persistere per 1 giorno dopo il completamento dell'aggiornamento. Quando questo avviso viene attivato da un aggiornamento, viene visualizzato da solo.

Periodo di scansione ILM troppo lungo

Il tempo necessario per eseguire la scansione, valutare gli oggetti e applicare ILM è troppo lungo.

Se il tempo stimato per completare una scansione ILM completa di tutti gli oggetti è troppo lungo (vedere periodo di scansione - stimato nella dashboard), il criterio ILM attivo potrebbe non essere applicato ai nuovi oggetti acquisiti. Le modifiche al criterio ILM potrebbero non essere applicate agli oggetti esistenti.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Verificare che tutti i nodi di storage siano online.

  3. Ridurre temporaneamente la quantità di traffico client. Ad esempio, in Grid Manager, selezionare CONFIGURATION Network Traffic classification e creare una policy che limiti la larghezza di banda o il numero di richieste.

  4. Se l'i/o del disco o la CPU sono sovraccarichi, provare a ridurre il carico o aumentare la risorsa.

  5. Se necessario, aggiornare le regole ILM per utilizzare il posizionamento sincrono (impostazione predefinita per le regole create dopo StorageGRID 11.3).

  6. Se l'avviso persiste, contattare il supporto tecnico.

Velocità di scansione ILM bassa

La velocità di scansione ILM è impostata su un valore inferiore a 100 oggetti/secondo.

Questo avviso indica che la velocità di scansione ILM del sistema è stata modificata a meno di 100 oggetti/secondo (impostazione predefinita: 400 oggetti/secondo). Il criterio ILM attivo potrebbe non essere applicato ai nuovi oggetti acquisiti. Le modifiche successive al criterio ILM non verranno applicate agli oggetti esistenti.

  1. Determinare se è stata apportata una modifica temporanea alla velocità di scansione ILM come parte di un'indagine di supporto in corso.

  2. Contattare il supporto tecnico.

Importante Non modificare mai la velocità di scansione ILM senza contattare il supporto tecnico.

Scadenza del certificato CA KMS

Il certificato dell'autorità di certificazione (CA) utilizzato per firmare il certificato del server di gestione delle chiavi (KMS) sta per scadere.

  1. Utilizzando il software KMS, aggiornare il certificato CA per il server di gestione delle chiavi.

  2. Da Grid Manager, selezionare CONFIGURATION Security Key management server.

  3. Selezionare il KMS che presenta un avviso di stato del certificato.

  4. Selezionare Modifica.

  5. Selezionare Avanti per passare alla fase 2 (carica certificato server).

  6. Selezionare Sfoglia per caricare il nuovo certificato.

  7. Selezionare Salva.

Scadenza del certificato client KMS

Il certificato client per un server di gestione delle chiavi sta per scadere.

  1. Da Grid Manager, selezionare CONFIGURATION Security Key management server.

  2. Selezionare il KMS che presenta un avviso di stato del certificato.

  3. Selezionare Modifica.

  4. Selezionare Avanti per passare alla fase 3 (carica certificati client).

  5. Selezionare Sfoglia per caricare il nuovo certificato.

  6. Selezionare Sfoglia per caricare la nuova chiave privata.

  7. Selezionare Salva.

Impossibile caricare la configurazione KMS

La configurazione per il server di gestione delle chiavi esiste ma non è riuscita a caricarsi.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Se l'avviso persiste, contattare il supporto tecnico.

Errore di connettività KMS

Un nodo appliance non è riuscito a connettersi al server di gestione delle chiavi del proprio sito.

  1. Da Grid Manager, selezionare CONFIGURATION Security Key management server.

  2. Verificare che le voci relative a porta e nome host siano corrette.

  3. Verificare che il certificato del server, il certificato del client e la chiave privata del certificato del client siano corretti e non scaduti.

  4. Assicurarsi che le impostazioni del firewall consentano al nodo dell'appliance di comunicare con il KMS specificato.

  5. Correggere eventuali problemi di rete o DNS.

  6. Se hai bisogno di assistenza o se l'avviso persiste, contatta il supporto tecnico.

Nome chiave di crittografia KMS non trovato

Il server di gestione delle chiavi configurato non dispone di una chiave di crittografia corrispondente al nome fornito.

  1. Verificare che il KMS assegnato al sito utilizzi il nome corretto per la chiave di crittografia e le versioni precedenti.

  2. Se hai bisogno di assistenza o se l'avviso persiste, contatta il supporto tecnico.

Rotazione della chiave di crittografia KMS non riuscita

Tutti i volumi dell'appliance sono stati decifrati, ma uno o più volumi non sono stati ruotati sulla chiave più recente.contattare il supporto tecnico.

KMS non configurato

Non esiste alcun server di gestione delle chiavi per questo sito.

  1. Da Grid Manager, selezionare CONFIGURATION Security Key management server.

  2. Aggiungere un KMS per questo sito o un KMS predefinito.

La chiave KMS non è riuscita a decrittare un volume dell'appliance

Non è stato possibile decifrare uno o più volumi su un'appliance con crittografia del nodo abilitata con la chiave KMS corrente.

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Assicurarsi che il server di gestione delle chiavi (KMS) disponga della chiave di crittografia configurata e di eventuali versioni precedenti.

  3. Se hai bisogno di assistenza o se l'avviso persiste, contatta il supporto tecnico.

Scadenza del certificato del server KMS

Il certificato del server utilizzato dal server di gestione delle chiavi (KMS) sta per scadere.

  1. Utilizzando il software KMS, aggiornare il certificato del server per il server di gestione delle chiavi.

  2. Se hai bisogno di assistenza o se l'avviso persiste, contatta il supporto tecnico.

Coda di audit di grandi dimensioni

La coda dei dischi per i messaggi di controllo è piena.

  1. Controllare il carico sul sistema - se si è verificato un numero significativo di transazioni, l'avviso dovrebbe risolversi nel tempo e si può ignorare l'avviso.

  2. Se l'avviso persiste e aumenta di severità, visualizzare un grafico delle dimensioni della coda. Se il numero aumenta costantemente nel corso di ore o giorni, il carico di audit ha probabilmente superato la capacità di audit del sistema.

  3. Ridurre il tasso di operazioni del client o diminuire il numero di messaggi di controllo registrati modificando il livello di controllo per le scritture del client e le letture del client su Error (errore) o Off (CONFIGURATION Monitoring Audit and syslog server).

Rilevata attività di bilanciamento del carico CLB legacy

Alcuni client potrebbero connettersi al servizio di bilanciamento del carico CLB obsoleto utilizzando il certificato API S3 e Swift predefinito.

  1. Per semplificare gli aggiornamenti futuri, installare un certificato S3 e Swift API personalizzato nella scheda Global della pagina Certificates. Quindi, assicurarsi che tutti i client S3 o Swift che si connettono alla CLB legacy abbiano il nuovo certificato.

  2. Creare uno o più endpoint del bilanciamento del carico. Quindi, indirizzare tutti i client S3 e Swift esistenti a questi endpoint. Contattare il supporto tecnico se è necessario rimappare la porta del client.

Altre attività potrebbero attivare questo avviso, incluse le scansioni delle porte. Per determinare se il servizio CLB obsoleto è attualmente in uso, consultare la storagegrid_private_clb_http_connection_established_successful Metrica Prometheus.

Se necessario, disattivare o disattivare questa regola di avviso se il servizio CLB non è più in uso.

I registri vengono aggiunti alla coda su disco

Il nodo non può inoltrare i log al server syslog esterno e la coda su disco si sta riempiendo.

  1. Da Grid Manager, andare a CONFIGURAZIONE monitoraggio Audit e server syslog.

  2. Selezionare Modifica server syslog esterno.

  3. Avanzare attraverso la Configurazione guidata fino a quando non si è in grado di selezionare Invia messaggi di prova.

  4. Selezionare Send test messages (Invia messaggi di test) per determinare perché i log non possono essere inoltrati al server syslog esterno.

  5. Risolvere eventuali problemi segnalati.

Bassa capacità del disco di log di audit

Lo spazio disponibile per i registri di controllo è insufficiente.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo e se lo spazio su disco diventa nuovamente disponibile.

  2. Contattare il supporto tecnico se lo spazio disponibile continua a diminuire.

Memoria del nodo a bassa disponibilità

La quantità di RAM disponibile su un nodo è bassa.

Una RAM disponibile bassa potrebbe indicare un cambiamento nel carico di lavoro o una perdita di memoria con uno o più nodi.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo.

  2. Se la memoria disponibile scende al di sotto della soglia di allarme principale, contattare il supporto tecnico.

Spazio libero ridotto per il pool di storage

La quantità di spazio disponibile per memorizzare i dati degli oggetti in un pool di storage è bassa.

  1. Selezionare ILM > Storage Pools.

  2. Selezionare il pool di storage elencato nell'avviso e selezionare Visualizza dettagli.

  3. Determinare dove è richiesta ulteriore capacità di storage. È possibile aggiungere nodi di storage a ciascun sito del pool di storage o aggiungere volumi di storage (LUN) a uno o più nodi di storage esistenti.

  4. Eseguire una procedura di espansione per aumentare la capacità dello storage.

Memoria del nodo installata insufficiente

La quantità di memoria installata su un nodo è bassa.

Aumentare la quantità di RAM disponibile per la macchina virtuale o l'host Linux. Controllare il valore di soglia dell'avviso principale per determinare il requisito minimo predefinito per un nodo StorageGRID. Consultare le istruzioni per l'installazione della piattaforma:

Storage dei metadati basso

Lo spazio disponibile per memorizzare i metadati degli oggetti è basso.

Allarme critico

  1. Interrompere l'acquisizione degli oggetti.

  2. Aggiungere immediatamente nodi di storage in una procedura di espansione.

Allerta importante

Aggiungere immediatamente nodi di storage in una procedura di espansione.

Avviso minore

  1. Monitorare la velocità di utilizzo dello spazio di metadati dell'oggetto. Selezionare NODES Storage Node Storage e visualizzare il grafico Storage Used - Object Metadata.

  2. Aggiungere nodi di storage in un procedura di espansione il più presto possibile.

Una volta aggiunti nuovi nodi di storage, il sistema ribilancia automaticamente i metadati degli oggetti in tutti i nodi di storage e l'allarme viene cancellato.

Consultare le istruzioni per l'avviso di storage metadati in esaurimento in Risolvere i problemi relativi ai metadati.

Capacità disco di metriche ridotte

Lo spazio disponibile per il database delle metriche è basso.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo e se lo spazio su disco diventa nuovamente disponibile.

  2. Contattare il supporto tecnico se lo spazio disponibile continua a diminuire.

Storage dei dati a oggetti basso

Lo spazio disponibile per memorizzare i dati degli oggetti è basso.

Eseguire una procedura di espansione. È possibile aggiungere volumi di storage (LUN) ai nodi di storage esistenti oppure aggiungere nuovi nodi di storage.

Override del watermark di sola lettura bassa

L'override filigrana di sola lettura soft del volume di storage è inferiore al watermark ottimizzato minimo per un nodo di storage.

Per informazioni su come risolvere questo avviso, visitare il sito Web all'indirizzo Risolvere i problemi relativi agli avvisi di override del watermark di sola lettura bassa.

Bassa capacità del disco root

Lo spazio disponibile per il disco root è insufficiente.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo e se lo spazio su disco diventa nuovamente disponibile.

  2. Contattare il supporto tecnico se lo spazio disponibile continua a diminuire.

Bassa capacità dei dati di sistema

Lo spazio disponibile per i dati di sistema StorageGRID su /var/local il file system è in esaurimento.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo e se lo spazio su disco diventa nuovamente disponibile.

  2. Contattare il supporto tecnico se lo spazio disponibile continua a diminuire.

Spazio libero nella directory tmp basso

Lo spazio disponibile nella directory /tmp è insufficiente.

  1. Monitorare questo avviso per verificare se il problema si risolve da solo e se lo spazio su disco diventa nuovamente disponibile.

  2. Contattare il supporto tecnico se lo spazio disponibile continua a diminuire.

Errore di connettività di rete del nodo

Si sono verificati errori durante il trasferimento dei dati tra nodi.

Gli errori di connettività di rete potrebbero essere stati corretti senza l'intervento manuale. Contattare il supporto tecnico se gli errori non sono chiari.

Consultare le istruzioni relative all'allarme NRER (Network Receive Error) in Risolvere i problemi di rete, hardware e piattaforma.

Errore frame ricezione rete nodo

Un'elevata percentuale di frame di rete ricevuti da un nodo presenta errori.

Questo avviso potrebbe indicare un problema hardware, ad esempio un cavo difettoso o un ricetrasmettitore guasto su entrambe le estremità della connessione Ethernet.

  1. Se si utilizza un'appliance, provare a sostituire ogni ricetrasmettitore e cavo SFP+ o SFP28, uno alla volta, per verificare se l'avviso scompare.

  2. Se l'avviso persiste, contattare il supporto tecnico.

Nodo non sincronizzato con il server NTP

L'ora del nodo non è sincronizzata con il server NTP (Network Time Protocol).

  1. Verificare di aver specificato almeno quattro server NTP esterni, ciascuno dei quali fornisce un riferimento di livello 3 o superiore.

  2. Verificare che tutti i server NTP funzionino correttamente.

  3. Verificare le connessioni ai server NTP. Assicurarsi che non siano bloccati da un firewall.

Nodo non bloccato con server NTP

Il nodo non è bloccato su un server NTP (Network Time Protocol).

  1. Verificare di aver specificato almeno quattro server NTP esterni, ciascuno dei quali fornisce un riferimento di livello 3 o superiore.

  2. Verificare che tutti i server NTP funzionino correttamente.

  3. Verificare le connessioni ai server NTP. Assicurarsi che non siano bloccati da un firewall.

Rete nodo non appliance non in funzione

Uno o più dispositivi di rete sono disconnessi o non attivi. Questo avviso indica che un'interfaccia di rete (eth) per un nodo installato su una macchina virtuale o su un host Linux non è accessibile.

Contattare il supporto tecnico.

Controllo dell'esistenza dell'oggetto non riuscito

Il processo di controllo dell'esistenza dell'oggetto non è riuscito.

  1. Selezionare MAINTENANCE object existence check.

  2. Annotare il messaggio di errore. Eseguire le azioni correttive appropriate:

    Impossibile avviare, connessione persa, errore sconosciuto

    1. Assicurarsi che i nodi di storage e i volumi inclusi nel processo siano online e disponibili.

    2. Assicurarsi che non vi siano errori di servizio o di volume sui nodi di storage. Se un servizio non è in esecuzione, avviare o riavviare il servizio. Vedere istruzioni per il ripristino e la manutenzione.

    3. Assicurarsi che il controllo di coerenza selezionato possa essere soddisfatto.

    4. Dopo aver risolto eventuali problemi, selezionare Riprova. Il lavoro riprenderà dall'ultimo stato valido.

      Errore critico dello storage nel volume

    5. Ripristinare il volume guasto. Vedere istruzioni per il ripristino e la manutenzione.

    6. Selezionare Riprova.

    7. Al termine del lavoro, creare un altro lavoro per i volumi rimanenti sul nodo per verificare la presenza di errori aggiuntivi.

  3. Se non riesci a risolvere i problemi, contatta il supporto tecnico.

Controllo dell'esistenza dell'oggetto bloccato

Il lavoro di verifica dell'esistenza dell'oggetto si è bloccato.

Impossibile continuare il lavoro di verifica dell'esistenza dell'oggetto. Uno o più nodi di storage o volumi inclusi nel processo non sono in linea o non rispondono, oppure il controllo di coerenza selezionato non può più essere soddisfatto perché troppi nodi sono inattivi o non disponibili.

  1. Assicurarsi che tutti i nodi e i volumi di storage controllati siano online e disponibili (selezionare NODI).

  2. Assicurarsi che siano disponibili e in linea un numero sufficiente di nodi di storage per consentire al nodo coordinatore corrente di leggere i metadati degli oggetti utilizzando il controllo di coerenza selezionato. Se necessario, avviare o riavviare un servizio. Vedere istruzioni per il ripristino e la manutenzione.

    Quando si risolvono i passi 1 e 2, il lavoro viene avviato automaticamente da dove è stato interrotto.

  3. Se il controllo di coerenza selezionato non può essere soddisfatto, annullare il lavoro e avviare un altro lavoro utilizzando un controllo di coerenza inferiore.

  4. Se non riesci a risolvere i problemi, contatta il supporto tecnico.

Oggetti persi

Uno o più oggetti sono stati persi dalla griglia.

Questo avviso potrebbe indicare che i dati sono stati persi in modo permanente e non sono recuperabili.

  1. Esaminare immediatamente questo avviso. Potrebbe essere necessario intervenire per evitare ulteriori perdite di dati. Inoltre, se si esegue un'azione rapida, potrebbe essere possibile ripristinare un oggetto perso.

  2. Una volta risolto il problema sottostante, azzerare il contatore:

    1. Selezionare SUPPORT > Tools > Grid topology.

    2. Per il nodo di storage che ha generato l'avviso, selezionare Site Grid Node LDR Data Store Configuration Main.

    3. Selezionare Reset Lost Objects Count e fare clic su Apply Changes (Applica modifiche).

Servizi della piattaforma non disponibili

In un sito sono in esecuzione o disponibili troppi nodi di storage con il servizio RSM.

Assicurarsi che la maggior parte dei nodi di storage che dispongono del servizio RSM nel sito interessato sia in esecuzione e in stato non di errore.

Consultare “Troubleshooting platform Services” in Istruzioni per l'amministrazione di StorageGRID.

S3 HA POSTO la dimensione dell'oggetto troppo grande

Un client S3 sta tentando di eseguire un'operazione PUT Object che supera i limiti di dimensione S3.

  1. Utilizzare l'ID tenant mostrato nei dettagli dell'avviso per identificare l'account tenant.

  2. Accedere a Support Tools Logs e raccogliere i registri delle applicazioni per il nodo di storage mostrato nei dettagli dell'avviso. Specificare un periodo di tempo di 15 minuti prima e dopo l'ora dell'avviso.

  3. Estrarre l'archivio scaricato e accedere alla posizione di bycast.log (/GID<grid_id>_<time_stamp>/<site_node>/<time_stamp>/grid/bycast.log).

  4. Cercare il contenuto di bycast.log per "method=PUT" E identificare l'indirizzo IP del client S3 osservando il clientIP campo.

  5. Informare tutti gli utenti client che la dimensione massima DELL'oggetto PUT è 5 GiB.

  6. USA caricamenti multiparte per oggetti di dimensioni superiori a 5 GiB.

Collegamento dell'appliance di servizi alla porta di rete dell'amministratore 1

La porta Admin Network 1 dell'appliance è inattiva o disconnessa.

  1. Controllare il cavo e la connessione fisica alla porta di rete amministrativa 1.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

Collegamento dell'appliance di servizi su Admin Network (o Client Network)

L'interfaccia dell'appliance alla rete di amministrazione (eth1) o alla rete client (eth2) è inattiva o disconnessa.

  1. Controllare i cavi, gli SFP e le connessioni fisiche alla rete StorageGRID.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

Collegamento dell'appliance di servizi alla porta di rete 1, 2, 3 o 4

La porta di rete 1, 2, 3 o 4 dell'appliance è inattiva o scollegata.

  1. Controllare i cavi, gli SFP e le connessioni fisiche alla rete StorageGRID.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

Connettività dello storage dell'appliance di servizi degradata

Uno dei due SSD di un'appliance di servizi si è guastato o non è sincronizzato con l'altro.

La funzionalità dell'appliance non viene influenzata, ma il problema deve essere risolto immediatamente. Se entrambi i dischi si guastano, l'apparecchio non funzionerà più.

  1. Da Grid Manager, selezionare NODES Services appliance, quindi selezionare la scheda hardware.

  2. Esaminare il messaggio nel campo Storage RAID Mode (modalità RAID storage).

  3. Se il messaggio indica lo stato di avanzamento di un'operazione di risincronizzazione, attendere il completamento dell'operazione, quindi confermare che l'avviso è stato risolto. Un messaggio di risincronizzazione indica che l'unità SSD è stata sostituita di recente o che viene risincronizzata per un altro motivo.

  4. Se il messaggio indica che uno degli SSD è guasto, sostituire il disco guasto non appena possibile.

    Per istruzioni su come sostituire un disco in un'appliance di servizi, consultare la guida all'installazione e alla manutenzione delle appliance SG100 e SG1000.

Collegamento dell'appliance di storage alla porta di rete dell'amministratore 1

La porta Admin Network 1 dell'appliance è inattiva o disconnessa.

  1. Controllare il cavo e la connessione fisica alla porta di rete amministrativa 1.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

Collegamento dell'appliance di storage su Admin Network (o Client Network)

L'interfaccia dell'appliance alla rete di amministrazione (eth1) o alla rete client (eth2) è inattiva o disconnessa.

  1. Controllare i cavi, gli SFP e le connessioni fisiche alla rete StorageGRID.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

Collegamento dell'appliance di storage alla porta di rete 1, 2, 3 o 4

La porta di rete 1, 2, 3 o 4 dell'appliance è inattiva o scollegata.

  1. Controllare i cavi, gli SFP e le connessioni fisiche alla rete StorageGRID.

  2. Risolvere eventuali problemi di connessione. Consultare le istruzioni di installazione e manutenzione dell'hardware dell'appliance.

  3. Se questa porta viene disconnessa in base allo scopo, disattivare questa regola. In Grid Manager, selezionare ALERTS Rules, selezionare la regola e fare clic su Edit rule (Modifica regola). Quindi, deselezionare la casella di controllo Enabled.

La connettività dello storage dell'appliance di storage è degradata

Si è verificato un problema con una o più connessioni tra il controller di calcolo e il controller dello storage.

  1. Controllare le spie degli indicatori di porta dall'apparecchio.

  2. Se le spie di una porta sono spente, verificare che il cavo sia collegato correttamente. Se necessario, sostituire il cavo.

  3. Attendere fino a cinque minuti.

    Nota: se è necessario sostituire un secondo cavo, non scollegarlo per almeno 5 minuti. In caso contrario, il volume root potrebbe diventare di sola lettura, il che richiede un riavvio hardware.

  4. Da Grid Manager, selezionare NODES. Quindi, selezionare la scheda hardware del nodo che ha riscontrato il problema. Verificare che la condizione di avviso sia stata risolta.

Dispositivo di storage inaccessibile

Impossibile accedere a un dispositivo di storage.

Questo avviso indica che non è possibile montare o accedere a un volume a causa di un problema con un dispositivo di storage sottostante.

  1. Controllare lo stato di tutti i dispositivi di storage utilizzati per il nodo:

    • Se il nodo è installato su una macchina virtuale o su un host Linux, seguire le istruzioni del sistema operativo per eseguire la diagnostica hardware o eseguire un controllo del file system.

    • Se il nodo è installato su un'appliance SG100, SG1000 o SG6000, utilizzare BMC.

    • Se il nodo è installato su un'appliance SG5600 o SG5700, utilizzare Gestione di sistema di SANtricity.

  2. Se necessario, sostituire il componente. Consultare le istruzioni per l'apparecchio:

Utilizzo elevato della quota del tenant

Viene utilizzata una percentuale elevata di spazio di quota tenant. Se un tenant supera la quota, i nuovi ingest vengono rifiutati.

Nota: questa regola di avviso è disattivata per impostazione predefinita perché potrebbe generare numerose notifiche.

  1. In Grid Manager, selezionare TENANT.

  2. Ordinare la tabella in base a quota Utilization.

  3. Selezionare un tenant il cui utilizzo della quota è prossimo al 100%.

  4. Eseguire una o entrambe le operazioni seguenti:

    • Selezionare Edit (Modifica) per aumentare la quota di storage per il tenant.

    • Avvisare il tenant che l'utilizzo delle quote è elevato.

Impossibile comunicare con il nodo

Uno o più servizi non rispondono o non è possibile raggiungere il nodo.

Questo avviso indica che un nodo è disconnesso per un motivo sconosciuto. Ad esempio, un servizio sul nodo potrebbe essere stato arrestato o il nodo potrebbe aver perso la connessione di rete a causa di un'interruzione dell'alimentazione o di un'interruzione imprevista.

Monitorare questo avviso per verificare se il problema si risolve da solo. Se il problema persiste:

  1. Determinare se è presente un altro avviso che interessa questo nodo. Questo avviso potrebbe essere risolto quando si risolve l'altro avviso.

  2. Verificare che tutti i servizi su questo nodo siano in esecuzione. Se un servizio viene arrestato, provare ad avviarlo. Vedere istruzioni per il ripristino e la manutenzione.

  3. Assicurarsi che l'host del nodo sia acceso. In caso contrario, avviare l'host.

    Nota: se più host sono spenti, consultare la istruzioni per il ripristino e la manutenzione.

  4. Determinare se si è verificato un problema di connettività di rete tra questo nodo e il nodo di amministrazione.

  5. Se non si riesce a risolvere l'avviso, contattare il supporto tecnico.

Riavvio del nodo imprevisto

Un nodo si è riavviato inaspettatamente nelle ultime 24 ore.

  1. Monitorare questo avviso. L'avviso viene cancellato dopo 24 ore. Tuttavia, se il nodo si riavvia di nuovo inaspettatamente, questo avviso viene attivato di nuovo.

  2. Se non si riesce a risolvere l'avviso, potrebbe esserci un guasto hardware. Contattare il supporto tecnico.

Rilevato oggetto corrotto non identificato

È stato trovato un file nello storage a oggetti replicato che non è stato possibile identificare come oggetto replicato.

  1. Determinare se vi sono problemi con lo storage sottostante su un nodo di storage. Ad esempio, eseguire la diagnostica hardware o eseguire un controllo del file system.

  2. Dopo aver risolto eventuali problemi di storage, eseguire il controllo dell'esistenza dell'oggetto Per determinare se le copie replicate, come definito dalla policy ILM, sono mancanti.

  3. Monitorare questo avviso. L'avviso verrà visualizzato dopo 24 ore, ma verrà nuovamente attivato se il problema non è stato risolto.

  4. Se non si riesce a risolvere l'avviso, contattare il supporto tecnico.