Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Risoluzione dei problemi di un sistema StorageGRID

Se si verifica un problema durante l'utilizzo di un sistema StorageGRID , fare riferimento ai suggerimenti e alle linee guida in questa sezione per individuare e risolvere il problema.

Spesso è possibile risolvere i problemi autonomamente; tuttavia, potrebbe essere necessario segnalare alcuni problemi al supporto tecnico.

Definisci il problema

Il primo passo per risolvere un problema è definirlo chiaramente.

Questa tabella fornisce esempi dei tipi di informazioni che potresti raccogliere per definire un problema:

Domanda Esempio di risposta

Cosa fa o non fa il sistema StorageGRID ? Quali sono i suoi sintomi?

Le applicazioni client segnalano che gli oggetti non possono essere acquisiti in StorageGRID.

Quando è iniziato il problema?

L'acquisizione di oggetti è stata negata per la prima volta intorno alle 14:50 dell'8 gennaio 2020.

Come hai notato per la prima volta il problema?

Notificato dall'applicazione client. Ho ricevuto anche notifiche di avviso via email.

Il problema si verifica regolarmente o solo a volte?

Il problema persiste.

Se il problema si verifica regolarmente, quali passaggi lo causano?

Il problema si verifica ogni volta che un client tenta di acquisire un oggetto.

Se il problema si verifica in modo intermittente, quando si verifica? Annota gli orari di ogni incidente di cui sei a conoscenza.

Il problema non è intermittente.

Hai già riscontrato questo problema? Con quale frequenza hai avuto questo problema in passato?

È la prima volta che vedo questo problema.

Valutare il rischio e l'impatto sul sistema

Dopo aver definito il problema, valutarne il rischio e l'impatto sul sistema StorageGRID . Ad esempio, la presenza di avvisi critici non significa necessariamente che il sistema non stia erogando servizi essenziali.

Questa tabella riassume l'impatto che il problema di esempio sta avendo sulle operazioni del sistema:

Domanda Esempio di risposta

Il sistema StorageGRID può acquisire contenuti?

NO.

Le applicazioni client possono recuperare contenuti?

Alcuni oggetti possono essere recuperati, altri no.

I dati sono a rischio?

NO.

La capacità di svolgere attività imprenditoriale è gravemente compromessa?

Sì, perché le applicazioni client non possono archiviare oggetti nel sistema StorageGRID e i dati non possono essere recuperati in modo coerente.

Raccogliere dati

Dopo aver definito il problema e valutato il rischio e l'impatto, raccogliere i dati per l'analisi. Il tipo di dati più utile da raccogliere dipende dalla natura del problema.

Tipologia di dati da raccogliere Perché raccogliere questi dati Istruzioni

Crea una cronologia delle modifiche recenti

Le modifiche apportate al sistema StorageGRID , alla sua configurazione o al suo ambiente possono causare nuovi comportamenti.

Avvisi di revisione

Gli avvisi possono aiutarti a determinare rapidamente la causa principale di un problema, fornendo indizi importanti sui problemi sottostanti che potrebbero esserne la causa.

Esamina l'elenco degli avvisi correnti per verificare se StorageGRID ha identificato la causa principale di un problema.

Per ulteriori informazioni, consultare gli avvisi attivati in passato.

Monitorare gli eventi

Gli eventi includono qualsiasi errore di sistema o evento di guasto per un nodo, compresi errori come gli errori di rete. Monitora gli eventi per saperne di più sui problemi o per trovare aiuto nella risoluzione dei problemi.

Identificare le tendenze utilizzando grafici e report di testo

Le tendenze possono fornire indizi preziosi su quando si sono manifestati i primi problemi e possono aiutarti a capire con quale rapidità le cose stanno cambiando.

Stabilire le linee di base

Raccogliere informazioni sui livelli normali dei vari valori operativi. Questi valori di base e le deviazioni da essi possono fornire indizi preziosi.

Eseguire test di ingestione e recupero

Per risolvere i problemi di prestazioni relativi all'acquisizione e al recupero, utilizzare una workstation per archiviare e recuperare gli oggetti. Confronta i risultati con quelli ottenuti utilizzando l'applicazione client.

Rivedi i messaggi di audit

Esaminare i messaggi di controllo per seguire in dettaglio le operazioni StorageGRID . I dettagli nei messaggi di controllo possono essere utili per risolvere molti tipi di problemi, compresi quelli relativi alle prestazioni.

Controllare le posizioni degli oggetti e l'integrità dell'archiviazione

Se riscontri problemi di stoccaggio, verifica che gli oggetti siano posizionati dove previsto. Verificare l'integrità dei dati degli oggetti su un nodo di archiviazione.

Raccogliere dati per il supporto tecnico

L'assistenza tecnica potrebbe chiederti di raccogliere dati o di esaminare informazioni specifiche per aiutarti a risolvere i problemi.

Crea una cronologia delle modifiche recenti

Quando si verifica un problema, è opportuno considerare cosa è cambiato di recente e quando si sono verificati tali cambiamenti.

  • Le modifiche apportate al sistema StorageGRID , alla sua configurazione o al suo ambiente possono causare nuovi comportamenti.

  • Una cronologia delle modifiche può aiutarti a identificare quali modifiche potrebbero essere responsabili di un problema e in che modo ciascuna modifica potrebbe averne influenzato lo sviluppo.

Crea una tabella delle modifiche recenti apportate al tuo sistema che includa informazioni su quando si è verificata ciascuna modifica e tutti i dettagli rilevanti sulla modifica, come informazioni su cos'altro stava accadendo mentre la modifica era in corso:

Tempo di cambiamento Tipo di modifica Dettagli

Per esempio:

  • Quando hai iniziato il ripristino del nodo?

  • Quando è stato completato l'aggiornamento del software?

  • Hai interrotto il processo?

Quello che è successo? Che cosa hai fatto?

Documentare tutti i dettagli rilevanti relativi alla modifica. Per esempio:

  • Dettagli delle modifiche alla rete.

  • Quale hotfix è stato installato.

  • Come sono cambiati i carichi di lavoro dei clienti.

Assicurati di annotare se si verificano più modifiche contemporaneamente. Ad esempio, questa modifica è stata apportata mentre era in corso un aggiornamento?

Esempi di cambiamenti significativi recenti

Ecco alcuni esempi di cambiamenti potenzialmente significativi:

  • Il sistema StorageGRID è stato installato, ampliato o ripristinato di recente?

  • Il sistema è stato aggiornato di recente? È stato applicato un hotfix?

  • Di recente è stato riparato o cambiato qualche componente hardware?

  • La politica ILM è stata aggiornata?

  • Il carico di lavoro del cliente è cambiato?

  • L'applicazione client o il suo comportamento sono cambiati?

  • Hai modificato i bilanciatori del carico oppure aggiunto o rimosso un gruppo ad alta disponibilità di nodi amministrativi o nodi gateway?

  • Sono stati avviati dei compiti che potrebbero richiedere molto tempo per essere completati? Alcuni esempi:

    • Ripristino di un nodo di archiviazione non riuscito

    • Dismissione del nodo di archiviazione

  • Sono state apportate modifiche all'autenticazione utente, ad esempio l'aggiunta di un tenant o la modifica della configurazione LDAP?

  • È in corso la migrazione dei dati?

  • I servizi della piattaforma sono stati abilitati o modificati di recente?

  • La conformità è stata abilitata di recente?

  • Sono stati aggiunti o rimossi pool di archiviazione cloud?

  • Sono state apportate modifiche alla compressione o alla crittografia dell'archiviazione?

  • Ci sono state modifiche all'infrastruttura di rete? Ad esempio, VLAN, router o DNS.

  • Sono state apportate modifiche alle fonti NTP?

  • Sono state apportate modifiche alle interfacce Grid, Admin o Client Network?

  • Sono state apportate altre modifiche al sistema StorageGRID o al suo ambiente?

Stabilire le linee di base

È possibile stabilire i valori di base per il sistema registrando i livelli normali di vari valori operativi. In futuro, sarà possibile confrontare i valori attuali con questi valori di base per individuare e risolvere i valori anomali.

Proprietà Valore Come ottenere

Consumo medio di spazio di archiviazione

GB consumati/giorno

Percentuale consumata/giorno

Vai al Grid Manager. Nella pagina Nodi, seleziona l'intera griglia o un sito e vai alla scheda Archiviazione.

Nel grafico Spazio di archiviazione utilizzato - Dati oggetto, individuare un periodo in cui la linea è abbastanza stabile. Posiziona il cursore sul grafico per stimare la quantità di spazio di archiviazione consumata ogni giorno

È possibile raccogliere queste informazioni per l'intero sistema o per un data center specifico.

Consumo medio di metadati

GB consumati/giorno

Percentuale consumata/giorno

Vai al Grid Manager. Nella pagina Nodi, seleziona l'intera griglia o un sito e vai alla scheda Archiviazione.

Nel grafico Spazio di archiviazione utilizzato - Metadati oggetto, individuare un periodo in cui la linea è abbastanza stabile. Posiziona il cursore sul grafico per stimare la quantità di spazio di archiviazione dei metadati consumata ogni giorno

È possibile raccogliere queste informazioni per l'intero sistema o per un data center specifico.

Tasso di operazioni S3/Swift

Operazioni/secondo

Nella dashboard di Grid Manager, seleziona Prestazioni > Operazioni S3 oppure Prestazioni > Operazioni Swift.

Per visualizzare le velocità e i conteggi di acquisizione e recupero per un sito o un nodo specifico, selezionare NODI > sito o Nodo di archiviazione > Oggetti. Posiziona il cursore sul grafico Ingest and Retrieve per S3.

Operazioni S3/Swift non riuscite

Operazioni

Selezionare SUPPORTO > Strumenti > Topologia griglia. Nella scheda Panoramica nella sezione Operazioni API, visualizza il valore per Operazioni S3 - Non riuscite o Operazioni Swift - Non riuscite.

Tasso di valutazione ILM

Oggetti/secondo

Dalla pagina Nodi, seleziona grid > ILM.

Nel grafico della coda ILM, trova un periodo in cui la linea è abbastanza stabile. Posiziona il cursore sul grafico per stimare un valore di base per il tasso di valutazione del tuo sistema.

Frequenza di scansione ILM

Oggetti/secondo

Selezionare NODI > griglia > ILM.

Nel grafico della coda ILM, trova un periodo in cui la linea è abbastanza stabile. Posiziona il cursore sul grafico per stimare un valore di base per la velocità di scansione del tuo sistema.

Oggetti in coda dalle operazioni client

Oggetti/secondo

Selezionare NODI > griglia > ILM.

Nel grafico della coda ILM, trova un periodo in cui la linea è abbastanza stabile. Posiziona il cursore sul grafico per stimare un valore di base per gli Oggetti in coda (dalle operazioni client) per il tuo sistema.

Latenza media delle query

Millisecondi

Selezionare NODI > Nodo di archiviazione > Oggetti. Nella tabella Query, visualizza il valore per Latenza media.

Analizzare i dati

Utilizza le informazioni raccolte per determinare la causa del problema e le possibili soluzioni.

L'analisi dipende dal problema, ma in generale:

  • Individua i punti di errore e i colli di bottiglia utilizzando gli avvisi.

  • Ricostruire la cronologia dei problemi utilizzando la cronologia degli avvisi e i grafici.

  • Utilizzare i grafici per individuare anomalie e confrontare la situazione problematica con il normale funzionamento.

Lista di controllo delle informazioni di escalation

Se non riesci a risolvere il problema da solo, contatta l'assistenza tecnica. Prima di contattare l'assistenza tecnica, raccogliere le informazioni elencate nella tabella seguente per facilitare la risoluzione dei problemi.

segno di spunta Articolo Note

Enunciato del problema

Quali sono i sintomi del problema? Quando è iniziato il problema? Si verifica in modo costante o intermittente? Se si verifica in modo intermittente, in quali momenti?

Valutazione dell'impatto

Qual è la gravità del problema? Qual è l'impatto sull'applicazione client?

  • Il client si è già connesso correttamente in precedenza?

  • Il client può acquisire, recuperare ed eliminare dati?

ID di sistema StorageGRID

Selezionare MANUTENZIONE > Sistema > Licenza. L'ID del sistema StorageGRID viene visualizzato come parte della licenza corrente.

Versione del software

Nella parte superiore di Grid Manager, seleziona l'icona della guida e seleziona Informazioni per visualizzare la versione StorageGRID .

Personalizzazione

Riassumi la configurazione del tuo sistema StorageGRID . Ad esempio, elenca quanto segue:

  • La griglia utilizza la compressione dell'archiviazione, la crittografia dell'archiviazione o la conformità?

  • ILM realizza oggetti replicati o con codice di cancellazione? ILM garantisce la ridondanza del sito? Le regole ILM utilizzano i comportamenti di ingestione Balanced, Strict o Dual Commit?

File di registro e dati di sistema

Raccogli file di registro e dati di sistema per il tuo sistema. Selezionare SUPPORTO > Strumenti > Registri.

È possibile raccogliere i log per l'intera griglia o per nodi selezionati.

Se si raccolgono i log solo per nodi selezionati, assicurarsi di includere almeno un nodo di archiviazione che disponga del servizio ADC. (I primi tre nodi di archiviazione in un sito includono il servizio ADC.)

Informazioni di base

Raccogliere informazioni di base sulle operazioni di acquisizione, sulle operazioni di recupero e sul consumo di spazio di archiviazione.

Cronologia delle modifiche recenti

Crea una cronologia che riepiloghi tutte le modifiche recenti apportate al sistema o al suo ambiente.

Cronologia degli sforzi per diagnosticare il problema

Se hai adottato misure per diagnosticare o risolvere autonomamente il problema, assicurati di annotare i passaggi eseguiti e il risultato.