Risoluzione dei problemi NVMe-oF con storage ONTAP per Linux Host Utilities
Risolvi i problemi di errore NVMe-oF per gli host Oracle Linux, RHEL, Rocky Linux e SUSE Linux Enterprise Server con storage ONTAP .
Prima di iniziare la risoluzione dei problemi, verificare di eseguire una configurazione conforme a "Tool di matrice di interoperabilità" specifiche e quindi procedere con i passaggi successivi per risolvere eventuali problemi lato host.
|
|
Le istruzioni per la risoluzione dei problemi non sono applicabili agli host AIX, ESXi, Proxmox e Windows. |
Attiva la registrazione dettagliata
In caso di problemi di configurazione, la registrazione dettagliata può fornire informazioni essenziali per la risoluzione dei problemi.
Imposta la registrazione dettagliata per LPFC o Qlogic (Qla2xxx).
Impostare il driver lpfc per NVMe/FC.
-
Impostare
lpfc_log_verboseImpostazione del driver su uno dei seguenti valori per registrare gli eventi NVMe/FC.#define LOG_NVME 0x00100000 /* NVME general events. */ #define LOG_NVME_DISC 0x00200000 /* NVME Discovery/Connect events. */ #define LOG_NVME_ABTS 0x00400000 /* NVME ABTS events. */ #define LOG_NVME_IOERR 0x00800000 /* NVME IO Error events. */
-
Dopo aver impostato i valori, eseguire
dracut-fcomandare e riavviare l'host. -
Verificare le impostazioni:
# cat /etc/modprobe.d/lpfc.conf options lpfc lpfc_log_verbose=0xf00083 # cat /sys/module/lpfc/parameters/lpfc_log_verbose 15728771
Non esiste una registrazione specifica di qla2xxx per NVMe/FC simile a quella per lpfc driver. Impostare invece il livello di registrazione generale di qla2xxx.
-
Aggiungere il
ql2xextended_error_logging=0x1e400000al corrispondentemodprobe qla2xxx conffile. -
Eseguire
dracut -fe riavviare l'host. -
Dopo il riavvio, verificare che la registrazione dettagliata sia stata abilitata:
# cat /etc/modprobe.d/qla2xxx.confDovresti vedere un output simile al seguente esempio:
options qla2xxx ql2xnvmeenable=1 ql2xextended_error_logging=0x1e400000 # cat /sys/module/qla2xxx/parameters/ql2xextended_error_logging 507510784
Errori comuni di "nvme-cli" e soluzioni alternative
Gli errori visualizzati da nvme-cli durante nvme discover, nvme connect, o. nvme connect-all le operazioni e le soluzioni alternative sono illustrate nella seguente tabella:
| Messaggio di errore | Causa probabile | Soluzione alternativa |
|---|---|---|
|
Sintassi errata |
Verificare di utilizzare la sintassi corretta per |
|
Questo può essere causato da diversi problemi, ad esempio, fornire argomenti errati ai comandi NVMe è una delle cause più comuni. |
|
|
Generalmente osservato quando |
Verificare che l'esatto |
|
Osservato quando le associazioni del controller o l'operazione specificata sono già state create o in fase di creazione. Ciò potrebbe avvenire nell'ambito degli script di connessione automatica installati in precedenza. |
Nessuno. Provare a eseguire |
Quando contattare il supporto tecnico
Se i problemi persistono, raccogli i seguenti file e output dei comandi e contatta "Supporto NetApp" per un ulteriore triage:
cat /sys/class/scsi_host/host*/nvme_info
/var/log/messages
dmesg
nvme discover output as in:
nvme discover --transport=fc --traddr=nn-0x200a00a098c80f09:pn-0x200b00a098c80f09 --host-traddr=nn-0x20000090fae0ec9d:pn-0x10000090fae0ec9d
nvme list
nvme list-subsys /dev/nvmeXnY