Solución de problemas de NVMe-oF con almacenamiento ONTAP para utilidades de host de Linux
Solucione fallas de NVMe-oF para hosts Oracle Linux, RHEL, Rocky Linux y SUSE Linux Enterprise Server con almacenamiento ONTAP .
Antes de comenzar a solucionar problemas, verifique que esté ejecutando una configuración que cumpla con las "Herramienta de matriz de interoperabilidad" especificaciones y luego proceda con los siguientes pasos para depurar cualquier problema del lado del host.
|
|
Las instrucciones de solución de problemas no se aplican a los hosts AIX, ESXi, Proxmox y Windows. |
Active el registro detallado
Si tiene algún problema con la configuración, el registro detallado puede proporcionar información esencial para la solución de problemas.
Establecer el registro detallado para LPFC o Qlogic (Qla2xxx).
Establezca el controlador lpfc para NVMe/FC.
-
Ajuste la
lpfc_log_verboseConfiguración del controlador en cualquiera de los siguientes valores para registrar los eventos de NVMe/FC.#define LOG_NVME 0x00100000 /* NVME general events. */ #define LOG_NVME_DISC 0x00200000 /* NVME Discovery/Connect events. */ #define LOG_NVME_ABTS 0x00400000 /* NVME ABTS events. */ #define LOG_NVME_IOERR 0x00800000 /* NVME IO Error events. */
-
Después de ajustar los valores, ejecute la
dracut-fcommand y reinicie el host. -
Verificar la configuración:
# cat /etc/modprobe.d/lpfc.conf options lpfc lpfc_log_verbose=0xf00083 # cat /sys/module/lpfc/parameters/lpfc_log_verbose 15728771
No hay ningún registro qla2xxx específico para NVMe/FC similar al para el lpfc controlador. En su lugar, defina el nivel de registro general de qla2xxx.
-
Añada el
ql2xextended_error_logging=0x1e400000valor para el correspondientemodprobe qla2xxx confarchivo. -
Ejecute el
dracut -freinicie el host. -
Después del reinicio, compruebe que el registro detallado se ha habilitado:
# cat /etc/modprobe.d/qla2xxx.confDebería ver un resultado similar al siguiente ejemplo:
options qla2xxx ql2xnvmeenable=1 ql2xextended_error_logging=0x1e400000 # cat /sys/module/qla2xxx/parameters/ql2xextended_error_logging 507510784
Errores comunes de "nvme-cli" y soluciones alternativas
Los errores mostrados por nvme-cli durante nvme discover, nvme connect, o. nvme connect-all las operaciones y las soluciones alternativas se muestran en la siguiente tabla:
| Mensaje de error | Causa probable | Solución alternativa |
|---|---|---|
|
Sintaxis incorrecta |
Compruebe que está utilizando la sintaxis correcta para el |
|
Varios problemas pueden desencadenar esto, por ejemplo, proporcionar argumentos incorrectos en los comandos NVMe es una de las causas comunes. |
|
|
Generalmente observado cuando |
Compruebe que el valor es exacto |
|
Se observa cuando las asociaciones de controladores o la operación especificada ya se han creado o se está creando. Esto podría suceder como parte de los scripts de conexión automática instalados anteriormente. |
Ninguno. Intente ejecutar el |
Cuándo ponerse en contacto con el soporte técnico
Si continúa teniendo problemas, recopile los siguientes archivos y salidas de comandos y comuníquese con "Soporte de NetApp" Para mayor triaje:
cat /sys/class/scsi_host/host*/nvme_info
/var/log/messages
dmesg
nvme discover output as in:
nvme discover --transport=fc --traddr=nn-0x200a00a098c80f09:pn-0x200b00a098c80f09 --host-traddr=nn-0x20000090fae0ec9d:pn-0x10000090fae0ec9d
nvme list
nvme list-subsys /dev/nvmeXnY