Configuración de host de NVMe-oF para RHEL 8,10 con ONTAP
NVMe over Fabrics (NVMe-oF), incluido NVMe over Fibre Channel (NVMe/FC) y otros transportes, es compatible con Red Hat Enterprise Linux (RHEL) 8,10 con acceso asimétrico a espacio de nombres (ANA). En entornos de NVMe-oF, ANA es el equivalente a la multivía ALUA en entornos iSCSI y FC y se implementa con NVMe multivía en kernel.
Se ofrece la siguiente compatibilidad para la configuración del host de NVMe-oF para RHEL 8,10 con ONTAP:
-
Compatibilidad para NVMe sobre TCP (NVMe/TCP) además de NVMe/FC. El plugin de NetApp es en la versión nativa
nvme-cli
El paquete muestra detalles de ONTAP para espacios de nombres NVMe/FC y NVMe/TCP.
Si quiere más información sobre las configuraciones compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".
Limitaciones conocidas
-
La multivía de NVMe en kernel está deshabilitada de forma predeterminada para los hosts RHEL 8,10 NVMe-oF. Por lo tanto, debe habilitarla manualmente.
-
En los hosts RHEL 8,10, NVMe/TCP es una función de vista previa de tecnología debido a problemas abiertos.
-
Actualmente no se admite el arranque SAN mediante el protocolo NVMe-oF.
Habilite la multivía en kernel
Puede utilizar el siguiente procedimiento para habilitar la multivía en el kernel.
-
Instale RHEL 8,10 en el servidor host.
-
Una vez finalizada la instalación, compruebe que está ejecutando el kernel de RHEL 8,10 especificado:
# uname -r
Ejemplo de salida
4.18.0-553.el8_10.x86_64
-
Instale el
nvme-cli
paquete:rpm -qa|grep nvme-cli
Ejemplo de salida
nvme-cli-1.16-9.el8.x86_64
-
Habilitar multivía en el kernel NVMe:
ejemplo
# grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-553.el8_10.x86_64
-
En el host, compruebe la cadena NQN del host en
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
Ejemplo de salida
nqn.2014-08.org.nvmexpress:uuid:4c4c4544-0032-3410-8035-b8c04f4c5132
-
Compruebe que el
hostnqn
la cadena coincide conhostnqn
Cadena para el subsistema correspondiente en la cabina de ONTAP:::> vserver nvme subsystem host show -vserver vs_fcnvme_141
Ejemplo de salida
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_25_2742 rhel_101_QLe2772 nqn.2014-08.org.nvmexpress:uuid:546399fc-160f-11e5-89aa-98be942440ca
Si las cadenas NQN del host no coinciden, puede usar el vserver modify
Comando para actualizar la cadena NQN del host en el subsistema NVMe de ONTAP correspondiente para que coincidan con la cadena NQN del host/etc/nvme/hostnqn
en el host. -
Reinicie el host.
Si tiene intención de ejecutar el tráfico coexistente de NVMe y SCSI en el mismo host, NetApp recomienda utilizar el acceso multivía de NVMe in-kernel para espacios de nombres de ONTAP y dm-multipath para LUN de ONTAP respectivamente. Esto debería excluir los espacios de nombres ONTAP de dm-multipath y evitar que dm-multipath reclame estos dispositivos de espacio de nombres. Puede hacerlo añadiendo el # cat /etc/multipath.conf defaults { enable_foreign NONE } |
Configure NVMe/FC
Puede configurar NVMe/FC para adaptadores Broadcom/Emulex o Marvell/Qlogic.
-
Compruebe que está utilizando el modelo de adaptador admitido:
# cat /sys/class/scsi_host/host*/modelname
Ejemplo de salida:
LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc
Ejemplo de salida:
Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Compruebe que está utilizando la Broadcom recomendada
lpfc
firmware y controlador de bandeja de entrada:# cat /sys/class/scsi_host/host*/fwrev 14.2.539.21, sli-4:2:c 14.2.539.21, sli-4:2:c
# cat /sys/module/lpfc/version 0:14.0.0.21
Para obtener la lista más actual de las versiones de firmware y controladores de adaptador compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".
-
Compruebe que
lpfc_enable_fc4_type
se establece en3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Compruebe que los puertos del iniciador están en funcionamiento y que puede ver los LIF de destino:
# cat /sys/class/fc_host/host*/port_name 0x10000090fae0ec88 0x10000090fae0ec89
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109bf044b1 WWNN x200000109bf044b1 DID x022a00 ONLINE NVME RPORT WWPN x211ad039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x021302 TARGET DISCSRVC ONLINE NVME RPORT WWPN x211cd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x020b02 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 00000001ff Cmpl 00000001ff Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000001330ec7 Issue 0000000001330ec9 OutIO 0000000000000002 abort 00000330 noxri 00000000 nondlp 0000000b qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000354 Err 00000361 NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109bf044b2 WWNN x200000109bf044b2 DID x021b00 ONLINE NVME RPORT WWPN x211bd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x022902 TARGET DISCSRVC ONLINE NVME RPORT WWPN x211dd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x020102 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 00000001ff Cmpl 00000001ff Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 00000000012ec220 Issue 00000000012ec222 OutIO 0000000000000002 abort 0000033b noxri 00000000 nondlp 00000085 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000368 Err 00000382
El controlador de la bandeja de entrada nativa qla2xxx que se incluye en el kernel GA de RHEL 8,10 tiene las correcciones más recientes. Estas correcciones son esenciales para la compatibilidad con ONTAP.
-
Compruebe que está ejecutando las versiones de firmware y controlador del adaptador compatibles:
# cat /sys/class/fc_host/host*/symbolic_name
Ejemplo de salida
QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k
-
Compruebe que
ql2xnvmeenable
está configurado. Esto permite que el adaptador Marvell funcione como iniciador NVMe/FC:# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Habilitar 1MB I/O (opcional)
ONTAP informa de un MDT (tamaño de transferencia de MAX Data) de 8 en los datos Identify Controller. Esto significa que el tamaño máximo de solicitud de E/S puede ser de hasta 1MB TB. Para emitir solicitudes de I/O de tamaño 1 MB para un host Broadcom NVMe/FC, debe aumentar lpfc
el valor lpfc_sg_seg_cnt
del parámetro a 256 con respecto al valor predeterminado de 64.
Estos pasos no se aplican a los hosts Qlogic NVMe/FC. |
-
Defina el
lpfc_sg_seg_cnt
parámetro en 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Ejecute
dracut -f
el comando y reinicie el host. -
Compruebe que el valor esperado de
lpfc_sg_seg_cnt
es 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configure NVMe/TCP
NVMe/TCP no tiene la funcionalidad de conexión automática. Por lo tanto, si una ruta deja de funcionar y no se restablece en el tiempo de espera predeterminado de 10 minutos, no se puede volver a conectar automáticamente NVMe/TCP. Para evitar que se agote el tiempo de espera, debe definir el período de reintento para los eventos de conmutación por error en al menos 30 minutos.
-
Compruebe que el puerto del iniciador pueda recuperar los datos de la página de registro de detección en las LIF NVMe/TCP admitidas:
nvme discover -t tcp -w host-traddr -a traddr
Ejemplo de salida:
# nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.25 Discovery Log Number of Records 8, Generation counter 18 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified. portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:discovery: discovery traddr: 192.168.1.25 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified. portid: 1 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:discovery traddr: 192.168.2.26 sectype: none ..........
-
Compruebe que las otras combinaciones de LIF iniciador-objetivo NVMe/TCP puedan recuperar correctamente los datos de la página del registro de detección:
nvme discover -t tcp -w host-traddr -a traddr
Ejemplo de salida:
# nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.25 # nvme discover -t tcp -w 192.168.1.31 -a 192.168.1.24 # nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.26 # nvme discover -t tcp -w 192.168.1.31 -a 192.168.1.25
-
Ejecute el
nvme connect-all
Comando en todos los LIF de destino iniciador NVMe/TCP admitidos en los nodos y establezca el período de tiempo de espera de pérdida de la controladora durante al menos 30 minutos o 1800 segundos:nvme connect-all -t tcp -w host-traddr -a traddr -l 1800
Ejemplo de salida:
# nvme connect-all -t tcp -w 192.168.2.31 -a 192.168.2.25 -l 1800 # nvme connect-all -t tcp -w 192.168.1.31 -a 192.168.1.24 -l 1800 # nvme connect-all -t tcp -w 192.168.2.31 -a 192.168.2.26 -l 1800 # nvme connect-all -t tcp -w 192.168.1.31 -a 192.168.1.25 -l 1800
Valide NVMe-of
Puede usar el siguiente procedimiento para validar NVMe-oF.
-
Compruebe que la multivía NVMe en kernel esté habilitada:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Compruebe que la configuración de NVMe-of adecuada (como,
model
establezca enNetApp ONTAP Controller
y equilibrio de cargaiopolicy
establezca enround-robin
) Para los respectivos espacios de nombres ONTAP se refleja correctamente en el host:# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Verifique que los espacios de nombres se hayan creado y detectado correctamente en el host:
# nvme list
Ejemplo de salida:
Node SN Model --------------------------------------------------------- /dev/nvme0n1 81K1ABVnkwbNAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Compruebe que el estado de la controladora de cada ruta sea activo y que tenga el estado de ANA correcto:
NVMe/FC# nvme list-subsys /dev/nvme0n1
Ejemplo de salida:
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.0cd9ee0dc0ec11ee8e7fd039ea9e8ae9:subsystem.nvme \ +- nvme1 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2086d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6d:pn-0x21000024ff752e6d live non-optimized +- nvme2 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2016d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6c:pn-0x21000024ff752e6c live optimized +- nvme3 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2081d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6c:pn-0x21000024ff752e6c live non-optimized +- nvme4 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2087d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6d:pn-0x21000024ff752e6d live optimized
NVMe/TCP# nvme list-subsys /dev/nvme0n1
Ejemplo de salida:
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:subsystem.nvme_tcp_1 \ +- nvme0 tcp traddr=192.168.2.26 trsvcid=4420 host_traddr=192.168.2.31 live non-optimized +- nvme1 tcp traddr=192.168.2.25 trsvcid=4420 host_traddr=192.168.2.31 live optimized +- nvme2 tcp traddr=192.168.1.25 trsvcid=4420 host_traddr=192.168.1.31 live non-optimized +- nvme3 tcp traddr=192.168.1.24 trsvcid=4420 host_traddr=192.168.1.31 live optimized
-
Confirmar que el complemento de NetApp muestra los valores correctos para cada dispositivo de espacio de nombres ONTAP:
Columna# nvme netapp ontapdevices -o column
Ejemplo de salida:
Device Vserver Namespace Path ----------------------------------------------------- /dev/nvme0n1 tcpiscsi_129 /vol/tcpnvme_1_0_0/tcpnvme_ns NSID UUID Size ------------------------------------------------------------ 1 05c2c351-5d7f-41d7-9bd8-1a56c 21.47GB
JSON# nvme netapp ontapdevices -o json
Ejemplo de salida
{ "ONTAPdevices": [ { "Device": "/dev/nvme0n1", "Vserver": "tcpiscsi_129", "Namespace Path”: /vol/tcpnvme_1_0_0/tcpnvme_ns ", "NSID": 1, "UUID": " 05c2c351-5d7f-41d7-9bd8-1a56c160c80b ", "Size2: "21.47GB", "LBA_Data_Size": 4096, "Namespace Size" : 5242880 }, ] }
Problemas conocidos
La configuración de host de NVMe-oF para RHEL 8,10 con ONTAP tiene el siguiente problema conocido:
ID de error de NetApp | Título | Descripción |
---|---|---|
Los hosts RHEL 8,10 NVMe-oF crean controladoras de detección persistente duplicadas |
En los hosts NVMe over Fabrics (NVMe-of), es posible utilizar el comando "nvme Discover -p" para crear controladoras de detección persistente (PDCs). Cuando se utiliza este comando, sólo se debe crear un PDC por combinación iniciador-destino. Sin embargo, si ejecuta Red Hat Enterprise Linux (RHEL) 8,10 en un host NVMe-oF, se crea un PDC duplicado cada vez que se ejecuta «nvme discover -p». Esto lleva a un uso innecesario de recursos tanto en el host como en el destino. |