Configuración de host de NVMe-oF para RHEL 8,5 con ONTAP
NVMe over Fabrics o NVMe-oF (incluidos NVMe/FC y otros transportes) es compatible con Red Hat Enterprise Linux (RHEL) 8,5 con ANA (Acceso asimétrico al espacio de nombres). ANA es el equivalente de acceso asimétrico de unidad lógica (ALUA) en el entorno NVMe-of y, actualmente, se implementa con NVMe Multipath en el kernel. Durante este procedimiento, se habilita NVMe-oF con NVMe Multipath en kernel mediante ANA en RHEL 8,5 y ONTAP como destino.
Consulte "Herramienta de matriz de interoperabilidad de NetApp" para obtener información precisa sobre las configuraciones compatibles.
Funciones
RHEL 8.5 incluye compatibilidad con NVMe/TCP (como función de vista previa de tecnología), además de NVMe/FC. El plugin de NetApp en el paquete nativo nvme-cli puede mostrar detalles de ONTAP tanto para espacios de nombres NVMe/FC como NVMe/TCP.
Limitaciones conocidas
-
Para RHEL 8.5, la función multivía de NVMe en el kernel sigue deshabilitada de forma predeterminada. Por lo tanto, debe habilitarla manualmente.
-
NVMe/TCP en RHEL 8.5 sigue siendo una función de vista previa de la tecnología debido a problemas abiertos. Consulte la "Notas de la versión de RHEL 8.5" para obtener más detalles.
-
Actualmente no se admite el arranque SAN mediante el protocolo NVMe-oF.
Habilite NVMe multivía en el kernel
Es posible utilizar el siguiente procedimiento para habilitar la multivía NVMe in-kernel.
-
Instale RHEL 8.5 GA en el servidor. Una vez finalizada la instalación, compruebe que está ejecutando el kernel RHEL 8.5 GA especificado. Consulte "Matriz de interoperabilidad de NetApp" para obtener la lista más actual de versiones compatibles.
Ejemplo:
# uname -r 4.18.0-348.el8.x86_64
-
Instale el
nvme-cli
paquete:Ejemplo:
# rpm -qa|grep nvme-cli nvme-cli-1.14-3.el8.x86_64
-
Habilitar multivía en el kernel NVMe:
# grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-348.el8.x86_64
-
En el host, compruebe la cadena NQN del host en
/etc/nvme/hostnqn
Y verifique que coincida con la cadena del host NQN para el subsistema correspondiente en la cabina de ONTAP. Ejemplo:# cat /etc/nvme/hostnqn nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1 ::> vserver nvme subsystem host show -vserver vs_fcnvme_141 Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_fcnvme_14 nvme_141_1 nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
Si las cadenas del host NQN no coinciden, se debe usar vserver modify
Comando para actualizar la cadena NQN del host en el subsistema NVMe de ONTAP correspondiente para que coincidan con la cadena NQN del host/etc/nvme/hostnqn
en el host. -
Reinicie el host.
Si tiene intención de ejecutar tráfico coexistente tanto NVMe como SCSI en el mismo host, NetApp recomienda utilizar NVMe multivía in-kernel para espacios de nombres ONTAP y dm-multipath para LUN de ONTAP respectivamente. Esto significa que los espacios de nombres ONTAP deben excluirse de dm-multipath para evitar que dm-multipath reclamen estos dispositivos de espacio de nombres. Para ello, agregue el valor ENABLE_FOREIGN al
/etc/multipath.conf
archivo:# cat /etc/multipath.conf defaults { enable_foreign NONE }
Reinicie el daemon multipathd ejecutando un
systemctl restart multipathd
comando para permitir que la nueva configuración surta efecto.
Configure NVMe/FC
Puede configurar NVMe/FC para adaptadores Broadcom/Emulex o Marvell/Qlogic.
-
Compruebe que está utilizando el adaptador compatible. Consulte "Matriz de interoperabilidad de NetApp" para obtener la lista más actual de adaptadores compatibles.
# cat /sys/class/scsi_host/host*/modelname LPe32002-M2 LPe32002-M2 # cat /sys/class/scsi_host/host*/modeldesc Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Compruebe que está utilizando el firmware de Broadcom lpfc y el controlador de bandeja de entrada recomendados. Consulte "Matriz de interoperabilidad de NetApp" para obtener la lista más actual de versiones de firmware y controladores de adaptador compatibles.
# cat /sys/class/scsi_host/host*/fwrev 12.8.351.47, sli-4:2:c 12.8.351.47, sli-4:2:c # cat /sys/module/lpfc/version 0:12.8.0.10
-
Compruebe que
lpfc_enable_fc4_type
se establece en 3# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Compruebe que los puertos iniciador están en funcionamiento y que puede ver las LIF de destino.
# cat /sys/class/fc_host/host*/port_name 0x100000109b1c1204 0x100000109b1c1205 # cat /sys/class/fc_host/host*/port_state Online Online # cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b1c1204 WWNN x200000109b1c1204 DID x011d00 ONLINE NVME RPORT WWPN x203800a098dfdd91 WWNN x203700a098dfdd91 DID x010c07 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203900a098dfdd91 WWNN x203700a098dfdd91 DID x011507 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000f78 Cmpl 0000000f78 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002fe29bba Issue 000000002fe29bc4 OutIO 000000000000000a abort 00001bc7 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001e15 Err 0000d906 NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b1c1205 WWNN x200000109b1c1205 DID x011900 ONLINE NVME RPORT WWPN x203d00a098dfdd91 WWNN x203700a098dfdd91 DID x010007 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203a00a098dfdd91 WWNN x203700a098dfdd91 DID x012a07 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000fa8 Cmpl 0000000fa8 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002e14f170 Issue 000000002e14f17a OutIO 000000000000000a abort 000016bb noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001f50 Err 0000d9f8
El controlador de la bandeja de entrada nativo qla2xxx
que se incluye en el kernel GA de RHEL 8,5 tiene las correcciones más recientes. Estas correcciones son esenciales para la compatibilidad con ONTAP.
-
Compruebe que está ejecutando las versiones de firmware y controlador del adaptador compatibles:
# cat /sys/class/fc_host/host*/symbolic_name QLE2742 FW:v9.06.02 DVR:v10.02.00.106-k QLE2742 FW:v9.06.02 DVR:v10.02.00.106-k
-
Verificación
ql2xnvmeenable
Is set que permite que el adaptador Marvell funcione como iniciador NVMe/FC:# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Habilitar 1MB I/O (opcional)
ONTAP informa de un MDT (tamaño de transferencia de MAX Data) de 8 en los datos Identify Controller. Esto significa que el tamaño máximo de solicitud de E/S puede ser de hasta 1MB TB. Para emitir solicitudes de I/O de tamaño 1 MB para un host Broadcom NVMe/FC, debe aumentar lpfc
el valor lpfc_sg_seg_cnt
del parámetro a 256 con respecto al valor predeterminado de 64.
Estos pasos no se aplican a los hosts Qlogic NVMe/FC. |
-
Defina el
lpfc_sg_seg_cnt
parámetro en 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Ejecute
dracut -f
el comando y reinicie el host. -
Compruebe que el valor esperado de
lpfc_sg_seg_cnt
es 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configure NVMe/TCP
NVMe/TCP no tiene la funcionalidad de conexión automática. Por lo tanto, si una ruta deja de funcionar y no se restablece en el tiempo de espera predeterminado de 10 minutos, no se puede volver a conectar automáticamente NVMe/TCP. Para evitar que se agote el tiempo de espera, debe definir el período de reintento para los eventos de conmutación por error en al menos 30 minutos.
-
Compruebe si el puerto iniciador puede recuperar los datos de la página de registro de detección en las LIF NVMe/TCP admitidas:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 Discovery Log Number of Records 10, Generation counter 119 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.2.56 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 1 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.1.51 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_2 traddr: 192.168.2.56 sectype: none ...
-
Compruebe que otros combinados de LIF iniciador-objetivo NVMe/TCP pueden recuperar correctamente los datos de la página de registro de detección. Por ejemplo:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 # nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.52 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.56 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.57
-
Ejecute el
nvme connect-all
Command entre todas las LIF de iniciador NVMe/TCP admitidas en los nodos. Asegúrese de establecer un valor más largoctrl_loss_tmo
período de reintento del temporizador (por ejemplo, 30 minutos, que se puede establecer a través de-l 1800
) durante la conexión-todo para que reintenta durante un período más largo en caso de una pérdida de ruta. Por ejemplo:# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.51 -l 1800 # nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.52 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.56 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.57 -l 1800
Valide NVMe-of
Puede usar el siguiente procedimiento para validar NVMe-oF.
-
Compruebe que la multivía de NVMe en kernel está habilitada:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Compruebe que la configuración de NVMe-of adecuada (como,
model
establezca enNetApp ONTAP Controller
y..load balancing iopolicy
establezca enround-robin
) Para los respectivos espacios de nombres ONTAP se reflejan correctamente en el host:# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller # cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Compruebe que los espacios de nombres de ONTAP se reflejan correctamente en el host. Por ejemplo:
# nvme list Node SN Model Namespace ------------ --------------------- --------------------------------- /dev/nvme0n1 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 1 Usage Format FW Rev ------------------- ----------- -------- 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF
-
Compruebe que el estado de la controladora de cada ruta sea activo y que tenga el estado de ANA adecuado. Por ejemplo:
# nvme list-subsys /dev/nvme0n1 nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.5f5f2c4aa73b11e9967e00a098df41bd:subsystem.nvme_141_1 \ +- nvme0 fc traddr=nn-0x203700a098dfdd91:pn-0x203800a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live inaccessible +- nvme1 fc traddr=nn-0x203700a098dfdd91:pn-0x203900a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live inaccessible +- nvme2 fc traddr=nn-0x203700a098dfdd91:pn-0x203a00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized +- nvme3 fc traddr=nn-0x203700a098dfdd91:pn-0x203d00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
-
Confirmar que el complemento de NetApp muestra los valores adecuados para cada dispositivo de espacio de nombres ONTAP. Por ejemplo:
# nvme netapp ontapdevices -o column Device Vserver Namespace Path --------- ------- -------------------------------------------------- /dev/nvme0n1 vs_fcnvme_141 vol/fcnvme_141_vol_1_1_0/fcnvme_141_ns NSID UUID Size ---- ------------------------------ ------ 1 72b887b1-5fb6-47b8-be0b-33326e2542e2 85.90GB # nvme netapp ontapdevices -o json { "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_fcnvme_141", "Namespace_Path" : "/vol/fcnvme_141_vol_1_1_0/fcnvme_141_ns", "NSID" : 1, "UUID" : "72b887b1-5fb6-47b8-be0b-33326e2542e2", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 } ] }
Problemas conocidos
No hay problemas conocidos.