Configuración de host de NVMe/FC para Oracle Linux 8.4 con ONTAP
Es posible configurar NVMe over Fibre Channel (NVMe/FC) en hosts de iniciador que ejecutan Oracle Linux 8,4 y ONTAP como destino.
Compatibilidad
NVMe over Fabrics o NVMe-of (incluidos NVMe/FC y NVMe/TCP) es compatible con Oracle Linux 8.4 con acceso asimétrico de espacio de nombres (ANA), lo cual se requiere para sobrevivir a las recuperaciones tras fallos de almacenamiento (SFO) en la cabina ONTAP. ANA es el equivalente de acceso asimétrico de unidad lógica (ALUA) en el entorno NVMe-of y, actualmente, se implementa con NVMe Multipath en el kernel. En este tema, se describe cómo habilitar NVMe-of con NVMe multivía en el kernel mediante ANA en Oracle Linux 8.4 con ONTAP como destino.
Puede utilizar los ajustes de configuración que se proporcionan en este documento para configurar los clientes de cloud conectados a. "Cloud Volumes ONTAP" y.. "Amazon FSX para ONTAP". |
Funciones
-
Oracle Linux 8.4 tiene NVMe multivía en el kernel habilitado de forma predeterminada para nombres NVMe.
-
Con Oracle Linux 8,4,
nvme-fc auto-connect
los scripts se incluyen en el paquete nativonvme-cli
. Puede utilizar estos scripts nativos de conexión automática en lugar de instalar scripts de conexión automática proporcionados por el proveedor externo. -
Con Oracle Linux 8.4, un nativo
udev
la regla se proporciona como parte de lanvme-cli
Paquete que permite el equilibrio de carga por turnos para NVMe multivía. Por lo tanto, ya no es necesario crear manualmente esta regla. -
Con Oracle Linux 8.4, tanto el tráfico NVMe como SCSI pueden ejecutarse en el mismo host coexistente. De hecho, se espera que sea la configuración de host instalada habitualmente. Por lo tanto, puede configurar dm-multipath como suele suceder en los LUN de SCSI, lo que provoca en dispositivos mpath mientras que el multivía de NVMe se puede utilizar para configurar dispositivos multivía de NVMe-of (por ejemplo,
/dev/nvmeXnY
) en el host. -
Con Oracle Linux 8.4, el complemento de NetApp en el nativo
nvme-cli
El paquete puede mostrar detalles de ONTAP, así como espacios de nombres ONTAP.
Limitaciones conocidas
Actualmente no se admite el arranque SAN mediante el protocolo NVMe-oF.
Requisitos de configuración
Consulte la "Matriz de interoperabilidad de NetApp (IMT)" para obtener información exacta sobre las configuraciones compatibles.
Habilite NVMe/FC
-
Instale Oracle Linux 8.4 GA en el servidor. Una vez finalizada la instalación, compruebe que está ejecutando el kernel de Oracle Linux 8.4 GA especificado. Consulte "Matriz de interoperabilidad de NetApp" para obtener la lista más actual de versiones compatibles.
# uname -r 5.4.17-2102.206.1.el8uek.x86_64
-
Instale el
nvme-cli
paquete.# rpm -qa|grep nvme-cli nvme-cli-1.12-3.el8.x86_64
-
En el host Oracle Linux 8.4, compruebe la cadena hostnqn en
/etc/nvme/hostnqn
Y verifique que coincida con la cadena hostnqn para el subsistema correspondiente en la matriz ONTAP.# cat /etc/nvme/hostnqn nqn.2014-08.org.nvmexpress:uuid:8b43c7c6-e98d-4cc7-a699-d66a69aa714e ::> vserver nvme subsystem host show -vserver vs_coexistance_2 Vserver Subsystem Host NQN ------- -------------------------------------------------------------------- vs_coexistance_2 nvme_1 nqn.2014-08.org.nvmexpress:uuid:753881b6-3163-46f9-8145-0d1653d99389
Si las cadenas hostnqn no coinciden, debe utilizar vserver modify
Comando para actualizar la cadena hostnqn en el subsistema de cabina de ONTAP correspondiente para que coincida con la cadena hostnqn de/etc/nvme/hostnqn
en el host. -
Reinicie el host.
Si planea ejecutar el tráfico NVMe y SCSI en el mismo host coexistente de Oracle Linux 8.4, NetApp recomienda usar la multivía NVMe en el kernel para espacios de nombres de ONTAP y dm-multipath para LUN de ONTAP respectivamente. Esto también significa que los espacios de nombres ONTAP deben estar en la lista negra en dm-multipath para evitar que dm-multipath reclamen estos dispositivos de espacio de nombres. Esto se puede hacer agregando la
enable_foreign
ajuste en la/etc/multipath.conf
archivo:#cat /etc/multipath.conf defaults { enable_foreign NONE }
Reinicie el daemon multipathd ejecutando
systemctl restart multipathd
comando para permitir que la nueva configuración tenga efecto.
Configurar el adaptador de FC de Broadcom para NVMe/FC
-
Compruebe que está utilizando el adaptador compatible. Para obtener la lista más actual de adaptadores compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".
# cat /sys/class/scsi_host/host*/modelname LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Compruebe que está utilizando el firmware de Broadcom lpfc y el controlador de bandeja de entrada recomendados. Para obtener la lista más actual de las versiones de firmware y controladores de adaptador compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".
# cat /sys/class/scsi_host/host*/fwrev 14.0.505.11, sli-4:2:c 14.0.505.11, sli-4:2:c
# cat /sys/module/lpfc/version 0:12.8.0.5
-
Compruebe que
lpfc_enable_fc4_type
se establece en 3.# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Compruebe que los puertos iniciador están en funcionamiento y que puede ver las LIF de destino.
# cat /sys/class/fc_host/host*/port_name 0x100000109b213a00 0x100000109b2139ff # cat /sys/class/fc_host/host*/port_state Online Online # cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b213a00 WWNN x200000109b213a00 DID x031700 ONLINE NVME RPORT WWPN x208cd039ea243510 WWNN x208bd039ea243510 DID x03180a TARGET DISCSRVC ONLINE NVME RPORT WWPN x2090d039ea243510 WWNN x208bd039ea243510 DID x03140a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000000079efc Issue 0000000000079eeb OutIO ffffffffffffffef abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000002 Err 00000004 NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b2139ff WWNN x200000109b2139ff DID x031300 ONLINE NVME RPORT WWPN x208ed039ea243510 WWNN x208bd039ea243510 DID x03230c TARGET DISCSRVC ONLINE NVME RPORT WWPN x2092d039ea243510 WWNN x208bd039ea243510 DID x03120c TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000000029ba0 Issue 0000000000029ba2 OutIO 0000000000000002 abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000002 Err 00000004
Activando un tamaño de I/o de 1 MB
ONTAP informa de un MDT (tamaño de transferencia de MAX Data) de 8 en los datos Identify Controller. Esto significa que el tamaño máximo de solicitud de E/S puede ser de hasta 1MB TB. Para emitir solicitudes de I/O de tamaño 1 MB para un host Broadcom NVMe/FC, debe aumentar lpfc
el valor lpfc_sg_seg_cnt
del parámetro a 256 con respecto al valor predeterminado de 64.
Estos pasos no se aplican a los hosts Qlogic NVMe/FC. |
-
Defina el
lpfc_sg_seg_cnt
parámetro en 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Ejecute
dracut -f
el comando y reinicie el host. -
Compruebe que el valor esperado de
lpfc_sg_seg_cnt
es 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configure el adaptador Marvell/QLogic FC para NVMe/FC
El controlador de la bandeja de entrada nativa qla2xxx incluido en el kernel OL 8,4 GA tiene las últimas correcciones ascendentes. Estas correcciones son esenciales para la compatibilidad con ONTAP.
-
Compruebe que está ejecutando las versiones de firmware y controlador del adaptador compatibles:
# cat /sys/class/fc_host/host*/symbolic_name QLE2742 FW:v9.08.02 DVR:v10.02.00.103-k QLE2742 FW:v9.08.02 DVR:v10.02.00.103-k
-
Compruebe que el
ql2xnvmeenable
Se configura el parámetro que permite que el adaptador Marvell funcione como iniciador NVMe/FC.# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Configure NVMe/TCP
NVMe/TCP no tiene la funcionalidad de conexión automática. Por lo tanto, si una ruta deja de funcionar y no se restablece en el tiempo de espera predeterminado de 10 minutos, no se puede volver a conectar automáticamente NVMe/TCP. Para evitar que se agote el tiempo de espera, debe definir el período de reintento para los eventos de conmutación por error en al menos 30 minutos.
-
Compruebe que el puerto del iniciador pueda recuperar datos de la página de registro de detección en las LIF NVMe/TCP admitidas:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 Discovery Log Number of Records 10, Generation counter 119 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.2.56 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 1 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.1.51 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_2 traddr: 192.168.2.56 sectype: none ...
-
De igual modo, compruebe que otras combinaciones de LIF iniciador-destino NVMe/TCP puedan recuperar correctamente los datos de la página del registro de detección. Ejemplo:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 #nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.52 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.56 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.57
-
Ahora ejecute el
nvme connect-all
Command entre todas las LIF de iniciador NVMe/TCP admitidas en los nodos. Asegúrese de proporcionar un tiempo másctrl_loss_tmo
período del temporizador (30 minutos o más, que se puede ajustar la adición-l 1800
) duranteconnect-all
de modo que se reintente durante un período más largo en caso de una pérdida de ruta. Ejemplo:# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.51 -l 1800 # nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.52 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.56 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.57 -l 1800
Valide NVMe/FC
-
Verifique la siguiente configuración de NVMe/FC en el host de Oracle Linux 8.4:
# cat /sys/module/nvme_core/parameters/multipath Y
# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Compruebe que los espacios de nombres se crean y se detectarán correctamente en el host:
# nvme list Node SN Model Namespace ----------------------------------------------------------------------------------------- /dev/nvme0n1 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 1 /dev/nvme0n2 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 2 /dev/nvme0n3 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 3 Usage Format FW Rev ------------------------------------------------------ 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF
-
Compruebe que el estado de la controladora de cada ruta sea activo y que tenga el estado de ANA correcto.
# nvme list-subsys /dev/nvme0n1 nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.5f5f2c4aa73b11e9967e00a098df41bd:subsystem.nvme_ss_ol_1 \ +- nvme0 fc traddr=nn-0x203700a098dfdd91:pn-0x203800a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized +- nvme1 fc traddr=nn-0x203700a098dfdd91:pn-0x203900a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized +- nvme2 fc traddr=nn-0x203700a098dfdd91:pn-0x203a00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized +- nvme3 fc traddr=nn-0x203700a098dfdd91:pn-0x203d00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
-
Confirmar que el plugin de NetApp muestra los valores correctos para cada dispositivo de espacio de nombres ONTAP.
# nvme netapp ontapdevices -o column Device Vserver Namespace Path ----------------------- ------------------------------ ----------------------------------------------------------------------- --------- -- /dev/nvme0n1 vs_ol_nvme /vol/ol_nvme_vol_1_1_0/ol_nvme_ns /dev/nvme0n2 vs_ol_nvme /vol/ol_nvme_vol_1_0_0/ol_nvme_ns /dev/nvme0n3 vs_ol_nvme /vol/ol_nvme_vol_1_1_1/ol_nvme_ns NSID UUID Size -------------------------------------------------------------- 1 72b887b1-5fb6-47b8-be0b-33326e2542e2 85.90GB 2 04bf9f6e-9031-40ea-99c7-a1a61b2d7d08 85.90GB 3 264823b1-8e03-4155-80dd-e904237014a4 85.90GB
# nvme netapp ontapdevices -o json { "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_1_0/ol_nvme_ns", "NSID" : 1, "UUID" : "72b887b1-5fb6-47b8-be0b-33326e2542e2", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, { "Device" : "/dev/nvme0n2", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_0_0/ol_nvme_ns", "NSID" : 2, "UUID" : "04bf9f6e-9031-40ea-99c7-a1a61b2d7d08", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, { "Device" : "/dev/nvme0n3", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_1_1/ol_nvme_ns", "NSID" : 3, "UUID" : "264823b1-8e03-4155-80dd-e904237014a4", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, ] }
Problemas conocidos
La configuración de host de NVMe-oF para OL 8,4 con ONTAP tiene los siguientes problemas conocidos:
ID de error de NetApp | Título | Descripción |
---|---|---|
1517321 |
Los hosts Oracle Linux 8.4 NVMe-of crean controladoras de detección persistente duplicadas |
En los hosts Oracle Linux 8.4 NVMe over Fabrics (NVMe-of), puede usar el comando "nvme Discover -p" para crear controladoras de detección persistente (CMC). Cuando se utiliza este comando, sólo se debe crear un PDC por combinación iniciador-destino. Sin embargo, si ejecuta ONTAP 9.10.1 y Oracle Linux 8.4 con un host NVMe-of, se crea un PDC duplicado cada vez que se ejecuta "nvme Discover -p". Esto lleva a un uso innecesario de recursos tanto en el host como en el destino. |