Configurar RHEL 8.8 para NVMe-oF con almacenamiento ONTAP
Los hosts Red Hat Enterprise Linux (RHEL) admiten los protocolos NVMe sobre canal de fibra (NVMe/FC) y NVMe sobre TCP (NVMe/TCP) con acceso asimétrico al espacio de nombres (ANA). ANA proporciona una funcionalidad de múltiples rutas equivalente al acceso a unidad lógica asimétrica (ALUA) en entornos iSCSI y FCP.
Aprenda a configurar hosts NVMe over Fabrics (NVMe-oF) para RHEL 8.8. Para obtener más información sobre soporte y funciones, consulte"Descripción general de NVME-oF" .
NVMe-oF con RHEL 8.8 tiene las siguientes limitaciones conocidas:
-
Actualmente no se admite el arranque SAN mediante el protocolo NVMe-oF.
-
La multiruta NVMe dentro del kernel está deshabilitada de manera predeterminada en los hosts NVMe-oF en RHEL 8.8; debe habilitarla manualmente.
-
NVMe/TCP está disponible como una versión preliminar de tecnología debido a problemas conocidos.
Paso 1: Opcionalmente, habilite el arranque SAN
Puede configurar su host para utilizar el arranque SAN para simplificar la implementación y mejorar la escalabilidad. Utilice el"Herramienta de matriz de interoperabilidad" para verificar que su sistema operativo Linux, el adaptador de bus de host (HBA), el firmware del HBA, el BIOS de arranque del HBA y la versión de ONTAP admitan el arranque SAN.
-
Habilite el arranque SAN en el BIOS del servidor para los puertos a los que está asignado el espacio de nombres de arranque SAN.
Para obtener información acerca de cómo activar el BIOS HBA, consulte la documentación específica de su proveedor.
-
Reinicie el host y verifique que el sistema operativo esté funcionando.
Paso 2: Verifique la versión del software y la configuración de NVMe
Verifique que su sistema cumpla con los requisitos de software y verifique las instalaciones de paquetes NVMe y la configuración del host.
-
Instalar RHEL 8.8 en el servidor. Una vez completada la instalación, verifique que esté ejecutando el kernel RHEL 8.8 requerido:
uname -rEjemplo de versión del kernel RHEL:
4.18.0-477.10.1.el8_8.x86_64
-
Instale el
nvme-clipaquete:rpm -qa|grep nvme-cliEl siguiente ejemplo muestra una versión del paquete nvme-cli:
nvme-cli-1.16-7.el8.x86_64
-
Instale el
libnvmepaquete:rpm -qa|grep libnvmeEl siguiente ejemplo muestra una versión del paquete libnvme:
libnvme-1.4-3.el8.x86_64
-
Habilitar multivía en el kernel NVMe:
grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-477.10.1.el8_8.x86_64 -
En el host RHEL 8.8, verifique la
hostnqncuerda en/etc/nvme/hostnqn:cat /etc/nvme/hostnqnEl siguiente ejemplo muestra un
hostnqnversión:nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
-
Verificar que el
hostnqnLa cadena coincide con lahostnqncadena para el subsistema correspondiente en el sistema de almacenamiento ONTAP :::> vserver nvme subsystem host show -vserver vs_fcnvme_141Muestra el ejemplo
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_nvme161 rhel_161_LPe32002 nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
Si el hostnqnLas cadenas no coinciden, utilice elvserver modifycomando para actualizar elhostnqncadena en el subsistema del sistema de almacenamiento ONTAP correspondiente para que coincida con elhostnqncadena de/etc/nvme/hostnqnen el host. -
Reinicie el host.
Para ejecutar tráfico NVMe y SCSI en el mismo host, NetApp recomienda utilizar la ruta múltiple NVMe en el kernel para espacios de nombres ONTAP y dm-multipath para LUN ONTAP . Para evitar que dm-multipath reclame dispositivos de espacio de nombres ONTAP , exclúyalos agregando el
enable_foreignAjuste a la/etc/multipath.confarchivo:cat /etc/multipath.conf defaults { enable_foreign NONE }
Paso 3: Configurar NVMe/FC y NVMe/TCP
Configure NVMe/FC con adaptadores Broadcom/Emulex o Marvell/QLogic, o configure NVMe/TCP mediante operaciones de descubrimiento y conexión manuales.
Configuración de NVMe/FC para un adaptador Broadcom/Emulex.
-
Compruebe que está utilizando el modelo de adaptador admitido:
-
Mostrar los nombres de los modelos:
cat /sys/class/scsi_host/host*/modelnameDebería ver un resultado similar al siguiente ejemplo:
LPe32002-M2 LPe32002-M2
-
Mostrar las descripciones del modelo:
cat /sys/class/scsi_host/host*/modeldescDebería ver un resultado similar al siguiente ejemplo:
Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
-
Compruebe que está utilizando la Broadcom recomendada
lpfcfirmware y controlador de bandeja de entrada:-
Mostrar la versión del firmware:
cat /sys/class/scsi_host/host*/fwrevEl comando devuelve las versiones del firmware:
14.0.639.18, sli-4:2:c 14.0.639.18, sli-4:2:c
-
Mostrar la versión del controlador de la bandeja de entrada:
cat /sys/module/lpfc/versionEl siguiente ejemplo muestra una versión del controlador:
0:14.0.0.18
Para obtener la lista actual de versiones de firmware y controladores de adaptador compatibles, consulte la "Herramienta de matriz de interoperabilidad".
-
-
Compruebe que
lpfc_enable_fc4_typese establece en3:cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type -
Compruebe que puede ver los puertos de iniciador:
cat /sys/class/fc_host/host*/port_nameDebería ver un resultado similar al siguiente ejemplo:
0x100000109b1c1204 0x100000109b1c1205
-
Compruebe que los puertos de iniciador estén en línea:
cat /sys/class/fc_host/host*/port_stateDebe ver la siguiente salida:
Online Online
-
Compruebe que los puertos de iniciador NVMe/FC estén habilitados y que los puertos de destino estén visibles:
cat /sys/class/scsi_host/host*/nvme_infoMuestra el ejemplo
NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x10000090fae0ec88 WWNN x20000090fae0ec88 DID x0a1300 ONLINE NVME RPORT WWPN x2049d039ea36a105 WWNN x2048d039ea36a105 DID x0a0c0a TARGET DISCSRVC ONLINE NVME RPORT WWPN x204bd039ea36a105 WWNN x2048d039ea36a105 DID x0a100a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000000825e567 Issue 000000000825d7ed OutIO fffffffffffff286 abort 0000027c noxri 00000000 nondlp 00000a02 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000782 Err 000130fa NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x10000090fae0ec89 WWNN x20000090fae0ec89 DID x0a1200 ONLINE NVME RPORT WWPN x204ad039ea36a105 WWNN x2048d039ea36a105 DID x0a080a TARGET DISCSRVC ONLINE NVME RPORT WWPN x204cd039ea36a105 WWNN x2048d039ea36a105 DID x0a090a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000000826ced5 Issue 000000000826c226 OutIO fffffffffffff351 abort 0000029d noxri 00000000 nondlp 000008df qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000821 Err 00012fcd
Configure NVMe/FC para un adaptador Marvell/QLogic.
-
Verifique que esté utilizando el controlador del adaptador y las versiones de firmware compatibles:
cat /sys/class/fc_host/host*/symbolic_nameEl siguiente ejemplo muestra las versiones del controlador y del firmware:
QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug
-
Compruebe que
ql2xnvmeenableestá configurado. Esto permite que el adaptador Marvell funcione como iniciador NVMe/FC:cat /sys/module/qla2xxx/parameters/ql2xnvmeenableLa salida esperada es 1.
El protocolo NVMe/TCP no admite la operación de conexión automática. En su lugar, puede descubrir los subsistemas y espacios de nombres NVMe/TCP realizando la prueba NVMe/TCP. connect o connect-all operaciones manualmente.
-
Verifique que el puerto iniciador pueda obtener los datos de la página de registro de descubrimiento a través de los LIF NVMe/TCP compatibles:
nvme discover -t tcp -w host-traddr -a traddrMuestra el ejemplo
nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14 Discovery Log Number of Records 8, Generation counter 10 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.211.15 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 1 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.111.15 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 2 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.211.14 sectype: none
-
Verifique que las otras combinaciones de LIF de iniciador-destino NVMe/TCP puedan recuperar correctamente los datos de la página del registro de descubrimiento:
nvme discover -t tcp -w host-traddr -a traddrMuestra el ejemplo
nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14 nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.15 nvme discover -t tcp -w 192.168.211.79 -a 192.168.211.14 nvme discover -t tcp -w 192.168.211.79 -a 192.168.211.15
-
Ejecute el
nvme connect-allComando en todos los LIF objetivo iniciador NVMe/TCP admitidos entre los nodos:nvme connect-all -t tcp -w host-traddr -a traddr -1 1800Muestra el ejemplo
nvme connect-all -t tcp -w 192.168.111.79 -a 192.168.111.14 -l 1800 nvme connect-all -t tcp -w 192.168.111.79 -a 192.168.111.15 -l 1800 nvme connect-all -t tcp -w 192.168.211.79 -a 192.168.211.14 -l 1800 nvme connect-all -t tcp -w 192.168.211.79 -a 192.168.211.15 -l 1800
Paso 4: Opcionalmente, habilite 1 MB de E/S para NVMe/FC
ONTAP informa un tamaño máximo de transferencia de datos (MDTS) de 8 en los datos del controlador de identificación. Esto significa que el tamaño máximo de solicitud de E/S puede ser de hasta 1 MB. Para emitir solicitudes de E/S de tamaño 1 MB para un host Broadcom NVMe/FC, debe aumentar el lpfc valor de la lpfc_sg_seg_cnt parámetro a 256 desde el valor predeterminado de 64.
|
|
Estos pasos no se aplican a los hosts Qlogic NVMe/FC. |
-
Defina el
lpfc_sg_seg_cntparámetro en 256:cat /etc/modprobe.d/lpfc.confDebería ver un resultado similar al siguiente ejemplo:
options lpfc lpfc_sg_seg_cnt=256
-
Ejecute
dracut -fel comando y reinicie el host. -
Compruebe que el valor de
lpfc_sg_seg_cntes 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Paso 5: Validar NVMe-oF
Verifique que el estado de multivía de NVMe en kernel, el estado de ANA y los espacios de nombres de ONTAP sean correctos para la configuración de NVMe-oF.
-
Compruebe que la multivía NVMe en kernel esté habilitada:
cat /sys/module/nvme_core/parameters/multipathDebe ver la siguiente salida:
Y
-
Compruebe que la configuración NVMe-oF adecuada (como, por ejemplo, el modelo configurado en la controladora NetApp ONTAP y la política de balanceo de carga establecida en round-robin) en los respectivos espacios de nombres de ONTAP se reflejen correctamente en el host:
-
Mostrar los subsistemas:
cat /sys/class/nvme-subsystem/nvme-subsys*/modelDebe ver la siguiente salida:
NetApp ONTAP Controller NetApp ONTAP Controller
-
Mostrar la política:
cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicyDebe ver la siguiente salida:
round-robin round-robin
-
-
Verifique que los espacios de nombres se hayan creado y detectado correctamente en el host:
nvme listMuestra el ejemplo
Node SN Model --------------------------------------------------------- /dev/nvme4n1 81Ix2BVuekWcAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Compruebe que el estado de la controladora de cada ruta sea activo y que tenga el estado de ANA correcto:
NVMe/FCnvme list-subsys /dev/nvme3n1Muestra el ejemplo
nvme-subsys3 - NQN=nqn.1992-08.com.netapp:sn.ab4fa6a5ba8b11ecbe3dd039ea359e4b:subsystem.rhel_161_Lpe32002 \ +- nvme0 fc traddr=nn-0x2048d039ea36a105:pn-0x204cd039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live non-optimized +- nvme1 fc traddr=nn-0x2048d039ea36a105:pn-0x204ad039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live optimized +- nvme2 fc traddr=nn-0x2048d039ea36a105:pn-0x204bd039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live non-optimized +- nvme4 fc traddr=nn-0x2048d039ea36a105:pn-0x2049d039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live optimized
NVMe/TCPnvme list-subsys /dev/nvme0n1Muestra el ejemplo
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:subsystem.rhel_tcp_165 \ +- nvme0 tcp traddr=192.168.111.15 trsvcid=4420 host_traddr=192.168.111.79 live non-optimized +- nvme1 tcp traddr=192.168.111.14 trsvcid=4420 host_traddr=192.168.111.79 live optimized +- nvme2 tcp traddr=192.168.211.15 trsvcid=4420 host_traddr=192.168.211.79 live non-optimized
-
Confirmar que el complemento de NetApp muestra los valores correctos para cada dispositivo de espacio de nombres ONTAP:
Columnanvme netapp ontapdevices -o columnMuestra el ejemplo
Device Vserver Namespace Path ----------------------- ------------------------------ /dev/nvme0n1 vs_tcp /vol/vol1/ns1 NSID UUID Size ------------------------------------------------------------ 1 338d73ce-b5a8-4847-9cc9-b127c75d8855 21.47GB
JSONnvme netapp ontapdevices -o jsonMuestra el ejemplo
{ "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_tcp79", "Namespace_Path" : "/vol/vol1/ns1", "NSID" : 1, "UUID" : "338d73ce-b5a8-4847-9cc9-b127c75d8855", "Size" : "21.47GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 5242880 }, ] }
Paso 6: Revise los problemas conocidos
Estos son los problemas conocidos:
| ID de error de NetApp | Título | Descripción |
|---|---|---|
Los hosts NVMe-oF de RHEL 8.8 crean controladores de descubrimiento persistente (PDC) duplicados |
En los hosts NVMe-oF, puede utilizar el comando "nvme discover -p" para crear PDC. Cuando se utiliza este comando, solo se debe crear un PDC por combinación iniciador-destino. Sin embargo, si está ejecutando RHEL 8.8 en un host NVMe-oF, se crea un PDC duplicado cada vez que se ejecuta "nvme discover -p". Esto genera un uso innecesario de recursos tanto en el host como en el destino. |