Skip to main content
SAN hosts and cloud clients
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Configuración de host de NVMe-oF para RHEL 8,9 con ONTAP

Colaboradores

NVMe over Fabrics (NVMe-oF), incluido NVMe over Fibre Channel (NVMe/FC) y otros transportes, es compatible con Red Hat Enterprise Linux (RHEL) 8,9 con acceso asimétrico a espacio de nombres (ANA). En entornos de NVMe-oF, ANA es el equivalente a la multivía ALUA en entornos iSCSI y FC y se implementa con NVMe multivía en kernel.

Se ofrece la siguiente compatibilidad para la configuración del host de NVMe-oF para RHEL 8,9 con ONTAP:

  • Compatibilidad para NVMe sobre TCP (NVMe/TCP) además de NVMe/FC. El plugin de NetApp en el paquete nvme-cli nativo muestra detalles de ONTAP para espacios de nombres NVMe/FC y NVMe/TCP.

Si quiere más información sobre las configuraciones compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".

Limitaciones conocidas

  • La multivía de NVMe en kernel está deshabilitada de forma predeterminada para los hosts RHEL 8,9 NVMe-oF. Por lo tanto, debe habilitarla manualmente.

  • En los hosts RHEL 8,9, NVMe/TCP es una función de vista previa de tecnología debido a problemas abiertos.

  • Actualmente no se admite el arranque SAN mediante el protocolo NVMe-oF.

Habilite la multivía en kernel

Puede utilizar el siguiente procedimiento para habilitar la multivía en el kernel.

Pasos
  1. Instale RHEL 8,9 en el servidor host.

  2. Una vez finalizada la instalación, compruebe que está ejecutando el kernel de RHEL 8,9 especificado:

    # uname -r

    Ejemplo de salida

    4.18.0-513.5.1.el8_9.x86_64
  3. Instale el paquete nvme-cli:

    rpm -qa|grep nvme-cli

    Ejemplo de salida

    nvme-cli-1.16-9.el8.x86_64
  4. Habilitar multivía NVMe en kernel:

    # grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-513.5.1.el8_9.x86_64
  5. En el host, compruebe la cadena NQN del host en /etc/nvme/hostnqn:

    # cat /etc/nvme/hostnqn

    Ejemplo de salida

    nqn.2014-08.org.nvmexpress:uuid:4c4c4544-0032-3410-8035-b8c04f4c5132
  6. Compruebe que el hostnqn la cadena coincide con hostnqn Cadena para el subsistema correspondiente en la cabina de ONTAP:

    ::> vserver nvme subsystem host show -vserver vs_fcnvme_141

    Ejemplo de salida

    Vserver     Subsystem       Host NQN
    ----------- --------------- ----------------------------------------------------------
    vs_nvme101 rhel_101_QLe2772    nqn.2014-08.org.nvmexpress: uuid:4c4c4544-0032-3410-8035-b8c04f4c5132
    Nota Si las cadenas NQN del host no coinciden, puede usar el vserver modify Comando para actualizar la cadena NQN del host en el subsistema NVMe de ONTAP correspondiente para que coincidan con la cadena NQN del host /etc/nvme/hostnqn en el host.
  7. Reinicie el host.

Nota

Si tiene intención de ejecutar el tráfico coexistente de NVMe y SCSI en el mismo host, NetApp recomienda utilizar el acceso multivía de NVMe in-kernel para espacios de nombres de ONTAP y dm-multipath para LUN de ONTAP respectivamente. Esto debería excluir los espacios de nombres ONTAP de dm-multipath y evitar que dm-multipath reclame estos dispositivos de espacio de nombres. Puede hacerlo añadiendo el enable_foreign ajuste en la /etc/multipath.conf archivo:

# cat /etc/multipath.conf
defaults {
  enable_foreign  NONE
}

Configure NVMe/FC

Puede configurar NVMe/FC para adaptadores Broadcom/Emulex o Marvell/Qlogic.

Broadcom/Emulex
Pasos
  1. Compruebe que está utilizando el modelo de adaptador admitido:

    # cat /sys/class/scsi_host/host*/modelname

    Ejemplo de salida:

    LPe32002-M2
    LPe32002-M2
    # cat /sys/class/scsi_host/host*/modeldesc

    Ejemplo de salida:

    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
  2. Compruebe que está utilizando la Broadcom recomendada lpfc firmware y controlador de bandeja de entrada:

    # cat /sys/class/scsi_host/host*/fwrev
    14.2.539.16, sli-4:2:c
    14.2.539.16, sli-4:2:c
    # cat /sys/module/lpfc/version
    0:14.0.0.21

    Para obtener la lista más actual de las versiones de firmware y controladores de adaptador compatibles, consulte "Herramienta de matriz de interoperabilidad de NetApp".

  3. Compruebe que lpfc_enable_fc4_type se establece en 3:

    # cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type
    3
  4. Compruebe que los puertos del iniciador están en funcionamiento y que puede ver los LIF de destino:

    # cat /sys/class/fc_host/host*/port_name
    0x10000090fae0ec88
    0x10000090fae0ec89
    # cat /sys/class/fc_host/host*/port_state
    Online
    Online
    # cat /sys/class/scsi_host/host*/nvme_info
    NVME Initiator Enabled
    XRI Dist lpfc0 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc0 WWPN x10000090fae0ec88 WWNN x20000090fae0ec88 DID x0a1300 ONLINE
    NVME RPORT       WWPN x2049d039ea36a105 WWNN x2048d039ea36a105 DID x0a0c0a TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000024 Cmpl 0000000024 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 00000000000001aa Issue 00000000000001ab OutIO 0000000000000001
            abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00000002 Err 00000003
    NVME Initiator Enabled
    XRI Dist lpfc1 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc1 WWPN x10000090fae0ec89 WWNN x20000090fae0ec89 DID x0a1200 ONLINE
    NVME RPORT       WWPN x204ad039ea36a105 WWNN x2048d039ea36a105 DID x0a080a TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000024 Cmpl 0000000024 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 00000000000001ac Issue 00000000000001ad OutIO 0000000000000001
            abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00000002 Err 00000003
Adaptador FC Marvell/QLogic para NVMe/FC

El controlador de la bandeja de entrada nativa qla2xxx que se incluye en el kernel GA de RHEL 8,9 tiene las correcciones más recientes. Estas correcciones son esenciales para la compatibilidad con ONTAP.

Pasos
  1. Compruebe que está ejecutando las versiones de firmware y controlador del adaptador compatibles:

    # cat /sys/class/fc_host/host*/symbolic_name

    Ejemplo de salida

    QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k
    QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k
  2. Compruebe que ql2xnvmeenable está configurado. Esto permite que el adaptador Marvell funcione como iniciador NVMe/FC:

    # cat /sys/module/qla2xxx/parameters/ql2xnvmeenable
    1

Habilitar 1MB I/O (opcional)

ONTAP informa de un MDT (tamaño de transferencia de MAX Data) de 8 en los datos Identify Controller. Esto significa que el tamaño máximo de solicitud de E/S puede ser de hasta 1MB TB. Para emitir solicitudes de I/O de tamaño 1 MB para un host Broadcom NVMe/FC, debe aumentar lpfc el valor lpfc_sg_seg_cnt del parámetro a 256 con respecto al valor predeterminado de 64.

Nota Estos pasos no se aplican a los hosts Qlogic NVMe/FC.
Pasos
  1. Defina el lpfc_sg_seg_cnt parámetro en 256:

    cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_sg_seg_cnt=256
  2. Ejecute dracut -f el comando y reinicie el host.

  3. Compruebe que el valor esperado de lpfc_sg_seg_cnt es 256:

    cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt

Configure NVMe/TCP

NVMe/TCP no tiene la funcionalidad de conexión automática. Por lo tanto, si una ruta deja de funcionar y no se restablece en el tiempo de espera predeterminado de 10 minutos, no se puede volver a conectar automáticamente NVMe/TCP. Para evitar que se agote el tiempo de espera, debe definir el período de reintento para los eventos de conmutación por error en al menos 30 minutos.

Pasos
  1. Compruebe que el puerto del iniciador pueda recuperar los datos de la página de registro de detección en las LIF NVMe/TCP admitidas:

    nvme discover -t tcp -w host-traddr -a traddr

    Ejemplo de salida:

    # nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14 -l 1800
    
    Discovery Log Number of Records 8, Generation counter 18
    =====Discovery Log Entry 0======
    trtype:  tcp
    adrfam:  ipv4
    subtype: unrecognized
    treq:    not specified.
    portid:  0
    trsvcid: 8009
    subnqn:  nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b: discovery
    traddr:  192.168.211.15
    sectype: none
    =====Discovery Log Entry 1======
    trtype:  tcp
    adrfam:  ipv4
    subtype: unrecognized
    treq:    not specified.
    portid:  1
    trsvcid: 8009
    subnqn:  nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b: discovery
    traddr:  192.168.111.15
    sectype: none ..........
  2. Compruebe que las otras combinaciones de LIF iniciador-objetivo NVMe/TCP puedan recuperar correctamente los datos de la página del registro de detección:

    nvme discover -t tcp -w host-traddr -a traddr

    Ejemplo de salida:

    # nvme	discover	-t   tcp    -w	192.168.111.79   -a	192.168.111.14
    # nvme	discover	-t   tcp    -w	192.168.111.79   -a	192.168.111.15
    # nvme	discover	-t   tcp    -w	192.168.211.79   -a	192.168.211.14
    # nvme	discover	-t   tcp    -w	192.168.211.79   -a	192.168.211.15
  3. Ejecute el nvme connect-all Comando en todos los LIF de destino iniciador NVMe/TCP admitidos en los nodos y establezca el período de tiempo de espera de pérdida de la controladora durante al menos 30 minutos o 1800 segundos:

    nvme connect-all -t tcp -w host-traddr -a traddr -l 1800

    Ejemplo de salida:

    # nvme	connect-all	-t	tcp	-w	192.168.111.79	-a	192.168.111.14	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.111.79	-a	192.168.111.15	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.211.79	-a	192.168.211.14	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.211.79	-a	192.168.211.15	-l	1800

Valide NVMe-of

Puede usar el siguiente procedimiento para validar NVMe-oF.

Pasos
  1. Compruebe que la multivía NVMe en kernel esté habilitada:

    # cat /sys/module/nvme_core/parameters/multipath
    Y
  2. Compruebe que la configuración de NVMe-of adecuada (como, model establezca en NetApp ONTAP Controller y equilibrio de carga iopolicy establezca en round-robin) Para los respectivos espacios de nombres ONTAP se refleja correctamente en el host:

    # cat /sys/class/nvme-subsystem/nvme-subsys*/model
    NetApp ONTAP Controller
    NetApp ONTAP Controller
    # cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy
    round-robin
    round-robin
  3. Verifique que los espacios de nombres se hayan creado y detectado correctamente en el host:

    # nvme list

    Ejemplo de salida:

    Node         SN                   Model
    ---------------------------------------------------------
    /dev/nvme0n1 81Gx7NSiKSQqAAAAAAAB	NetApp ONTAP Controller
    
    
    Namespace Usage    Format             FW             Rev
    -----------------------------------------------------------
    1                 21.47 GB / 21.47 GB	4 KiB + 0 B   FFFFFFFF
  4. Compruebe que el estado de la controladora de cada ruta sea activo y que tenga el estado de ANA correcto:

    NVMe/FC
    # nvme list-subsys /dev/nvme3n1

    Ejemplo de salida:

    nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.8e501f8ebafa11ec9b99d039ea359e4b:subsystem.rhel_163_Qle2742
    +- nvme0 fc traddr=nn-0x204dd039ea36a105:pn-0x2050d039ea36a105 host_traddr=nn-0x20000024ff7f4994:pn-0x21000024ff7f4994 live non-optimized
    +- nvme1 fc traddr=nn-0x204dd039ea36a105:pn-0x2050d039ea36a105 host_traddr=nn-0x20000024ff7f4994:pn-0x21000024ff7f4994 live non-optimized
    +- nvme2 fc traddr=nn-0x204dd039ea36a105:pn-0x204fd039ea36a105 host_traddr=nn-0x20000024ff7f4995:pn-0x21000024ff7f4995 live optimized
    +- nvme3 fc traddr=nn-0x204dd039ea36a105:pn-0x204ed039ea36a105 host_traddr=nn-0x20000024ff7f4994:pn-0x21000024ff7f4994 live optimized
    NVMe/TCP
    # nvme list-subsys /dev/nvme0n1

    Ejemplo de salida:

    nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:subsystem.rhel_tcp_165\
    +- nvme0 tcp traddr=192.168.111.15 trsvcid=4420 host_traddr=192.168.111.79 live non-optimized
    +- nvme1 tcp traddr=192.168.111.14 trsvcid=4420 host_traddr=192.168.111.79 live optimized
    +- nvme2 tcp traddr=192.168.211.15 trsvcid=4420 host_traddr=192.168.211.79 live non-optimized
    +- nvme3 tcp traddr=192.168.211.14 trsvcid=4420 host_traddr=192.168.211.79 live optimized
  5. Confirmar que el complemento de NetApp muestra los valores correctos para cada dispositivo de espacio de nombres ONTAP:

    Columna
    # nvme netapp ontapdevices -o column

    Ejemplo de salida:

    Device        Vserver   Namespace Path
    ----------------------- ------------------------------
    /dev/nvme0n1 vs_tcp79           /vol/vol1/ns
    
    
    NSID       UUID                                   Size
    ------------------------------------------------------------
    1          aa197984-3f62-4a80-97de-e89436360cec	21.47GB
    JSON
    # nvme netapp ontapdevices -o json

    Ejemplo de salida

    {
      "ONTAPdevices”: [
        {
          "Device”: "/dev/nvme0n1",
          "Vserver”: "vs_tcp79",
          "Namespace Path”: "/vol/vol1/ns",
          "NSID”: 1,
          "UUID”: "aa197984-3f62-4a80-97de-e89436360cec",
          "Size”: "21.47GB",
          "LBA_Data_Size”: 4096,
          "Namespace Size" : 5242880
        },
    ]
    
    }

Problemas conocidos

La configuración de host de NVMe-oF para RHEL 8,9 con la versión ONTAP tiene el siguiente problema conocido:

ID de error de NetApp Título Descripción

"1479047"

Los hosts RHEL 8,9 NVMe-oF crean controladoras de detección persistente duplicadas

En los hosts NVMe over Fabrics (NVMe-of), es posible utilizar el comando "nvme Discover -p" para crear controladoras de detección persistente (PDCs). Cuando se utiliza este comando, sólo se debe crear un PDC por combinación iniciador-destino. Sin embargo, si ejecuta Red Hat Enterprise Linux (RHEL) 8,9 en un host NVMe-oF, se crea un PDC duplicado cada vez que se ejecuta «nvme discover -p». Esto lleva a un uso innecesario de recursos tanto en el host como en el destino.