Skip to main content
SAN hosts and cloud clients
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Configurazione host NVMe-of per RHEL 8,8 con ONTAP

Collaboratori

NVMe over Fabrics (NVMe-of), inclusi NVMe over Fibre Channel (NVMe/FC) e altri trasporti, è supportato con Red Hat Enterprise Linux (RHEL) 8.8 con Ametric namespace Access (ANA). Negli ambienti NVMe-of, ANA è l'equivalente del multipathing ALUA in ambienti iSCSI e FC ed è implementato con multipath NVMe nel kernel.

Il seguente supporto è disponibile per la configurazione host NVMe-of per RHEL 8.8 con ONTAP:

  • Supporto per NVMe su TCP (NVMe/TCP) oltre a NVMe/FC. Il plug-in NetApp nel pacchetto nvme-cli nativo visualizza i dettagli ONTAP per gli spazi dei nomi NVMe/FC e NVMe/TCP.

Per ulteriori informazioni sulle configurazioni supportate, consultare "Tool di matrice di interoperabilità NetApp".

Limitazioni note

  • Il multipath NVMe nel kernel è disattivato per impostazione predefinita per gli host RHEL 8.8 NVMe-of. Pertanto, è necessario attivarlo manualmente.

  • Negli host RHEL 8.8, NVMe/TCP è una funzionalità di anteprima tecnologica dovuta a problemi aperti.

  • L'avvio SAN che utilizza il protocollo NVMe-of non è attualmente supportato.

Abilitare multipath in-kernel

È possibile utilizzare la procedura seguente per attivare il multipath in-kernal.

Fasi
  1. Installare RHEL 8.8 sul server host.

  2. Una volta completata l'installazione, verificare di eseguire il kernel RHEL 8.8 specificato.

    # uname -r

    Esempio di output

    4.18.0-477.10.1.el8_8.x86_64
  3. Installare il pacchetto nvme-cli:

    rpm -qa|grep nvme-cli

    Esempio di output

    nvme-cli-1.16-7.el8.x86_64
  4. Abilita in -kernel NVMe multipath:

    # grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-477.10.1.el8_8.x86_64
  5. Sull'host, controllare la stringa NQN host su /etc/nvme/hostnqn:

    # cat /etc/nvme/hostnqn

    Esempio di output

    nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
  6. Verificare che il hostnqn la stringa corrisponde a. hostnqn Stringa per il sottosistema corrispondente sull'array ONTAP:

    ::> vserver nvme subsystem host show -vserver vs_fcnvme_141

    Esempio di output

    Vserver     Subsystem       Host NQN
    ----------- --------------- ----------------------------------------------------------
    vs_nvme161 rhel_161_LPe32002    nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
    Nota Se le stringhe NQN host non corrispondono, è possibile utilizzare vserver modify Per aggiornare la stringa NQN host nel sottosistema NVMe ONTAP corrispondente in modo che corrisponda alla stringa NQN host /etc/nvme/hostnqn sull'host.
  7. Riavviare l'host.

Nota

Se si intende eseguire traffico NVMe e SCSI coesistente sullo stesso host, NetApp consiglia di utilizzare il multipath NVMe nel kernel rispettivamente per gli spazi dei nomi ONTAP e il multipath dm per i LUN ONTAP. Ciò significa che gli spazi dei nomi ONTAP devono essere esclusi da dm-multipath per impedire a dm-multipath di rivendicare questi dispositivi dello spazio dei nomi. Per eseguire questa operazione, aggiungere enable_foreign impostazione su /etc/multipath.conf file:

# cat /etc/multipath.conf
defaults {
  enable_foreign  NONE
}

Configurare NVMe/FC

È possibile configurare NVMe/FC per gli adattatori Broadcom/Emulex o Marvell/Qlogic.

Broadcom/Emulex
Fasi
  1. Verificare di utilizzare il modello di adattatore supportato:

    # cat /sys/class/scsi_host/host*/modelname

    Esempio di output:

    LPe32002-M2
    LPe32002-M2
    # cat /sys/class/scsi_host/host*/modeldesc

    Esempio di output:

    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
  2. Verificare di utilizzare il Broadcom consigliato lpfc firmware e driver della posta in arrivo:

    # cat /sys/class/scsi_host/host*/fwrev
    14.0.639.18, sli-4:2:c
    14.0.639.18, sli-4:2:c
    # cat /sys/module/lpfc/version
    0:14.0.0.18

    Per l'elenco più aggiornato delle versioni firmware e dei driver della scheda di rete supportati, consultare "Tool di matrice di interoperabilità NetApp".

  3. Verificare che lpfc_enable_fc4_type è impostato su 3:

    # cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type
    3
  4. Verificare che le porte dell'iniziatore siano attive e in esecuzione e che siano visualizzate le LIF di destinazione:

    # cat /sys/class/fc_host/host*/port_name
    0x100000109b1c1204
    0x100000109b1c1205
    # cat /sys/class/fc_host/host*/port_state
    Online
    Online
    # cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled
    XRI Dist lpfc0 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc0 WWPN x10000090fae0ec88 WWNN x20000090fae0ec88 DID x0a1300 ONLINE
    NVME RPORT       WWPN x2049d039ea36a105 WWNN x2048d039ea36a105 DID x0a0c0a TARGET DISCSRVC ONLINE
    NVME RPORT       WWPN x204bd039ea36a105 WWNN x2048d039ea36a105 DID x0a100a TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000
    LS XMIT: Err 00000000  CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000000825e567 Issue 000000000825d7ed OutIO fffffffffffff286
    abort 0000027c noxri 00000000 nondlp 00000a02 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00000782 Err 000130fa
    
    NVME Initiator Enabled
    XRI Dist lpfc1 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc1 WWPN x10000090fae0ec89 WWNN x20000090fae0ec89 DID x0a1200 ONLINE
    NVME RPORT       WWPN x204ad039ea36a105 WWNN x2048d039ea36a105 DID x0a080a TARGET DISCSRVC ONLINE
    NVME RPORT       WWPN x204cd039ea36a105 WWNN x2048d039ea36a105 DID x0a090a TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000
    LS XMIT: Err 00000000  CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000000826ced5 Issue 000000000826c226 OutIO fffffffffffff351
            abort 0000029d noxri 00000000 nondlp 000008df qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00000821 Err 00012fcd
Adattatore FC Marvell/QLogic per NVMe/FC
Fasi
  1. Il driver nativo qla2xxx della posta in arrivo incluso nel kernel GA RHEL 8.8 ha le ultime correzioni upstream essenziali per il supporto di ONTAP. Verificare che siano in esecuzione le versioni del firmware e del driver dell'adattatore supportate:

    # cat /sys/class/fc_host/host*/symbolic_name

    Esempio di output

    QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug
    QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug
  2. Verificare che ql2xnvmeenable è impostato. Ciò consente all'adattatore Marvell di funzionare come iniziatore NVMe/FC:

    # cat /sys/module/qla2xxx/parameters/ql2xnvmeenable
    1

Abilita i/o da 1 MB (opzionale)

ONTAP riporta un MDTS (MAX Data Transfer Size) di 8 nei dati del controller di identificazione. Ciò significa che le dimensioni massime delle richieste i/o possono essere fino a 1MB MB. Per emettere richieste di i/o di dimensioni pari a 1 MB per un host Broadcom NVMe/FC, è necessario aumentare il lpfc valore del lpfc_sg_seg_cnt parametro a 256 dal valore predefinito di 64.

Fasi
  1. Impostare il lpfc_sg_seg_cnt parametro su 256:

    # cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_sg_seg_cnt=256
  2. Eseguire un dracut -f comando e riavviare l'host:

  3. Verificare che lpfc_sg_seg_cnt sia 256:

    # cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
    256
Nota Non applicabile agli host Qlogic NVMe/FC.

Configurare NVMe/TCP

NVMe/TCP non dispone della funzionalità di connessione automatica. Pertanto, se un percorso non viene eseguito e non viene ripristinato entro il periodo di timeout predefinito di 10 minuti, NVMe/TCP non può riconnettersi automaticamente. Per evitare un timeout, impostare il periodo di ripetizione degli eventi di failover su almeno 30 minuti.

Fasi
  1. Verificare che la porta iniziatore possa recuperare i dati della pagina del registro di rilevamento attraverso le LIF NVMe/TCP supportate:

    nvme discover -t tcp -w host-traddr -a traddr

    Esempio di output:

    # nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14
    
    Discovery Log Number of Records 8, Generation counter 10
    =====Discovery Log Entry 0======
    trtype:  tcp
    adrfam:  ipv4
    subtype: unrecognized
    treq:    not specified
    portid:  0
    trsvcid: 8009
    subnqn:  nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery
    traddr:  192.168.211.15
    sectype: none
    =====Discovery Log Entry 1======
    trtype:  tcp
    adrfam:  ipv4
    subtype: unrecognized
    treq:    not specified
    portid:  1
    trsvcid: 8009
    subnqn:  nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery
    traddr:  192.168.111.15
    sectype: none
    =====Discovery Log Entry 2======
    trtype:  tcp
    adrfam:  ipv4
    subtype: unrecognized
    treq:    not specified
    portid:  2
    trsvcid: 8009
    subnqn:  nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery
    traddr:  192.168.211.14
    sectype: none
    ..........
  2. Verificare che le altre combinazioni LIF iniziatore-destinazione NVMe/TCP possano recuperare correttamente i dati della pagina del registro di rilevamento:

    nvme discover -t tcp -w host-traddr -a traddr

    Esempio di output:

    # nvme	discover	-t   tcp    -w	192.168.111.79   -a	192.168.111.14
    # nvme	discover	-t   tcp    -w	192.168.111.79   -a	192.168.111.15
    # nvme	discover	-t   tcp    -w	192.168.211.79   -a	192.168.211.14
    # nvme	discover	-t   tcp    -w	192.168.211.79   -a	192.168.211.15
  3. Eseguire nvme connect-all Controlla tutti i LIF di destinazione dell'iniziatore NVMe/TCP supportati nei nodi e imposta il periodo di timeout per la perdita del controller per almeno 30 minuti o 1800 secondi:

    nvme connect-all -t tcp -w host-traddr -a traddr -l 1800

    Esempio di output:

    # nvme	connect-all	-t	tcp	-w	192.168.111.79	-a	192.168.111.14	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.111.79	-a	192.168.111.15	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.211.79	-a	192.168.211.14	-l	1800
    # nvme	connect-all	-t	tcp	-w	192.168.211.79	-a	192.168.211.15	-l	1800

Validare NVMe-of

È possibile utilizzare la seguente procedura per convalidare NVME-of.

Fasi
  1. Verificare che il multipath NVMe nel kernel sia attivato:

    # cat /sys/module/nvme_core/parameters/multipath
    Y
  2. Verificare che le impostazioni NVMe-of appropriate (ad esempio, model impostare su NetApp ONTAP Controller e bilanciamento del carico iopolicy impostare su round-robin) Per i rispettivi spazi dei nomi ONTAP, riflettere correttamente sull'host:

    # cat /sys/class/nvme-subsystem/nvme-subsys*/model
    NetApp ONTAP Controller
    NetApp ONTAP Controller
    # cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy
    round-robin
    round-robin
  3. Verificare che gli spazi dei nomi siano stati creati e rilevati correttamente sull'host:

    # nvme list

    Esempio di output:

    Node         SN                   Model
    ---------------------------------------------------------
    /dev/nvme3n1 81Gx7NSiKSQeAAAAAAAB	NetApp ONTAP Controller
    
    
    Namespace Usage    Format             FW             Rev
    -----------------------------------------------------------
    1                 21.47 GB / 21.47 GB	4 KiB + 0 B   FFFFFFFF
  4. Verificare che lo stato del controller di ciascun percorso sia attivo e che abbia lo stato ANA corretto:

    NVMe/FC
    # nvme list-subsys /dev/nvme3n1

    Esempio di output:

    nvme-subsys3 - NQN=nqn.1992-08.com.netapp:sn.ab4fa6a5ba8b11ecbe3dd039ea359e4b:subsystem.rhel_161_Lpe32002
    \
     +- nvme0 fc traddr=nn-0x2048d039ea36a105:pn-0x204cd039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live non-optimized
     +- nvme1 fc traddr=nn-0x2048d039ea36a105:pn-0x204ad039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live optimized
     +- nvme2 fc traddr=nn-0x2048d039ea36a105:pn-0x204bd039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live non-optimized
     +- nvme4 fc traddr=nn-0x2048d039ea36a105:pn-0x2049d039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live optimized
    NVMe/TCP
    # nvme list-subsys /dev/nvme0n1

    Esempio di output:

    nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:subsystem.rhel_tcp_165
    \
     +- nvme0 tcp traddr=192.168.111.15 trsvcid=4420 host_traddr=192.168.111.79 live non-optimized
     +- nvme1 tcp traddr=192.168.111.14 trsvcid=4420 host_traddr=192.168.111.79 live optimized
     +- nvme2 tcp traddr=192.168.211.15 trsvcid=4420 host_traddr=192.168.211.79 live non-optimized
  5. Verificare che il plug-in NetApp visualizzi i valori corretti per ciascun dispositivo dello spazio dei nomi ONTAP:

    Colonna
    # nvme netapp ontapdevices -o column

    Esempio di output:

    Device        Vserver   Namespace Path
    ----------------------- ------------------------------
    /dev/nvme0n1 vs_tcp           /vol/vol1/ns1
    
    
    
    NSID       UUID                                   Size
    ------------------------------------------------------------
    1          338d73ce-b5a8-4847-9cc9-b127c75d8855	21.47GB
    JSON
    # nvme netapp ontapdevices -o json

    Esempio di output

    {
      "ONTAPdevices" : [
        {
          "Device" : "/dev/nvme0n1",
          "Vserver" : "vs_tcp79",
          "Namespace_Path" : "/vol/vol1/ns1",
          "NSID" : 1,
          "UUID" : "338d73ce-b5a8-4847-9cc9-b127c75d8855",
          "Size" : "21.47GB",
          "LBA_Data_Size" : 4096,
          "Namespace_Size" : 5242880
        },
    ]
    
    }

Problemi noti

La configurazione dell'host NVMe-of per RHEL 8.8 con release ONTAP presenta i seguenti problemi noti:

ID bug NetApp Titolo Descrizione

"1479047"

Gli host RHEL 8.8 NVMe-of creano controller di rilevamento persistenti duplicati

Sugli host NVMe over Fabrics (NVMe-of), è possibile utilizzare il comando "nvme Discover -p" per creare controller di rilevamento persistenti (PDC). Quando si utilizza questo comando, è necessario creare un solo PDC per ogni combinazione initiator-target. Tuttavia, se si esegue Red Hat Enterprise Linux (RHEL) 8.8 su un host NVMe-of, viene creato un PDC duplicato ogni volta che viene eseguito "nvme Discover -p". Ciò comporta un utilizzo non necessario delle risorse sia sull'host che sulla destinazione.