Configurazione host NVMe-of per RHEL 8,10 con ONTAP
NVMe over Fabrics (NVMe-of), incluso NVMe over Fibre Channel (NVMe/FC) e altri tipi di trasporto, è supportato da Red Hat Enterprise Linux (RHEL) 8,10 con Asymmetric Namespace Access (ANA). Negli ambienti NVMe-of, ANA è l'equivalente del multipathing ALUA in ambienti iSCSI e FC ed è implementato con multipath NVMe nel kernel.
Il seguente supporto è disponibile per la configurazione host NVMe-of per RHEL 8,10 con ONTAP:
-
Supporto per NVMe su TCP (NVMe/TCP) oltre a NVMe/FC. Il plug-in NetApp nel nativo
nvme-cli
Il pacchetto visualizza i dettagli ONTAP per gli spazi dei nomi NVMe/FC e NVMe/TCP.
Per ulteriori informazioni sulle configurazioni supportate, consultare "Tool di matrice di interoperabilità NetApp".
Limitazioni note
-
Il multipath NVMe in-kernel è disattivato per impostazione predefinita per gli host RHEL 8,10 NVMe-of. Pertanto, è necessario attivarlo manualmente.
-
Sugli host RHEL 8,10, NVMe/TCP è una funzionalità di anteprima della tecnologia a causa di problemi aperti.
-
L'avvio SAN che utilizza il protocollo NVMe-of non è attualmente supportato.
Abilitare multipath in-kernel
È possibile utilizzare la seguente procedura per abilitare il multipath in-kernel.
-
Installare RHEL 8,10 sul server host.
-
Una volta completata l'installazione, verificare che il kernel RHEL 8,10 specificato sia in esecuzione:
# uname -r
Esempio di output
4.18.0-553.el8_10.x86_64
-
Installare
nvme-cli
pacchetto:rpm -qa|grep nvme-cli
Esempio di output
nvme-cli-1.16-9.el8.x86_64
-
Abilita multipath NVMe nel kernel:
Esempio
# grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-553.el8_10.x86_64
-
Sull'host, controllare la stringa NQN host su
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
Esempio di output
nqn.2014-08.org.nvmexpress:uuid:4c4c4544-0032-3410-8035-b8c04f4c5132
-
Verificare che il
hostnqn
la stringa corrisponde a.hostnqn
Stringa per il sottosistema corrispondente sull'array ONTAP:::> vserver nvme subsystem host show -vserver vs_fcnvme_141
Esempio di output
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_25_2742 rhel_101_QLe2772 nqn.2014-08.org.nvmexpress:uuid:546399fc-160f-11e5-89aa-98be942440ca
Se le stringhe NQN host non corrispondono, è possibile utilizzare vserver modify
Per aggiornare la stringa NQN host nel sottosistema NVMe ONTAP corrispondente in modo che corrisponda alla stringa NQN host/etc/nvme/hostnqn
sull'host. -
Riavviare l'host.
Se si intende eseguire traffico NVMe e SCSI coesistente sullo stesso host, NetApp consiglia di utilizzare il multipath NVMe nel kernel rispettivamente per gli spazi dei nomi ONTAP e il multipath dm per i LUN ONTAP. Questo dovrebbe escludere gli spazi dei nomi ONTAP da dm-multipath e impedire che dm-multipath recuperi questi dispositivi dello spazio dei nomi. È possibile farlo aggiungendo il # cat /etc/multipath.conf defaults { enable_foreign NONE } |
Configurare NVMe/FC
È possibile configurare NVMe/FC per gli adattatori Broadcom/Emulex o Marvell/Qlogic.
-
Verificare di utilizzare il modello di adattatore supportato:
# cat /sys/class/scsi_host/host*/modelname
Esempio di output:
LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc
Esempio di output:
Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Verificare di utilizzare il Broadcom consigliato
lpfc
firmware e driver della posta in arrivo:# cat /sys/class/scsi_host/host*/fwrev 14.2.539.21, sli-4:2:c 14.2.539.21, sli-4:2:c
# cat /sys/module/lpfc/version 0:14.0.0.21
Per l'elenco più aggiornato delle versioni firmware e dei driver della scheda di rete supportati, consultare "Tool di matrice di interoperabilità NetApp".
-
Verificare che
lpfc_enable_fc4_type
è impostato su3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Verificare che le porte dell'iniziatore siano attive e in esecuzione e che siano visualizzate le LIF di destinazione:
# cat /sys/class/fc_host/host*/port_name 0x10000090fae0ec88 0x10000090fae0ec89
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109bf044b1 WWNN x200000109bf044b1 DID x022a00 ONLINE NVME RPORT WWPN x211ad039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x021302 TARGET DISCSRVC ONLINE NVME RPORT WWPN x211cd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x020b02 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 00000001ff Cmpl 00000001ff Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000001330ec7 Issue 0000000001330ec9 OutIO 0000000000000002 abort 00000330 noxri 00000000 nondlp 0000000b qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000354 Err 00000361 NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109bf044b2 WWNN x200000109bf044b2 DID x021b00 ONLINE NVME RPORT WWPN x211bd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x022902 TARGET DISCSRVC ONLINE NVME RPORT WWPN x211dd039eaa7dfc8 WWNN x2119d039eaa7dfc8 DID x020102 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 00000001ff Cmpl 00000001ff Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 00000000012ec220 Issue 00000000012ec222 OutIO 0000000000000002 abort 0000033b noxri 00000000 nondlp 00000085 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000368 Err 00000382
Il driver inbox qla2xxx nativo incluso nel kernel RHEL 8,10 GA ha le ultime correzioni upstream. Queste correzioni sono essenziali per il supporto di ONTAP.
-
Verificare che siano in esecuzione le versioni del firmware e del driver dell'adattatore supportate:
# cat /sys/class/fc_host/host*/symbolic_name
Esempio di output
QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k QLE2742 FW: v9.10.11 DVR: v10.02.08.200-k
-
Verificare che
ql2xnvmeenable
è impostato. Ciò consente all'adattatore Marvell di funzionare come iniziatore NVMe/FC:# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Abilita i/o da 1 MB (opzionale)
ONTAP riporta un MDTS (MAX Data Transfer Size) di 8 nei dati del controller di identificazione. Ciò significa che le dimensioni massime delle richieste i/o possono essere fino a 1MB MB. Per emettere richieste di i/o di dimensioni pari a 1 MB per un host Broadcom NVMe/FC, è necessario aumentare il lpfc
valore del lpfc_sg_seg_cnt
parametro a 256 dal valore predefinito di 64.
I seguenti passaggi non si applicano agli host Qlogic NVMe/FC. |
-
Impostare il
lpfc_sg_seg_cnt
parametro su 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Eseguire il
dracut -f
comando e riavviare l'host: -
Verificare che
lpfc_sg_seg_cnt
sia 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Il valore previsto è 256.
Configurare NVMe/TCP
NVMe/TCP non dispone della funzionalità di connessione automatica. Pertanto, se un percorso non viene eseguito e non viene ripristinato entro il periodo di timeout predefinito di 10 minuti, NVMe/TCP non può riconnettersi automaticamente. Per evitare un timeout, impostare il periodo di ripetizione degli eventi di failover su almeno 30 minuti.
-
Verificare che la porta iniziatore possa recuperare i dati della pagina del registro di rilevamento attraverso le LIF NVMe/TCP supportate:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
# nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.25 Discovery Log Number of Records 8, Generation counter 18 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified. portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:discovery: discovery traddr: 192.168.1.25 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified. portid: 1 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:discovery traddr: 192.168.2.26 sectype: none ..........
-
Verificare che le altre combinazioni LIF iniziatore-destinazione NVMe/TCP possano recuperare correttamente i dati della pagina del registro di rilevamento:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
# nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.25 # nvme discover -t tcp -w 192.168.1.31 -a 192.168.1.24 # nvme discover -t tcp -w 192.168.2.31 -a 192.168.2.26 # nvme discover -t tcp -w 192.168.1.31 -a 192.168.1.25
-
Eseguire
nvme connect-all
Controlla tutti i LIF di destinazione dell'iniziatore NVMe/TCP supportati nei nodi e imposta il periodo di timeout per la perdita del controller per almeno 30 minuti o 1800 secondi:nvme connect-all -t tcp -w host-traddr -a traddr -l 1800
Esempio di output:
# nvme connect-all -t tcp -w 192.168.2.31 -a 192.168.2.25 -l 1800 # nvme connect-all -t tcp -w 192.168.1.31 -a 192.168.1.24 -l 1800 # nvme connect-all -t tcp -w 192.168.2.31 -a 192.168.2.26 -l 1800 # nvme connect-all -t tcp -w 192.168.1.31 -a 192.168.1.25 -l 1800
Validare NVMe-of
È possibile utilizzare la seguente procedura per convalidare NVMe-of.
-
Verificare che il multipath NVMe nel kernel sia attivato:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Verificare che le impostazioni NVMe-of appropriate (ad esempio,
model
impostare suNetApp ONTAP Controller
e bilanciamento del caricoiopolicy
impostare suround-robin
) Per i rispettivi spazi dei nomi ONTAP, riflettere correttamente sull'host:# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Verificare che gli spazi dei nomi siano stati creati e rilevati correttamente sull'host:
# nvme list
Esempio di output:
Node SN Model --------------------------------------------------------- /dev/nvme0n1 81K1ABVnkwbNAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Verificare che lo stato del controller di ciascun percorso sia attivo e che abbia lo stato ANA corretto:
NVMe/FC# nvme list-subsys /dev/nvme0n1
Esempio di output:
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.0cd9ee0dc0ec11ee8e7fd039ea9e8ae9:subsystem.nvme \ +- nvme1 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2086d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6d:pn-0x21000024ff752e6d live non-optimized +- nvme2 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2016d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6c:pn-0x21000024ff752e6c live optimized +- nvme3 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2081d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6c:pn-0x21000024ff752e6c live non-optimized +- nvme4 fc traddr=nn-0x2005d039eaa7dfc8:pn-0x2087d039eaa7dfc8 host_traddr=nn-0x20000024ff752e6d:pn-0x21000024ff752e6d live optimized
NVMe/TCP# nvme list-subsys /dev/nvme0n1
Esempio di output:
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.a1b2b785b9de11ee8e7fd039ea9e8ae9:subsystem.nvme_tcp_1 \ +- nvme0 tcp traddr=192.168.2.26 trsvcid=4420 host_traddr=192.168.2.31 live non-optimized +- nvme1 tcp traddr=192.168.2.25 trsvcid=4420 host_traddr=192.168.2.31 live optimized +- nvme2 tcp traddr=192.168.1.25 trsvcid=4420 host_traddr=192.168.1.31 live non-optimized +- nvme3 tcp traddr=192.168.1.24 trsvcid=4420 host_traddr=192.168.1.31 live optimized
-
Verificare che il plug-in NetApp visualizzi i valori corretti per ciascun dispositivo dello spazio dei nomi ONTAP:
Colonna# nvme netapp ontapdevices -o column
Esempio di output:
Device Vserver Namespace Path ----------------------------------------------------- /dev/nvme0n1 tcpiscsi_129 /vol/tcpnvme_1_0_0/tcpnvme_ns NSID UUID Size ------------------------------------------------------------ 1 05c2c351-5d7f-41d7-9bd8-1a56c 21.47GB
JSON# nvme netapp ontapdevices -o json
Esempio di output
{ "ONTAPdevices": [ { "Device": "/dev/nvme0n1", "Vserver": "tcpiscsi_129", "Namespace Path”: /vol/tcpnvme_1_0_0/tcpnvme_ns ", "NSID": 1, "UUID": " 05c2c351-5d7f-41d7-9bd8-1a56c160c80b ", "Size2: "21.47GB", "LBA_Data_Size": 4096, "Namespace Size" : 5242880 }, ] }
Problemi noti
La configurazione host NVMe-of per RHEL 8,10 con ONTAP presenta il seguente problema noto:
ID bug NetApp | Titolo | Descrizione |
---|---|---|
Gli host RHEL 8,10 NVMe-of creano controller di Discovery persistenti duplicati |
Sugli host NVMe over Fabrics (NVMe-of), è possibile utilizzare il comando "nvme Discover -p" per creare controller di rilevamento persistenti (PDC). Quando si utilizza questo comando, è necessario creare un solo PDC per ogni combinazione initiator-target. Tuttavia, se utilizzi Red Hat Enterprise Linux (RHEL) 8,10 su un host NVMe-of, ogni volta che viene eseguito "nvme Discover -p" viene creato un PDC duplicato. Ciò comporta un utilizzo non necessario delle risorse sia sull'host che sulla destinazione. |