Configurazione host NVMe-of per RHEL 9,4 con ONTAP
NVMe over Fabrics (NVMe-of), incluso NVMe over Fibre Channel (NVMe/FC) e altri tipi di trasporto, è supportato da Red Hat Enterprise Linux (RHEL) 9,4 con Asymmetric Namespace Access (ANA). Negli ambienti NVMe-of, ANA è l'equivalente del multipathing ALUA in ambienti iSCSI e FC ed è implementato con multipath NVMe nel kernel.
Il seguente supporto è disponibile per la configurazione host NVMe-of per RHEL 9,4 con ONTAP:
-
Supporto per NVMe su TCP (NVMe/TCP) oltre a NVMe/FC. Il plug-in NetApp nel nativo
nvme-cli
Il pacchetto visualizza i dettagli ONTAP per gli spazi dei nomi NVMe/FC e NVMe/TCP. -
Utilizzo del traffico NVMe e SCSI esistente sullo stesso host su un determinato host bus adapter (HBA) senza le impostazioni dm-multipath esplicite per impedire il recupero dei namespace NVMe.
Per ulteriori informazioni sulle configurazioni supportate, consultare "Tool di matrice di interoperabilità NetApp".
Caratteristiche
-
RHEL 9,4 ha la funzionalità multipath NVMe in-kernel abilitata per i namespace NVMe per impostazione predefinita; pertanto, non sono necessarie impostazioni esplicite.
-
È supportato l'avvio SAN che utilizza il protocollo NVMe/FC.
Limitazioni note
Non esistono limitazioni note.
Convalidare le versioni software
È possibile utilizzare la seguente procedura per convalidare le versioni minime del software RHEL 9,4 supportate.
-
Installare RHEL 9,4 sul server. Una volta completata l'installazione, verificare che il kernel RHEL 9,4 specificato sia in esecuzione:
# uname -r
Esempio di output:
5.14.0-423.el9.x86_64
-
Installare
nvme-cli
pacchetto:# rpm -qa|grep nvme-cli
Esempio di output:
nvme-cli-2.6-4.el9.x86_64
-
Installare
libnvme
pacchetto:#rpm -qa|grep libnvme
Esempio di output
libnvme-1.6-1.el9.x86_64
-
Sull'host RHEL 9,4, controllare la stringa hostnqn all'indirizzo
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
Esempio di output
nqn.2014-08.org.nvmexpress:uuid: uuid:4c4c4544-0036-5610-804a-c7c04f365a32
-
Verificare che il
hostnqn
la stringa corrisponde a.hostnqn
Stringa per il sottosistema corrispondente sull'array ONTAP:::> vserver nvme subsystem host show -vserver vs_coexistence_LPE36002
Esempio di output:
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_coexistence_LPE36002 nvme nqn.2014-08.org.nvmexpress:uuid: 4c4c4544-0036-5610-804a-
Se il hostnqn
le stringhe non corrispondono, utilizzarevserver modify
per aggiornarehostnqn
Stringa sul sottosistema di array ONTAP corrispondente ahostnqn
stringa da/etc/nvme/hostnqn
sull'host.
Configurare NVMe/FC
È possibile configurare NVMe/FC per gli adattatori Broadcom/Emulex o Marvell/Qlogic.
-
Verificare di utilizzare il modello di adattatore supportato:
# cat /sys/class/scsi_host/host*/modelname
Esempio di output:
LPe36002-M64 LPe36002-M64
# cat /sys/class/scsi_host/host*/modeldesc
Esempio di output:
Emulex LightPulse LPe36002-M64 2-Port 64Gb Fibre Channel Adapter Emulex LightPulse LPe36002-M64 2-Port 64Gb Fibre Channel Adapter
-
Verificare di utilizzare il Broadcom consigliato
lpfc
firmware e driver della posta in arrivo:# cat /sys/class/scsi_host/host*/fwrev 14.2.673.40, sli-4:6:d 14.2.673.40, sli-4:6:d # cat /sys/module/lpfc/version 0:14.2.0.16
Per l'elenco più aggiornato delle versioni firmware e dei driver della scheda di rete supportati, consultare "Tool di matrice di interoperabilità NetApp".
-
Verificare che
lpfc_enable_fc4_type
è impostato su3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Verificare che le porte dell'iniziatore siano attive e in esecuzione e che siano visualizzate le LIF di destinazione:
# cat /sys/class/fc_host/host*/port_name 0x100000109b3c081f 0x100000109b3c0820
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b3c081f WWNN x200000109b3c081f DID x062300 ONLINE NVME RPORT WWPN x2143d039ea165877 WWNN x2142d039ea165877 DID x061b15 TARGET DISCSRVC ONLINE NVME RPORT WWPN x2145d039ea165877 WWNN x2142d039ea165877 DID x061115 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000040b Cmpl 000000040b Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000001f5c4538 Issue 000000001f58da22 OutIO fffffffffffc94ea abort 00000630 noxri 00000000 nondlp 00001071 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000630 Err 0001bd4a NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b3c0820 WWNN x200000109b3c0820 DID x062c00 ONLINE NVME RPORT WWPN x2144d039ea165877 WWNN x2142d039ea165877 DID x060215 TARGET DISCSRVC ONLINE NVME RPORT WWPN x2146d039ea165877 WWNN x2142d039ea165877 DID x061815 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000040b Cmpl 000000040b Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000001f5c3618 Issue 000000001f5967a4 OutIO fffffffffffd318c abort 00000629 noxri 00000000 nondlp 0000044e qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000629 Err 0001bd3d
Il driver inbox qla2xxx nativo incluso nel kernel RHEL 9,4 GA ha le ultime correzioni. Queste correzioni sono essenziali per il supporto di ONTAP.
-
Verificare che siano in esecuzione le versioni del firmware e del driver dell'adattatore supportate:
# cat /sys/class/fc_host/host*/symbolic_name
Esempio di output
QLE2872 FW:v9.12.01 DVR:v10.02.09.100-k QLE2872 FW:v9.12.01 DVR:v10.02.09.100-k
-
Verificare che
ql2xnvmeenable
è impostato. Ciò consente all'adattatore Marvell di funzionare come iniziatore NVMe/FC:# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Abilita i/o da 1 MB (opzionale)
ONTAP riporta un MDTS (MAX Data Transfer Size) di 8 nei dati del controller di identificazione. Ciò significa che le dimensioni massime delle richieste i/o possono essere fino a 1MB MB. Per emettere richieste di i/o di dimensioni pari a 1 MB per un host Broadcom NVMe/FC, è necessario aumentare il lpfc
valore del lpfc_sg_seg_cnt
parametro a 256 dal valore predefinito di 64.
Questi passaggi non si applicano agli host Qlogic NVMe/FC. |
-
Impostare il
lpfc_sg_seg_cnt
parametro su 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Eseguire il
dracut -f
comando e riavviare l'host. -
Verificare che il valore previsto di
lpfc_sg_seg_cnt
sia 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configurare NVMe/TCP
NVMe/TCP non dispone di funzionalità di connessione automatica. Invece, puoi rilevare i sottosistemi NVMe/TCP e gli spazi dei nomi eseguendo manualmente le operazioni NVMe/TCP connect
o connect-all
.
-
Verificare che la porta iniziatore possa recuperare i dati della pagina del registro di rilevamento attraverso le LIF NVMe/TCP supportate:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
# nvme discover -t tcp -w 192.168.167.1 -a 192.168.167.16 Discovery Log Number of Records 8, Generation counter 10 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 11 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18: discovery traddr: 192.168.167.8 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 9 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18: discovery traddr: 192.168.166.8 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 12 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18: discovery traddr: 192.168.167.7 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 3====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 10 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18: discovery traddr: 192.168.166.7 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 4====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 11 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18:subsystem.nvme_tcp_1 traddr: 192.168.167.8 eflags: none sectype: none =====Discovery Log Entry 5====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 9 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18:subsystem.nvme_tcp_1 traddr: 192.168.166.8 eflags: none sectype: none =====Discovery Log Entry 6====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 12 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18:subsystem.nvme_tcp_1 traddr: 192.168.167.7 eflags: none sectype: none =====Discovery Log Entry 7====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 10 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.983de7f4b39411ee871ed039ea954d18:subsystem.nvme_tcp_1 traddr: 192.168.166.7 eflags: none sectype: none
-
Verifica che le altre combinazioni di LIF initiator NVMe/TCP siano in grado di recuperare correttamente i dati della pagina del log di rilevamento:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
#nvme discover -t tcp -w 192.168.166.6 -a 192.168.166.7 #nvme discover -t tcp -w 192.168.166.6 -a 192.168.166.8 #nvme discover -t tcp -w 192.168.167.6 -a 192.168.167.7 #nvme discover -t tcp -w 192.168.167.6 -a 192.168.167.8
-
Eseguire
nvme connect-all
Command tra tutti i LIF target initiator NVMe/TCP supportati nei nodi:nvme connect-all -t tcp -w host-traddr -a traddr
Esempio di output:
# nvme connect-all -t tcp -w 192.168.166.6 -a 192.168.166.7 # nvme connect-all -t tcp -w 192.168.166.6 -a 192.168.166.8 # nvme connect-all -t tcp -w 192.168.167.6 -a 192.168.167.7 # nvme connect-all -t tcp -w 192.168.167.6 -a 192.168.167.8
A partire da RHEL 9,4, l'impostazione predefinita per il timeout NVMe/TCP ctrl_loss_tmo è disattivata. Ciò significa che non vi è alcun limite al numero di tentativi (tentativi indefiniti). Di conseguenza, non è necessario configurare manualmente una durata di timeout specifica ctrl_loss_tmo quando si utilizzano i nvme connect comandi o nvme connect-all (opzione -l ). Con questo comportamento predefinito, i controller NVMe/TCP non riscontrano timeout in caso di errore di percorso e rimangono connessi a tempo indeterminato.
|
Validare NVMe-of
È possibile utilizzare la seguente procedura per convalidare NVME-of.
-
Verificare che il multipath NVMe nel kernel sia attivato:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Verificare che le impostazioni NVMe-of appropriate (ad esempio, modello impostato su controller NetApp ONTAP e ipopolicy per il bilanciamento del carico impostato su round-robin) per i rispettivi spazi dei nomi ONTAP si riflettano correttamente sull'host:
# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Verificare che gli spazi dei nomi siano stati creati e rilevati correttamente sull'host:
# nvme list
Esempio di output:
Node SN Model --------------------------------------------------------- /dev/nvme4n1 81Ix2BVuekWcAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Verificare che lo stato del controller di ciascun percorso sia attivo e che abbia lo stato ANA corretto:
NVMe/FC# nvme list-subsys /dev/nvme5n21
Esempio di output:
nvme-subsys4 - NQN=nqn.1992-08.com.netapp:sn.efd7989cb10111ee871ed039ea954d18:subsystem.nvme hostnqn=nqn.2014-08.org.nvmexpress:uuid:d3b581b4-c975-11e6-8425-0894ef31a074 iopolicy=round-robin \ +- nvme2 fc traddr=nn-0x2013d039ea951c45:pn-0x2018d039ea951c45,host_traddr=nn-0x200000109bdacc76:pn-0x100000109bdacc76 live non-optimized +- nvme3 fc traddr=nn-0x2013d039ea951c45:pn-0x2017d039ea951c45,host_traddr=nn-0x200000109bdacc75:pn-0x100000109bdacc75 live non-optimized +- nvme5 fc traddr=nn-0x2013d039ea951c45:pn-0x2016d039ea951c45,host_traddr=nn- 0x200000109bdacc76:pn-0x100000109bdacc76 live optimized +- nvme6 fc traddr=nn-0x2013d039ea951c45:pn-0x2014d039ea951c45,host_traddr=nn- 0x200000109bdacc75:pn-0x100000109bdacc75 live optimized
NVMe/TCP# nvme list-subsys /dev/nvme1n1
Esempio di output:
nvme-subsys1 -NQN=nqn.1992-08.com.netapp: sn.983de7f4b39411ee871ed039ea954d18:subsystem.nvme_tcp_1 hostnqn=nqn.2014-08.org.nvmexpress:uuid: 4c4c4544-0035-5910-804b-c2c04f444d33 iopolicy=round-robin \ +- nvme5 tcp traddr=192.168.166.7,trsvcid=4420,host_traddr=192.168.166.6,src_addr=192.168.166.6 live +- nvme4 tcp traddr=192.168.166.8,trsvcid=4420,host_traddr=192.168.166.6,src_addr=192.168.166.6 live +- nvme2 tcp traddr=192.168.167.7,trsvcid=4420,host_traddr=192.168.167.6,src_addr=192.168.167.6 live +- nvme1 tcp traddr=192.168.167.8,trsvcid=4420,host_traddr=192.168.167.6,src_addr=192.168.167.6 live
-
Verificare che il plug-in NetApp visualizzi i valori corretti per ciascun dispositivo dello spazio dei nomi ONTAP:
Colonna# nvme netapp ontapdevices -o column
Esempio di output:
Device Vserver Namespace Path ----------------------- ------------------------------ /dev/nvme0n1 vs_tcp /vol/vol1/ns1 NSID UUID Size ------------------------------------------------------------ 1 6fcb8ea0-dc1e-4933-b798-8a62a626cb7f 21.47GB
JSON# nvme netapp ontapdevices -o json
Esempio di output
{ "ONTAPdevices" : [ { "Device" : "/dev/nvme1n1", "Vserver" : "linux_tcnvme_iscsi", "Namespace_Path" : "/vol/tcpnvme_1_0_0/tcpnvme_ns", "NSID" : 1, "UUID" : "1a42c652-1450-4a29-886a-b4ccc23e637d", "Size" : "21.47GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 5242880 }, ] }
Problemi noti
Non ci sono problemi noti per la configurazione host NVMe-of per RHEL 9,4 con ONTAP release.