Configurazione host NVMe-of per Ubuntu 22,04 con ONTAP
NVMe over Fabrics (NVMe-of), inclusi NVMe over Fibre Channel (NVMe/FC) e altri trasporti, è supportato con Ubuntu 22,04 con Asymmetric Namespace Access (ANA). Negli ambienti NVMe-of, ANA è l'equivalente del multipathing ALUA in ambienti iSCSI e FC ed è implementato con multipath NVMe nel kernel.
Il seguente supporto è disponibile per la configurazione host NVMe-of per Ubuntu 22,04 con ONTAP:
-
Il plug-in NetApp nel pacchetto nvme-cli nativo visualizza i dettagli ONTAP per gli namespace NVMe/FC.
-
Utilizzo di traffico NVMe e SCSI coesistente sullo stesso host su un determinato HBA (host bus adapter), senza le impostazioni esplicite di dm-multipath per impedire la richiesta di spazi dei nomi NVMe.
Per ulteriori informazioni sulle configurazioni supportate, consultare "Tool di matrice di interoperabilità NetApp".
Caratteristiche
Ubuntu 22,04 ha la tecnologia multipath NVMe in-kernel abilitata per i namespace NVMe per impostazione predefinita. Pertanto, non sono necessarie impostazioni esplicite.
Limitazioni note
L'avvio SAN che utilizza il protocollo NVMe-of non è attualmente supportato.
Convalidare le versioni software
È possibile utilizzare la seguente procedura per convalidare le versioni minime supportate del software Ubuntu 22,04.
-
Installare Ubuntu 22,04 sul server. Al termine dell'installazione, verificare che il kernel Ubuntu 22,04 specificato sia in esecuzione:
# uname -r
Esempio di output:
5.15.0-101-generic
-
Installare
nvme-cli
pacchetto:# apt list | grep nvme
Esempio di output:
nvme-cli/jammy-updates,now 1.16-3ubuntu0.1 amd64
-
Sull'host Ubuntu 22,04, controllare la stringa hostnqn in
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
Esempio di output
nqn.2014-08.org.nvmexpress:uuid:063a9fa0-438a-4737-b9b4-95a21c66d041
-
Verificare che il
hostnqn
la stringa corrisponde a.hostnqn
Stringa per il sottosistema corrispondente sull'array ONTAP:::> vserver nvme subsystem host show -vserver vs_106_fc_nvme
Esempio di output:
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_106_fc_nvme ub_106 nqn.2014-08.org.nvmexpress:uuid:c04702c8-e91e-4353-9995-ba4536214631
Se il hostnqn
le stringhe non corrispondono, utilizzarevserver modify
per aggiornarehostnqn
Stringa sul sottosistema di array ONTAP corrispondente ahostnqn
stringa da/etc/nvme/hostnqn
sull'host.
Configurare NVMe/FC
È possibile configurare NVMe/FC per gli adattatori Broadcom/Emulex o Marvell/Qlogic.
-
Verificare di utilizzare il modello di adattatore supportato.
# cat /sys/class/scsi_host/host*/modelname
Esempio di output:
LPe36002-M64 LPe36002-M64
# cat /sys/class/scsi_host/host*/modeldesc
Esempio di output:
Emulex LPe36002-M64 2-Port 64Gb Fibre Channel Adapter Emulex LPe36002-M64 2-Port 64Gb Fibre Channel Adapter
-
Verificare di utilizzare il Broadcom consigliato
lpfc
firmware e driver della posta in arrivo.# cat /sys/class/scsi_host/host*/fwrev 14.2.673.40, sli-4:6:d 14.2.673.40, sli-4:6:d # cat /sys/module/lpfc/version 0: 14.0.0.4
Per l'elenco più aggiornato delle versioni firmware e dei driver della scheda di rete supportati, consultare "Tool di matrice di interoperabilità NetApp".
-
Verificare che
lpfc_enable_fc4_type
è impostato su3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Verificare che le porte dell'iniziatore siano attive e in esecuzione e che siano visualizzate le LIF di destinazione:
# cat /sys/class/fc_host/host*/port_name 0x100000109bf0447c 0x100000109bf0447b # cat /sys/class/fc_host/host*/port_state Online Online # cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109bf0447c WWNN x200000109bf0447c DID x022300 ONLINE NVME RPORT WWPN x200cd039eaa8138b WWNN x200ad039eaa8138b DID x021509 TARGET DISCSRVC ONLINE NVME RPORT WWPN x2010d039eaa8138b WWNN x200ad039eaa8138b DID x021108 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000000005238 Issue 000000000000523a OutIO 0000000000000002 abort 00000000 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000000 Err 00000000 NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109bf0447b WWNN x200000109bf0447b DID x022600 ONLINE NVME RPORT WWPN x200bd039eaa8138b WWNN x200ad039eaa8138b DID x021409 TARGET DISCSRVC ONLINE NVME RPORT WWPN x200fd039eaa8138b WWNN x200ad039eaa8138b DID x021008 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000000000523c Issue 000000000000523e OutIO 0000000000000002 abort 00000000 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000000 Err 00000000
Il driver inbox qla2xxx nativo incluso nel kernel Ubuntu 22,04 GA ha le ultime correzioni upstream. Queste correzioni sono essenziali per il supporto di ONTAP.
-
Verificare che siano in esecuzione le versioni del firmware e del driver dell'adattatore supportate:
# cat /sys/class/fc_host/host*/symbolic_name
Esempio di output
QLE2872 FW: v9.14.02 DVR: v10.02.06.200-k QLE2872 FW: v9.14.02 DVR: v10.02.06.200-k
-
Verificare che
ql2xnvmeenable
è impostato. Ciò consente all'adattatore Marvell di funzionare come iniziatore NVMe/FC:# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Abilita i/o da 1 MB (opzionale)
ONTAP riporta un MDTS (MAX Data Transfer Size) di 8 nei dati del controller di identificazione. Ciò significa che le dimensioni massime delle richieste i/o possono essere fino a 1MB MB. Per emettere richieste di i/o di dimensioni pari a 1 MB per un host Broadcom NVMe/FC, è necessario aumentare il lpfc
valore del lpfc_sg_seg_cnt
parametro a 256 dal valore predefinito di 64.
Questi passaggi non si applicano agli host Qlogic NVMe/FC. |
-
Impostare il
lpfc_sg_seg_cnt
parametro su 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Eseguire il
dracut -f
comando e riavviare l'host. -
Verificare che il valore previsto di
lpfc_sg_seg_cnt
sia 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configurare NVMe/TCP
NVMe/TCP non dispone della funzionalità di connessione automatica. Pertanto, se un percorso non viene eseguito e non viene ripristinato entro il periodo di timeout predefinito di 10 minuti, NVMe/TCP non può riconnettersi automaticamente. Per evitare un timeout, impostare il periodo di ripetizione degli eventi di failover su almeno 30 minuti.
-
Verificare che la porta iniziatore possa recuperare i dati della pagina del registro di rilevamento attraverso le LIF NVMe/TCP supportate:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
# nvme discover -t tcp -w 10.10.11.47-a 10.10.10.122 Discovery Log Number of Records 8, Generation counter 10 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.bbfb4ee8dfb611edbd07d039ea165590:discovery traddr: 10.10.10.122 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 1 trsvcid: 8009 subnqn: nqn.1992 08.com.netapp:sn.bbfb4ee8dfb611edbd07d039ea165590:discovery traddr: 10.10.10.124 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 2====== trtype: tcp
-
Verifica che le altre combinazioni di LIF initiator NVMe/TCP siano in grado di recuperare correttamente i dati della pagina del log di rilevamento:
nvme discover -t tcp -w host-traddr -a traddr
Esempio di output:
#nvme discover -t tcp -w 10.10.10.47 -a 10.10.10.122 #nvme discover -t tcp -w 10.10.10.47 -a 10.10.10.124 #nvme discover -t tcp -w 10.10.11.47 -a 10.10.11.122 #nvme discover -t tcp -w 10.10.11.47 -a 10.10.11.
-
Eseguire il comando nvme Connect-all in tutti i LIF NVMe/TCP Initiator-target supportati nei nodi e impostare il periodo di timeout per la perdita del controller per almeno 30 minuti o 1800 secondi:
nvme connect-all -t tcp -w host-traddr -a traddr -l 1800
Esempio di output:
# nvme connect-all -t tcp -w 10.10.10.47 -a 10.10.10.122 -l 1800 # nvme connect-all -t tcp -w 10.10.10.47 -a 10.10.10.124 -l 1800 # nvme connect-all -t tcp -w 10.10.11.47 -a 10.10.11.122 -l 1800 # nvme connect-all -t tcp -w 10.10.11.47 -a 10.10.11.124 -l 1800
Validare NVMe-of
È possibile utilizzare la seguente procedura per convalidare NVME-of.
-
Verificare che il multipath NVMe nel kernel sia attivato:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Verificare che le impostazioni NVMe-of appropriate (ad esempio, modello impostato su controller NetApp ONTAP e ipopolicy per il bilanciamento del carico impostato su round-robin) per i rispettivi spazi dei nomi ONTAP si riflettano correttamente sull'host:
# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Verificare che gli spazi dei nomi siano stati creati e rilevati correttamente sull'host:
# nvme list
Esempio di output:
Node SN Model --------------------------------------------------------- /dev/nvme0n1 81CZ5BQuUNfGAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Verificare che lo stato del controller di ciascun percorso sia attivo e che abbia lo stato ANA corretto:
NVMe/FC# nvme list-subsys /dev/nvme0n1
Esempio di output:
nvme-subsys4 - NQN=nqn.1992-08.com.netapp:sn.8763d311b2ac11ed950ed039ea951c46:subsystem. ub_106 \ +- nvme1 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a7d039ea954d17,host_traddr=nn-0x200000109b1b95ef:pn-0x100000109b1b95ef live optimized +- nvme2 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a8d039ea954d17,host_traddr=nn-0x200000109b1b95f0:pn-0x100000109b1b95f0 live optimized +- nvme3 fc traddr=nn-0x20a6d039ea954d17:pn-0x20aad039ea954d17,host_traddr=nn-0x200000109b1b95f0:pn-0x100000109b1b95f0 live non-optimized +- nvme5 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a9d039ea954d17,host_traddr=nn-0x200000109b1b95ef:pn-0x100000109b1b95ef live non-optimized
NVME/TCP# nvme list-subsys /dev/nvme1n1
Esempio di output:
nvme-subsys1 - NQN=nqn.1992- 08.com.netapp:sn. bbfb4ee8dfb611edbd07d039ea165590:subsystem.rhel_tcp_95 +- nvme1 tcp traddr=10.10.10.122,trsvcid=4420,host_traddr=10.10.10.47,src_addr=10.10.10.47 live +- nvme2 tcp traddr=10.10.10.124,trsvcid=4420,host_traddr=10.10.10.47,src_addr=10.10.10.47 live +- nvme3 tcp traddr=10.10.11.122,trsvcid=4420,host_traddr=10.10.11.47,src_addr=10.10.11.47 live +- nvme4 tcp traddr=10.10.11.124,trsvcid=4420,host_traddr=10.10.11.47,src_addr=10.10.11.47 live
-
Verificare che il plug-in NetApp visualizzi i valori corretti per ciascun dispositivo dello spazio dei nomi ONTAP:
Colonna# nvme netapp ontapdevices -o column
Esempio di output:
Device Vserver Namespace Path ----------------------- ------------------------------ /dev/nvme0n1 co_iscsi_tcp_ubuntu /vol/vol1/ns1 NSID UUID Size ------------------------------------------------------------ 1 79c2c569-b7fa-42d5-b870-d9d6d7e5fa84 21.47GB
JSON# nvme netapp ontapdevices -o json
Esempio di output
{ "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "co_iscsi_tcp_ubuntu", "Namespace_Path" : "/vol/nvmevol1/ns1", "NSID" : 1, "UUID" : "79c2c569-b7fa-42d5-b870-d9d6d7e5fa84", "Size" : "21.47GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 5242880 }, ] }
Problemi noti
La configurazione host NVMe-of per Ubuntu 22,04 con ONTAP presenta il seguente problema noto:
ID bug NetApp | Titolo | Descrizione |
---|---|---|
CONTAPEXT-2037 |
Gli host Ubuntu 22,04 NVMe-of creano controller di rilevamento persistenti duplicati |
Sugli host NVMe-of, è possibile utilizzare il comando "nvme Discover -p" per creare PDC (Persistent Discovery Controller). Questo comando dovrebbe creare un solo PDC per ogni combinazione iniziatore-destinazione. Tuttavia, se si esegue Ubuntu 22,04 su un host NVMe-of, viene creato un PDC duplicato ogni volta che viene eseguito "nvme Discover -p". Ciò comporta un utilizzo non necessario delle risorse sia sull'host che sulla destinazione. |