Configurazione host NVMe-of per RHEL 9,0 con ONTAP
NVMe-of (inclusi NVMe/FC e NVMe/TCP) è supportato con RHEL 9.0 con ANA (Asymmetric namespace Access) richiesto per i failover dello storage superstiti sull'array ONTAP. ANA è l'equivalente ALUA nell'ambiente NVM-of ed è attualmente implementato con NVMe multipath nel kernel. Questa procedura consente di abilitare NVMe-of con multipath NVMe in-kernel, utilizzando ANA su RHEL 9,0 e ONTAP come destinazione.
Per ulteriori informazioni sulle configurazioni supportate, consultare "Tool di matrice di interoperabilità NetApp".
Caratteristiche
-
A partire da RHEL 9,0, NVMe/TCP non è più una funzionalità di anteprima tecnologica (a differenza di RHEL 8), ma una funzione Enterprise completamente supportata.
-
A partire da RHEL 9,0, per impostazione predefinita, il multipath in-kernel NVMe è abilitato per gli namespace NVMe, senza richiedere impostazioni esplicite (a differenza di RHEL 8).
Limitazioni note
L'avvio SAN che utilizza il protocollo NVMe-of non è attualmente supportato.
Abilitare il multipath NVMe nel kernel
Puoi usare la seguente procedura per abilitare il multipath NVMe in-kernel.
-
Installare RHEL 9.0 sul server.
-
Una volta completata l'installazione, verificare di eseguire il kernel RHEL 9.0 specificato. Vedere "Matrice di interoperabilità NetApp" per l'elenco più aggiornato delle versioni supportate.
# uname -r 5.14.0-70.13.1.el9_0.x86_64
-
Installare
nvme-cli
pacchetto.# rpm -qa|grep nvme-cli nvme-cli-1.16-3.el9.x86_64
-
Sull'host, controllare la stringa NQN host su
/etc/nvme/hostnqn
E verificare che corrisponda alla stringa NQN host per il sottosistema corrispondente sull'array ONTAP. Ad esempio,# cat /etc/nvme/hostnqn nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
::> vserver nvme subsystem host show -vserver vs_fcnvme_141 Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_fcnvme_14 nvme_141_1 nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
Se le stringhe NQN host non corrispondono, utilizzare vserver modify
Comando per aggiornare la stringa NQN host nel sottosistema NVMe ONTAP corrispondente in modo che corrisponda alla stringa NQN host da/etc/nvme/hostnqn
sull'host. -
Riavviare l'host.
Configurare NVMe/FC
È possibile configurare NVMe/FC per gli adattatori Broadcom/Emulex o Marvell/Qlogic.
-
Verificare di utilizzare l'adattatore supportato. Per ulteriori informazioni sulle schede di rete supportate, consultare la "Tool di matrice di interoperabilità NetApp".
# cat /sys/class/scsi_host/host*/modelname LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Verificare di utilizzare il firmware Broadcom lpfc e il driver della posta in arrivo consigliati. Per l'elenco più aggiornato delle versioni firmware e dei driver della scheda di rete supportati, vedere "Matrice di interoperabilità NetApp".
# cat /sys/class/scsi_host/host*/fwrev 12.8.351.47, sli-4:2:c 12.8.351.47, sli-4:2:c
# cat /sys/module/lpfc/version 0:14.0.0.4
-
Verificare che
lpfc_enable_fc4_type
è impostato su3
.# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Verificare che le porte dell'iniziatore siano attive e in esecuzione e che sia possibile visualizzare le LIF di destinazione.
# cat /sys/class/fc_host/host*/port_name 0x100000109b1c1204 0x100000109b1c1205
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b1c1204 WWNN x200000109b1c1204 DID x011d00 ONLINE NVME RPORT WWPN x203800a098dfdd91 WWNN x203700a098dfdd91 DID x010c07 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203900a098dfdd91 WWNN x203700a098dfdd91 DID x011507 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000f78 Cmpl 0000000f78 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002fe29bba Issue 000000002fe29bc4 OutIO 000000000000000a abort 00001bc7 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001e15 Err 0000d906 NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b1c1205 WWNN x200000109b1c1205 DID x011900 ONLINE NVME RPORT WWPN x203d00a098dfdd91 WWNN x203700a098dfdd91 DID x010007 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203a00a098dfdd91 WWNN x203700a098dfdd91 DID x012a07 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000fa8 Cmpl 0000000fa8 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002e14f170 Issue 000000002e14f17a OutIO 000000000000000a abort 000016bb noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001f50 Err 0000d9f8
Il driver inbox qla2xxx nativo incluso nel kernel RHEL 9,0 ha le ultime correzioni. Queste correzioni sono essenziali per il supporto di ONTAP.
-
Verificare che siano in esecuzione le versioni del firmware e del driver dell'adattatore supportate:
# cat /sys/class/fc_host/host*/symbolic_name QLE2742 FW:v9.06.02 DVR:v10.02.00.200-k QLE2742 FW:v9.06.02 DVR:v10.02.00.200-k
-
Verificare
ql2xnvmeenable
È impostato per consentire all'adattatore Marvell di funzionare come iniziatore NVMe/FC:
# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Abilita i/o da 1 MB (opzionale)
ONTAP riporta un MDTS (MAX Data Transfer Size) di 8 nei dati del controller di identificazione. Ciò significa che le dimensioni massime delle richieste i/o possono essere fino a 1MB MB. Per emettere richieste di i/o di dimensioni pari a 1 MB per un host Broadcom NVMe/FC, è necessario aumentare il lpfc
valore del lpfc_sg_seg_cnt
parametro a 256 dal valore predefinito di 64.
I seguenti passaggi non si applicano agli host Qlogic NVMe/FC. |
-
Impostare il
lpfc_sg_seg_cnt
parametro su 256:cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Eseguire il
dracut -f
comando e riavviare l'host: -
Verificare che
lpfc_sg_seg_cnt
sia 256:cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Il valore previsto è 256.
Configurare NVMe/TCP
NVMe/TCP non dispone della funzionalità di connessione automatica. Pertanto, se un percorso non viene eseguito e non viene ripristinato entro il periodo di timeout predefinito di 10 minuti, NVMe/TCP non può riconnettersi automaticamente. Per evitare un timeout, impostare il periodo di ripetizione degli eventi di failover su almeno 30 minuti.
-
Verificare se la porta iniziatore è in grado di recuperare i dati della pagina del registro di rilevamento attraverso le LIF NVMe/TCP supportate:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 Discovery Log Number of Records 10, Generation counter 119 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.2.56 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 1 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.1.51 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_2 traddr: 192.168.2.56 sectype: none ...
-
Analogamente, verificare che le altre combo LIF NVMe/TCP initiator-target siano in grado di recuperare correttamente i dati della pagina del registro di rilevamento. Ad esempio,
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 # nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.52 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.56 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.57
-
Eseguire
nvme connect-all
Comando tra tutti i LIF di destinazione degli iniziatori NVMe/TCP supportati nei nodi. Assicurarsi di impostare un valore più lungoctrl_loss_tmo
intervallo di ripetizione del timer (ad esempio, 30 minuti, che può essere impostato attraverso-l 1800
) durante la connessione, in modo da riprovare per un periodo di tempo più lungo in caso di perdita di percorso. Ad esempio,# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.51 -l 1800 # nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.52 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.56 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.57 -l 1800
Validare NVMe-of
È possibile utilizzare la seguente procedura per convalidare NVMe-of.
-
Verificare che il multipath NVMe in-kernel sia effettivamente attivato selezionando:
# cat /sys/module/nvme_core/parameters/multipath Y
-
Verificare che le impostazioni NVMf appropriate (ad esempio, modello impostato su
NetApp ONTAP Controller
e bilanciamento del caricoiopolicy
impostare suround-robin
) Per i rispettivi spazi dei nomi ONTAP riflettere correttamente sull'host:# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Verificare che gli spazi dei nomi ONTAP riflettano correttamente sull'host.
Esempio (a):
# nvme list Node SN Model Namespace Usage ------ --------------------------------------- ------------------------ /dev/nvme0n1 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 1 85.90 GB / 85.90 GB Format FW Rev --------------------- 4 KiB + 0 B FFFFFFFF
Esempio (b):
# nvme list Node SN Model Namespace Usage ---------------------------------------------------- ------------------------------------ /dev/nvme0n1 81CZ5BQuUNfGAAAAAAAB NetApp ONTAP Controller 1 85.90 GB / 85.90 GB Format FW Rev ----------------------- 4 KiB + 0 B FFFFFFFF
-
Verificare che lo stato del controller di ciascun percorso sia attivo e che abbia uno stato ANA corretto.
Esempio (a):
# nvme list-subsys /dev/nvme0n1 nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.5f5f2c4aa73b11e9967e00a098df41bd:subsystem.nvme_141_1 \ +- nvme0 fc traddr=nn-0x203700a098dfdd91:pn-0x203800a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live inaccessible +- nvme1 fc traddr=nn-0x203700a098dfdd91:pn-0x203900a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live inaccessible +- nvme2 fc traddr=nn-0x203700a098dfdd91:pn-0x203a00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized +- nvme3 fc traddr=nn-0x203700a098dfdd91:pn-0x203d00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
Esempio (b):
# nvme list-subsys /dev/nvme0n1 nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 \ +- nvme0 tcp traddr=192.168.1.51 trsvcid=4420 host_traddr=192.168.1.8 live optimized +- nvme10 tcp traddr=192.168.2.56 trsvcid=4420 host_traddr=192.168.2.9 live optimized +- nvme15 tcp traddr=192.168.2.57 trsvcid=4420 host_traddr=192.168.2.9 live non-optimized +- nvme5 tcp traddr=192.168.1.52 trsvcid=4420 host_traddr=192.168.1.8 live non-optimized
-
Verificare che il plug-in NetApp visualizzi i valori corretti per ciascun dispositivo dello spazio dei nomi ONTAP.
Esempio (a):
# nvme netapp ontapdevices -o column Device Vserver Namespace Path NSID ----------------------- ------------------------------ ------------------------- /dev/nvme0n1 vs_fcnvme_141 /vol/fcnvme_141_vol_1_1_0/fcnvme_141_ns 1 UUID Size -------------------------------------------- 72b887b1-5fb6-47b8-be0b-33326e2542e2 85.90GB
# nvme netapp ontapdevices -o json { "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_fcnvme_141", "Namespace_Path" : "/vol/fcnvme_141_vol_1_1_0/fcnvme_141_ns", "NSID" : 1, "UUID" : "72b887b1-5fb6-47b8-be0b-33326e2542e2", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 } ] }
Esempio (b):
# nvme netapp ontapdevices -o column Device Vserver Namespace Path --------------------- ------------------------- ------------------------------------ /dev/nvme0n1 vs_tcp_118 /vol/tcpnvme_118_1_0_0/tcpnvme_118_ns NSID UUID Size ------------------------------------------------- 1 4a3e89de-b239-45d8-be0c-b81f6418283c 85.90GB
# nvme netapp ontapdevices -o json { "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_tcp_118", "Namespace_Path" : "/vol/tcpnvme_118_1_0_0/tcpnvme_118_ns", "NSID" : 1, "UUID" : "4a3e89de-b239-45d8-be0c-b81f6418283c", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, ] }
Problemi noti
La configurazione dell'host NVMe-of per RHEL 9.0 con ONTAP presenta i seguenti problemi noti:
ID bug NetApp | Titolo | Descrizione |
---|---|---|
Gli host RHEL 9.0 NVMe-of creano controller di rilevamento persistenti duplicati |
Sugli host NVMe over Fabrics (NVMe-of), è possibile utilizzare il comando "nvme Discover -p" per creare controller di rilevamento persistenti (PDC). Quando si utilizza questo comando, è necessario creare un solo PDC per ogni combinazione initiator-target. Tuttavia, se si esegue ONTAP 9.10.1 e Red Hat Enterprise Linux (RHEL) 9.0 con un host NVMe-of, viene creato un PDC duplicato ogni volta che viene eseguito "nvme Discover -p". Ciò comporta un utilizzo non necessario delle risorse sia sull'host che sulla destinazione. |