Configuration hôte NVMe-of pour RHEL 9.2 avec ONTAP
NVMe over Fabrics (NVMe-of), y compris NVMe over Fibre Channel (NVMe/FC) et d'autres moyens de transport, est pris en charge par Red Hat Enterprise Linux (RHEL) 9.2 avec ANA (Asymmetric Namespace Access). Dans les environnements NVMe-of, ANA est l'équivalent des chemins d'accès multiples ALUA dans les environnements iSCSI et FC. Il est implémenté avec les chemins d'accès multiples NVMe intégrés au noyau.
La prise en charge suivante est disponible pour la configuration hôte NVMe-of pour RHEL 9.2 avec ONTAP :
-
Prise en charge de NVMe over TCP (NVMe/TCP) en plus de NVMe/FC. Le plug-in NetApp du package nvme-cli natif affiche les détails des ONTAP pour les namespaces NVMe/FC et NVMe/TCP.
-
Utilisation du trafic existant NVMe et SCSI sur le même hôte sur un adaptateur de bus hôte (HBA) donné, sans les paramètres dm-multipathing explicites pour empêcher la demande d'espaces de noms NVMe.
Pour plus d'informations sur les configurations prises en charge, reportez-vous au "Matrice d'interopérabilité NetApp".
Caractéristiques
-
Dans RHEL 9.2, le protocole NVMe multipath intégré est activé par défaut pour les espaces de noms NVMe. Par conséquent, il n'est pas nécessaire de définir des paramètres explicites.
Limites connues
Le démarrage SAN à l'aide du protocole NVMe-of n'est pas pris en charge pour le moment.
Validation des versions logicielles
Vous pouvez utiliser la procédure suivante pour valider les versions minimales de RHEL 9.2 prises en charge.
-
Installez RHEL 9.2 sur le serveur. Une fois l'installation terminée, vérifiez que vous exécutez le noyau RHEL 9.2 spécifié.
# uname -r
Exemple de sortie :
5.14.0-284.11.1.el9_2.x86_64
-
Installer le
nvme-cli
groupe :# rpm -qa|grep nvme-cli
Exemple de sortie :
nvme-cli-2.2.1-2.el9.x86_64
-
Installer le
libnvme
groupe :#rpm -qa|grep libnvme
Exemple de sortie
libnvme-1.2-2.el9.x86_64
-
Sur l'hôte RHEL 9.2, vérifiez la chaîne hostnqn à l'adresse
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
Exemple de sortie
nqn.2014-08.org.nvmexpress:uuid:4c4c4544-0032-3310-8033-b8c04f4c5132
-
Vérifiez que le
hostnqn
la chaîne correspond auhostnqn
Chaîne du sous-système correspondant sur la baie ONTAP :::> vserver nvme subsystem host show -vserver vs_ol_nvme
Exemple de sortie :
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_nvme207 rhel_207_LPe32002 nqn.2014-08.org.nvmexpress:uuid:325e7554-1f9b-11ec-8489-3a68dd61a4df
Si le hostnqn
les chaînes ne correspondent pas, utilisez levserver modify
commande pour mettre à jour lehostnqn
Chaîne sur le sous-système de matrice ONTAP correspondant àhostnqn
chaîne de/etc/nvme/hostnqn
sur l'hôte.
Configurez NVMe/FC
Vous pouvez configurer NVMe/FC pour les cartes Broadcom/Emulex ou Marvell/Qlogic.
-
Vérifiez que vous utilisez le modèle de carte pris en charge.
# cat /sys/class/scsi_host/host*/modelname
Exemple de sortie :
LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc
Exemple de sortie :
Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
Vérifiez que vous utilisez la carte Broadcom recommandée
lpfc
micrologiciel et pilote de boîte de réception.# cat /sys/class/scsi_host/host*/fwrev 14.0.639.18, sli-4:2:c 14.0.639.18, sli-4:2:c # cat /sys/module/lpfc/version 0:12.8.0.11
Pour obtenir la liste la plus récente des versions de pilote de carte et de micrologiciel prises en charge, reportez-vous à la section "Matrice d'interopérabilité NetApp".
-
Vérifiez-le
lpfc_enable_fc4_type
est défini sur3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
Vérifier que les ports initiateurs sont opérationnels et que les LIFs cibles sont visibles :
# cat /sys/class/fc_host/host*/port_name 0x100000109b1c1204 0x100000109b1c1205
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b1c1204 WWNN x200000109b1c1204 DID x011d00 ONLINE NVME RPORT WWPN x203800a098dfdd91 WWNN x203700a098dfdd91 DID x010c07 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203900a098dfdd91 WWNN x203700a098dfdd91 DID x011507 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000f78 Cmpl 0000000f78 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002fe29bba Issue 000000002fe29bc4 OutIO 000000000000000a abort 00001bc7 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001e15 Err 0000d906 NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b1c1205 WWNN x200000109b1c1205 DID x011900 ONLINE NVME RPORT WWPN x203d00a098dfdd91 WWNN x203700a098dfdd91 DID x010007 TARGET DISCSRVC ONLINE NVME RPORT WWPN x203a00a098dfdd91 WWNN x203700a098dfdd91 DID x012a07 TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000fa8 Cmpl 0000000fa8 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000002e14f170 Issue 000000002e14f17a OutIO 000000000000000a abort 000016bb noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00001f50 Err 0000d9f8
Le pilote natif qla2xxx inclus dans le noyau RHEL 9.2 GA possède les derniers correctifs en amont. Ces correctifs sont essentiels à la prise en charge de ONTAP.
-
Vérifiez que vous exécutez les versions du pilote de carte et du micrologiciel prises en charge :
# cat /sys/class/fc_host/host*/symbolic_name
Exemple de sortie
QLE2742 FW:v9.08.02 DVR:v10.02.00.106-k QLE2742 FW:v9.08.02 DVR:v10.02.00.106-k
-
Vérifiez-le
ql2xnvmeenable
est défini. L'adaptateur Marvell peut ainsi fonctionner en tant qu'initiateur NVMe/FC :# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
Activer les E/S de 1 Mo (en option)
ONTAP signale une taille de transfert MAX Data (MDT) de 8 dans les données Identify Controller. La taille maximale des demandes d'E/S peut donc atteindre 1 Mo. Pour émettre des demandes d'E/S d'une taille de 1 Mo pour un hôte Broadcom NVMe/FC, augmentez la lpfc
valeur du lpfc_sg_seg_cnt
paramètre à 256 par rapport à la valeur par défaut 64.
Ces étapes ne s'appliquent pas aux hôtes NVMe/FC Qlogic. |
-
Réglez le
lpfc_sg_seg_cnt
paramètre sur 256 :cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
Exécutez
dracut -f
la commande et redémarrez l'hôte. -
Vérifier que la valeur attendue de
lpfc_sg_seg_cnt
est 256 :cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
Configurez NVMe/TCP
NVMe/TCP ne dispose pas de la fonctionnalité de connexion automatique. Par conséquent, si un chemin tombe en panne et n'est pas rétabli dans le délai par défaut de 10 minutes, NVMe/TCP ne peut pas se reconnecter automatiquement. Pour éviter une temporisation, vous devez définir la période de nouvelle tentative pour les événements de basculement sur incident à au moins 30 minutes.
-
Vérifiez que le port initiateur peut récupérer les données de la page de journal de découverte sur les LIF NVMe/TCP prises en charge :
nvme discover -t tcp -w host-traddr -a traddr
Exemple de sortie :
# nvme discover -t tcp -w 192.168.167.5 -a 192.168.167.22 Discovery Log Number of Records 8, Generation counter 18 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.c680f5bcae1411ed8639d039ea951c46:discovery traddr: 192.168.166.23 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 1 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.c680f5bcae1411ed8639d039ea951c46:discovery traddr: 192.168.166.22 eflags: explicit discovery connections, duplicate discovery information sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: current discovery subsystem treq: not specified portid: 2 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.c680f5bcae1411ed8639d039ea951c46:discovery traddr: 192.168.167.23 eflags: explicit discovery connections, duplicate discovery information sectype: none ..........
-
Vérifiez que les autres combinaisons de LIF cible-initiateur NVMe/TCP peuvent récupérer correctement les données de la page du journal de détection.
nvme discover -t tcp -w host-traddr -a traddr
Exemple de sortie :
#nvme discover -t tcp -w 192.168.166.5 -a 192.168.166.22 #nvme discover -t tcp -w 192.168.166.5 -a 192.168.166.23 #nvme discover -t tcp -w 192.168.167.5 -a 192.168.167.22 #nvme discover -t tcp -w 192.168.167.5 -a 192.168.167.23
-
Exécutez le
nvme connect-all
Commande sur toutes les LIFs initiator-target-target NVMe/TCP prises en charge sur les nœuds et définissez le délai de perte du contrôleur pendant au moins 30 minutes ou 1800 secondes :nvme connect-all -t tcp -w host-traddr -a traddr -l 1800
Exemple de sortie :
# nvme connect-all -t tcp -w 192.168.166.5 -a 192.168.166.22 -l 1800 # nvme connect-all -t tcp -w 192.168.166.5 -a 192.168.166.23 -l 1800 # nvme connect-all -t tcp -w 192.168.167.5 -a 192.168.167.22 -l 1800 # nvme connect-all -t tcp -w 192.168.167.5 -a 192.168.167.23 -l 1800
Validez la spécification NVMe-of
La procédure suivante permet de valider la NVME-of.
-
Vérifiez que le chemin d'accès multiples NVMe intégré au noyau est activé :
# cat /sys/module/nvme_core/parameters/multipath Y
-
Vérifiez que les paramètres NVMe-of appropriés (par exemple, modèle défini sur contrôleur NetApp ONTAP et iopole d'équilibrage de la charge sur round-Robin) pour les espaces de noms ONTAP respectifs reflètent correctement l'hôte :
# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
Vérifiez que les espaces de noms sont créés et correctement découverts sur l'hôte :
# nvme list
Exemple de sortie :
Node SN Model --------------------------------------------------------- /dev/nvme0n1 81CZ5BQuUNfGAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
Vérifiez que l'état du contrôleur de chaque chemin est actif et que l'état ANA est correct :
NVMe/FC# nvme list-subsys /dev/nvme0n1
Exemple de sortie :
nvme-subsys4 - NQN=nqn.1992-08.com.netapp:sn.8763d311b2ac11ed950ed039ea951c46:subsystem.rhel_207_LB \ +- nvme1 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a7d039ea954d17,host_traddr=nn-0x200000109b1b95ef:pn-0x100000109b1b95ef live optimized +- nvme2 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a8d039ea954d17,host_traddr=nn-0x200000109b1b95f0:pn-0x100000109b1b95f0 live optimized +- nvme3 fc traddr=nn-0x20a6d039ea954d17:pn-0x20aad039ea954d17,host_traddr=nn-0x200000109b1b95f0:pn-0x100000109b1b95f0 live non-optimized +- nvme5 fc traddr=nn-0x20a6d039ea954d17:pn-0x20a9d039ea954d17,host_traddr=nn-0x200000109b1b95ef:pn-0x100000109b1b95ef live non-optimized
NVMe/TCP# nvme list-subsys /dev/nvme1n1
Exemple de sortie :
nvme-subsys1 - NQN=nqn.1992-08.com.netapp:sn.c680f5bcae1411ed8639d039ea951c46:subsystem.rhel_tcp97 \ +- nvme1 tcp traddr=192.168.167.23,trsvcid=4420,host_traddr=192.168.167.5 live non-optimized +- nvme2 tcp traddr=192.168.167.22,trsvcid=4420,host_traddr=192.168.167.5 live non-optimized +- nvme3 tcp traddr=192.168.166.23,trsvcid=4420,host_traddr=192.168.166.5 live optimized +- nvme4 tcp traddr=192.168.166.22,trsvcid=4420,host_traddr=192.168.166.5 live optimized
-
Vérifier que le plug-in NetApp affiche les valeurs correctes pour chaque périphérique d'espace de noms ONTAP :
Colonne# nvme netapp ontapdevices -o column
Exemple de sortie :
Device Vserver Namespace Path ----------------------- ------------------------------ /dev/nvme0n1 vs_tcp /vol/vol1/ns1 NSID UUID Size ------------------------------------------------------------ 1 79c2c569-b7fa-42d5-b870-d9d6d7e5fa84 21.47GB
JSON# nvme netapp ontapdevices -o json
Exemple de sortie
{ "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_tcp79", "Namespace_Path" : "/vol/vol1/ns1", "NSID" : 1, "UUID" : "79c2c569-b7fa-42d5-b870-d9d6d7e5fa84", "Size" : "21.47GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 5242880 }, ] }
Problèmes connus
Il n'y a pas de problème connu.