Dépannage NVMe-oF avec ONTAP Storage pour les utilitaires hôtes Linux
Dépannage des échecs NVMe-oF pour les hôtes Oracle Linux, RHEL, Rocky Linux et SUSE Linux Enterprise Server avec stockage ONTAP .
Avant de commencer le dépannage, vérifiez que vous utilisez une configuration conforme à la norme. "Matrice d'interopérabilité" Consultez les spécifications, puis passez aux étapes suivantes pour déboguer les éventuels problèmes côté hôte.
|
|
Les instructions de dépannage ne s'appliquent pas aux hôtes AIX, ESXi, Proxmox et Windows. |
Activer la journalisation détaillée
Si vous rencontrez un problème avec votre configuration, la journalisation détaillée peut fournir des informations essentielles pour le dépannage.
Configurer la journalisation détaillée pour LPFC ou Qlogic (Qla2xxx).
Définissez le pilote lpfc pour NVMe/FC.
-
Réglez le
lpfc_log_verboseParamètre du pilote sur l'une des valeurs suivantes pour enregistrer les événements NVMe/FC.#define LOG_NVME 0x00100000 /* NVME general events. */ #define LOG_NVME_DISC 0x00200000 /* NVME Discovery/Connect events. */ #define LOG_NVME_ABTS 0x00400000 /* NVME ABTS events. */ #define LOG_NVME_IOERR 0x00800000 /* NVME IO Error events. */
-
Une fois les valeurs définies, exécutez le
dracut-fcommande et redémarre l'hôte. -
Vérifiez les paramètres :
# cat /etc/modprobe.d/lpfc.conf options lpfc lpfc_log_verbose=0xf00083 # cat /sys/module/lpfc/parameters/lpfc_log_verbose 15728771
Il n'existe pas de journalisation qla2xxx spécifique pour NVMe/FC similaire à celle du lpfc conducteur. Définissez plutôt le niveau de journalisation général qla2xxx.
-
Ajoutez le
ql2xextended_error_logging=0x1e400000valeur au correspondantmodprobe qla2xxx conffichier. -
Exécutez le
dracut -fpuis redémarrez l'hôte. -
Après le redémarrage, vérifiez que la journalisation détaillée a été activée :
# cat /etc/modprobe.d/qla2xxx.confVous devriez voir une sortie similaire à l’exemple suivant :
options qla2xxx ql2xnvmeenable=1 ql2xextended_error_logging=0x1e400000 # cat /sys/module/qla2xxx/parameters/ql2xextended_error_logging 507510784
Erreurs courantes liées à « nvme-cli » et solutions de contournement
Les erreurs affichées par nvme-cli pendant nvme discover, nvme connect, ou nvme connect-all les opérations et les solutions de contournement sont indiquées dans le tableau suivant :
| Message d'erreur | Cause probable | Solution de contournement |
|---|---|---|
|
Syntaxe incorrecte |
Vérifiez que vous utilisez la syntaxe correcte pour le |
|
Plusieurs problèmes peuvent déclencher cette situation, par exemple, la fourniture d'arguments incorrects vers les commandes NVMe est l'une des causes courantes. |
|
|
Généralement observé lorsque l' |
Vérifiez que le code est exact |
|
Observé lorsque les associations de contrôleur ou l'opération spécifiée sont déjà créées ou en cours de création. Cela peut se produire dans le cadre des scripts de connexion automatique installés ci-dessus. |
Aucune. Essayez d'exécuter le |
Quand contacter le support technique
Si le problème persiste, veuillez rassembler les fichiers et les résultats des commandes suivants et nous contacter. "Support NetApp" pour un triage plus approfondi :
cat /sys/class/scsi_host/host*/nvme_info
/var/log/messages
dmesg
nvme discover output as in:
nvme discover --transport=fc --traddr=nn-0x200a00a098c80f09:pn-0x200b00a098c80f09 --host-traddr=nn-0x20000090fae0ec9d:pn-0x10000090fae0ec9d
nvme list
nvme list-subsys /dev/nvmeXnY