使用ONTAP儲存對 NVMe-oF 進行故障排除(適用於 Linux 主機公用程式)
對配備ONTAP儲存的 Oracle Linux、RHEL、Rocky Linux 和 SUSE Linux Enterprise Server 主機進行 NVMe-oF 故障排查。
在開始故障排除之前,請確認您執行的配置符合以下要求: "互通性對照表工具" 然後按照說明進行下一步操作,以調試任何主機端問題。
|
|
故障排除說明不適用於 AIX、ESXi、Proxmox 和 Windows 主機。 |
啟用詳細記錄
如果您的組態有問題、詳細記錄可提供疑難排解的必要資訊。
為 LPFC 或 Qlogic (Qla2xxx) 設定詳細日誌記錄。
設定適用於 NVMe / FC 的 lpfc 驅動程式。
-
設定
lpfc_log_verbose將驅動程式設定為下列任一值、以記錄NVMe/FC事件。#define LOG_NVME 0x00100000 /* NVME general events. */ #define LOG_NVME_DISC 0x00200000 /* NVME Discovery/Connect events. */ #define LOG_NVME_ABTS 0x00400000 /* NVME ABTS events. */ #define LOG_NVME_IOERR 0x00800000 /* NVME IO Error events. */
-
設定值之後、請執行
dracut-f命令並重新啟動主機。 -
請核對設定:
# cat /etc/modprobe.d/lpfc.conf options lpfc lpfc_log_verbose=0xf00083 # cat /sys/module/lpfc/parameters/lpfc_log_verbose 15728771
NVMe / FC 沒有類似於的特定 qla2xxx 記錄 lpfc 驅動程式:請改為設定一般 qla2xxx 記錄層級。
-
將「ql2xextend_error_logging=x1e400000」值附加至對應的「modf探測qla2xxx conf」檔案。
-
執行
dracut -f命令、然後重新啟動主機。 -
重新開機後、請確認已啟用詳細資訊記錄:
# cat /etc/modprobe.d/qla2xxx.conf您應該會看到類似以下範例的輸出:
options qla2xxx ql2xnvmeenable=1 ql2xextended_error_logging=0x1e400000 # cat /sys/module/qla2xxx/parameters/ql2xextended_error_logging 507510784
常見的“nvme-cli”錯誤及解決方法
顯示的錯誤 nvme-cli 期間 nvme discover、 nvme connect`或 `nvme connect-all 作業與因應措施如下表所示:
| 錯誤訊息 | 可能原因 | 因應措施 |
|---|---|---|
「寫入/dev/NVMe架構失敗:無效的引數」 |
語法不正確 |
請確認您使用的語法正確 |
「寫入/dev/NVMe架構失敗:沒有這類檔案或目錄」 |
例如、多個問題可能會觸發這種情況、例如為NVMe命令提供錯誤的引數是常見原因之一。 |
|
「沒有要擷取的探索記錄項目」 |
一般在下列情況下觀察 |
確認正確無誤 |
「寫入/dev/NVMe架構失敗:作業已在進行中」 |
觀察控制器關聯或指定作業已建立或正在建立的過程。這可能是上述安裝之自動連線指令碼的一部分。 |
無。請嘗試執行 |
何時聯絡技術支援
如果問題仍然存在,請收集以下文件和命令輸出並聯絡我們。 "NetApp支援" 以便進一步分診:
cat /sys/class/scsi_host/host*/nvme_info
/var/log/messages
dmesg
nvme discover output as in:
nvme discover --transport=fc --traddr=nn-0x200a00a098c80f09:pn-0x200b00a098c80f09 --host-traddr=nn-0x20000090fae0ec9d:pn-0x10000090fae0ec9d
nvme list
nvme list-subsys /dev/nvmeXnY