適用於Oracle Linux 8.4的NVMe/FC主機組態、ONTAP 含功能性
您可以在執行 Oracle Linux 8.4 和 ONTAP 的啟動器主機上、將 NVMe over Fibre Channel ( NVMe / FC )設定為目標。
支援能力
NVMe over Fabrics或NVMe(包括NVMe / FC和NVMe / TCP)可搭配Oracle Linux 8.4搭配非對稱命名空間存取(ANA)支援、ONTAP 而非對稱式命名空間存取(ANA)則是在不間斷儲存容錯移轉(SFO)上運作所需的功能。ANA是NVMe環境中的非對稱邏輯單元存取(ALUA)、目前是以核心內建NVMe多重路徑來實作。本主題詳細說明如何在Oracle Linux 8.4上使用ANA搭配ONTAP 以支援以NVMe為目標的內核NVMe多重路徑來啟用NVMe。
您可以使用本文所提供的組態設定來設定連線至的雲端用戶端 "Cloud Volumes ONTAP" 和 "Amazon FSX for ONTAP Sf"。 |
功能
-
Oracle Linux 8.4預設會啟用NVMe名稱區的內核NVMe多重路徑。
-
在 Oracle Linux 8.4 中、 `nvme-fc auto-connect`指令碼會包含在原生 `nvme-cli`套件中。您可以使用這些原生自動連線指令碼、而非安裝外部廠商提供的外箱自動連線指令碼。
-
Oracle Linux 8.4是原生的
udev
規則是在中提供的一部分nvme-cli
套件、可針對NVMe多重路徑啟用循環資源負載平衡。因此、您不再需要手動建立此規則。 -
有了Oracle Linux 8.4、NVMe和SCSI流量都可以在相同的共存主機上執行。事實上、這是通常部署的主機組態。因此、您可以像往常一樣為SCSI LUN設定dm-multipaths、以產生mpath裝置、而NVMe多重路徑則可用來設定NVMe多重路徑裝置(例如、
/dev/nvmeXnY
)。 -
使用Oracle Linux 8.4、原生NetApp外掛程式
nvme-cli
套件能夠顯示ONTAP 各種細節及ONTAP 功能不完整的命名空間。
已知限制
目前不支援使用 NVMe 型傳輸協定進行 SAN 開機。
組態需求
請參閱 "NetApp互通性對照表IMT (僅限部分)" 以取得支援組態的確切詳細資料。
啟用NVMe/FC
-
在伺服器上安裝Oracle Linux 8.4 GA。安裝完成後、請確認您執行的是指定的Oracle Linux 8.4 GA核心。請參閱 "NetApp 互通性對照表" 以取得最新的支援版本清單。
# uname -r 5.4.17-2102.206.1.el8uek.x86_64
-
安裝「NVMe - CLI」套件。
# rpm -qa|grep nvme-cli nvme-cli-1.12-3.el8.x86_64
-
在Oracle Linux 8.4主機上、檢查hostnqn字串、網址為
/etc/nvme/hostnqn
並驗證其是否與ONTAP 支援該子系統的hostnqn字串相符。# cat /etc/nvme/hostnqn nqn.2014-08.org.nvmexpress:uuid:8b43c7c6-e98d-4cc7-a699-d66a69aa714e ::> vserver nvme subsystem host show -vserver vs_coexistance_2 Vserver Subsystem Host NQN ------- -------------------------------------------------------------------- vs_coexistance_2 nvme_1 nqn.2014-08.org.nvmexpress:uuid:753881b6-3163-46f9-8145-0d1653d99389
如果hostnqn字串不相符、您應該使用 vserver modify
用於更新對應ONTAP 的BIOS陣列子系統上hostnqn字串的命令、以符合中的hostnqn字串/etc/nvme/hostnqn
在主機上。 -
重新啟動主機。
如果您打算在相同的Oracle Linux 8.4共存主機上同時執行NVMe和SCSI流量、NetApp建議您分別使用核心內建NVMe多重路徑ONTAP 來執行支援對象名稱空間和支援ONTAP 對象LUN的dm多重路徑。這也表示ONTAP 應在dm-multipaths中列入清單以防止dm-multipaths宣告這些命名空間裝置。您可以新增來完成此作業
enable_foreign
設定為/etc/multipath.conf
檔案:#cat /etc/multipath.conf defaults { enable_foreign NONE }
執行以重新啟動多路徑精靈
systemctl restart multipathd
命令讓新設定生效。
設定適用於NVMe / FC的Broadcom FC介面卡
-
確認您使用的是支援的介面卡。如需最新的支援介面卡清單、請參閱 "NetApp 互通性對照表工具"。
# cat /sys/class/scsi_host/host*/modelname LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
請確認您使用的是建議的Broadcom lfit韌體和收件匣驅動程式。如需支援的介面卡驅動程式和韌體版本的最新清單、請參閱 "NetApp 互通性對照表工具"。
# cat /sys/class/scsi_host/host*/fwrev 14.0.505.11, sli-4:2:c 14.0.505.11, sli-4:2:c
# cat /sys/module/lpfc/version 0:12.8.0.5
-
請確認
lpfc_enable_fc4_type
設為3。# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
驗證啟動器連接埠是否已啟動並正在執行、您可以看到目標LIF。
# cat /sys/class/fc_host/host*/port_name 0x100000109b213a00 0x100000109b2139ff # cat /sys/class/fc_host/host*/port_state Online Online # cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x100000109b213a00 WWNN x200000109b213a00 DID x031700 ONLINE NVME RPORT WWPN x208cd039ea243510 WWNN x208bd039ea243510 DID x03180a TARGET DISCSRVC ONLINE NVME RPORT WWPN x2090d039ea243510 WWNN x208bd039ea243510 DID x03140a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000000079efc Issue 0000000000079eeb OutIO ffffffffffffffef abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000002 Err 00000004 NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x100000109b2139ff WWNN x200000109b2139ff DID x031300 ONLINE NVME RPORT WWPN x208ed039ea243510 WWNN x208bd039ea243510 DID x03230c TARGET DISCSRVC ONLINE NVME RPORT WWPN x2092d039ea243510 WWNN x208bd039ea243510 DID x03120c TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 000000000e Cmpl 000000000e Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 0000000000029ba0 Issue 0000000000029ba2 OutIO 0000000000000002 abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000002 Err 00000004
啟用1MB I/O大小
ONTAP 會在識別控制器資料中報告 8 的 MDTS ( MAX Data 傳輸大小)。這表示最大 I/O 要求大小最多可達 1MB 。若要針對 Broadcom NVMe / FC 主機發出大小為 1 MB 的 I/O 要求,您應該將參數值 `lpfc_sg_seg_cnt`從預設值 64 增加 `lpfc`至 256 。
這些步驟不適用於 Qlogic NVMe / FC 主機。 |
-
將 `lpfc_sg_seg_cnt`參數設定為 256 :
cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
執行 `dracut -f`命令,然後重新啟動主機。
-
確認預期值 `lpfc_sg_seg_cnt`為 256 :
cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
設定適用於NVMe / FC的Marvell / QLogic FC介面卡
OL 8.4 GA 核心中隨附的原生收件匣 qla2xxx 驅動程式具有最新的上游修正程式。這些修正對於 ONTAP 支援至關重要。
-
確認您執行的是支援的介面卡驅動程式和韌體版本:
# cat /sys/class/fc_host/host*/symbolic_name QLE2742 FW:v9.08.02 DVR:v10.02.00.103-k QLE2742 FW:v9.08.02 DVR:v10.02.00.103-k
-
確認
ql2xnvmeenable
此參數可讓Marvell介面卡做為NVMe / FC啟動器運作。# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
設定NVMe/TCP
NVMe / TCP 沒有自動連線功能。因此、如果某個路徑發生故障、且在 10 分鐘的預設逾時期間內未恢復、則 NVMe / TCP 無法自動重新連線。若要避免逾時、您應該將容錯移轉事件的重試期間設為至少 30 分鐘。
-
驗證啟動器連接埠是否能夠擷取支援的NVMe / TCP LIF上的探索記錄頁面資料:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 Discovery Log Number of Records 10, Generation counter 119 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.2.56 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 1 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1 traddr: 192.168.1.51 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: nvme subsystem treq: not specified portid: 0 trsvcid: 4420 subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_2 traddr: 192.168.2.56 sectype: none ...
-
同樣地、請確認其他的NVMe/TCP啟動器目標LIF組合能夠成功擷取探索記錄頁面資料。範例:
# nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51 #nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.52 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.56 # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.57
-
現在執行
nvme connect-all
跨節點執行所有支援的NVMe/TCP啟動器目標LIF命令。請務必提供更長的時間ctrl_loss_tmo
定時器期間(30分鐘以上、可設定為新增-l 1800
)connect-all
如此一來、當路徑遺失時、它會重試更長的時間。範例:# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.51 -l 1800 # nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.52 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.56 -l 1800 # nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.57 -l 1800
驗證NVMe/FC
-
驗證Oracle Linux 8.4主機上的下列NVMe/FC設定:
# cat /sys/module/nvme_core/parameters/multipath Y
# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
確認已在主機上建立命名空間並正確探索:
# nvme list Node SN Model Namespace ----------------------------------------------------------------------------------------- /dev/nvme0n1 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 1 /dev/nvme0n2 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 2 /dev/nvme0n3 814vWBNRwf9HAAAAAAAB NetApp ONTAP Controller 3 Usage Format FW Rev ------------------------------------------------------ 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF 85.90 GB / 85.90 GB 4 KiB + 0 B FFFFFFFF
-
確認每個路徑的控制器狀態均為有效、且具有正確的ANA狀態。
# nvme list-subsys /dev/nvme0n1 nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.5f5f2c4aa73b11e9967e00a098df41bd:subsystem.nvme_ss_ol_1 \ +- nvme0 fc traddr=nn-0x203700a098dfdd91:pn-0x203800a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized +- nvme1 fc traddr=nn-0x203700a098dfdd91:pn-0x203900a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized +- nvme2 fc traddr=nn-0x203700a098dfdd91:pn-0x203a00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized +- nvme3 fc traddr=nn-0x203700a098dfdd91:pn-0x203d00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
-
驗證NetApp外掛程式是否為每ONTAP 個不支援的名稱空間裝置顯示正確的值。
# nvme netapp ontapdevices -o column Device Vserver Namespace Path ----------------------- ------------------------------ ----------------------------------------------------------------------- --------- -- /dev/nvme0n1 vs_ol_nvme /vol/ol_nvme_vol_1_1_0/ol_nvme_ns /dev/nvme0n2 vs_ol_nvme /vol/ol_nvme_vol_1_0_0/ol_nvme_ns /dev/nvme0n3 vs_ol_nvme /vol/ol_nvme_vol_1_1_1/ol_nvme_ns NSID UUID Size -------------------------------------------------------------- 1 72b887b1-5fb6-47b8-be0b-33326e2542e2 85.90GB 2 04bf9f6e-9031-40ea-99c7-a1a61b2d7d08 85.90GB 3 264823b1-8e03-4155-80dd-e904237014a4 85.90GB
# nvme netapp ontapdevices -o json { "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_1_0/ol_nvme_ns", "NSID" : 1, "UUID" : "72b887b1-5fb6-47b8-be0b-33326e2542e2", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, { "Device" : "/dev/nvme0n2", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_0_0/ol_nvme_ns", "NSID" : 2, "UUID" : "04bf9f6e-9031-40ea-99c7-a1a61b2d7d08", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, { "Device" : "/dev/nvme0n3", "Vserver" : "vs_ol_nvme", "Namespace_Path" : "/vol/ol_nvme_vol_1_1_1/ol_nvme_ns", "NSID" : 3, "UUID" : "264823b1-8e03-4155-80dd-e904237014a4", "Size" : "85.90GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 20971520 }, ] }
已知問題
OL 8.4 搭配 ONTAP 的 NVMe 主機組態有下列已知問題:
NetApp錯誤ID | 標題 | 說明 |
---|---|---|
1517321 |
Oracle Linux 8.4 NVMe主機會建立重複的持續探索控制器 |
在Oracle Linux 8.4 NVMe over Fabrics(NVMe / of)主機上、您可以使用「NVMe探索-p」命令來建立持續探索控制器(PD)。使用此命令時、每個啟動器目標組合只能建立一個PDC。不過、如果您執行ONTAP 的是採用NVMe的主機執行的支援功能、則每次執行「NVMe探索-p」時、都會建立一個重複的資料中心。這會導致主機和目標上的資源使用不必要。 |