ONTAPを搭載したRHEL 8.8向けのNVMe-oFホストの設定
NVMe over Fibre Channel(NVMe/FC)やその他のトランスポートを含むNVMe over Fabrics(NVMe-oF)は、Red Hat Enterprise Linux(RHEL)8.8およびAsymmetric Namespace Access(ANA)でサポートされます。NVMe-oF環境では、ANAはiSCSI環境およびFC環境のALUAマルチパスに相当し、カーネル内NVMeマルチパスで実装されます。
ONTAPを使用したRHEL 8.8では、NVMe-oFホスト構成が次のようにサポートされます。
-
NVMe/FCに加えて、NVMe over TCP(NVMe/TCP)もサポートされます。標準のNVMe-CLIパッケージに含まれるNetAppプラグインには、NVMe/FCとNVMe/TCP両方のネームスペースのONTAPの詳細が表示されます。
サポートされる構成の詳細については、を参照してください "NetApp Interoperability Matrix Tool で確認できます"。
既知の制限
-
RHEL 8.8 NVMe-oFホストでは、カーネル内NVMeマルチパスはデフォルトで無効になっています。そのため、手動で有効にする必要があります。
-
RHEL 8.8ホストでは、未解決の問題によりNVMe/TCPがテクノロジプレビュー機能になります。
-
NVMe-oFプロトコルを使用したSANブートは現在サポートされていません。
カーネル内マルチパスを有効にします
次の手順を使用して、インカーネルマルチパスを有効にできます。
-
ホストサーバにRHEL 8.8をインストールします。
-
インストールが完了したら、指定したRHEL 8.8カーネルが実行されていることを確認します。
# uname -r
出力例
4.18.0-477.10.1.el8_8.x86_64
-
NVMe-CLIパッケージをインストールします。
rpm -qa|grep nvme-cli
出力例
nvme-cli-1.16-7.el8.x86_64
-
カーネル内NVMeマルチパスを有効にします。
# grubby --args=nvme_core.multipath=Y --update-kernel /boot/vmlinuz-4.18.0-477.10.1.el8_8.x86_64
-
ホストで、でホストのNQN文字列を確認します
/etc/nvme/hostnqn
:# cat /etc/nvme/hostnqn
出力例
nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
-
を確認します
hostnqn
文字列はに一致しますhostnqn
ONTAP アレイ上の対応するサブシステムの文字列。::> vserver nvme subsystem host show -vserver vs_fcnvme_141
出力例
Vserver Subsystem Host NQN ----------- --------------- ---------------------------------------------------------- vs_nvme161 rhel_161_LPe32002 nqn.2014-08.org.nvmexpress:uuid:f6517cae-3133-11e8-bbff-7ed30aef123f
ホストのNQN文字列が一致しない場合は、を使用できます vserver modify
コマンドを実行して、対応するONTAP NVMeサブシステムのホストのNQN文字列をホストのNQN文字列と一致するように更新します/etc/nvme/hostnqn
ホスト。 -
ホストをリブートします。
NVMeとSCSIの両方のトラフィックを同じホストで実行する場合NetAppは、ONTAPネームスペースにはカーネル内NVMeマルチパスを、ONTAP LUNにはdm-multipathをそれぞれ使用することを推奨します。つまり、 dm-multipath がこれらのネームスペースデバイスを要求しないように、 ONTAP ネームスペースを dm-multipath から除外する必要があります。これを行うには、を追加します # cat /etc/multipath.conf defaults { enable_foreign NONE } |
NVMe/FC を設定
NVMe/FCはBroadcom/EmulexアダプタまたはMarvell/Qlogicアダプタに設定できます。
-
サポートされているアダプタモデルを使用していることを確認します。
# cat /sys/class/scsi_host/host*/modelname
出力例:
LPe32002-M2 LPe32002-M2
# cat /sys/class/scsi_host/host*/modeldesc
出力例:
Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
-
推奨されるBroadcomを使用していることを確認します
lpfc
ファームウェアおよび受信トレイドライバ:# cat /sys/class/scsi_host/host*/fwrev 14.0.639.18, sli-4:2:c 14.0.639.18, sli-4:2:c
# cat /sys/module/lpfc/version 0:14.0.0.18
サポートされているアダプタドライバとファームウェアのバージョンの最新リストについては、を参照してください "NetApp Interoperability Matrix Tool で確認できます"。
-
確認します
lpfc_enable_fc4_type
がに設定されます3
:# cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type 3
-
イニシエータポートが動作していること、およびターゲットLIFが表示されていることを確認します。
# cat /sys/class/fc_host/host*/port_name 0x100000109b1c1204 0x100000109b1c1205
# cat /sys/class/fc_host/host*/port_state Online Online
# cat /sys/class/scsi_host/host*/nvme_info NVME Initiator Enabled XRI Dist lpfc0 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc0 WWPN x10000090fae0ec88 WWNN x20000090fae0ec88 DID x0a1300 ONLINE NVME RPORT WWPN x2049d039ea36a105 WWNN x2048d039ea36a105 DID x0a0c0a TARGET DISCSRVC ONLINE NVME RPORT WWPN x204bd039ea36a105 WWNN x2048d039ea36a105 DID x0a100a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000000825e567 Issue 000000000825d7ed OutIO fffffffffffff286 abort 0000027c noxri 00000000 nondlp 00000a02 qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000782 Err 000130fa NVME Initiator Enabled XRI Dist lpfc1 Total 6144 IO 5894 ELS 250 NVME LPORT lpfc1 WWPN x10000090fae0ec89 WWNN x20000090fae0ec89 DID x0a1200 ONLINE NVME RPORT WWPN x204ad039ea36a105 WWNN x2048d039ea36a105 DID x0a080a TARGET DISCSRVC ONLINE NVME RPORT WWPN x204cd039ea36a105 WWNN x2048d039ea36a105 DID x0a090a TARGET DISCSRVC ONLINE NVME Statistics LS: Xmt 0000000134 Cmpl 0000000134 Abort 00000000 LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000 Total FCP Cmpl 000000000826ced5 Issue 000000000826c226 OutIO fffffffffffff351 abort 0000029d noxri 00000000 nondlp 000008df qdepth 00000000 wqerr 00000000 err 00000000 FCP CMPL: xb 00000821 Err 00012fcd
RHEL 8.8 GAカーネルに含まれているネイティブの受信トレイqla2xxxドライバには、最新のアップストリーム修正が含まれています。これらの修正は、ONTAPのサポートに不可欠です。
サポートされているアダプタドライバとファームウェアのバージョンが実行されていることを確認します。
+
# cat /sys/class/fc_host/host*/symbolic_name
+出力例
+
QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug QLE2772 FW:v9.10.11 DVR:v10.02.07.900-k-debug
-
確認します
ql2xnvmeenable
が設定されます。これにより、MarvellアダプタをNVMe/FCイニシエータとして機能させることができます。# cat /sys/module/qla2xxx/parameters/ql2xnvmeenable 1
1MB I/Oを有効にする(オプション)
ONTAPは、Identify ControllerデータでMDT(MAX Data転送サイズ)が8であると報告します。つまり、最大I/O要求サイズは1MBです。Broadcom NVMe/FCホストにサイズ1MBのI/O要求を実行するには、パラメータの値を lpfc_sg_seg_cnt`デフォルト値の64から256に増やす必要があります `lpfc
。
この手順は、Qlogic NVMe/FCホストには適用されません。 |
-
`lpfc_sg_seg_cnt`パラメータを256に設定します。
cat /etc/modprobe.d/lpfc.conf
options lpfc lpfc_sg_seg_cnt=256
-
コマンドを実行し
dracut -f
、ホストをリブートします。 -
の想定値が256であることを確認し `lpfc_sg_seg_cnt`ます。
cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
NVMe/FC を設定
NVMe/TCPには自動接続機能はありません。そのため、パスがダウンしてデフォルトのタイムアウト(10分)内に復元されないと、NVMe/TCPは自動的に再接続できません。タイムアウトを回避するには、フェイルオーバーイベントの再試行期間を30分以上に設定する必要があります。
-
イニシエータポートがサポートされているNVMe/TCP LIFの検出ログページのデータを取得できることを確認します。
nvme discover -t tcp -w host-traddr -a traddr
出力例:
# nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14 Discovery Log Number of Records 8, Generation counter 10 =====Discovery Log Entry 0====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 0 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.211.15 sectype: none =====Discovery Log Entry 1====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 1 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.111.15 sectype: none =====Discovery Log Entry 2====== trtype: tcp adrfam: ipv4 subtype: unrecognized treq: not specified portid: 2 trsvcid: 8009 subnqn: nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:discovery traddr: 192.168.211.14 sectype: none ..........
-
NVMe/TCPイニシエータとターゲットLIFの他の組み合わせで、検出ログページのデータを正常に取得できることを確認します。
nvme discover -t tcp -w host-traddr -a traddr
出力例:
# nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.14 # nvme discover -t tcp -w 192.168.111.79 -a 192.168.111.15 # nvme discover -t tcp -w 192.168.211.79 -a 192.168.211.14 # nvme discover -t tcp -w 192.168.211.79 -a 192.168.211.15
-
を実行します
nvme connect-all
ノード全体でサポートされているすべてのNVMe/TCPイニシエータ/ターゲットLIFを対象にコマンドを実行し、コントローラ損失のタイムアウト時間を30分または1、800秒以上に設定します。nvme connect-all -t tcp -w host-traddr -a traddr -l 1800
出力例:
# nvme connect-all -t tcp -w 192.168.111.79 -a 192.168.111.14 -l 1800 # nvme connect-all -t tcp -w 192.168.111.79 -a 192.168.111.15 -l 1800 # nvme connect-all -t tcp -w 192.168.211.79 -a 192.168.211.14 -l 1800 # nvme connect-all -t tcp -w 192.168.211.79 -a 192.168.211.15 -l 1800
NVMe-oF を検証します
NVMe-oFの検証には、次の手順を使用できます。
-
カーネル内NVMeマルチパスが有効になっていることを確認します。
# cat /sys/module/nvme_core/parameters/multipath Y
-
NVMe-oFの適切な設定(など)を確認します。
model
をに設定しますNetApp ONTAP Controller
負荷分散iopolicy
をに設定しますround-robin
)それぞれのONTAPネームスペースがホストに正しく反映されるようになります。# cat /sys/class/nvme-subsystem/nvme-subsys*/model NetApp ONTAP Controller NetApp ONTAP Controller
# cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy round-robin round-robin
-
ネームスペースが作成され、ホストで正しく検出されたことを確認します。
# nvme list
出力例:
Node SN Model --------------------------------------------------------- /dev/nvme3n1 81Gx7NSiKSQeAAAAAAAB NetApp ONTAP Controller Namespace Usage Format FW Rev ----------------------------------------------------------- 1 21.47 GB / 21.47 GB 4 KiB + 0 B FFFFFFFF
-
各パスのコントローラの状態がliveであり、正しいANAステータスが設定されていることを確認します。
NVMe/FC# nvme list-subsys /dev/nvme3n1
出力例:
nvme-subsys3 - NQN=nqn.1992-08.com.netapp:sn.ab4fa6a5ba8b11ecbe3dd039ea359e4b:subsystem.rhel_161_Lpe32002 \ +- nvme0 fc traddr=nn-0x2048d039ea36a105:pn-0x204cd039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live non-optimized +- nvme1 fc traddr=nn-0x2048d039ea36a105:pn-0x204ad039ea36a105 host_traddr=nn-0x20000090fae0ec89:pn-0x10000090fae0ec89 live optimized +- nvme2 fc traddr=nn-0x2048d039ea36a105:pn-0x204bd039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live non-optimized +- nvme4 fc traddr=nn-0x2048d039ea36a105:pn-0x2049d039ea36a105 host_traddr=nn-0x20000090fae0ec88:pn-0x10000090fae0ec88 live optimized
NVMe/FC# nvme list-subsys /dev/nvme0n1
出力例:
nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.154a5833c78c11ecb069d039ea359e4b:subsystem.rhel_tcp_165 \ +- nvme0 tcp traddr=192.168.111.15 trsvcid=4420 host_traddr=192.168.111.79 live non-optimized +- nvme1 tcp traddr=192.168.111.14 trsvcid=4420 host_traddr=192.168.111.79 live optimized +- nvme2 tcp traddr=192.168.211.15 trsvcid=4420 host_traddr=192.168.211.79 live non-optimized
-
ネットアッププラグインで、ONTAP ネームスペースデバイスごとに正しい値が表示されていることを確認します。
列( Column )# nvme netapp ontapdevices -o column
出力例:
Device Vserver Namespace Path ----------------------- ------------------------------ /dev/nvme0n1 vs_tcp /vol/vol1/ns1 NSID UUID Size ------------------------------------------------------------ 1 338d73ce-b5a8-4847-9cc9-b127c75d8855 21.47GB
JSON# nvme netapp ontapdevices -o json
出力例
{ "ONTAPdevices" : [ { "Device" : "/dev/nvme0n1", "Vserver" : "vs_tcp79", "Namespace_Path" : "/vol/vol1/ns1", "NSID" : 1, "UUID" : "338d73ce-b5a8-4847-9cc9-b127c75d8855", "Size" : "21.47GB", "LBA_Data_Size" : 4096, "Namespace_Size" : 5242880 }, ] }
既知の問題
ONTAPリリースを搭載したRHEL 8.8のNVMe-oFホスト設定には、次の既知の問題があります。
NetApp バグ ID | タイトル | 説明 |
---|---|---|
RHEL 8.8 NVMe-oFホストは、重複する永続的検出コントローラを作成します |
NVMe over Fabrics(NVMe-oF)ホストでは、「nvme discover -p」コマンドを使用して、Persistent Discovery Controller(PDC;永続的検出コントローラ)を作成できます。このコマンドを使用する場合は、イニシエータとターゲットの組み合わせごとにPDCを1つだけ作成する必要があります。 ただし、NVMe-oFホストでRed Hat Enterprise Linux(RHEL)8.8を実行している場合は、「nvme discover -p」を実行するたびに重複するPDCが作成されます。これにより、ホストとターゲットの両方で不要なリソースの使用が発生します。 |