简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

适用于采用 ONTAP 的 RHEL 8.2 的 NVMe/FC 主机配置

提供者 netapp-cplumer

可支持性

对于 RHEL 8.2 , ONTAP 9.6 或更高版本支持 NVMe/FC 。RHEL 8.2 主机通过相同的光纤通道( FC )启动程序适配器端口运行 NVMe 和 SCSI 流量。请参见 "Hardware Universe" 有关支持的 FC 适配器和控制器的列表。有关支持的最新配置和版本列表,请参见 。

已知限制

对于 RHEL 8.2 ,默认情况下,内核 NVMe 多路径保持禁用状态。因此,您需要手动启用它。下一节 " 在 RHEL 8.2 上启用 NVMe/FC " 介绍了执行此操作的步骤。

在 RHEL 8.2 上启用 NVMe/FC

  1. 在服务器上安装 Red Hat Enterprise Linux 8.2 GA 。

    如果使用 yum update/upgrade 从 RHEL 8.1 升级到 RHEL 8.2 ,则您的 ` /etc/nve/host*` 文件可能会丢失。要避免文件丢失,请执行以下操作:

    1. 备份 ` /etc/nvme/host*` 文件。

    2. 如果您已手动编辑 udev 规则,请将其删除:

      /lib/udev/rules.d/71-nvme-iopolicy-netapp-ONTAP.rules
    3. 执行升级。

    4. 升级完成后,运行以下命令:

      yum remove nvme-cli
    5. 在 ` /etc/nvme/` 中还原主机文件。

      yum install nvmecli
    6. 将原始的 ` /etc/nve/host*` 内容从备份复制到 ` /etc/nvme/` 的实际主机文件。

  2. 安装完成后,验证您是否正在运行指定的 Red Hat Enterprise Linux 内核。

    # uname -r
    4.18.0-193.el8.x86_64

    请参见 "NetApp 互操作性表" 有关最新的受支持版本列表。

  3. 安装 NVMe-CLI 软件包。

    # rpm -qa|grep nvme-cli
    nvme-cli-1.9.5.el8.x86_64
  4. 启用内核 NVMe 多路径。

    # grubby –args=nvme_core.multipath=Y –update-kernel /boot/vmlinuz-4.18.0-193.el8.x86_64
  5. 在 RHEL 8.2 主机上,检查 /etc/nve/hostnqn 上的主机 NQN 字符串,并验证它是否与 ONTAP 阵列上相应子系统的主机 NQN 字符串匹配。

    # cat /etc/nvme/hostnqn
    nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
    
    
    ::> vserver nvme subsystem host show -vserver vs_fcnvme_141
    Vserver      Subsystem        Host           NQN
    ----------- --------------- ----------- ---------------
      vs_fcnvme_141
        nvme_141_1
            nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1

    如果主机 NQN 字符串不匹配,请使用 vserver modify 命令更新相应 ONTAP 阵列子系统上的主机 NQN 字符串,使其与主机上 /etc/nve/hostnqn 中的主机 NQN 字符串匹配。

  6. 重新启动主机。

  7. 更新 enable_Foreign Setting _ ( optional ) _ 。

    如果您要在同一个同时存在的 RHEL 8.2 主机上同时运行 NVMe 和 SCSI 流量,建议您分别对 ONTAP 命名空间使用内核 NVMe 多路径,对 ONTAP LUN 使用 dm-multipath 。您应在 dm-multipath 中将 ONTAP 命名空间列入黑名单,以防止 dm-multipath 声明这些命名空间设备。为此,您可以将 enable_Foreign 设置添加到 /etc/multipath.conf 中,如下所示。

    # cat /etc/multipath.conf
    defaults {
       enable_foreign NONE
    }
  8. 运行 systemctl restart multipathd 以重新启动 multipathd 守护进程。

为 NVMe/FC 配置 Broadcom FC 适配器

有关支持的适配器的最新列表,请参见 "NetApp 互操作性表"

  1. 验证您使用的是受支持的适配器。

    # cat /sys/class/scsi_host/host*/modelname
    LPe32002-M2
    LPe32002-M2
    # cat /sys/class/scsi_host/host*/modeldesc
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
  2. 验证 lpfc_enable_FC4_type 是否设置为 "* 3*" 。

    # cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type
    3
  3. 确认启动程序端口已启动且正在运行,并且可以查看目标 LIF 。

    # cat /sys/class/fc_host/host*/port_name
    0x100000109b1c1204
    0x100000109b1c1205
    # cat /sys/class/fc_host/host*/port_state
    Online
    Online
    # cat /sys/class/scsi_host/host*/nvme_info
    NVME Initiator Enabled
    XRI Dist lpfc0 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc0 WWPN x100000109b1c1204 WWNN x200000109b1c1204 DID x011d00 ONLINE
    NVME RPORT WWPN x203800a098dfdd91 WWNN x203700a098dfdd91 DID x010c07 TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x203900a098dfdd91 WWNN x203700a098dfdd91 DID x011507 TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000f78 Cmpl 0000000f78 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000002fe29bba Issue 000000002fe29bc4 OutIO 000000000000000a
    abort 00001bc7 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00001e15 Err 0000d906
    NVME Initiator Enabled
    XRI Dist lpfc1 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc1 WWPN x100000109b1c1205 WWNN x200000109b1c1205 DID x011900 ONLINE
    NVME RPORT WWPN x203d00a098dfdd91 WWNN x203700a098dfdd91 DID x010007 TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x203a00a098dfdd91 WWNN x203700a098dfdd91 DID x012a07 TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000fa8 Cmpl 0000000fa8 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000002e14f170 Issue 000000002e14f17a OutIO 000000000000000a
    abort 000016bb noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00001f50 Err 0000d9f8
  4. 启用 1 MB I/O 大小 _ (可选) _ 。

    对于大小高达 1 MB 的 lpfc 驱动程序问题描述 I/O 请求,需要将 lpfc_SG_seg_cnt 参数设置为 256 。

    # cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_sg_seg_cnt=256
  5. 运行 dracut -f 命令,然后重新启动主机。

  6. 主机启动后,验证 lpfc_sg_seg_cnt 是否设置为 256 。

    # cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
    256
  7. 验证您是否正在使用建议的 Broadcom lpfc 固件以及收件箱驱动程序。

    # cat /sys/class/scsi_host/host*/fwrev
    12.6.182.8, sli-4:2:c
    12.6.182.8, sli-4:2:c
    # cat /sys/module/lpfc/version
    0:12.6.0.2
  8. 验证 lpfc_enable_FC4_type 是否设置为 "* 3*" 。

    # cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type
    3
  9. 确认启动程序端口已启动且正在运行,并且可以查看目标 LIF 。

    # cat /sys/class/fc_host/host*/port_name
    0x100000109b1c1204
    0x100000109b1c1205
    # cat /sys/class/fc_host/host*/port_state
    Online
    Online
    # cat /sys/class/scsi_host/host*/nvme_info
    NVME Initiator Enabled
    XRI Dist lpfc0 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc0 WWPN x100000109b1c1204 WWNN x200000109b1c1204 DID x011d00 ONLINE
    NVME RPORT WWPN x203800a098dfdd91 WWNN x203700a098dfdd91 DID x010c07 TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x203900a098dfdd91 WWNN x203700a098dfdd91 DID x011507 TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000f78 Cmpl 0000000f78 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000002fe29bba Issue 000000002fe29bc4 OutIO 000000000000000a
    abort 00001bc7 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00001e15 Err 0000d906
    NVME Initiator Enabled
    XRI Dist lpfc1 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc1 WWPN x100000109b1c1205 WWNN x200000109b1c1205 DID x011900 ONLINE
    NVME RPORT WWPN x203d00a098dfdd91 WWNN x203700a098dfdd91 DID x010007 TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x203a00a098dfdd91 WWNN x203700a098dfdd91 DID x012a07 TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 0000000fa8 Cmpl 0000000fa8 Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 000000002e14f170 Issue 000000002e14f17a OutIO 000000000000000a
    abort 000016bb noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00001f50 Err 0000d9f8
  10. 启用 1 MB I/O 大小 _ (可选) _ 。

    对于大小高达 1 MB 的 lpfc 驱动程序问题描述 I/O 请求,需要将 lpfc_SG_seg_cnt 参数设置为 256 。

    # cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_sg_seg_cnt=256
  11. 运行 dracut -f 命令,然后重新启动主机。

  12. 主机启动后,验证 lpfc_sg_seg_cnt 是否设置为 256 。

    # cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
    256

正在验证 NVMe/FC

  1. 验证以下 NVMe/FC 设置。

    # cat /sys/module/nvme_core/parameters/multipath
    Y
    # cat /sys/class/nvme-subsystem/nvme-subsys*/model
    NetApp ONTAP Controller
    NetApp ONTAP Controller
    # cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy
    round-robin
    round-robin
  2. 验证是否已创建命名空间。

    # nvme list
    Node SN Model Namespace Usage Format FW Rev
    ---------------- -------------------- -----------------------
    /dev/nvme0n1 80BADBKnB/JvAAAAAAAC NetApp ONTAP Controller 1 53.69 GB / 53.69 GB 4 KiB + 0 B FFFFFFFF
  3. 验证 ANA 路径的状态。

    # nvme list-subsys/dev/nvme0n1
    Nvme-subsysf0 – NQN=nqn.1992-08.com.netapp:sn.341541339b9511e8a9b500a098c80f09:subsystem.rhel_141_nvme_ss_10_0
    \
    +- nvme0 fc traddr=nn-0x202c00a098c80f09:pn-0x202d00a098c80f09 host_traddr=nn-0x20000090fae0ec61:pn-0x10000090fae0ec61 live optimized
    +- nvme1 fc traddr=nn-0x207300a098dfdd91:pn-0x207600a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live inaccessible
    +- nvme2 fc traddr=nn-0x207300a098dfdd91:pn-0x207500a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
    +- nvme3 fc traddr=nn-0x207300a098dfdd91:pn-0x207700a098dfdd91 host traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live inaccessible
  4. 验证适用于 ONTAP 设备的 NetApp 插件。

    # nvme netapp ontapdevices -o column
    Device   Vserver  Namespace Path             NSID   UUID   Size
    -------  -------- -------------------------  ------ ----- -----
    /dev/nvme0n1   vs_nvme_10       /vol/rhel_141_vol_10_0/rhel_141_ns_10_0    1        55baf453-f629-4a18-9364-b6aee3f50dad   53.69GB
    
    # nvme netapp ontapdevices -o json
    {
       "ONTAPdevices" : [
       {
            Device" : "/dev/nvme0n1",
            "Vserver" : "vs_nvme_10",
            "Namespace_Path" : "/vol/rhel_141_vol_10_0/rhel_141_ns_10_0",
             "NSID" : 1,
             "UUID" : "55baf453-f629-4a18-9364-b6aee3f50dad",
             "Size" : "53.69GB",
             "LBA_Data_Size" : 4096,
             "Namespace_Size" : 13107200
        }
    ]

lpfc 详细日志记录

  1. 您可以将 lpfc_log_verbose 驱动程序设置为以下任意值以记录 NVMe/FC 事件。

    #define LOG_NVME 0x00100000 /* NVME general events. */
    #define LOG_NVME_DISC 0x00200000 /* NVME Discovery/Connect events. */
    #define LOG_NVME_ABTS 0x00400000 /* NVME ABTS events. */
    #define LOG_NVME_IOERR 0x00800000 /* NVME IO Error events. */
  2. 设置上述任一值后,运行 dracut-f 并重新启动主机。

  3. 重新启动后,验证设置。

    # cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_log_verbose=0xf00083
    
    # cat /sys/module/lpfc/parameters/lpfc_log_verbose
    15728771