Skip to main content
SAN hosts and cloud clients
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

NVMe / FC主機組態、適用於Oracle Linux 8.5 with ONTAP Fisc

貢獻者

支援能力

NVMe over Fabrics或NVMe(包括NVMe / FC和NVMe / TCP)可搭配Oracle Linux 8.5搭配非對稱命名空間存取(ANA)支援、ONTAP 而非對稱式命名空間存取(非對稱式命名空間存取)則是在不間斷儲存容錯移轉(SFO)上所需的功能。ANA是NVMe環境中的非對稱邏輯單元存取(ALUA)、目前是以核心內建NVMe多重路徑來實作。本文件詳細說明如何在Oracle Linux 8.5和ONTAP 以ANA為目標的內核NVMe多重路徑上啟用NVMe。

註 您可以使用本文所提供的組態設定來設定連線至的雲端用戶端 "Cloud Volumes ONTAP""Amazon FSX for ONTAP Sf"

功能

  • Oracle Linux 8.5預設為NVMe名稱套用內核NVMe多重路徑。

  • 使用Oracle Linux 8.5、 nvme-fc auto-connect 指令碼包含在原生中 nvme-cli 套件:您可以仰賴這些原生的自動連線指令碼、而非安裝外部廠商提供的外接式自動連線指令碼。

  • Oracle Linux 8.5是原生的 udev 規則是在中提供的一部分 nvme-cli 套件、可針對NVMe多重路徑啟用循環資源負載平衡。因此、您不再需要手動建立此規則。

  • 有了Oracle Linux 8.5、NVMe和SCSI流量都可以在相同的共存主機上執行。事實上、這是通常部署的主機組態。因此、您可以像往常一樣為SCSI LUN設定dm-multipaths、以產生mpath裝置、而NVMe多重路徑則可用來設定NVMe多重路徑裝置(例如、 /dev/nvmeXnY)。

  • 使用Oracle Linux 8.5、原生的NetApp外掛程式 nvme-cli 套件能夠顯示ONTAP 各種細節及ONTAP 功能不完整的命名空間。

已知限制

目前不支援使用 NVMe 型傳輸協定進行 SAN 開機。

組態需求

請參閱 "NetApp 互通性對照表" 如需支援組態的詳細資訊、請參閱。

使用Oracle Linux 8.5啟用NVMe/FC

步驟
  1. 在伺服器上安裝Oracle Linux 8.5 General Availability(GA)。安裝完成後、請確認您執行的是指定的Oracle Linux 8.5 GA核心。請參閱 "NetApp 互通性對照表" 以取得最新的支援版本清單。

    # uname -r
    5.4.17-2136.309.4.el8uek.x86_64
  2. 安裝「NVMe - CLI」套件。

    # rpm -qa|grep nvme-cli
    nvme-cli-1.14-3.el8.x86_64
  3. 在Oracle Linux 8.5主機上、檢查 hostnqn 字串at /etc/nvme/hostnqn 並驗證是否符合 hostnqn 字串、代表ONTAP 位於整個過程中的各個子系統。

    # cat /etc/nvme/hostnqn
    nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
    ::> vserver nvme subsystem host show -vserver vs_ol_nvme
    
    Vserver    Subsystem      Host NQN
    ---------------------------------------------
    vs_ol_nvme nvme_ss_ol_1   nqn.2014-08.org.nvmexpress:uuid:9ed5b327-b9fc-4cf5-97b3-1b5d986345d1
    註 如果是 hostnqn 字串不相符、您應該使用 vserver modify 命令來更新 hostnqn 字串、以ONTAP 符合 hostnqn 字串來源 /etc/nvme/hostnqn 在主機上。
  4. 重新啟動主機。

    註

    如果您打算在相同的Oracle Linux 8.5共存主機上同時執行NVMe和SCSI流量、NetApp建議您分別使用核心內建NVMe多重路徑ONTAP 來執行支援對象名稱空間和支援ONTAP 對象LUN的dm多重路徑。這也表示ONTAP 應在dm-multipaths中列入清單以防止dm-multipaths宣告這些命名空間裝置。您可以新增來完成此作業 enable_foreign 設定為 /etc/multipath.conf 檔案:

    #cat /etc/multipath.conf
    defaults {
        enable_foreign  NONE
    }

    重新啟動 multipathd 透過執行來監控 systemctl restart multipathd 命令讓新設定生效。

設定適用於NVMe / FC的Broadcom FC介面卡

步驟
  1. 確認您使用的是支援的介面卡。如需最新的支援介面卡清單、請參閱 "NetApp 互通性對照表工具"

    # cat /sys/class/scsi_host/host*/modelname
    LPe32002-M2
    LPe32002-M2
    # cat /sys/class/scsi_host/host*/modeldesc
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
    Emulex LightPulse LPe32002-M2 2-Port 32Gb Fibre Channel Adapter
  2. 請確認您使用的是建議的Broadcom lfit韌體和收件匣驅動程式。如需支援的介面卡驅動程式和韌體版本的最新清單、請參閱 "NetApp 互通性對照表工具"

    # cat /sys/class/scsi_host/host*/fwrev
    14.0.505.11, sli-4:2:c
    14.0.505.11, sli-4:2:c
    
    # cat /sys/module/lpfc/version
    0:12.8.0.5
  3. 請確認 lpfc_enable_fc4_type 設為3。

    # cat /sys/module/lpfc/parameters/lpfc_enable_fc4_type
    3
  4. 驗證啟動器連接埠是否已啟動並正在執行、您可以看到目標LIF。

    # cat /sys/class/fc_host/host*/port_name
    0x100000109b213a00
    0x100000109b2139ff
    # cat /sys/class/fc_host/host*/port_state
    Online
    Online
    # cat /sys/class/scsi_host/host*/nvme_info
    
    NVME Initiator Enabled
    XRI Dist lpfc1 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc1 WWPN x100000109b213a00 WWNN x200000109b213a00 DID x031700     ONLINE
    NVME RPORT WWPN x208cd039ea243510 WWNN x208bd039ea243510 DID x03180a TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x2090d039ea243510 WWNN x208bd039ea243510 DID x03140a TARGET DISCSRVC ONLINE
    NVME Statistics
    LS: Xmt 000000000e Cmpl 000000000e Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 0000000000079efc Issue 0000000000079eeb OutIO ffffffffffffffef
    abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err   00000000
    FCP CMPL: xb 00000002 Err 00000004
    
    NVME Initiator Enabled
    XRI Dist lpfc0 Total 6144 IO 5894 ELS 250
    NVME LPORT lpfc0 WWPN x100000109b2139ff WWNN x200000109b2139ff DID x031300 ONLINE
    NVME RPORT WWPN x208ed039ea243510 WWNN x208bd039ea243510 DID x03230c TARGET DISCSRVC ONLINE
    NVME RPORT WWPN x2092d039ea243510 WWNN x208bd039ea243510 DID x03120c TARGET DISCSRVC ONLINE
    
    NVME Statistics
    LS: Xmt 000000000e Cmpl 000000000e Abort 00000000
    LS XMIT: Err 00000000 CMPL: xb 00000000 Err 00000000
    Total FCP Cmpl 0000000000029ba0 Issue 0000000000029ba2 OutIO 0000000000000002
    abort 00000002 noxri 00000000 nondlp 00000000 qdepth 00000000 wqerr 00000000 err 00000000
    FCP CMPL: xb 00000002 Err 00000004

啟用1MB I/O大小

ONTAP 在識別控制器資料中報告的 MDTS ( MAX Data 傳輸大小)為 8 、表示最大 I/O 要求大小可達 1MB 。不過、若要針對 Broadcom NVMe / FC 主機發出大小為 1 MB 的 I/O 要求、您必須增加 lpfc 的價值 lpfc_sg_seg_cnt 從預設值 64 到 256 。

步驟
  1. 將「lfc_sg_seg_cnt"參數設為256。

    # cat /etc/modprobe.d/lpfc.conf
    options lpfc lpfc_sg_seg_cnt=256
  2. 執行「dracut -f」命令、然後重新啟動主機。

  3. 驗證「lfc_sg_seg_cnt"是否為256。

    # cat /sys/module/lpfc/parameters/lpfc_sg_seg_cnt
    256
註 這不適用於 Qlogic NVMe / FC 主機。

設定適用於NVMe / FC的Marvell / QLogic FC介面卡

步驟
  1. 確認您執行的是支援的介面卡驅動程式和韌體版本。OL 8.5 GA核心隨附的原生內建qla2xxx驅動程式、提供ONTAP 最新的上游修正程式、可支援下列功能:

    # cat /sys/class/fc_host/host*/symbolic_name
    QLE2742 FW:v9.06.02 DVR:v10.02.00.106-k
    QLE2742 FW:v9.06.02 DVR:v10.02.00.106-k
  2. 驗證 ql2xnvmeenable 設定可讓Marvell介面卡作為NVMe / FC啟動器運作。

    # cat /sys/module/qla2xxx/parameters/ql2xnvmeenable
    1

設定NVMe/TCP

NVMe / TCP 沒有自動連線功能。因此、如果某個路徑發生故障、且在 10 分鐘的預設逾時期間內未恢復、則 NVMe / TCP 無法自動重新連線。若要避免逾時、您應該將容錯移轉事件的重試期間設為至少 30 分鐘。

步驟
  1. 驗證啟動器連接埠是否能夠在支援的NVMe / TCP生命期中擷取探索記錄頁面資料。

    # nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51
    Discovery Log Number of Records 10, Generation counter 119
    =====Discovery Log Entry 0======
    trtype: tcp
    adrfam: ipv4
    subtype: nvme subsystem
    treq: not specified
    portid: 0
    trsvcid: 4420
    subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1
    traddr: 192.168.2.56
    sectype: none
    =====Discovery Log Entry 1======
    trtype: tcp
    adrfam: ipv4
    subtype: nvme subsystem
    treq: not specified
    portid: 1
    trsvcid: 4420
    subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_1
    traddr: 192.168.1.51
    sectype: none
    =====Discovery Log Entry 2======
    trtype: tcp
    adrfam: ipv4
    subtype: nvme subsystem
    treq: not specified
    portid: 0
    trsvcid: 4420
    subnqn: nqn.1992-08.com.netapp:sn.56e362e9bb4f11ebbaded039ea165abc:subsystem.nvme_118_tcp_2
    traddr: 192.168.2.56
    sectype: none
    
    ...
  2. 同樣地、請確認其他的NVMe/TCP啟動器目標LIF組合能夠成功擷取探索記錄頁面資料。範例:

    # nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.51
    # nvme discover -t tcp -w 192.168.1.8 -a 192.168.1.52
    # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.56
    # nvme discover -t tcp -w 192.168.2.9 -a 192.168.2.57
  3. 現在執行 nvme connect-all 跨節點執行所有支援的NVMe/TCP啟動器目標LIF命令。請務必提供更長的時間 ctrl_loss_tmo 定時器期間(例如30分鐘、可設定為新增 -l 1800connect-all 如此一來、當路徑遺失時、它會重試更長的時間。範例:

# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.51 -l 1800
# nvme connect-all -t tcp -w 192.168.1.8 -a 192.168.1.52 -l 1800
# nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.56 -l 1800
# nvme connect-all -t tcp -w 192.168.2.9 -a 192.168.2.57 -l 1800

驗證NVMe/FC

步驟
  1. 驗證Oracle Linux 8.5主機上的下列NVMe/FC設定。

    # cat /sys/module/nvme_core/parameters/multipath
    Y
    # cat /sys/class/nvme-subsystem/nvme-subsys*/model
    NetApp ONTAP Controller
    NetApp ONTAP Controller
    # cat /sys/class/nvme-subsystem/nvme-subsys*/iopolicy
    round-robin
    round-robin
  2. 確認已在主機上建立並正確探索命名空間。

    # nvme list
    Node         SN                    Model
    ---------------------------------------------------------------
    /dev/nvme0n1 814vWBNRwf9HAAAAAAAB  NetApp ONTAP Controller
    /dev/nvme0n2 814vWBNRwf9HAAAAAAAB  NetApp ONTAP Controller
    /dev/nvme0n3 814vWBNRwf9HAAAAAAAB  NetApp ONTAP Controller
    
    Namespace Usage  Format                  FW            Rev
    --------------------------------------------------------------
    1                85.90 GB / 85.90 GB     4 KiB + 0 B   FFFFFFFF
    2                85.90 GB / 85.90 GB     4 KiB + 0 B   FFFFFFFF
    3                85.90 GB / 85.90 GB     4 KiB + 0 B   FFFFFFFF
  3. 確認每個路徑的控制器狀態均為有效、且具有正確的ANA狀態。

    # nvme list-subsys /dev/nvme0n1
    nvme-subsys0 - NQN=nqn.1992-08.com.netapp:sn.5f5f2c4aa73b11e9967e00a098df41bd:subsystem.nvme_ss_ol_1
    \
    +- nvme0 fc traddr=nn-0x203700a098dfdd91:pn-0x203800a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized
    +- nvme1 fc traddr=nn-0x203700a098dfdd91:pn-0x203900a098dfdd91 host_traddr=nn-0x200000109b1c1204:pn-0x100000109b1c1204 live non-optimized
    +- nvme2 fc traddr=nn-0x203700a098dfdd91:pn-0x203a00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
    +- nvme3 fc traddr=nn-0x203700a098dfdd91:pn-0x203d00a098dfdd91 host_traddr=nn-0x200000109b1c1205:pn-0x100000109b1c1205 live optimized
  4. 驗證NetApp外掛程式是否顯示每ONTAP 個支援的名稱空間裝置的正確值。

    # nvme netapp ontapdevices -o column
    Device       Vserver  Namespace Path
    -----------------------------------
    /dev/nvme0n1  vs_ol_nvme  /vol/ol_nvme_vol_1_1_0/ol_nvme_ns
    /dev/nvme0n2  vs_ol_nvme  /vol/ol_nvme_vol_1_0_0/ol_nvme_ns
    /dev/nvme0n3  vs_ol_nvme  /vol/ol_nvme_vol_1_1_1/ol_nvme_ns
    
    NSID    UUID                                   Size
    -----------------------------------------------------
    1       72b887b1-5fb6-47b8-be0b-33326e2542e2   85.90GB
    2       04bf9f6e-9031-40ea-99c7-a1a61b2d7d08   85.90GB
    3       264823b1-8e03-4155-80dd-e904237014a4   85.90GB
    
    # nvme netapp ontapdevices -o json
    {
    "ONTAPdevices" : [
        {
            "Device" : "/dev/nvme0n1",
            "Vserver" : "vs_ol_nvme",
            "Namespace_Path" : "/vol/ol_nvme_vol_1_1_0/ol_nvme_ns",
            "NSID" : 1,
            "UUID" : "72b887b1-5fb6-47b8-be0b-33326e2542e2",
            "Size" : "85.90GB",
            "LBA_Data_Size" : 4096,
            "Namespace_Size" : 20971520
        },
        {
            "Device" : "/dev/nvme0n2",
            "Vserver" : "vs_ol_nvme",
            "Namespace_Path" : "/vol/ol_nvme_vol_1_0_0/ol_nvme_ns",
            "NSID" : 2,
            "UUID" : "04bf9f6e-9031-40ea-99c7-a1a61b2d7d08",
            "Size" : "85.90GB",
            "LBA_Data_Size" : 4096,
            "Namespace_Size" : 20971520
          },
          {
             "Device" : "/dev/nvme0n3",
             "Vserver" : "vs_ol_nvme",
             "Namespace_Path" : "/vol/ol_nvme_vol_1_1_1/ol_nvme_ns",
             "NSID" : 3,
             "UUID" : "264823b1-8e03-4155-80dd-e904237014a4",
             "Size" : "85.90GB",
             "LBA_Data_Size" : 4096,
             "Namespace_Size" : 20971520
           },
      ]
    }

已知問題

OL 8.5 搭配 ONTAP 的 NVMe 主機組態有下列已知問題:

NetApp錯誤ID 標題 說明 Bugzilla ID

1517321

Oracle Linux 8.5 NVMe主機會建立重複的持續探索控制器

在Oracle Linux 8.5 NVMe over Fabrics(NVMe)主機上、您可以使用 nvme discover -p 建立持續探索控制器(PD)的命令。使用此命令時、每個啟動器目標組合只能建立一個PDC。不過、如果您是以ONTAP NVMe型主機執行EFlash 9.10.1和Oracle Linux 8.5、則每次都會建立一個重複的資料中心 nvme discover -p 已執行。這會導致主機和目標上的資源使用不必要。

"18118."