简体中文版经机器翻译而成，仅供参考。如与英语版出现任何冲突，应以英语版为准。

将Red Hat Enterprise Linux 7.5与ONTAP结合使用

03/26/2025 贡献者

PDF

您可以使用ONTAP SAN主机配置设置将ONTAP配置为目标Red Hat Enterprise Linux 7.5。

安装Linux Host Utilities

NetApp LINUX主机实用程序软件包以32位和64位.rpm文件的形式在上提供"NetApp 支持站点"。如果您不知道哪个文件适合您的配置、请使用验证您需要哪个文件"互操作性表工具"。

NetApp强烈建议安装Linux主机实用程序、但这并不是必需的。这些实用程序不会更改Linux主机上的任何设置。这些实用程序可改进管理并帮助 NetApp 客户支持收集有关您的配置的信息。

如果您当前已安装Linux Host Utilities、则应将其升级到最新版本或将其删除、然后按照以下步骤安装最新版本。

步骤

将32位或64位Linux Host Utilities软件包从下载"NetApp 支持站点"到主机。
安装软件包：

rpm -ivh netapp_linux_unified_host_utilitis-7-1.x86_64

您可以使用此过程中提供的配置设置来配置连接到和"适用于 ONTAP 的 Amazon FSX"的云客户端"Cloud Volumes ONTAP"。

SAN 工具包

安装 NetApp Host Utilities 软件包时，工具包会自动安装。此套件提供 sanlun 实用程序，可帮助您管理 LUN 和 HBA 。sanlun 命令可返回有关映射到主机的 LUN 的信息，多路径以及创建启动程序组所需的信息。

示例

在以下示例中， sanlun lun show 命令将返回 LUN 信息。

# sanlun lun show all

示例输出：

controller(7mode/E-Series)/            device     host               lun
vserver(cDOT/FlashRay)   lun-pathname  filename   adapter  protocol  size    Product
------------------------------------------------------------------------------------
data_vserver          /vol/vol1/lun1   /dev/sdb   host16   FCP       120.0g  cDOT
data_vserver          /vol/vol1/lun1   /dev/sdc   host15   FCP       120.0g  cDOT
data_vserver          /vol/vol2/lun2   /dev/sdd   host16   FCP       120.0g  cDOT
data_vserver          /vol/vol2/lun2   /dev/sde   host15   FCP       120.0g  cDOT

SAN 启动

开始之前

如果您决定使用 SAN 启动，则配置必须支持它。您可以使用"互操作性表工具"验证您的操作系统、HBA、HBA固件、HBA启动BIOS以及ONTAP版本是否受支持。

步骤

将 SAN 启动 LUN 映射到主机。
验证是否有多个可用路径。

主机操作系统启动并在多个路径上运行后、这些路径将变为可用。
在服务器 BIOS 中为 SAN 启动 LUN 映射到的端口启用 SAN 启动。

有关如何启用 HBA BIOS 的信息，请参见供应商专用文档。
重新启动主机以验证启动是否成功。

多路径

对于 Red Hat Enterprise Linux （ RHEL ） 7.5 ， /etc/multipath.conf 文件必须存在，但您不需要对该文件进行特定更改。RHEL 7.5 使用识别和正确管理 ONTAP LUN 所需的所有设置进行编译。

您可以使用 multipath -ll 命令验证 ONTAP LUN 的设置。

以下各节提供了映射到ASA和非ASA用户身份的LUN的示例多路径输出。

所有SAN阵列配置

全SAN阵列(ASA)配置可优化指向给定LUN的所有路径、使其保持活动状态。这样可以同时通过所有路径提供I/O操作、从而提高性能。

示例

以下示例显示了ONTAP LUN的正确输出。

# multipath -ll
3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode
size=80G  features='4 queue_if_no_path pg_init_retries 50 retain_attached_hw_handle' hwhandler='1 alua' wp=rw
`-+- policy='service-time 0' prio=50 status=active
  |- 11:0:7:1    sdfi   130:64   active ready running
  |- 11:0:9:1    sdiy  8:288     active ready running
  |- 11:0:10:1  sdml 69:464   active ready running
  |- 11:0:11:1  sdpt  131:304  active ready running

一个LUN不应需要四个以上的路径。如果路径数超过四个、则可能会在存储故障期间导致路径问题。

非ASA配置

对于非ASA配置、应具有两组具有不同优先级的路径。优先级较高的路径为主动/优化路径。这意味着它们由聚合所在的控制器提供服务。优先级较低的路径处于活动状态、但未进行优化、因为它们是从其他控制器提供的。只有在优化路径不可用时、才会使用非优化路径。

示例

以下示例显示了具有两个主动 / 优化路径和两个主动 / 非优化路径的 ONTAP LUN 的正确输出。

# multipath -ll
3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode
size=80G features='4 queue_if_no_path pg_init_retries 50 retain_attached_hw_handle’ hwhandler='1 alua' wp=rw
|-+- policy='service-time 0' prio=50 status=active
| |- 11:0:1:0 sdj  8:144  active ready running
| |- 11:0:2:0 sdr  65:16  active ready running
`-+- policy='service-time 0' prio=10 status=enabled
  |- 11:0:0:0 sdb  8:i6   active ready running
  |- 12:0:0:0 sdz  65:144 active ready running

一个LUN不应需要四个以上的路径。如果路径数超过四个、则可能会在存储故障期间导致路径问题。

建议设置

RHEL 7.5 操作系统经过编译，可识别 ONTAP LUN ，并自动为 ASA 和非 ASA 配置正确设置所有配置参数。

`multipath.conf`要启动多路径守护进程、必须存在该文件。如果此文件不存在、您可以使用命令创建一个空的零字节文件 `touch /etc/multipath.conf`。

首次创建 `multipath.conf`文件时、可能需要使用以下命令启用并启动多路径服务：

chkconfig multipathd on
/etc/init.d/multipathd start

您无需直接向文件中添加任何内容 multipath.conf、除非您的设备不需要多路径管理、或者您的现有设置会覆盖默认值。要排除不需要的设备、请在文件中添加以下语法 multipath.conf、将<DevId>替换为要排除的设备的全球通用标识符(WWID)字符串：

blacklist {
        wwid <DevId>
        devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
        devnode "^hd[a-z]"
        devnode "^cciss.*"
}

以下示例将确定设备的WWID并将其添加到文件中 multipath.conf。

步骤

确定WWID：
```
/lib/udev/scsi_id -gud /dev/sda
```
```
3600a098038314c4a433f5774717a3046
```
`sda`是要添加到黑名单中的本地SCSI磁盘。

添加 WWID 到黑名单中 /etc/multipath.conf：

blacklist {
     wwid   3600a098038314c4a433f5774717a3046
     devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
     devnode "^hd[a-z]"
     devnode "^cciss.*"
}

请始终检查您的 `/etc/multipath.conf`文件、尤其是在默认部分中、以了解可能会覆盖默认设置的原有设置。

下表显示了 `multipathd`ONTAP LUN的关键参数和所需值。如果主机连接到其他供应商的LUN、并且这些参数中的任何一个被覆盖、则必须通过 `multipath.conf`文件中专门适用于ONTAP LUN的后续条款进行更正。如果不进行此更正、ONTAP LUN可能无法按预期运行。只有在与NetApp和/或操作系统供应商协商后、并且只有在充分了解影响后、才应覆盖这些默认值。

参数	正在设置 …
detect_prio	是的。
dev_los_TMO	" 无限 "
故障恢复	即时
fast_io_fail_sMO	5.
features	"3 queue_if_no_path pG_init_retries 50"
flush_on_last_del	是的。
硬件处理程序	0
no_path_retry	队列
path_checker	"TUR"
path_grouping_policy	"Group_by-prio"
path_selector	" 服务时间 0"
Polling interval	5.
PRIO	ONTAP
产品	lun.*
Retain Attached Hw_handler	是的。
rr_weight	" 统一 "
user_friendly_names	否
供应商	NetApp

参数

正在设置 …

detect_prio

是的。

dev_los_TMO

" 无限 "

故障恢复

即时

fast_io_fail_sMO

features

"3 queue_if_no_path pG_init_retries 50"

flush_on_last_del

是的。

硬件处理程序

no_path_retry

队列

path_checker

"TUR"

path_grouping_policy

"Group_by-prio"

path_selector

" 服务时间 0"

Polling interval

PRIO

ONTAP

产品

lun.*

Retain Attached Hw_handler

是的。

rr_weight

" 统一 "

user_friendly_names

否

供应商

NetApp

示例

以下示例显示了如何更正被覆盖的默认值。在这种情况下， multipath.conf 文件会为 path_checker 和 no_path_retry 定义与 ONTAP LUN 不兼容的值。如果由于其他 SAN 阵列仍连接到主机而无法删除这些参数，则可以专门针对具有设备实例的 ONTAP LUN 更正这些参数。

defaults {
   path_checker      readsector0
   no_path_retry      fail
}

devices {
   device {
      vendor         "NETAPP  "
      product         "LUN.*"
      no_path_retry     queue
      path_checker      tur
   }
}

配置KVM设置

您无需为基于内核的虚拟机配置设置、因为LUN已映射到虚拟机管理程序。

ASM 镜像

自动存储管理(Automatic Storage Management、ASM)镜像可能需要更改Linux多路径设置、以使ASM能够识别问题并切换到备用故障组。ONTAP上的大多数ASM配置都使用外部冗余、这意味着数据保护由外部阵列提供、ASM不会镜像数据。某些站点使用具有正常冗余的ASM来提供双向镜像、通常在不同站点之间进行镜像。有关详细信息、请参见"基于ONTAP的Oracle数据库"。

已知问题

使用ONTAP的RHEL 7.5版本存在以下已知问题：

NetApp 错误 ID	标题	Description
1440718	如果在未执行SCSI重新扫描的情况下取消映射或映射LUN、可能会导致主机上的数据损坏。	如果将"disable_changed_WWIDs"多路径配置参数设置为是、则在WWID发生更改时、它将禁用对路径设备的访问。在将路径的WWID还原到多路径设备的WWID之前、多路径将禁用对路径设备的访问。要了解更多信息，请参阅"NetApp知识库：Oracle Linux 7上iSCSI LUN上的文件系统损坏"。
"1139053"	在存储故障转移操作期间，使用 QLogic QLE2672 16 Gb FC 的 RHEL7.5 发生内核中断	在使用 QLogic QLE2672 16 Gb 光纤通道主机总线适配器对 RHEL7U5 内核执行存储故障转移操作期间，内核发生崩溃。内核崩溃导致 RHEL 7.5 重新启动，从而导致应用程序中断。如果配置了 kdump ，内核崩溃将在 /var/crash/directory 下生成 vmcore 文件。vmcore 文件用于了解故障的发生原因。在这种情况下，在 vmcore 文件中使用以下字符串记录的 "get_next_timer_interruption+440" 模块中观察到崩溃： " 【异常 RIP ： get_next_timer_interruption+440] 】发生内核中断后，您可以通过重新启动主机操作系统并根据需要重新启动应用程序来恢复操作系统。
"1138536"	在存储故障转移操作期间，使用 QLogic QLE2742 32 Gb FC 的 RHEL7U5 发生内核中断	在使用 QLogic QLE2742 HBA 的 Red Hat Enterprise Linux （ RHEL ） RHEL7U5 内核上执行存储故障转移操作期间，由于内核发生崩溃，导致内核中断。内核崩溃会导致操作系统重新启动，从而导致应用程序中断。如果配置了 kdump ，内核崩溃将在 /var/crash/ 目录下生成 vmcore 文件。当内核崩溃时，您可以使用 vmcore 文件调查失败的原因。以下示例显示了 bget_next_timer_interruption+440b 模块中发生崩溃。崩溃记录在 vmcore 文件中，并包含以下字符串： " [Exception RIP ： get_next_timer_interruption+440" 您可以根据需要重新启动主机操作系统并重新启动应用程序来恢复操作系统。
"1148090"	在存储故障转移操作期间，使用 QLogic QLE2742 32 Gb FC HBA 的 RHEL 7.5 发生内核中断	在使用 QLogic QLE2742 光纤通道（ FC ）主机总线适配器（ HBA ）的 Red Hat Enterprise Linux （ RHEL ） 7.5 内核上执行存储故障转移操作期间，由于内核发生崩溃，发生内核中断。内核崩溃导致 RHEL 7.5 重新启动，从而导致应用程序中断。如果启用了 kdump 机制，则内核崩溃将生成位于 /var/crash/ 目录中的 vmcore 文件。您可以分析 vmcore 文件以确定崩溃的发生原因。在这种情况下，发生 QLogic QLE2742 HBA 事件的存储故障转移时， "native_queued_spin_lock_slowpath+464" 模块将受到影响。您可以通过查找以下字符串在 vmcore 文件中查找此事件： " [Exception RIP ： native_queued_spin_lock_slowpath+464]" 内核中断后，您可以重新启动主机操作系统并恢复操作系统，然后根据需要重新启动应用程序。
"1146898"	在存储故障转移操作期间，使用 Emulex HBA 的 RHEL 7.5 会发生内核中断	在使用 Emulex LPe32002 M2 32 Gb FC 主机总线适配器（ HBA ）的 Red Hat Enterprise Linux （ RHEL ） 7.5 系统上执行存储故障转移操作期间，内核发生中断。内核中断会导致操作系统重新启动，进而导致应用程序中断。如果配置了 kdump ，则内核中断会在 /var/crash/ 目录下生成 vmcore 文件。您可以使用 vmcore 文件确定故障的发生原因。在以下示例中，您可以在 "lpfc_HBA_clean-txcmplq+368" 模块中看到中断。此中断会记录在包含以下字符串的 vmcore 文件中： " [Exception RIP ： lpfc_HBA_clean-txcmplq+368]" 内核中断后，重新启动主机操作系统以恢复操作系统。根据需要重新启动应用程序。

NetApp 错误 ID

标题

Description

1440718

如果在未执行SCSI重新扫描的情况下取消映射或映射LUN、可能会导致主机上的数据损坏。

如果将"disable_changed_WWIDs"多路径配置参数设置为是、则在WWID发生更改时、它将禁用对路径设备的访问。在将路径的WWID还原到多路径设备的WWID之前、多路径将禁用对路径设备的访问。要了解更多信息，请参阅"NetApp知识库：Oracle Linux 7上iSCSI LUN上的文件系统损坏"。

"1139053"

在存储故障转移操作期间，使用 QLogic QLE2672 16 Gb FC 的 RHEL7.5 发生内核中断

在使用 QLogic QLE2672 16 Gb 光纤通道主机总线适配器对 RHEL7U5 内核执行存储故障转移操作期间，内核发生崩溃。内核崩溃导致 RHEL 7.5 重新启动，从而导致应用程序中断。如果配置了 kdump ，内核崩溃将在 /var/crash/directory 下生成 vmcore 文件。vmcore 文件用于了解故障的发生原因。在这种情况下，在 vmcore 文件中使用以下字符串记录的 "get_next_timer_interruption+440" 模块中观察到崩溃： " 【异常 RIP ： get_next_timer_interruption+440] 】发生内核中断后，您可以通过重新启动主机操作系统并根据需要重新启动应用程序来恢复操作系统。

"1138536"

在存储故障转移操作期间，使用 QLogic QLE2742 32 Gb FC 的 RHEL7U5 发生内核中断

在使用 QLogic QLE2742 HBA 的 Red Hat Enterprise Linux （ RHEL ） RHEL7U5 内核上执行存储故障转移操作期间，由于内核发生崩溃，导致内核中断。内核崩溃会导致操作系统重新启动，从而导致应用程序中断。如果配置了 kdump ，内核崩溃将在 /var/crash/ 目录下生成 vmcore 文件。当内核崩溃时，您可以使用 vmcore 文件调查失败的原因。以下示例显示了 bget_next_timer_interruption+440b 模块中发生崩溃。崩溃记录在 vmcore 文件中，并包含以下字符串： " [Exception RIP ： get_next_timer_interruption+440" 您可以根据需要重新启动主机操作系统并重新启动应用程序来恢复操作系统。

"1148090"

在存储故障转移操作期间，使用 QLogic QLE2742 32 Gb FC HBA 的 RHEL 7.5 发生内核中断

在使用 QLogic QLE2742 光纤通道（ FC ）主机总线适配器（ HBA ）的 Red Hat Enterprise Linux （ RHEL ） 7.5 内核上执行存储故障转移操作期间，由于内核发生崩溃，发生内核中断。内核崩溃导致 RHEL 7.5 重新启动，从而导致应用程序中断。如果启用了 kdump 机制，则内核崩溃将生成位于 /var/crash/ 目录中的 vmcore 文件。您可以分析 vmcore 文件以确定崩溃的发生原因。在这种情况下，发生 QLogic QLE2742 HBA 事件的存储故障转移时， "native_queued_spin_lock_slowpath+464" 模块将受到影响。您可以通过查找以下字符串在 vmcore 文件中查找此事件： " [Exception RIP ： native_queued_spin_lock_slowpath+464]" 内核中断后，您可以重新启动主机操作系统并恢复操作系统，然后根据需要重新启动应用程序。

"1146898"

在存储故障转移操作期间，使用 Emulex HBA 的 RHEL 7.5 会发生内核中断

在使用 Emulex LPe32002 M2 32 Gb FC 主机总线适配器（ HBA ）的 Red Hat Enterprise Linux （ RHEL ） 7.5 系统上执行存储故障转移操作期间，内核发生中断。内核中断会导致操作系统重新启动，进而导致应用程序中断。如果配置了 kdump ，则内核中断会在 /var/crash/ 目录下生成 vmcore 文件。您可以使用 vmcore 文件确定故障的发生原因。在以下示例中，您可以在 "lpfc_HBA_clean-txcmplq+368" 模块中看到中断。此中断会记录在包含以下字符串的 vmcore 文件中： " [Exception RIP ： lpfc_HBA_clean-txcmplq+368]" 内核中断后，重新启动主机操作系统以恢复操作系统。根据需要重新启动应用程序。