将Oracle Linux 7.0与ONTAP结合使用
您可以使用ONTAP SAN主机配置设置将以ONTAP为目标的Oracle Linux 7.0配置为目标。
安装 Linux Unified Host Utilities
上提供了 NetApp Linux Unified Host Utilities 软件包 "NetApp 支持站点" 在 32 位和 64 位 .rpm 文件中。如果您不知道哪个文件适合您的配置,请使用 "NetApp 互操作性表工具" 验证所需的配置。
NetApp强烈建议安装Linux统一主机实用程序、但并非强制要求。这些实用程序不会更改 Linux 主机上的任何设置。这些实用程序可改进管理并帮助 NetApp 客户支持收集有关您的配置的信息。
如果您当前安装的是Linux Unified Host Utilities版本、则应将其升级或删除、然后按照以下步骤安装最新版本。
-
从下载 32 位或 64 位 Linux Unified Host Utilities 软件包 "NetApp 支持站点" 站点到主机。
-
使用以下命令安装软件包:
rpm -ivh netapp_linux_unified_host_utilitis-7-1.x86_64
您可以使用本文档中提供的配置设置来配置连接到的云客户端 "Cloud Volumes ONTAP" 和 "适用于 ONTAP 的 Amazon FSX"。 |
SAN 工具包
安装 NetApp Host Utilities 软件包时,工具包会自动安装。此套件提供 sanlun
实用程序,可帮助您管理 LUN 和 HBA 。sanlun
命令可返回有关映射到主机的 LUN 的信息,多路径以及创建启动程序组所需的信息。
在以下示例中, sanlun lun show
命令将返回 LUN 信息。
# sanlun lun show all
示例输出:
controller(7mode/E-Series)/ device host lun vserver(cDOT/FlashRay) lun-pathname filename adapter protocol size Product ------------------------------------------------------------------------------------ data_vserver /vol/vol1/lun1 /dev/sdb host16 FCP 120.0g cDOT data_vserver /vol/vol1/lun1 /dev/sdc host15 FCP 120.0g cDOT data_vserver /vol/vol2/lun2 /dev/sdd host16 FCP 120.0g cDOT data_vserver /vol/vol2/lun2 /dev/sde host15 FCP 120.0g cDOT
SAN 启动
如果您决定使用 SAN 启动,则配置必须支持它。您可以使用 "NetApp 互操作性表工具" 验证您的操作系统, HBA , HBA 固件和 HBA 启动 BIOS 以及 ONTAP 版本是否受支持。
-
将 SAN 启动 LUN 映射到主机。
-
验证是否有多个可用路径。
主机操作系统启动并在多个路径上运行后、这些路径将变为可用。 -
在服务器 BIOS 中为 SAN 启动 LUN 映射到的端口启用 SAN 启动。
有关如何启用 HBA BIOS 的信息,请参见供应商专用文档。
-
重新启动主机以验证启动是否成功。
多路径
对于 Oracle Linux 7.0 , /etc/multipath.conf 文件必须存在,但您不需要对该文件进行特定更改。Oracle Linux 7.0 使用识别和正确管理 ONTAP LUN 所需的所有设置进行编译。要启用 ALUA 处理程序,请执行以下步骤:
-
创建 initrd-image 的备份。
-
将以下参数值附加到内核中,以使 ALUA 和非 ALUA 正常工作:
rdloaddriver=SCSI_DH_ALUA
kernel /vmlinuz-3.8.13-68.1.2.el6uek.x86_64 ro root=/dev/mapper/vg_ibmx3550m421096-lv_root rd_NO_LUKSrd_LVM_LV=vg_ibmx3550m421096/lv_root LANG=en_US.UTF-8 rd_NO_MDSYSFONT=latarcyrheb-sun16 crashkernel=256M KEYBOARDTYPE=pc KEYTABLE=us rd_LVM_LV=vg_ibmx3550m421096/lv_swap rd_NO_DM rhgb quiet rdloaddriver=scsi_dh_alua
-
使用
dracut -f
命令重新创建 initrd-image 。 -
重新启动主机。
-
验证
cat /proc/cmdline
命令的输出,以确保设置完成。
您可以使用 `multipath -ll`命令验证ONTAP LUN的设置。应存在两组具有不同优先级的路径。优先级较高的路径为主动/优化路径、这意味着它们由聚合所在的控制器提供服务。优先级较低的路径处于活动状态、但未进行优化、因为它们是从其他控制器提供的。只有在优化路径不可用时、才会使用非优化路径。
以下示例显示了具有两个主动 / 优化路径和两个主动 / 非优化路径的 ONTAP LUN 的正确输出:
# multipath -ll 3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode size=80G features='4 queue_if_no_path pg_init_retries 50 retain_attached_hw_handle' hwhandler='1 alua' wp=rw |-+- policy='service-time 0' prio=50 status=active | |- 11:0:1:0 sdj 8:144 active ready running | |- 11:0:2:0 sdr 65:16 active ready running |-+- policy='service-time 0' prio=10 status=enabled |- 11:0:0:0 sdb 8:i6 active ready running |- 12:0:0:0 sdz 65:144 active ready running
一个LUN不应需要四个以上的路径。在存储故障期间,超过八个路径可能会出现发生原因路径问题。 |
建议设置
Oracle Linux 7.0 操作系统经过编译,可识别 ONTAP LUN 并自动正确设置所有配置参数。
`multipath.conf`要启动多路径守护进程、必须存在该文件。如果此文件不存在、您可以使用以下命令创建一个空的零字节文件:
touch /etc/multipath.conf
首次创建 `multipath.conf`文件时、可能需要使用以下命令启用并启动多路径服务:
# chkconfig multipathd on # /etc/init.d/multipathd start
除非您的设备不希望多路径管理、或者您的现有设置覆盖默认值、否则不需要直接向文件中添加任何内容 multipath.conf
。要排除不需要的设备、请在 `multipath.conf`文件中添加以下语法、将<DevId>替换为要排除的设备的WWID字符串:
blacklist { wwid <DevId> devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
以下示例将确定设备的WWID并将其添加到文件中 multipath.conf
。
-
确定WWID:
# /lib/udev/scsi_id -gud /dev/sda 360030057024d0730239134810c0cb833
`sda`是要添加到黑名单中的本地SCSI磁盘。
-
添加
WWID
到黑名单中/etc/multipath.conf
:blacklist { wwid 360030057024d0730239134810c0cb833 devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
您应始终检查 /etc/multipath.conf
文件中的文件、尤其是在默认值部分中、这些设置可能会覆盖默认设置。
下表显示了 `multipathd`ONTAP LUN的关键参数和所需值。如果主机连接到其他供应商的LUN、并且这些参数中的任何一个被覆盖、则必须通过 `multipath.conf`文件中专门适用于ONTAP LUN的后续条款进行更正。如果不进行此更正、ONTAP LUN可能无法按预期运行。只有在与NetApp和/或操作系统供应商协商后、并且只有在充分了解影响后、才应覆盖这些默认值。
参数 | 正在设置 … |
---|---|
detect_prio |
是的。 |
dev_los_TMO |
" 无限 " |
故障恢复 |
即时 |
fast_io_fail_sMO |
5. |
features |
"3 queue_if_no_path pG_init_retries 50" |
flush_on_last_del |
是的。 |
硬件处理程序 |
0 |
path_checker |
"TUR" |
path_grouping_policy |
"Group_by-prio" |
path_selector |
" 服务时间 0" |
Polling interval |
5. |
PRIO |
ONTAP |
产品 |
lun.* |
Retain Attached Hw_handler |
是的。 |
rr_weight |
" 统一 " |
user_friendly_names |
否 |
供应商 |
NetApp |
以下示例显示了如何更正被覆盖的默认值。在这种情况下, multipath.conf
文件会为 path_checker
和 detect_prio
定义与 ONTAP LUN 不兼容的值。如果由于其他 SAN 阵列仍连接到主机而无法删除这些参数,则可以专门针对具有设备实例的 ONTAP LUN 更正这些参数。
defaults { path_checker readsector0 detect_prio no } devices { device { vendor "NETAPP " product "LUN.*" path_checker tur detect_prio yes } }
要配置Oracle Linux 7.0 Red Hat Enterprise Kernel (RHCK)、请使用"建议设置"适用于Red Hat Enterprise Linux (RHEL) 7.0的。 |
已知问题
Oracle Linux 7.0 with ONTAP版本存在以下已知问题:
NetApp 错误 ID | 标题 | Description |
---|---|---|
OL7.0 :由于 Emulex 8G ( LPe12002 )主机上的 OL 7.0 Uek r3U5 测试版出现 "RSCN 超时 " 错误,主机丢失 LUN 的所有路径并挂起 |
您可能会发现,在对 I/O 执行存储故障转移操作期间, Emulex 8G ( LPe12002 )主机挂起,并且 I/O 中断率较高您可能会发现路径无法恢复,这是由于 RSCN 超时导致的,主机丢失所有路径并挂起。达到此问题描述的概率很高。 |
|
OL 7.0 :在使用 IO 执行存储故障转移操作期间,在 QLogic 8G FC ( QLE2562 ) SAN 主机上观察到高 IO 中断 |
在使用 IO 执行存储故障转移操作期间,您可能会发现 QLogic 8G FC ( QLE2562 )主机上的 IO 中断较高。中止和设备重置会在主机上表现为 IO 中断。遇到此 IO 中断的可能性很高。 |
|
OL7.0 : dracut 无法在 UEKR3U5 alpha 上的 initramfs 中包含 scsi_dh_alua.ko 模块 |
即使在内核命令行中添加参数 "rdloaddriver=SCSI_DH_ALUA" 并创建了 dracut , SCSI_DH_ALUA 模块也可能无法加载。因此,未按建议为 NetApp LUN 启用 ALUA 。 |
|
尽管在安装 OL 7.0 操作系统期间登录成功,但 Anaconda 仍会显示 iSCSI 登录失败消息 |
在安装 OL 7.0 时, anaconda 安装屏幕会显示 iSCSI 登录到多个目标 IP 失败,尽管 iSCSI 登录成功。AnacondA 显示以下错误消息: "Node Login Failed" 只有在为 iSCSI 登录选择多个目标 IP 时,您才会看到此错误。您可以单击 " 确定 " 按钮继续安装操作系统。此错误不会妨碍安装 iSCSI 或 OL 7.0 操作系统。 |
|
OL7.0 : Anacondup 不会在内核 cmd 行中添加 bootdev 参数来设置 iSCSI SANboot OS 安装的 IP 地址 |
Anaconda 不会在内核命令行中添加 bootdev 参数,您可以在 iSCSI 多路径 LUN 上安装 OL 7.0 操作系统期间设置 IPv4 地址。因此,您不能为任何配置为在 OL 7.0 启动期间与存储子系统建立 iSCSI 会话的以太网接口分配 IP 地址。由于未建立 iSCSI 会话,因此在操作系统启动时不会发现根 LUN ,因此操作系统启动失败。 |
|
在使用 IO 执行存储故障转移操作期间观察到 QLogic 10G FCoE ( QLE8152 )主机内核崩溃 |
您可能会发现 10G FCoE Qlogic ( QLE8152 )主机上的 Qlogic 驱动程序模块发生内核崩溃。在使用 IO 执行存储故障转移操作期间发生崩溃。发生此崩溃的可能性较高,从而导致主机上的 IO 中断时间较长。 |