搭配 ONTAP 使用 Red Hat Enterprise Linux 7.5
您可以使用 ONTAP SAN 主機組態設定、將 Red Hat Enterprise Linux 7.5 與 ONTAP 設定為目標。
安裝Linux Unified Host Utilities
NetApp Linux Unified Host Utilities軟體套件可在上取得 "NetApp 支援網站" 在32位元和64位元的.rpm檔案中。如果您不知道哪一個檔案適合您的組態、請使用 "NetApp 互通性對照表工具" 驗證您需要哪一個。
NetApp 強烈建議您安裝 Linux 統一化主機公用程式、但這不是強制性的。公用程式不會變更Linux主機上的任何設定。這些公用程式可改善管理、並協助NetApp客戶支援部門收集您的組態相關資訊。
如果您目前已安裝 Linux Unified Host Utilities 版本、您應該升級或移除該版本、然後依照下列步驟安裝最新版本。
-
從下載32位元或64位元Linux Unified Host Utilities軟體套件 "NetApp 支援網站" 站台到主機。
-
使用下列命令安裝軟體套件:
「rpm -ivh netapp_Linux統一化_host_utilities - 7-1.x86_64」
您可以使用本文所提供的組態設定來設定連線至的雲端用戶端 "Cloud Volumes ONTAP" 和 "Amazon FSX for ONTAP Sf"。 |
SAN工具套件
當您安裝NetApp主機公用程式套件時、會自動安裝此工具套件。此套件提供「資源」公用程式、可協助您管理LUN和HBA。「lanlun」命令會傳回對應至主機的LUN資訊、多重路徑、以及建立啟動器群組所需的資訊。
在以下範例中、「左LUN show」命令會傳回LUN資訊。
# sanlun lun show all
輸出範例:
controller(7mode/E-Series)/ device host lun vserver(cDOT/FlashRay) lun-pathname filename adapter protocol size Product ------------------------------------------------------------------------------------ data_vserver /vol/vol1/lun1 /dev/sdb host16 FCP 120.0g cDOT data_vserver /vol/vol1/lun1 /dev/sdc host15 FCP 120.0g cDOT data_vserver /vol/vol2/lun2 /dev/sdd host16 FCP 120.0g cDOT data_vserver /vol/vol2/lun2 /dev/sde host15 FCP 120.0g cDOT
SAN開機
如果您決定使用SAN開機、則組態必須支援SAN開機。您可以使用 "NetApp 互通性對照表工具" 驗證是否ONTAP 支援您的作業系統、HBA、HBA韌體和HBA開機BIOS及BIOS版本。
-
將SAN開機LUN對應至主機。
-
確認有多個路徑可供使用。
在主機作業系統啟動並在路徑上執行後、就會有多個路徑可供使用。 -
在伺服器BIOS中為SAN開機LUN對應的連接埠啟用SAN開機。
如需如何啟用HBA BIOS的相關資訊、請參閱廠商專屬的文件。
-
重新啟動主機、確認開機成功。
多重路徑
對於Red Hat Enterprise Linux(RHEL)7.5、/etc/multipath.conf檔案必須存在、但您不需要對檔案進行特定變更。RHEL 7.5是以所有必要設定來編譯、以辨識及正確管理ONTAP 各種LUN。
您可以使用「multiPath -ll」命令來驗證ONTAP 您的各個LUN的設定。
下列各節提供對應至 ASA 和非 ASA 角色之 LUN 的多重路徑輸出範例。
所有 SAN 陣列組態
在所有 SAN 陣列( ASA )組態中、通往指定 LUN 的所有路徑均為作用中且最佳化。如此可同時透過所有路徑提供 I/O 作業、進而提升效能。
下列範例顯示ONTAP 適用於某個實體LUN的正確輸出:
# multipath -ll 3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode size=80G features='4 queue_if_no_path pg_init_retries 50 retain_attached_hw_handle' hwhandler='1 alua' wp=rw `-+- policy='service-time 0' prio=50 status=active |- 11:0:7:1 sdfi 130:64 active ready running |- 11:0:9:1 sdiy 8:288 active ready running |- 11:0:10:1 sdml 69:464 active ready running |- 11:0:11:1 sdpt 131:304 active ready running
單一 LUN 不應需要四個以上的路徑。在儲存設備故障期間、可能會有八個以上的路徑發生問題。 |
非 ASA 組態
對於非 ASA 組態、應該有兩個路徑群組、其優先順序不同。優先順序較高的路徑為主動 / 最佳化、表示它們由集合所在的控制器提供服務。優先順序較低的路徑是作用中的、但未最佳化、因為它們是由不同的控制器提供服務。非最佳化路徑只有在最佳化路徑無法使用時才會使用。
下列範例顯示ONTAP 使用兩個主動/最佳化路徑和兩個主動/非最佳化路徑的正確輸出:
# multipath -ll 3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode size=80G features='4 queue_if_no_path pg_init_retries 50 retain_attached_hw_handle’ hwhandler='1 alua' wp=rw |-+- policy='service-time 0' prio=50 status=active | |- 11:0:1:0 sdj 8:144 active ready running | |- 11:0:2:0 sdr 65:16 active ready running `-+- policy='service-time 0' prio=10 status=enabled |- 11:0:0:0 sdb 8:i6 active ready running |- 12:0:0:0 sdz 65:144 active ready running
單一 LUN 不應需要四個以上的路徑。在儲存設備故障期間、可能會有八個以上的路徑發生問題。 |
建議設定
RHEL 7.5作業系統經過編譯、可辨識ONTAP 出各種不完整的LUN、並自動針對ASA 各種不適用的ASA組態、正確設定所有組態參數。
該 `multipath.conf`檔案必須存在、多重路徑常駐程式才能啟動。如果此檔案不存在、您可以使用下列命令來建立空的零位元組檔案:
touch /etc/multipath.conf
第一次建立 `multipath.conf`檔案時、您可能需要使用下列命令來啟用和啟動多重路徑服務:
# chkconfig multipathd on # /etc/init.d/multipathd start
除非您有不想要多重路徑管理的裝置、或是現有的設定會覆寫預設值、否則不需要直接將任何項目新增至 `multipath.conf`檔案。若要排除不想要的裝置、請 `multipath.conf`將下列語法新增至檔案、以您要排除的裝置 WWID 字串取代 <DevId> :
blacklist { wwid <DevId> devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
以下範例決定裝置的 WWID 、並將其新增至 `multipath.conf`檔案。
-
判斷 WWID :
# /lib/udev/scsi_id -gud /dev/sda 360030057024d0730239134810c0cb833
`sda`是您要新增至黑名單的本機 SCSI 磁碟。
-
新增
WWID
至中的黑名單/etc/multipath.conf
:blacklist { wwid 360030057024d0730239134810c0cb833 devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
您應該隨時檢查 /etc/multipath.conf
舊版設定的檔案、尤其是在預設值區段中、可能會覆寫預設設定。
下表說明 multipathd
ONTAP LUN 的關鍵參數及必要值。如果主機連接至其他廠商的 LUN 、且這些參數中的任何一個被覆寫、則必須在 `multipath.conf`檔案中以特定套用至 ONTAP LUN 的形式、在稍後的節段中加以修正。如果沒有此修正、 ONTAP LUN 可能無法如預期般運作。您只能在諮詢 NetApp 、作業系統廠商或兩者之後、以及完全瞭解影響時、才應覆寫這些預設值。
參數 | 設定 |
---|---|
DETECT(偵測)_prio |
是的 |
開發損失_tmo |
"無限遠" |
容錯回復 |
立即 |
fast_io_f故障_tmo |
5. |
功能 |
"3 queue_if_no_path pg_init_retries 50" |
Flip_on_last刪除 |
"是" |
硬體處理常式 |
「0」 |
no_path_retry |
佇列 |
path_checker_ |
"周" |
path_grouping_policy |
"群組by_prio" |
path_selector |
"服務時間0" |
Polling_時間 間隔 |
5. |
優先 |
「NetApp」ONTAP |
產品 |
LUN.* |
Retain附加的硬體處理常式 |
是的 |
RR_weight |
"統一" |
使用者易記名稱 |
否 |
廠商 |
NetApp |
下列範例說明如何修正被覆寫的預設值。在這種情況下、「multiPath.conf」檔案會定義「path_checker'」和「no_path_retry」的值、這些值與ONTAP 不兼容的現象是什麼。如果因為主機仍連接其他SAN陣列而無法移除、則可針對ONTAP 具有裝置例項的LUN、特別修正這些參數。
defaults { path_checker readsector0 no_path_retry fail } devices { device { vendor "NETAPP " product "LUN.*" no_path_retry queue path_checker tur } }
KVM 設定
您也可以使用建議的設定來設定核心型虛擬機器(KVM)。由於LUN已對應至Hypervisor、因此無需變更KVM設定。
已知問題
採用 ONTAP 版本的 RHEL 7.5 有下列已知問題:
NetApp錯誤ID | 標題 | 說明 |
---|---|---|
1440718 |
如果在不執行SCSI重新掃描的情況下取消對應或對應LUN、可能會導致主機上的資料毀損。 |
當您將「dis中將_changed_WWID」多重路徑組態參數設定為「是」時、會在WWID變更時停用路徑裝置的存取。多重路徑會停用路徑裝置的存取、直到路徑的WWID還原至多重路徑裝置的WWID為止。若要深入瞭解、請參閱 "NetApp知識庫:Oracle Linux 7上iSCSI LUN上的檔案系統毀損"。 |
在儲存容錯移轉作業期間、使用QLogic QLE2672 16GB FC的RHEL7.5會發生核心中斷 |
在使用QLogic QLE2672 16GB光纖通道主機匯流排介面卡的RHEL7U5核心上執行儲存容錯移轉作業時、核心會因為核心中的恐慌而中斷。核心異常會導致RHEL 7.5重新開機、進而導致應用程式中斷。如果已設定kdump、核心異常會在/var/crash /目錄下產生vmcore檔案。vmcore檔案用於瞭解故障原因。在這種情況下、vmcore檔案中記錄的「Get_no_timer_interrupt+440」模組會出現緊急狀況、並顯示下列字串:「[例外RIP:Get_no_timer_interrupt+440]」核心中斷之後、您可以重新啟動主機作業系統、並視需要重新啟動應用程式、以恢復作業系統。 |
|
在儲存容錯移轉作業期間、使用QLogic QLE2742 32GB FC的RHEL7U5發生核心中斷 |
在使用QLogic QLE2742 HBA的Red Hat Enterprise Linux(RHEL)RHEL7U5核心上執行儲存容錯移轉作業時、核心會因核心異常而中斷。核心毀損會導致作業系統重新開機、導致應用程式中斷。如果已設定kdump、核心異常會在/var/crash /目錄下產生vmcore檔案。當核心出現問題時、您可以使用vmcore檔案來調查故障原因。以下範例顯示bGet_no_timer_interrips+440b模組中的緊急情況。在vmcore檔案中、系統會以下列字串登入緊急狀況:「[例外RIP:Get_no_timer_interrup+440]」。您可以重新啟動主機作業系統、並視需要重新啟動應用程式、藉此恢復作業系統。 |
|
在執行儲存容錯移轉作業期間、RHEL 7.5搭配QLogic QLE2742 32GB FC HBA會發生核心中斷 |
在使用QLogic QLE2742 Fibre Channel(FC)主機匯流排介面卡(HBA)的Red Hat Enterprise Linux(RHEL)7.5核心上執行儲存容錯移轉作業時、核心會因為核心中的恐慌而造成核心中斷。核心異常會導致RHEL 7.5重新開機、進而導致應用程式中斷。如果已啟用kdump機制、核心異常會產生位於/var/crash /目錄中的vmcore檔案。您可以分析vmcore檔案、判斷造成這種情況的原因。在這種情況下、當發生以QLogic QLE2742 HBA事件進行儲存容錯移轉時、「nNative佇列_sin_lock _lipath+464」模組會受到影響。您可以在vmcore檔案中找到事件、方法是找出下列字串:「[例外RIP:nature_enternated_sin_lock_lipath+464]"核心中斷之後、您可以重新開機主機作業系統並還原作業系統、然後視需要重新啟動應用程式。 |
|
儲存容錯移轉作業期間、RHEL 7.5與Emulex HBA發生核心中斷 |
在使用Emulex LPe32002 - M2 32-GB FC主機匯流排介面卡(HBA)的Red Hat Enterprise Linux(RHEL)7.5系統上執行儲存容錯移轉作業時、核心會中斷。核心中斷會導致作業系統重新開機、進而導致應用程式中斷。如果您設定kdump、核心中斷會在/var/crash /目錄下產生vmcore檔案。您可以使用vmcore檔案來判斷故障原因。在下列範例中、您可以在「lfc_HBA _clean _txcmplq+3668」模組中看到中斷情形。此中斷會以下列字串記錄在vmcore檔案中:「[例外RIP:lfc_HBA、clean、txcmplq+368]"。核心中斷後、請重新啟動主機作業系統以恢復作業系統。視需要重新啟動應用程式。 |