適用於本機附加儲存設備的 ONTAP Select 軟體 RAID 組態服務
軟體RAID是一套RAID抽象層、實作於ONTAP 整套的功能。它提供的功能與傳統ONTAP 的支援平台(例如FAS 、)內的RAID層相同。RAID層會執行磁碟機同位元檢查計算、並在ONTAP Select 一個節點內針對個別磁碟機故障提供保護。
不受硬體RAID組態的影響ONTAP Select 、而支援使用軟體RAID選項。硬體RAID控制器在某些環境中可能無法使用或不受歡迎、例如ONTAP Select 當將處理器部署在小型市售硬體上時。軟體RAID可擴充可用的部署選項、以納入這類環境。若要在您的環境中啟用軟體RAID、請記住以下幾點:
-
提供Premium或Premium XL授權。
-
它僅支援SSD或NVMe(需要Premium XL授權)磁碟機、用於ONTAP 支援以供支援的實體根磁碟和資料磁碟。
-
它需要獨立的系統磁碟、才能用於ONTAP Select 整個過程中的虛擬機器開機分割區。
-
選擇獨立的磁碟(SSD或NVMe磁碟)、為系統磁碟建立資料存放區(在多節點設定中、可建立NVRAM、Boot/CF卡、coredump和資料管理器)。
-
|
|
本機附加儲存設備的軟體RAID組態
使用軟體RAID時、不需要硬體RAID控制器是理想的選擇、但如果系統確實有現有的RAID控制器、則必須符合下列要求:
-
您必須停用硬體 RAID 控制器,以便磁碟可以直接呈現給系統(JBOD)。通常,您可以在 RAID 控制器 BIOS 中進行此變更。
-
或者,硬體 RAID 控制器應處於 SAS HBA 模式。例如,某些 BIOS 設定除了 RAID 之外還允許使用「AHCI」模式,您可以選擇啟用 JBOD 模式。這將啟用直通功能,以便實體磁碟機在主機上可以按原樣顯示。
根據控制器支援的最大驅動器數量,可能需要額外的控制器。在 SAS HBA 模式下,請確保 I/O 控制器 (SAS HBA) 至少支援 6Gbps 的速度。不過, NetApp建議使用 12Gbps 的速度。
不支援任何其他硬體 RAID 控制器模式或配置。例如,某些控制器允許 RAID 0 支持,這可以人為地啟用磁碟直通功能,但其後果可能不堪設想。支援的實體磁碟(僅限 SSD)大小在 200GB 到 16TB 之間。
|
系統管理員必須追蹤ONTAP Select 哪些磁碟機正在由該名虛擬機器使用、並避免在主機上意外使用這些磁碟機。 |
虛擬與實體磁碟ONTAP Select
對於使用硬體RAID控制器的組態、實體磁碟備援是由RAID控制器提供。提供一個或多個VMDK、供VMware管理員設定資料集合體。ONTAP Select ONTAP這些VMDK採用RAID 0格式等量分佈、因為使用ONTAP VMware軟體RAID是備援的、效率不彰、而且由於硬體層級提供恢復功能、因此效率不彰。此外、用於系統磁碟的VMDK與用於儲存使用者資料的VMDK位於同一個資料存放區。
使用軟體 RAID 時, ONTAP Deploy 會向ONTAP Select提供一組 VMDK 和實體磁碟原始設備對映 [RDM](用於 SSD)以及直通或 DirectPath IO 設備(用於 NVMe)。
下圖更詳細地顯示這種關係、強調ONTAP Select 用來保存使用者資料的虛擬化磁碟與用來儲存使用者資料的實體磁碟之間的差異。
*支援軟體RAID:使用虛擬化磁碟和RDM * ONTAP Select
系統磁碟(VMDK)位於同一個資料存放區和同一個實體磁碟上。虛擬NVRAM磁碟需要快速且持久的媒體。因此、僅支援NVMe和SSD類型的資料存放區。
系統磁碟(VMDK)位於同一個資料存放區和同一個實體磁碟上。虛擬NVRAM磁碟需要快速且持久的媒體。因此、僅支援NVMe和SSD類型的資料存放區。在使用NVMe磁碟機進行資料時、基於效能考量、系統磁碟也應該是NVMe裝置。在All NVMe組態中、最適合使用系統磁碟的是Intel Optane卡。
|
在目前的版本中、ONTAP Select 不可能在多個資料存放區或多個實體磁碟機之間進一步分隔出系統磁碟。 |
每個資料磁碟分為三個部分:一個小的根分割區(條帶)和兩個大小相等的分割區,從而建立在ONTAP Select虛擬機器中可見的兩個資料磁碟。分區使用根資料 (RD2) 模式,如下圖所示,分別針對單節點叢集和高可用性 (HA) 對中的節點。
`P`表示奇偶校驗驅動器, `DP`表示雙奇偶校驗驅動器,且 `S`表示備用驅動器。
*單節點叢集*適用的RDD磁碟分割
適用於多節點叢集(HA配對)的RDD磁碟分割
ONTAP軟體 RAID 支援下列 RAID 類型:RAID 4、RAID-DP 和RAID-TEC。這些是FAS和AFF平台使用的相同 RAID 結構。對於根配置, ONTAP Select僅支援 RAID 4 和 RAID-DP。當使用RAID-TEC進行資料聚合時,整體保護是 RAID-DP。 ONTAPONTAP Select HA 使用無共享架構,將每個節點的配置複製到另一個節點。這意味著每個節點都必須儲存其根分區及其對等節點根分區的副本。資料磁碟有一個根分割區。這意味著資料磁碟的最小數量取決於ONTAP Select節點是否屬於 HA 對。
對於單一節點叢集、所有資料分割區都會用來儲存本機(作用中)資料。對於屬於HA配對一部分的節點、會使用一個資料分割區來儲存該節點的本機(作用中)資料、而第二個資料分割區則是用來鏡射HA對等端的作用中資料。
PassthThrough(DirectPath IO)裝置與原始裝置對應(RDM)
ESX 和 KVM 虛擬機器管理程式不支援將 NVMe 磁碟用作原始裝置對應 (RDM)。若要允許ONTAP Select直接控制 NVMe 磁碟,您必須在 ESX 或 KVM 中將這些磁碟機配置為直通裝置。將 NVMe 設備配置為直通設備時,需要伺服器 BIOS 支持,並且可能需要重新啟動主機。此外,每個主機可分配的直通設備數量有限制,具體數量可能因平台而異。但是, ONTAP Deploy 將此限制為每個ONTAP Select節點 14 個 NVMe 設備。這意味著 NVMe 配置以犧牲總容量為代價,提供了非常高的 IOP 密度 (IOPs/TB)。或者,如果您需要具有更大儲存容量的高效能配置,建議的配置是:較大的ONTAP Select VM 大小、用於系統磁碟的 INTEL Optane 卡以及用於資料儲存的一定數量的 SSD 磁碟機。
|
若要充分發揮NVMe效能、請考慮使用大ONTAP Select 尺寸的VMware。 |
直通設備和 RDM 之間還有一個區別。 RDM可以對應到正在執行的虛擬機器。直通設備需要重新啟動虛擬機器。這意味著任何 NVMe 驅動器更換或容量擴展(驅動器添加)過程都需要重新啟動ONTAP Select虛擬機。驅動器更換和容量擴展(驅動器添加)操作由ONTAP Deploy 中的工作流程驅動。 ONTAPONTAP管理單節點叢集的ONTAP Select重新啟動以及 HA 對的故障轉移/故障復原。但是,請務必注意使用 SSD 資料磁碟機(無需ONTAP Select重新啟動/故障轉移)和使用 NVMe 資料磁碟機(需要ONTAP Select重新啟動/故障轉移)之間的差異。
實體與虛擬磁碟資源配置
為了提供更精簡的使用者體驗、ONTAP 利用此功能、即可自動從指定的資料存放區(實體系統磁碟)配置系統(虛擬)磁碟、並將其附加至ONTAP Select 還原VM。這項作業會在初始設定期間自動執行、ONTAP Select 以便讓支援的不中斷虛擬機器能夠開機。系統會分割RDM、並自動建立根Aggregate。如果ONTAP Select 此節點是HA配對的一部分、則會自動將資料分割指派給本機儲存資源池和鏡射儲存資源池。這項指派會在叢集建立作業和儲存新增作業期間自動進行。
由於ONTAP Select 在VMware上的資料磁碟與基礎實體磁碟相關聯、因此建立具有大量實體磁碟的組態會帶來效能影響。
|
根Aggregate的RAID群組類型取決於可用的磁碟數目。支援:部署選擇適當的RAID群組類型。ONTAP如果有足夠的磁碟配置給節點、則會使用RAID-DP、否則會建立RAID-4根Aggregate。 |
使用軟體 RAID 為ONTAP Select虛擬機器新增容量時,管理員必須考慮實體磁碟機的大小以及所需的磁碟機數量。有關詳細信息,請參閱"增加儲存容量" 。
與FAS和AFF系統類似,您只能在現有 RAID 群組中新增容量相等或更大的磁碟機。容量更大的驅動器大小合適。如果您要建立新的 RAID 群組,則新 RAID 群組的大小應與現有 RAID 群組的大小相匹配,以確保整體聚合效能不會下降。
將ONTAP Select磁碟與對應的 ESX 或 KVM 磁碟相匹配
通常將各個磁碟標示為NET x.y。ONTAP Select您可以使用下列ONTAP 的fuse命令來取得磁碟UUID:
<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
在 ESXi 或 KVM shell 中,您可以輸入下列命令來使給定實體磁碟(由其 naa.unique-id 標識)的 LED 閃爍。
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
cat /sys/block/<block_device_id>/device/wwid
使用軟體RAID時發生多個磁碟機故障
系統可能會遇到多個磁碟機同時處於故障狀態的情況。系統的行為取決於Aggregate RAID保護和故障磁碟機的數量。
RAID4 Aggregate可在一次磁碟故障後繼續運作、RAID-DP Aggregate可在兩次磁碟故障時維持運作、RAID-TEC 而一個版本為可在三個磁碟故障後繼續運作的版本。
如果故障磁碟的數量少於RAID類型支援的最大故障數、而且有備用磁碟可用、重建程序就會自動啟動。如果備用磁碟無法使用、則Aggregate會以降級狀態提供資料、直到新增備用磁碟為止。
如果故障磁碟數量超過RAID類型支援的最大故障數、則本機叢會標示為故障、且Aggregate狀態會降級。資料是由位於HA合作夥伴的第二個叢提供。這表示任何節點1的I/O要求都會透過叢集互連連接埠e0e(iSCSI)傳送至實體位於節點2上的磁碟。如果第二個叢也失敗、則會將該集合體標示為故障、且資料無法使用。
必須刪除並重新建立發生故障的叢,才能恢復正確的資料鏡像。請注意,多磁碟故障導致資料聚合降級,也會導致根聚合降級。 ONTAPONTAP Select使用根-資料-資料 (RDD) 分區模式將每個實體磁碟機分割為一個根分割區和兩個資料分割區。因此,遺失一個或多個磁碟可能會影響多個聚合,包括本地根聚合或遠端根聚合的副本,以及本機資料聚合和遠端資料聚合的副本。
在以下範例輸出中,發生故障的 plex 被刪除並重新建立:
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
|
若要測試或模擬一或多個磁碟機故障、請使用「儲存磁碟故障-磁碟NET-x.y -immediate」命令。如果系統中有備援磁碟機、則會開始重建集合體。您可以使用命令「shorage aggregate show」來檢查重建影像的狀態。您可以使用ONTAP 「還原部署」移除模擬的故障磁碟機。請注意ONTAP 、此驅動器已標示為「毀損」。磁碟機實際上並未損壞、可以使用ONTAP 還原部署來重新新增。若要清除損壞的標籤、請在ONTAP Select CLI中輸入下列命令: set advanced disk unfail -disk NET-x.y -spare true disk show -broken 最後一個命令的輸出應為空白。 |
虛擬化NVRAM
NetApp FAS 產品技術系統通常裝有實體NVRAM PCI卡。此卡為高效能卡、內含非揮發性快閃記憶體、可大幅提升寫入效能。它藉由授予ONTAP 功能來立即認可傳入寫入回用戶端。它也可以在稱為「減少需求」的程序中、將修改過的資料區塊排程回較慢的儲存媒體。
一般而言、市售系統並未安裝此類設備。因此、NVRAM卡的功能已虛擬化、並放入ONTAP Select 了一個分區內的系統啟動磁碟。因此、放置執行個體的系統虛擬磁碟非常重要。