本機附加儲存設備的軟體RAID服務
軟體RAID是一套RAID抽象層、實作於ONTAP 整套的功能。它提供的功能與傳統ONTAP 的支援平台(例如FAS 、)內的RAID層相同。RAID層會執行磁碟機同位元檢查計算、並在ONTAP Select 一個節點內針對個別磁碟機故障提供保護。
不受硬體RAID組態的影響ONTAP Select 、而支援使用軟體RAID選項。硬體RAID控制器在某些環境中可能無法使用或不受歡迎、例如ONTAP Select 當將處理器部署在小型市售硬體上時。軟體RAID可擴充可用的部署選項、以納入這類環境。若要在您的環境中啟用軟體RAID、請記住以下幾點:
-
提供Premium或Premium XL授權。
-
它僅支援SSD或NVMe(需要Premium XL授權)磁碟機、用於ONTAP 支援以供支援的實體根磁碟和資料磁碟。
-
它需要獨立的系統磁碟、才能用於ONTAP Select 整個過程中的虛擬機器開機分割區。
-
選擇獨立的磁碟(SSD或NVMe磁碟)、為系統磁碟建立資料存放區(在多節點設定中、可建立NVRAM、Boot/CF卡、coredump和資料管理器)。
-
附註
-
術語服務磁碟和系統磁碟可互換使用。
-
服務磁碟是ONTAP Select 指在VMware支援中心內用於服務各種項目的VMDK、例如叢集、開機等。
-
服務磁碟實體位於單一實體磁碟(統稱為服務/系統實體磁碟)上、從主機即可看到。該實體磁碟必須包含DAS資料存放區。在叢集部署期間、利用「部署」功能建立這些服務磁碟、以利實現不受故障的VM。ONTAP ONTAP Select
-
-
不可能在ONTAP Select 多個資料存放區或多個實體磁碟機之間進一步分隔出不支援的系統磁碟。
-
硬體RAID並未過時。
本機附加儲存設備的軟體RAID組態
使用軟體RAID時、不需要硬體RAID控制器是理想的選擇、但如果系統確實有現有的RAID控制器、則必須符合下列要求:
-
硬體RAID控制器必須停用、才能將磁碟直接呈現給系統(JBOD)。這項變更通常可在RAID控制器BIOS中進行
-
或硬體RAID控制器應處於SAS HBA模式。例如,某些BIOS組態除了RAID之外還允許使用「ahci」模式,而RAID則可選擇啟用JBOD模式。這會啟用傳遞、使實體磁碟機可視為主機上的實體磁碟機。
視控制器支援的磁碟機數量上限而定、可能需要額外的控制器。使用SAS HBA模式時、請確保IO控制器(SAS HBA)支援最低6Gb/s速度。不過、NetApp建議使用12Gbps速度。
不支援其他硬體RAID控制器模式或組態。例如、某些控制器允許RAID 0支援、這可能會人為地讓磁碟通過、但可能會造成不良影響。支援的實體磁碟大小(僅限SSD)介於200GB至16TB之間。
系統管理員必須追蹤ONTAP Select 哪些磁碟機正在由該名虛擬機器使用、並避免在主機上意外使用這些磁碟機。 |
虛擬與實體磁碟ONTAP Select
對於使用硬體RAID控制器的組態、實體磁碟備援是由RAID控制器提供。提供一個或多個VMDK、供VMware管理員設定資料集合體。ONTAP Select ONTAP這些VMDK採用RAID 0格式等量分佈、因為使用ONTAP VMware軟體RAID是備援的、效率不彰、而且由於硬體層級提供恢復功能、因此效率不彰。此外、用於系統磁碟的VMDK與用於儲存使用者資料的VMDK位於同一個資料存放區。
使用軟體RAID時ONTAP 、針對ONTAP Select SSD和用於NVMes的PassthThrough或DirectPath IO裝置、使用一套虛擬磁碟(VMDK)和實體磁碟原始裝置對應(RDM)時、即可呈現出一套功能強大的功能。
下圖更詳細地顯示這種關係、強調ONTAP Select 用來保存使用者資料的虛擬化磁碟與用來儲存使用者資料的實體磁碟之間的差異。
*支援軟體RAID:使用虛擬化磁碟和RDM * ONTAP Select
系統磁碟(VMDK)位於同一個資料存放區和同一個實體磁碟上。虛擬NVRAM磁碟需要快速且持久的媒體。因此、僅支援NVMe和SSD類型的資料存放區。
系統磁碟(VMDK)位於同一個資料存放區和同一個實體磁碟上。虛擬NVRAM磁碟需要快速且持久的媒體。因此、僅支援NVMe和SSD類型的資料存放區。在使用NVMe磁碟機進行資料時、基於效能考量、系統磁碟也應該是NVMe裝置。在All NVMe組態中、最適合使用系統磁碟的是Intel Optane卡。
在目前的版本中、ONTAP Select 不可能在多個資料存放區或多個實體磁碟機之間進一步分隔出系統磁碟。 |
每個資料磁碟分為三個部分:一個小的根分割區(等量磁碟區)和兩個大小相同的分割區、以建立ONTAP Select 在該vme中可見的兩個資料磁碟。分割區使用根資料(RD2)架構、如下列圖表所示、適用於單一節點叢集和HA配對中的節點。
P`表示同位元檢查磁碟機。 `DP`表示雙同位元檢查磁碟機 `S
,表示備用磁碟機。
*單節點叢集*適用的RDD磁碟分割
適用於多節點叢集(HA配對)的RDD磁碟分割
支援下列RAID類型的軟件RAID:RAID 4、RAID-DP及ONTAP RAID-TEC這些都是FAS 由Same和AFF Same平台所使用的相同RAID架構。root資源配置ONTAP Select 僅支援RAID 4和RAID-DP。使用RAID-TEC 資料Aggregate時、整體保護是RAID-DP。NetApp HA使用無共享架構、將每個節點的組態複寫到另一個節點。ONTAP Select這表示每個節點都必須儲存其根分割區及其對等根分割區的複本。由於資料磁碟有單一根分割區、因此根據ONTAP Select 該節點是否屬於HA配對的一部分、資料磁碟的最小數量會有所不同。
對於單一節點叢集、所有資料分割區都會用來儲存本機(作用中)資料。對於屬於HA配對一部分的節點、會使用一個資料分割區來儲存該節點的本機(作用中)資料、而第二個資料分割區則是用來鏡射HA對等端的作用中資料。
Passthrough ( DirectPath IO )裝置與原始裝置地圖( RDM )
VMware ESX目前不支援NVMe磁碟做為原始裝置對應。若要讓VMware直接控制NVMe磁碟、NVMe磁碟機必須在ESX中設定為傳遞裝置。ONTAP Select請注意、將NVMe裝置設定為傳遞裝置需要伺服器BIOS的支援、這是一種中斷運作的程序、需要重新啟動ESX主機。此外、每個ESX主機的最大通道裝置數為16。不過、只有將此限制在14個範圍內。ONTAP每ONTAP Select 個節點最多可有14個NVMe裝置、這表示所有NVMe組態都能提供極高的IOPs密度(IOPS/TB)、而犧牲總容量。或者、如果您需要較大儲存容量的高效能組態、建議使用的組態為大ONTAP Select 尺寸的VMware VM、系統磁碟的Intel Optane卡、以及資料儲存的名義SSD磁碟機數量。
若要充分發揮NVMe效能、請考慮使用大ONTAP Select 尺寸的VMware。 |
PassthThrough裝置與RDM之間還有其他差異。RDM可對應至執行中的VM。傳遞裝置需要重新開機VM。這表示任何NVMe磁碟機更換或容量擴充(新增磁碟機)程序都需要ONTAP Select 重新啟動以進行支援。磁碟機更換與容量擴充(磁碟機新增)作業是由ONTAP 在「支援」中的工作流程所驅動。藉由使用者可管理單一節點叢集的重開機功能、以及HA配對的容錯移轉/容錯回復功能。ONTAP ONTAP Select不過請務必注意使用SSD資料磁碟機(ONTAP Select 不需要進行重新開機/容錯移轉)和使用NVMe資料磁碟機(ONTAP Select 需要進行重新開機/容錯移轉)之間的差異。
實體與虛擬磁碟資源配置
為了提供更精簡的使用者體驗、ONTAP 利用此功能、即可自動從指定的資料存放區(實體系統磁碟)配置系統(虛擬)磁碟、並將其附加至ONTAP Select 還原VM。這項作業會在初始設定期間自動執行、ONTAP Select 以便讓支援的不中斷虛擬機器能夠開機。系統會分割RDM、並自動建立根Aggregate。如果ONTAP Select 此節點是HA配對的一部分、則會自動將資料分割指派給本機儲存資源池和鏡射儲存資源池。這項指派會在叢集建立作業和儲存新增作業期間自動進行。
由於ONTAP Select 在VMware上的資料磁碟與基礎實體磁碟相關聯、因此建立具有大量實體磁碟的組態會帶來效能影響。
根Aggregate的RAID群組類型取決於可用的磁碟數目。支援:部署選擇適當的RAID群組類型。ONTAP如果有足夠的磁碟配置給節點、則會使用RAID-DP、否則會建立RAID-4根Aggregate。 |
當使用軟體RAID將容量新增至ONTAP Select 某個物件時、系統管理員必須考量實體磁碟機大小和所需磁碟機數量。有關詳細信息,請參閱一節"增加儲存容量"。
與FAS 支援不相同AFF 的是、只有容量相等或更大的磁碟機可以新增至現有的RAID群組。容量較大的磁碟機大小適中。如果您要建立新的RAID群組、新的RAID群組大小應與現有的RAID群組大小相符、以確保整體的Aggregate效能不會降低。
將 ONTAP Select 磁碟與對應的 ESX 磁碟配對
通常將各個磁碟標示為NET x.y。ONTAP Select您可以使用下列ONTAP 的fuse命令來取得磁碟UUID:
<system name>::> disk show NET-1.1 Disk: NET-1.1 Model: Micron_5100_MTFD Serial Number: 1723175C0B5E UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000 BPS: 512 Physical Size: 894.3GB Position: shared Checksum Compatibility: advanced_zoned Aggregate: - Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
在ESXi Shell中、您可以輸入下列命令、以將特定實體磁碟的LED(以naa.unite-id識別)閃亮。
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
使用軟體RAID時發生多個磁碟機故障
系統可能會遇到多個磁碟機同時處於故障狀態的情況。系統的行為取決於Aggregate RAID保護和故障磁碟機的數量。
RAID4 Aggregate可在一次磁碟故障後繼續運作、RAID-DP Aggregate可在兩次磁碟故障時維持運作、RAID-TEC 而一個版本為可在三個磁碟故障後繼續運作的版本。
如果故障磁碟的數量少於RAID類型支援的最大故障數、而且有備用磁碟可用、重建程序就會自動啟動。如果備用磁碟無法使用、則Aggregate會以降級狀態提供資料、直到新增備用磁碟為止。
如果故障磁碟數量超過RAID類型支援的最大故障數、則本機叢會標示為故障、且Aggregate狀態會降級。資料是由位於HA合作夥伴的第二個叢提供。這表示任何節點1的I/O要求都會透過叢集互連連接埠e0e(iSCSI)傳送至實體位於節點2上的磁碟。如果第二個叢也失敗、則會將該集合體標示為故障、且資料無法使用。
必須刪除並重新建立故障的叢、才能恢復正確的資料鏡射。請注意、多磁碟故障導致資料集合降級、也會導致根集合體降級。使用root資料資料(RDD)分割架構、將每個實體磁碟分割成一個根分割區和兩個資料分割區。ONTAP Select因此、遺失一或多個磁碟可能會影響多個Aggregate、包括本機根或遠端根Aggregate的複本、以及本機資料Aggregate和遠端資料Aggregate的複本。
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
若要測試或模擬一或多個磁碟機故障,請使用 storage disk fail -disk NET-x.y -immediate`命令。如果系統中有備援磁碟機、則會開始重建集合體。您可以使用命令檢查重建影像的狀態 `storage aggregate show 。您可以使用ONTAP 「還原部署」移除模擬的故障磁碟機。請注意, ONTAP 已將磁碟機標示為 Broken 。磁碟機實際上並未損壞、可以使用ONTAP 還原部署來重新新增。若要清除損壞的標籤、請在ONTAP Select CLI中輸入下列命令:
|
set advanced disk unfail -disk NET-x.y -spare true disk show -broken
最後一個命令的輸出應為空白。
虛擬化NVRAM
NetApp FAS 產品技術系統通常裝有實體NVRAM PCI卡。此卡為高效能卡、內含非揮發性快閃記憶體、可大幅提升寫入效能。它藉由授予ONTAP 功能來立即認可傳入寫入回用戶端。它也可以在稱為「減少需求」的程序中、將修改過的資料區塊排程回較慢的儲存媒體。
一般而言、市售系統並未安裝此類設備。因此、NVRAM卡的功能已虛擬化、並放入ONTAP Select 了一個分區內的系統啟動磁碟。因此、放置執行個體的系統虛擬磁碟非常重要。