Services de configuration RAID logiciel ONTAP Select pour le stockage local connecté
Le RAID logiciel est une couche d'abstraction RAID implémentée au sein de la pile logicielle ONTAP . Il offre les mêmes fonctionnalités que la couche RAID d'une plateforme ONTAP traditionnelle telle que FAS. La couche RAID effectue les calculs de parité des disques et assure une protection contre les pannes de disques individuels au sein d'un nœud ONTAP Select .
Indépendamment des configurations RAID matérielles, ONTAP Select propose également une option RAID logiciel. Un contrôleur RAID matériel peut ne pas être disponible ou être indésirable dans certains environnements, par exemple lorsque ONTAP Select est déployé sur un matériel standard compact. Le RAID logiciel étend les options de déploiement disponibles à ces environnements. Pour activer le RAID logiciel dans votre environnement, voici quelques points à retenir :
-
Il est disponible avec une licence Premium ou Premium XL.
-
Il prend uniquement en charge les disques SSD ou NVMe (nécessite une licence Premium XL) pour les disques racine et de données ONTAP .
-
Il nécessite un disque système distinct pour la partition de démarrage ONTAP Select VM.
-
Choisissez un disque séparé, soit un SSD, soit un lecteur NVMe, pour créer une banque de données pour les disques système (NVRAM, carte Boot/CF, Coredump et Mediator dans une configuration multi-nœuds).
-
|
|
|
Configuration RAID logicielle pour le stockage local connecté
Lors de l'utilisation d'un RAID logiciel, l'absence de contrôleur RAID matériel est idéale, mais si un système dispose d'un contrôleur RAID existant, il doit respecter les exigences suivantes :
-
Vous devez désactiver le contrôleur RAID matériel pour que les disques puissent être présentés directement au système (JBOD). Cette modification peut généralement être effectuée dans le BIOS du contrôleur RAID.
-
Le contrôleur RAID matériel doit également être en mode HBA SAS. Par exemple, certaines configurations BIOS autorisent un mode « AHCI » en plus du RAID, ce qui vous permet d'activer le mode JBOD. Cela permet un transfert, permettant ainsi aux disques physiques d'être visibles tels quels sur l'hôte.
Selon le nombre maximal de disques pris en charge par le contrôleur, un contrôleur supplémentaire peut être nécessaire. Avec le mode HBA SAS, assurez-vous que le contrôleur d'E/S (HBA SAS) est pris en charge avec un débit minimum de 6 Gbit/s. Cependant, NetApp recommande un débit de 12 Gbit/s.
Aucun autre mode ou configuration de contrôleur RAID matériel n'est pris en charge. Par exemple, certains contrôleurs prennent en charge le RAID 0, ce qui permet artificiellement le passage des disques, mais les conséquences peuvent être indésirables. La taille des disques physiques pris en charge (SSD uniquement) est comprise entre 200 Go et 16 To.
|
|
Les administrateurs doivent suivre les lecteurs utilisés par la machine virtuelle ONTAP Select et empêcher l'utilisation accidentelle de ces lecteurs sur l'hôte. |
ONTAP Select les disques virtuels et physiques
Pour les configurations avec contrôleurs RAID matériels, la redondance des disques physiques est assurée par le contrôleur RAID. ONTAP Select propose un ou plusieurs VMDK à partir desquels l'administrateur ONTAP peut configurer des agrégats de données. Ces VMDK sont répartis en RAID 0, car le RAID logiciel ONTAP est redondant et inefficace en raison de la résilience matérielle. De plus, les VMDK utilisés pour les disques système se trouvent dans le même magasin de données que ceux utilisés pour stocker les données utilisateur.
Lors de l'utilisation du RAID logiciel, ONTAP Deploy présente à ONTAP Select un ensemble de VMDK et de disques physiques, de mappages de périphériques bruts [RDM] pour les SSD et de périphériques d'E/S passthrough ou DirectPath pour NVMe.
Les figures suivantes illustrent cette relation plus en détail, en soulignant la différence entre les disques virtualisés utilisés pour les composants internes de la machine ONTAP Select et les disques physiques utilisés pour stocker les données utilisateur.
-
RAID logiciel ONTAP Select : utilisation de disques virtualisés et de RDM*
Les disques système (VMDK) résident dans le même magasin de données et sur le même disque physique. Le disque NVRAM virtuel nécessite un support rapide et durable. Par conséquent, seuls les magasins de données de type NVMe et SSD sont pris en charge.
Les disques système (VMDK) résident dans le même magasin de données et sur le même disque physique. Le disque NVRAM virtuel nécessite un support rapide et durable. Par conséquent, seuls les magasins de données de type NVMe et SSD sont pris en charge. Si vous utilisez des disques NVMe pour les données, le disque système doit également être un périphérique NVMe pour des raisons de performances. Une carte Intel Optane est un bon choix pour le disque système dans une configuration entièrement NVMe.
|
|
Avec la version actuelle, il n'est pas possible de séparer davantage les disques système ONTAP Select sur plusieurs banques de données ou plusieurs lecteurs physiques. |
Chaque disque de données est divisé en trois parties : une petite partition racine (stripe) et deux partitions de taille égale pour créer deux disques de données visibles dans la machine virtuelle ONTAP Select . Les partitions utilisent le schéma RD2 (Root Data Data), comme illustré dans les figures suivantes pour un cluster à nœud unique et pour un nœud d'une paire haute disponibilité (HA).
P`désigne une démarche de parité, `DP désigne un lecteur à double parité, et S indique un disque dur de rechange.
Partitionnement de disque RDD pour les clusters à nœud unique

Partitionnement de disque RDD pour clusters multinœuds (paires HA)

Le RAID logiciel ONTAP prend en charge les types RAID suivants : RAID 4, RAID-DP et RAID-TEC. Il s'agit des mêmes structures RAID que celles utilisées par les plateformes FAS et AFF . Pour le provisionnement racine, ONTAP Select prend uniquement en charge RAID 4 et RAID-DP. Lorsque RAID-TEC est utilisé pour l'agrégation de données, la protection globale est RAID-DP. ONTAP Select HA utilise une architecture sans partage qui réplique la configuration de chaque nœud sur l'autre. Cela signifie que chaque nœud doit stocker sa partition racine et une copie de celle de son homologue. Un disque de données possède une seule partition racine. Le nombre minimal de disques de données varie donc selon que le nœud ONTAP Select appartient ou non à une paire HA.
Pour les clusters à nœud unique, toutes les partitions de données servent au stockage des données locales (actives). Pour les nœuds faisant partie d'une paire HA, une partition de données sert au stockage des données locales (actives) de ce nœud, tandis que la seconde partition de données sert à refléter les données actives de l'homologue HA.
Périphériques de transfert (DirectPath IO) vs. Cartes de périphériques bruts (RDM)
Les hyperviseurs ESX et KVM ne prennent pas en charge les disques NVMe comme cartes de périphériques bruts (RDM). Pour permettre à ONTAP Select de prendre directement le contrôle des disques NVMe, vous devez configurer ces disques comme périphériques de transfert dans ESX ou KVM. La configuration d'un périphérique NVMe comme périphérique de transfert nécessite la prise en charge du BIOS du serveur et un redémarrage de l'hôte peut être nécessaire. De plus, le nombre de périphériques de transfert pouvant être attribués par hôte est limité, et peut varier selon la plateforme. Cependant, ONTAP Deploy limite ce nombre à 14 périphériques NVMe par nœud ONTAP Select . Cela signifie que la configuration NVMe offre une densité d'IOPS très élevée (IOPS/To) au détriment de la capacité totale. Si vous souhaitez une configuration hautes performances avec une capacité de stockage plus importante, nous recommandons une configuration ONTAP Select de grande taille, une carte Intel Optane pour le disque système et un nombre nominal de disques SSD pour le stockage des données.
|
|
Pour profiter pleinement des performances NVMe, tenez compte de la grande taille de la machine virtuelle ONTAP Select . |
Il existe une différence supplémentaire entre les périphériques de transfert et les RDM. Les RDM peuvent être mappés à une machine virtuelle en cours d'exécution. Les périphériques de transfert nécessitent un redémarrage de la machine virtuelle. Cela signifie que tout remplacement de disque NVMe ou extension de capacité (ajout de disque) nécessite un redémarrage de la machine virtuelle ONTAP Select . Ces opérations sont gérées par un workflow dans ONTAP Deploy. ONTAP Deploy gère le redémarrage ONTAP Select pour les clusters à nœud unique et le basculement/la restauration automatique pour les paires haute disponibilité. Cependant, il est important de noter la différence entre l'utilisation de disques de données SSD (aucun redémarrage/basculement ONTAP Select requis) et l'utilisation de disques de données NVMe (redémarrage/basculement ONTAP Select requis).
Provisionnement de disques physiques et virtuels
Pour une expérience utilisateur simplifiée, ONTAP Deploy provisionne automatiquement les disques système (virtuels) à partir du datastore spécifié (disque système physique) et les associe à la machine virtuelle ONTAP Select . Cette opération s'effectue automatiquement lors de la configuration initiale afin que la machine virtuelle ONTAP Select puisse démarrer. Les RDM sont partitionnés et l'agrégat racine est automatiquement créé. Si le nœud ONTAP Select fait partie d'une paire HA, les partitions de données sont automatiquement affectées à un pool de stockage local et à un pool de stockage miroir. Cette affectation s'effectue automatiquement lors des opérations de création de cluster et d'ajout de stockage.
Étant donné que les disques de données sur la machine virtuelle ONTAP Select sont associés aux disques physiques sous-jacents, la création de configurations avec un plus grand nombre de disques physiques a des conséquences sur les performances.
|
|
Le type de groupe RAID de l'agrégat racine dépend du nombre de disques disponibles. ONTAP Deploy sélectionne le type de groupe RAID approprié. Si le nombre de disques alloués au nœud est suffisant, il utilise RAID-DP ; sinon, il crée un agrégat racine RAID-4. |
Lors de l'ajout de capacité à une machine virtuelle ONTAP Select via RAID logiciel, l'administrateur doit tenir compte de la taille du disque physique et du nombre de disques requis. Pour plus de détails, voir"Augmenter la capacité de stockage" .
Comme pour les systèmes FAS et AFF , vous ne pouvez ajouter que des disques de capacité égale ou supérieure à un groupe RAID existant. Les disques de plus grande capacité sont dimensionnés de manière optimale. Si vous créez de nouveaux groupes RAID, la taille du nouveau groupe RAID doit correspondre à celle du groupe RAID existant afin de garantir une performance globale optimale.
Associez un disque ONTAP Select au disque ESX ou KVM correspondant
Les disques ONTAP Select sont généralement étiquetés NET xy. Vous pouvez utiliser la commande ONTAP suivante pour obtenir l'UUID du disque :
<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host

Dans le shell ESXi ou KVM, vous pouvez entrer la commande suivante pour faire clignoter la LED d'un disque physique donné (identifié par son naa.unique-id).
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
cat /sys/block/<block_device_id>/device/wwid
Pannes de disques multiples lors de l'utilisation du RAID logiciel
Il est possible qu'un système soit confronté à une situation où plusieurs disques sont en panne simultanément. Le comportement du système dépend de la protection RAID globale et du nombre de disques défaillants.
Un agrégat RAID4 peut survivre à une panne de disque, un agrégat RAID-DP peut survivre à deux pannes de disque et un agrégat RAID-TEC peut survivre à trois pannes de disque.
Si le nombre de disques défaillants est inférieur au nombre maximal de pannes pris en charge par le type RAID et si un disque de secours est disponible, le processus de reconstruction démarre automatiquement. En l'absence de disques de secours, l'agrégat fournit les données dans un état dégradé jusqu'à l'ajout de disques de secours.
Si le nombre de disques défaillants est supérieur au nombre maximal de pannes pris en charge par le type RAID, le plex local est marqué comme défaillant et l'état de l'agrégat est dégradé. Les données sont servies depuis le deuxième plex résidant sur le partenaire HA. Cela signifie que toutes les requêtes d'E/S du nœud 1 sont envoyées via le port d'interconnexion de cluster e0e (iSCSI) aux disques physiquement situés sur le nœud 2. Si le deuxième plex tombe également en panne, l'agrégat est marqué comme défaillant et les données sont indisponibles.
Un plex défaillant doit être supprimé puis recréé pour que la mise en miroir des données reprenne correctement. Notez qu'une panne multidisque entraînant la dégradation d'un agrégat de données entraîne également la dégradation d'un agrégat racine. ONTAP Select utilise le schéma de partitionnement root-data-data (RDD) pour diviser chaque disque physique en une partition racine et deux partitions de données. Par conséquent, la perte d'un ou plusieurs disques peut affecter plusieurs agrégats, notamment la racine locale ou la copie de l'agrégat racine distant, ainsi que l'agrégat de données local et la copie de l'agrégat de données distant.
Un plex défaillant est supprimé et recréé dans l'exemple de sortie suivant :
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1
Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable
negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online.
Do you want to continue? {y|n}: y
[Job 78] Job succeeded: DONE
C3111E67::> storage aggregate mirror -aggregate aggr1
Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner:
Second Plex
RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp)
Usable Physical
Position Disk Type Size Size
---------- ------------------------- ---------- -------- --------
shared NET-3.2 SSD - -
shared NET-3.3 SSD - -
shared NET-3.4 SSD 208.4GB 208.4GB
shared NET-3.5 SSD 208.4GB 208.4GB
shared NET-3.12 SSD 208.4GB 208.4GB
Aggregate capacity available for volume use would be 526.1GB.
625.2GB would be used from capacity license.
Do you want to continue? {y|n}: y
C3111E67::> storage aggregate show-status -aggregate aggr1
Owner Node: sti-rx2540-335a
Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums)
Plex: /aggr1/plex0 (online, normal, active, pool0)
RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal)
Plex: /aggr1/plex3 (online, normal, active, pool1)
RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal)
10 entries were displayed..
|
|
Pour tester ou simuler une ou plusieurs pannes de disque, utilisez le set advanced disk unfail -disk NET-x.y -spare true disk show -broken La sortie de la dernière commande doit être vide. |
NVRAM virtualisée
Les systèmes NetApp FAS sont traditionnellement équipés d'une carte PCI NVRAM physique. Cette carte hautes performances, dotée d'une mémoire flash non volatile, améliore considérablement les performances d'écriture. Elle permet à ONTAP d'accuser réception immédiate des écritures entrantes auprès du client. Elle peut également planifier le déplacement des blocs de données modifiés vers des supports de stockage plus lents, grâce à un processus appelé « destaging ».
Les systèmes courants ne sont généralement pas équipés de ce type d'équipement. Par conséquent, la fonctionnalité de la carte NVRAM a été virtualisée et placée dans une partition du disque de démarrage du système ONTAP Select . C'est pourquoi le placement du disque virtuel système de l'instance est extrêmement important.