Servizi di configurazione RAID software ONTAP Select per lo storage collegato localmente
Il software RAID è un layer di astrazione RAID implementato all'interno dello stack software ONTAP. Fornisce la stessa funzionalità del layer RAID all'interno di una piattaforma ONTAP tradizionale come FAS. Il layer RAID esegue i calcoli di parità dei dischi e fornisce protezione contro i guasti dei singoli dischi all'interno di un nodo ONTAP Select.
Indipendentemente dalle configurazioni RAID hardware, ONTAP Select offre anche un'opzione RAID software. Un controller RAID hardware potrebbe non essere disponibile o potrebbe risultare indesiderabile in determinati ambienti, ad esempio quando ONTAP Select viene distribuito su commodity hardware di piccolo formato. Il RAID software amplia le opzioni di implementazione disponibili per includere tali ambienti. Per abilitare il RAID software nel proprio ambiente, ecco alcuni punti da tenere a mente:
-
È disponibile con una licenza Premium o Premium XL.
-
Supporta solo unità SSD o NVMe (richiede licenza Premium XL) per i dischi root e dati di ONTAP.
-
Richiede un disco di sistema separato per la partizione di avvio della macchina virtuale ONTAP Select.
-
Scegli un disco separato, un'unità SSD o un'unità NVMe, per creare un datastore per i dischi di sistema (NVRAM, scheda Boot/CF, Coredump e Mediator in una configurazione multi-nodo).
-
|
|
|
Configurazione RAID software per lo storage collegato localmente
Quando si utilizza RAID software, l'assenza di un controller RAID hardware è l'ideale, ma, se un sistema dispone già di un controller RAID, questo deve soddisfare i seguenti requisiti:
-
È necessario disabilitare il controller RAID hardware affinché i dischi possano essere presentati direttamente al sistema (un JBOD). Di solito è possibile apportare questa modifica nel BIOS del controller RAID.
-
Oppure il controller RAID hardware dovrebbe essere in modalità SAS HBA. Ad esempio, alcune configurazioni del BIOS consentono una modalità "AHCI" oltre al RAID, che è possibile selezionare per abilitare la modalità JBOD. Questo abilita un passthrough, in modo che le unità fisiche possano essere viste così come sono dall'host.
A seconda del numero massimo di unità supportate dal controller, potrebbe essere necessario un controller aggiuntivo. Con la modalità SAS HBA, assicurarsi che il controller I/O (SAS HBA) sia supportato con una velocità minima di 6Gbps. Tuttavia, NetApp raccomanda una velocità di 12Gbps.
Non sono supportate altre modalità o configurazioni di controller RAID hardware. Ad esempio, alcuni controller consentono un supporto RAID 0 che può abilitare artificialmente il passthrough dei dischi, ma le implicazioni possono essere indesiderabili. La dimensione supportata dei dischi fisici (solo SSD) è compresa tra 200GB e 16TB.
|
|
Gli amministratori devono tenere traccia delle unità utilizzate dalla ONTAP Select VM e impedire l'utilizzo involontario di tali unità sull'host. |
ONTAP Select dischi virtuali e fisici
Per le configurazioni con controller RAID hardware, la ridondanza dei dischi fisici è fornita dal controller RAID. ONTAP Select viene presentato con uno o più VMDK dai quali l'amministratore ONTAP può configurare gli aggregati di dati. Questi VMDK sono suddivisi in un formato RAID 0 perché l'utilizzo del software RAID di ONTAP è ridondante, inefficiente e inefficace a causa della resilienza fornita a livello hardware. Inoltre, i VMDK utilizzati per i dischi di sistema si trovano nello stesso datastore dei VMDK utilizzati per memorizzare i dati utente.
Quando si utilizza il software RAID, ONTAP Deploy presenta ONTAP Select con un set di VMDK e dischi fisici Raw Device Mappings (RDM) per SSD e dispositivi passthrough o DirectPath IO per NVMe.
Le figure seguenti illustrano questa relazione in modo più dettagliato, evidenziando la differenza tra i dischi virtualizzati utilizzati per gli elementi interni della VM ONTAP Select e i dischi fisici utilizzati per archiviare i dati utente.
ONTAP Select software RAID: utilizzo di dischi virtualizzati e RDM
I dischi di sistema (VMDK) risiedono nello stesso datastore e sullo stesso disco fisico. Il disco NVRAM virtuale richiede un supporto veloce e durevole. Pertanto, sono supportati solo datastore di tipo NVMe e SSD.
I dischi di sistema (VMDK) risiedono nello stesso datastore e sullo stesso disco fisico. Il disco NVRAM virtuale richiede un supporto veloce e durevole. Pertanto, sono supportati solo datastore di tipo NVMe e SSD. Quando si utilizzano unità NVMe per i dati, anche il disco di sistema dovrebbe essere un dispositivo NVMe per motivi di prestazioni. Una buona soluzione per il disco di sistema in una configurazione interamente NVMe è una scheda INTEL Optane.
|
|
Con la versione attuale, non è possibile separare ulteriormente i dischi di sistema di ONTAP Select su più datastore o più unità fisiche. |
Ogni disco dati è diviso in tre parti: una piccola partizione root (stripe) e due partizioni di dimensioni uguali per creare due dischi dati visibili all'interno della ONTAP Select VM. Le partizioni utilizzano lo schema Root Data Data (RD2), come mostrato nelle figure seguenti per un cluster a nodo singolo e per un nodo in una coppia HA.
P indica un'unità di parità, DP indica un'unità a doppia parità, e S indica un'unità di riserva.
Partizionamento del disco RDD per cluster a nodo singolo

Partizionamento del disco RDD per cluster multi-nodo (coppia HA)

Il software RAID di ONTAP supporta i seguenti tipi di RAID: RAID 4, RAID-DP e RAID-TEC. Questi sono gli stessi costrutti RAID utilizzati dalle piattaforme FAS e AFF. Per il provisioning della root, ONTAP Select supporta solo RAID 4 e RAID-DP. Quando si utilizza RAID-TEC per l'aggregato dei dati, la protezione complessiva è RAID-DP. ONTAP Select HA utilizza un'architettura shared-nothing che replica la configurazione di ciascun nodo sull'altro nodo. Ciò significa che ogni nodo deve memorizzare la propria partizione root e una copia della partizione root del nodo peer. Un disco dati ha una singola partizione root. Questo significa che il numero minimo di dischi dati varia a seconda che il nodo ONTAP Select faccia parte di una coppia HA.
Nei cluster a nodo singolo, tutte le partizioni dati vengono utilizzate per memorizzare i dati locali (attivi). Nei nodi che fanno parte di una coppia HA, una partizione dati viene utilizzata per memorizzare i dati locali (attivi) di quel nodo e la seconda partizione dati viene utilizzata per eseguire il mirroring dei dati attivi dal peer HA.
Dispositivi passthrough (DirectPath IO) vs. Raw Device Maps (RDM)
Gli hypervisor ESXi e KVM non supportano i dischi NVMe come Raw Device Maps (RDM). Per consentire a ONTAP Select di assumere il controllo diretto dei dischi NVMe, è necessario configurare queste unità come dispositivi passthrough all'interno di ESXi o KVM. Quando si configura un dispositivo NVMe come dispositivo passthrough, è richiesto il supporto dal BIOS del server e potrebbe essere necessario riavviare l'host. Inoltre, esistono limiti al numero di dispositivi passthrough che possono essere assegnati per host, che possono variare a seconda della piattaforma. Tuttavia, ONTAP Deploy limita questo a 14 dispositivi NVMe per nodo ONTAP Select. Ciò significa che la configurazione NVMe offre una densità IOPS (IOPS/TB) molto elevata a scapito della capacità totale. In alternativa, se si desidera una configurazione ad alte prestazioni con maggiore capacità di storage, la configurazione consigliata è una ONTAP Select VM di grandi dimensioni, una scheda INTEL Optane per il disco di sistema e un numero nominale di unità SSD per l'archiviazione dei dati.
|
|
Per sfruttare appieno le prestazioni di NVMe, considera la ONTAP Select VM di grandi dimensioni. |
Esiste un'ulteriore differenza tra i dispositivi passthrough e gli RDM. Gli RDM possono essere mappati su una VM in esecuzione. I dispositivi passthrough richiedono il riavvio della VM. Ciò significa che qualsiasi procedura di sostituzione di un'unità NVMe o di espansione della capacità (aggiunta di unità) richiederà il riavvio della VM di ONTAP Select. L'operazione di sostituzione e di espansione della capacità (aggiunta di unità) è gestita da un flusso di lavoro in ONTAP Deploy. ONTAP Deploy gestisce il riavvio di ONTAP Select per i cluster a nodo singolo e il failover/failback per le coppie HA. Tuttavia, è importante notare la differenza tra lavorare con unità dati SSD (non è richiesto alcun riavvio/failover di ONTAP Select) e lavorare con unità dati NVMe (è richiesto il riavvio/failover di ONTAP Select).
Provisioning di dischi fisici e virtuali
Per offrire un'esperienza utente più snella, ONTAP Deploy esegue automaticamente il provisioning dei dischi di sistema (virtuali) dal datastore specificato (disco di sistema fisico) e li collega alla VM ONTAP Select. Questa operazione avviene automaticamente durante la configurazione iniziale, consentendo l'avvio della VM ONTAP Select. Gli RDM vengono partizionati e l'aggregato root viene creato automaticamente. Se il nodo ONTAP Select fa parte di una coppia HA, le partizioni dati vengono assegnate automaticamente a un pool di storage locale e a un mirror storage pool. Questa assegnazione avviene automaticamente sia durante le operazioni di creazione del cluster che durante le operazioni di aggiunta di storage.
Poiché i dischi dati sulla VM ONTAP Select sono associati ai dischi fisici sottostanti, la creazione di configurazioni con un numero maggiore di dischi fisici ha implicazioni in termini di prestazioni.
|
|
Il tipo di gruppo RAID dell'aggregato root dipende dal numero di dischi disponibili. ONTAP Deploy seleziona il tipo di gruppo RAID appropriato. Se sono disponibili dischi sufficienti per il nodo, utilizza RAID-DP, altrimenti crea un aggregato root RAID-4. |
Quando si aggiunge capacità a una VM ONTAP Select utilizzando RAID software, l'amministratore deve tenere conto delle dimensioni dell'unità fisica e del numero di unità necessarie. Per ulteriori dettagli, vedere "Aumentare la capacità di archiviazione".
Analogamente ai sistemi FAS e AFF, è possibile aggiungere solo dischi con capacità uguale o superiore a un gruppo RAID esistente. Le unità con capacità maggiore sono dimensionate correttamente. Se si creano nuovi gruppi RAID, la dimensione del nuovo gruppo RAID deve corrispondere a quella dei gruppi RAID esistenti per garantire che le prestazioni complessive dell'aggregato non si deteriorino.
Abbina un disco ONTAP Select al disco ESXi o KVM corrispondente
I dischi ONTAP Select sono generalmente etichettati come NET x.y. È possibile utilizzare il seguente comando ONTAP per ottenere l'UUID del disco:
<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host

Nella shell di ESXi o KVM, è possibile immettere il seguente comando per far lampeggiare il LED di un determinato disco fisico (identificato dal suo naa.unique-id).
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
cat /sys/block/<block_device_id>/device/wwid
Guasti multipli delle unità quando si utilizza RAID software
È possibile che un sistema si trovi in una situazione in cui più unità disco siano contemporaneamente in stato di guasto. Il comportamento del sistema dipende dalla protezione RAID dell'aggregato e dal numero di unità guaste.
Un aggregato RAID4 può resistere al guasto di un disco, un aggregato RAID-DP può resistere a due guasti di disco e un aggregato RAID-TEC può resistere a tre guasti di disco.
Se il numero di dischi guasti è inferiore al numero massimo di guasti supportati dal tipo di RAID e se un disco spare è disponibile, il processo di ricostruzione si avvia automaticamente. Se non sono disponibili dischi spare, l'aggregato fornisce i dati in uno stato degradato fino a quando non vengono aggiunti dischi spare.
Se il numero di dischi guasti supera il numero massimo di guasti supportati dal tipo di RAID, il plex locale viene contrassegnato come guasto e lo stato dell'aggregato viene degradato. I dati vengono forniti dal secondo plex residente sul partner HA. Ciò significa che tutte le richieste di I/O per il nodo 1 vengono inviate tramite la porta di interconnessione del cluster e0e (iSCSI) ai dischi fisicamente situati sul nodo 2. Se anche il secondo plex si guasta, l'aggregato viene contrassegnato come guasto e i dati non sono disponibili.
Un plex guasto deve essere eliminato e ricreato affinché il mirroring dei dati riprenda correttamente. Si noti che un guasto a più dischi che causa il degrado di un aggregato di dati comporta anche il degrado di un aggregato root. ONTAP Select utilizza lo schema di partizionamento root-data-data (RDD) per suddividere ogni unità fisica in una partizione root e due partizioni dati. Pertanto, la perdita di uno o più dischi potrebbe influire su più aggregati, inclusi il root locale o la copia dell'aggregato root remoto, nonché sull'aggregato dati locale e sulla copia dell'aggregato dati remoto.
Un plex non riuscito viene eliminato e ricreato nell'esempio di output seguente:
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1
Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable
negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online.
Do you want to continue? {y|n}: y
[Job 78] Job succeeded: DONE
C3111E67::> storage aggregate mirror -aggregate aggr1
Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner:
Second Plex
RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp)
Usable Physical
Position Disk Type Size Size
---------- ------------------------- ---------- -------- --------
shared NET-3.2 SSD - -
shared NET-3.3 SSD - -
shared NET-3.4 SSD 208.4GB 208.4GB
shared NET-3.5 SSD 208.4GB 208.4GB
shared NET-3.12 SSD 208.4GB 208.4GB
Aggregate capacity available for volume use would be 526.1GB.
625.2GB would be used from capacity license.
Do you want to continue? {y|n}: y
C3111E67::> storage aggregate show-status -aggregate aggr1
Owner Node: sti-rx2540-335a
Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums)
Plex: /aggr1/plex0 (online, normal, active, pool0)
RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal)
shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal)
Plex: /aggr1/plex3 (online, normal, active, pool1)
RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal)
shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal)
10 entries were displayed..
|
|
Per testare o simulare uno o più guasti delle unità, utilizzare il set advanced disk unfail -disk NET-x.y -spare true disk show -broken L'output dell'ultimo comando dovrebbe essere vuoto. |
NVRAM virtualizzata
I sistemi NetApp FAS sono tradizionalmente dotati di una scheda PCI NVRAM fisica. Questa scheda ad alte prestazioni contiene memoria flash non volatile che offre un significativo incremento delle prestazioni di scrittura. Lo fa concedendo a ONTAP la capacità di confermare immediatamente le scritture in arrivo al client. Può anche pianificare lo spostamento dei blocchi di dati modificati verso supporti di storage più lenti, in un processo noto come destaging.
I sistemi standard non sono generalmente dotati di questo tipo di apparecchiatura. Pertanto, la funzionalità della scheda NVRAM è stata virtualizzata e collocata in una partizione sul disco di avvio del sistema ONTAP Select. È per questo motivo che il posizionamento del disco virtuale di sistema dell'istanza è di fondamentale importanza.