Servicios de configuración RAID del software ONTAP Select para almacenamiento conectado local
El RAID de software es una capa de abstracción RAID implementada en la pila de software ONTAP. Proporciona la misma funcionalidad que la capa RAID en una plataforma ONTAP tradicional como FAS. La capa RAID realiza cálculos de paridad de unidades y proporciona protección frente a fallos individuales de unidades dentro de un nodo ONTAP Select.
Independientemente de las configuraciones RAID de hardware, ONTAP Select también proporciona una opción RAID de software. Es posible que una controladora RAID de hardware no esté disponible o que no sea deseable en ciertos entornos, como cuando ONTAP Select se implementa en un hardware genérico de factor de forma pequeño. El software RAID amplía las opciones de implementación disponibles para incluir tales entornos. Para activar el RAID de software en su entorno, aquí tiene que recordar algunos puntos:
-
Está disponible con licencia Premium o Premium XL.
-
Solo admite unidades SSD o NVMe (requiere licencia Premium XL) para discos raíz y de datos ONTAP.
-
Requiere un disco de sistema independiente para la partición de arranque de la máquina virtual de ONTAP Select.
-
Seleccione un disco independiente, un SSD o una unidad NVMe, para crear un almacén de datos para los discos del sistema (NVRAM, una tarjeta Boot/CF, coredump y Mediator en una configuración de varios nodos).
-
|
|
Configuración RAID de software para almacenamiento conectado local
Al utilizar el software RAID, la ausencia de un controlador RAID de hardware es ideal, pero, si un sistema tiene una controladora RAID existente, debe cumplir con los siguientes requisitos:
-
Debe desactivar la controladora RAID de hardware para que los discos se puedan presentar directamente al sistema (un JBOD). Normalmente, este cambio se puede realizar en la BIOS de la controladora RAID.
-
O bien, el controlador RAID de hardware debería estar en modo SAS HBA. Por ejemplo, algunas configuraciones de BIOS permiten un modo "AHCI" además de RAID, que puede elegir para habilitar el modo JBOD. Esto permite una transferencia directa, de modo que las unidades físicas se puedan ver tal como están en el host.
Según la cantidad máxima de unidades admitidas por la controladora, podría requerirse una controladora adicional. Con el modo HBA SAS, asegúrese de que la controladora de E/S (HBA SAS) sea compatible con una velocidad mínima de 6 Gbps. Sin embargo, NetApp recomienda una velocidad de 12 Gbps.
No se admiten otros modos ni configuraciones de controlador RAID de hardware. Por ejemplo, algunos controladores admiten RAID 0, lo que puede permitir artificialmente la transferencia de discos, pero las consecuencias pueden ser indeseables. El tamaño admitido de los discos físicos (solo SSD) oscila entre 200 GB y 16 TB.
|
Los administradores deben realizar un seguimiento de las unidades que utiliza la máquina virtual de ONTAP Select y evitar un uso accidental de esas unidades en el host. |
Discos físicos y virtuales de ONTAP Select
Para configuraciones con controladores RAID de hardware, la redundancia del disco físico es proporcionada por la controladora RAID. ONTAP Select se presenta con uno o más VMDK desde los que el administrador de ONTAP puede configurar agregados de datos. Estos VMDK se dividen en un formato RAID 0 porque con el software ONTAP RAID es redundante, ineficiente e ineficaz debido a la resiliencia que se proporciona a nivel de hardware. Además, los VMDK que se utilizan para los discos del sistema están en el mismo almacén de datos que los VMDK que se utilizan para almacenar datos de usuario.
Al utilizar RAID de software, ONTAP Deploy presenta a ONTAP Select un conjunto de VMDK y discos físicos Raw Device Mappings [RDM] para SSD y dispositivos de E/S de paso a través o DirectPath para NVMe.
Las siguientes figuras muestran esta relación con más detalle, y destacan la diferencia entre los discos virtualizados utilizados para los entornos internos de ONTAP Select VM y los discos físicos utilizados para almacenar datos de usuario.
ONTAP Select software RAID: Uso de discos virtualizados y RDM
Los discos de sistema (VMDK) residen en el mismo almacén de datos y en el mismo disco físico. El disco NVRAM virtual requiere un medio rápido y duradero. Por lo tanto, solo se admiten almacenes de datos NVMe y de tipo SSD.
Los discos de sistema (VMDK) residen en el mismo almacén de datos y en el mismo disco físico. El disco NVRAM virtual requiere un medio rápido y duradero. Por lo tanto, solo se admiten almacenes de datos NVMe y de tipo SSD. Cuando se utilizan unidades NVMe para datos, el disco del sistema también debe ser un dispositivo NVMe por motivos de rendimiento. Un buen candidato para el disco del sistema en una configuración todo NVMe es una tarjeta INTEL Optane.
|
Con la versión actual, no es posible separar más los discos del sistema ONTAP Select en varios almacenes de datos o en varias unidades físicas. |
Cada disco de datos se divide en tres partes: una pequeña partición raíz (stripe) y dos particiones del mismo tamaño para crear dos discos de datos visibles en la máquina virtual ONTAP Select . Las particiones utilizan el esquema de datos raíz (RD2), como se muestra en las siguientes figuras para un clúster de un solo nodo y para un nodo en un par de alta disponibilidad (HA).
P
denota una unidad de paridad, DP
denota una unidad de paridad dual, y S
denota una unidad de repuesto.
Partición de disco RDD para clústeres de un solo nodo
Particionado de discos RDD para clústeres multinodo (pares de alta disponibilidad)
El RAID por software de ONTAP admite los siguientes tipos de RAID: RAID 4, RAID-DP y RAID-TEC. Estas son las mismas estructuras RAID que utilizan las plataformas FAS y AFF . Para el aprovisionamiento de la raíz, ONTAP Select solo admite RAID 4 y RAID-DP. Al usar RAID-TEC para la agregación de datos, la protección general es RAID-DP. ONTAP Select HA utiliza una arquitectura de no compartido que replica la configuración de cada nodo en el otro. Esto significa que cada nodo debe almacenar su partición raíz y una copia de la partición raíz de su par. Un disco de datos tiene una única partición raíz. Esto significa que el número mínimo de discos de datos varía según si el nodo de ONTAP Select forma parte de un par de HA.
En el caso de clústeres de un solo nodo, todas las particiones de datos se usan para almacenar datos locales (activos). En el caso de los nodos que forman parte de un par de alta disponibilidad, una partición de datos se usa para almacenar datos locales (activos) en ese nodo, y la segunda partición de datos se usa para reflejar datos activos del mismo nivel de alta disponibilidad.
Dispositivos de paso a través (DirectPath IO) frente a Mapas de dispositivos sin formato (RDM)
Los hipervisores ESX y KVM no admiten discos NVMe como mapas de dispositivos sin procesar (RDM). Para que ONTAP Select controle directamente los discos NVMe, debe configurar estas unidades como dispositivos de paso a través dentro de ESX o KVM. Al configurar un dispositivo NVMe como dispositivo de paso a través, requiere compatibilidad con la BIOS del servidor y podría ser necesario reiniciar el host. Además, existen límites en la cantidad de dispositivos de paso a través que se pueden asignar por host, que pueden variar según la plataforma. Sin embargo, ONTAP Deploy limita esto a 14 dispositivos NVMe por nodo ONTAP Select . Esto significa que la configuración NVMe proporciona una densidad de IOP muy alta (IOP/TB) a expensas de la capacidad total. Como alternativa, si desea una configuración de alto rendimiento con mayor capacidad de almacenamiento, se recomienda una máquina virtual ONTAP Select de gran tamaño, una tarjeta Intel Optane para el disco del sistema y una cantidad nominal de unidades SSD para el almacenamiento de datos.
|
Para aprovechar al máximo el rendimiento de NVMe, tenga en cuenta el gran tamaño de máquina virtual de ONTAP Select. |
Existe una diferencia adicional entre los dispositivos de paso a través y los RDM. Los RDM se pueden asignar a una máquina virtual en ejecución. Los dispositivos de paso a través requieren reiniciar la máquina virtual. Esto significa que cualquier procedimiento de reemplazo de unidad NVMe o expansión de capacidad (adición de unidad) requerirá reiniciar la máquina virtual de ONTAP Select . La operación de reemplazo de unidad y expansión de capacidad (adición de unidad) se gestiona mediante un flujo de trabajo en ONTAP Deploy. ONTAP Deploy gestiona el reinicio de ONTAP Select para clústeres de un solo nodo y la conmutación por error/recuperación para pares de alta disponibilidad (HA). Sin embargo, es importante tener en cuenta la diferencia entre trabajar con unidades de datos SSD (no se requiere reinicio/conmutación por error de ONTAP Select ) y trabajar con unidades de datos NVMe (se requiere reinicio/conmutación por error de ONTAP Select ).
Aprovisionamiento de discos físicos y virtuales
Para proporcionar una experiencia de usuario más optimizada, ONTAP Deploy aprovisiona automáticamente los discos del sistema (virtual) desde el almacén de datos (disco de sistema físico) especificado y los conecta a la máquina virtual de ONTAP Select. Esta operación se produce automáticamente durante la configuración inicial para que la máquina virtual de ONTAP Select pueda arrancar. Los RDM se crean particiones y el agregado raíz se crea automáticamente. Si el nodo ONTAP Select forma parte de una pareja de alta disponibilidad, las particiones de datos se asignan automáticamente a un pool de almacenamiento local y a un pool de almacenamiento de reflejos. Esta asignación se produce automáticamente tanto durante las operaciones de creación de clúster como durante las operaciones de almacenamiento-añadido.
Debido a que los discos de datos del equipo virtual de ONTAP Select están asociados con los discos físicos subyacentes, tiene implicaciones de rendimiento para la creación de configuraciones con un mayor número de discos físicos.
|
El tipo de grupo RAID del agregado raíz depende del número de discos disponibles. La implementación de ONTAP selecciona el tipo de grupo de RAID adecuado. Si tiene suficientes discos asignados al nodo, utiliza RAID-DP; de lo contrario, crea un agregado raíz de RAID-4. |
Al agregar capacidad a una máquina virtual ONTAP Select mediante RAID por software, el administrador debe considerar el tamaño de la unidad física y la cantidad de unidades necesarias. Para obtener más información, consulte "Aumente la capacidad de almacenamiento" .
Al igual que en los sistemas FAS y AFF , solo se pueden agregar unidades con capacidad igual o superior a un grupo RAID existente. Las unidades de mayor capacidad tienen el tamaño adecuado. Si se crean nuevos grupos RAID, el tamaño del nuevo grupo RAID debe coincidir con el del grupo RAID existente para garantizar que el rendimiento general no se vea afectado.
Haga coincidir un disco ONTAP Select con el disco ESX o KVM correspondiente
Los discos ONTAP Select suelen denominarse NET x.y. Puede utilizar el siguiente comando de ONTAP para obtener el UUID de disco:
<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
En el shell ESXi o KVM, puede ingresar el siguiente comando para hacer parpadear el LED de un disco físico determinado (identificado por su naa.unique-id).
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
cat /sys/block/<block_device_id>/device/wwid
Fallos de varias unidades cuando se utiliza RAID de software
Puede que un sistema encuentre una situación en la que varias unidades se encuentren en estado de error al mismo tiempo. El comportamiento del sistema depende de la protección RAID del agregado y de la cantidad de unidades con errores.
Un agregado RAID4 puede sobrevivir a un fallo de disco, un agregado RAID-DP puede sobrevivir a dos fallos de disco y un agregado de RAID-TEC puede sobrevivir a tres fallos de discos.
Si el número de discos con errores es inferior al número máximo de errores compatibles con el tipo de RAID y, si hay un disco de repuesto disponible, el proceso de reconstrucción se inicia automáticamente. Si no hay discos de repuesto disponibles, el agregado proporciona datos en estado degradado hasta que se añadan los discos de repuesto.
Si el número de discos con fallos es superior al número máximo de errores compatibles con el tipo de RAID, el complejo local se Marca como erróneo y el estado del agregado es degradado. Los datos se sirven desde el segundo complejo que reside en el partner de alta disponibilidad. Esto significa que cualquier solicitud de I/o del nodo 1 se envía a través del puerto de interconexión de clúster e0e (iSCSI) a los discos ubicados físicamente en el nodo 2. Si el segundo complejo también falla, el agregado se Marca como defectuoso y los datos no están disponibles.
Un plex fallido debe eliminarse y recrearse para que se reanude la duplicación correcta de los datos. Tenga en cuenta que un fallo multidisco que provoque la degradación de un agregado de datos también provoca la degradación de un agregado raíz. ONTAP Select utiliza el esquema de particionamiento "raíz-datos-datos" (RDD) para dividir cada unidad física en una partición raíz y dos particiones de datos. Por lo tanto, la pérdida de uno o más discos podría afectar a varios agregados, incluyendo la raíz local o la copia del agregado raíz remoto, así como al agregado de datos local y a la copia del agregado de datos remoto.
Un plex fallido se elimina y se vuelve a crear en el siguiente ejemplo de salida:
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
|
Para probar o simular uno o varios fallos de la unidad, utilice el set advanced disk unfail -disk NET-x.y -spare true disk show -broken El resultado del último comando debe estar vacío. |
NVRAM virtualizada
Los sistemas FAS de NetApp vienen equipados tradicionalmente con una tarjeta PCI NVRAM física. Esta tarjeta es una tarjeta de alto rendimiento que contiene memoria flash no volátil que proporciona un impulso significativo del rendimiento de escritura. Para ello, otorga a ONTAP la capacidad de reconocer de inmediato las escrituras entrantes al cliente. También puede programar la transferencia de los bloques de datos modificados a medios de almacenamiento más lentos en un proceso conocido como separación.
Los sistemas de consumo no suelen estar equipados con este tipo de equipos. Por lo tanto, la funcionalidad de la tarjeta NVRAM se ha virtualizado y se ha colocado en una partición en el disco de arranque del sistema ONTAP Select. Es por esta razón por la cual la colocación del disco virtual del sistema de la instancia es extremadamente importante.