Serviços de configuração RAID de software ONTAP Select para armazenamento local conectado
O RAID de software é uma camada de abstração RAID implementada na pilha de software ONTAP . Ele fornece a mesma funcionalidade da camada RAID em uma plataforma ONTAP tradicional, como o FAS. A camada RAID realiza cálculos de paridade de unidades e fornece proteção contra falhas individuais de unidades em um nó ONTAP Select .
Independentemente das configurações de RAID de hardware, o ONTAP Select também oferece uma opção de RAID de software. Um controlador RAID de hardware pode não estar disponível ou ser indesejável em determinados ambientes, como quando o ONTAP Select é implantado em um hardware de formato compacto. O RAID de software expande as opções de implantação disponíveis para incluir esses ambientes. Para habilitar o RAID de software em seu ambiente, aqui estão alguns pontos a serem lembrados:
-
Está disponível com uma licença Premium ou Premium XL.
-
Ele suporta apenas unidades SSD ou NVMe (requer licença Premium XL) para discos raiz e de dados ONTAP .
-
É necessário um disco de sistema separado para a partição de inicialização do ONTAP Select VM.
-
Escolha um disco separado, um SSD ou uma unidade NVMe, para criar um armazenamento de dados para os discos do sistema (NVRAM, cartão Boot/CF, Coredump e Mediator em uma configuração de vários nós).
-
Notas
-
Os termos disco de serviço e disco de sistema são usados indistintamente.
-
Os discos de serviço são os VMDKs usados dentro da VM ONTAP Select para atender a vários itens, como clustering, inicialização e assim por diante.
-
Os discos de serviço estão fisicamente localizados em um único disco físico (coletivamente chamado de disco físico de serviço/sistema), visto do host. Esse disco físico deve conter um armazenamento de dados DAS. O ONTAP Deploy cria esses discos de serviço para a VM do ONTAP Select durante a implantação do cluster.
-
-
Não é possível separar ainda mais os discos do sistema ONTAP Select em vários armazenamentos de dados ou em várias unidades físicas.
-
O RAID de hardware não está obsoleto.
Configuração de RAID de software para armazenamento local conectado
Ao usar RAID de software, a ausência de um controlador RAID de hardware é ideal, mas, se um sistema tiver um controlador RAID existente, ele deve atender aos seguintes requisitos:
-
O controlador RAID de hardware deve ser desabilitado para que os discos possam ser apresentados diretamente ao sistema (um JBOD). Essa alteração geralmente pode ser feita no BIOS do controlador RAID.
-
Ou o controlador RAID de hardware deve estar no modo SAS HBA. Por exemplo, algumas configurações de BIOS permitem um modo “AHCI” além do RAID, que pode ser escolhido para habilitar o modo JBOD. Isso permite uma passagem, para que as unidades físicas possam ser vistas como estão no host.
Dependendo do número máximo de unidades suportadas pelo controlador, um controlador adicional pode ser necessário. Com o modo SAS HBA, certifique-se de que o controlador de E/S (SAS HBA) seja compatível com uma velocidade mínima de 6 Gb/s. No entanto, a NetApp recomenda uma velocidade de 12 Gbps.
Nenhum outro modo ou configuração de controlador RAID de hardware é suportado. Por exemplo, alguns controladores permitem suporte a RAID 0, o que pode habilitar artificialmente a passagem de discos, mas as implicações podem ser indesejáveis. O tamanho suportado de discos físicos (somente SSD) é entre 200 GB e 16 TB.
|
Os administradores precisam controlar quais unidades estão em uso pela VM ONTAP Select e evitar o uso inadvertido dessas unidades no host. |
ONTAP Select discos virtuais e físicos
Para configurações com controladores RAID de hardware, a redundância de disco físico é fornecida pelo controlador RAID. O ONTAP Select é apresentado com um ou mais VMDKs a partir dos quais o administrador do ONTAP pode configurar agregados de dados. Esses VMDKs são distribuídos em um formato RAID 0 porque o uso do RAID de software do ONTAP é redundante, ineficiente e ineficaz devido à resiliência fornecida no nível do hardware. Além disso, os VMDKs usados para discos do sistema estão no mesmo repositório de dados que os VMDKs usados para armazenar dados do usuário.
Ao usar RAID de software, o ONTAP Deploy apresenta ao ONTAP Select um conjunto de discos virtuais (VMDKs) e discos físicos Raw Device Mappings [RDMs] para SSDs e dispositivos passthrough ou DirectPath IO para NVMes.
As figuras a seguir mostram essa relação com mais detalhes, destacando a diferença entre os discos virtualizados usados para os componentes internos da VM ONTAP Select e os discos físicos usados para armazenar dados do usuário.
-
RAID de software ONTAP Select : uso de discos virtualizados e RDMs*
Os discos do sistema (VMDKs) residem no mesmo armazenamento de dados e no mesmo disco físico. O disco NVRAM virtual requer uma mídia rápida e durável. Portanto, apenas armazenamentos de dados do tipo NVMe e SSD são suportados.
Os discos do sistema (VMDKs) residem no mesmo armazenamento de dados e no mesmo disco físico. O disco NVRAM virtual requer uma mídia rápida e durável. Portanto, apenas armazenamentos de dados do tipo NVMe e SSD são suportados. Ao usar unidades NVMe para dados, o disco do sistema também deve ser um dispositivo NVMe por questões de desempenho. Uma boa opção para o disco do sistema em uma configuração totalmente NVMe é uma placa INTEL Optane.
|
Com a versão atual, não é possível separar ainda mais os discos do sistema ONTAP Select em vários armazenamentos de dados ou unidades físicas. |
Cada disco de dados é dividido em três partes: uma pequena partição raiz (stripe) e duas partições de tamanho igual para criar dois discos de dados vistos na VM ONTAP Select . As partições usam o esquema de dados raiz (RD2), conforme mostrado nas figuras a seguir, para um único cluster de nó e para um nó em um par de HA.
P
denota uma unidade de paridade. DP
denota uma unidade de paridade dupla e S
denota uma unidade sobressalente.
Particionamento de disco RDD para clusters de nó único
Particionamento de disco RDD para clusters multinós (pares HA)
O RAID de software ONTAP oferece suporte aos seguintes tipos de RAID: RAID 4, RAID-DP e RAID-TEC. Essas são as mesmas construções RAID usadas pelas plataformas FAS e AFF . Para provisionamento raiz, o ONTAP Select suporta apenas RAID 4 e RAID-DP. Ao usar RAID-TEC para o agregado de dados, a proteção geral é RAID-DP. O ONTAP Select HA usa uma arquitetura sem compartilhamento que replica a configuração de cada nó para o outro nó. Isso significa que cada nó deve armazenar sua partição raiz e uma cópia da partição raiz do seu par. Como um disco de dados possui uma única partição raiz, o número mínimo de discos de dados varia dependendo se o nó do ONTAP Select faz parte de um par de HA ou não.
Para clusters de nó único, todas as partições de dados são usadas para armazenar dados locais (ativos). Para nós que fazem parte de um par de HA, uma partição de dados é usada para armazenar dados locais (ativos) para esse nó e a segunda partição de dados é usada para espelhar dados ativos do par de HA.
Dispositivos Passthrough (DirectPath IO) vs. Mapas de Dispositivos Brutos (RDMs)
Atualmente, o VMware ESX não oferece suporte a discos NVMe como Raw Device Maps. Para que o ONTAP Select assuma o controle direto dos discos NVMe, as unidades NVMe devem ser configuradas no ESX como dispositivos de passagem. Observe que configurar um dispositivo NVMe como dispositivo de passagem requer suporte do BIOS do servidor e é um processo disruptivo, exigindo a reinicialização do host ESX. Além disso, o número máximo de dispositivos de passagem por host ESX é 16. No entanto, o ONTAP Deploy limita esse número a 14. Esse limite de 14 dispositivos NVMe por nó ONTAP Select significa que uma configuração totalmente NVMe fornecerá uma densidade de IOPs (IOPs/TB) muito alta, em detrimento da capacidade total. Como alternativa, se uma configuração de alto desempenho com maior capacidade de armazenamento for desejada, a configuração recomendada é uma VM ONTAP Select de tamanho grande, uma placa INTEL Optane para o disco do sistema e um número nominal de unidades SSD para armazenamento de dados.
|
Para aproveitar ao máximo o desempenho do NVMe, considere o grande tamanho da VM ONTAP Select . |
Há uma diferença adicional entre dispositivos de passagem e RDMs. Os RDMs podem ser mapeados para uma VM em execução. Dispositivos de passagem exigem uma reinicialização da VM. Isso significa que qualquer procedimento de substituição ou expansão de capacidade (adição de unidade) de disco NVMe exigirá uma reinicialização da VM ONTAP Select . A operação de substituição e expansão de capacidade (adição de unidade) de disco é conduzida por um fluxo de trabalho no ONTAP Deploy. O ONTAP Deploy gerencia a reinicialização do ONTAP Select para clusters de nó único e o failover/failback para pares de alta disponibilidade. No entanto, é importante observar a diferença entre trabalhar com unidades de dados SSD (não são necessárias reinicializações/failovers do ONTAP Select ) e trabalhar com unidades de dados NVMe (não são necessárias reinicializações/failovers do ONTAP Select ).
Provisionamento de disco físico e virtual
Para proporcionar uma experiência mais otimizada ao usuário, o ONTAP Deploy provisiona automaticamente os discos do sistema (virtuais) a partir do repositório de dados especificado (disco físico do sistema) e os anexa à VM do ONTAP Select . Essa operação ocorre automaticamente durante a configuração inicial para que a VM do ONTAP Select possa inicializar. Os RDMs são particionados e o agregado raiz é criado automaticamente. Se o nó do ONTAP Select fizer parte de um par de HA, as partições de dados serão atribuídas automaticamente a um pool de armazenamento local e a um pool de armazenamento espelho. Essa atribuição ocorre automaticamente durante as operações de criação de cluster e de adição de armazenamento.
Como os discos de dados na VM ONTAP Select estão associados aos discos físicos subjacentes, há implicações de desempenho ao criar configurações com um número maior de discos físicos.
|
O tipo de grupo RAID do agregado raiz depende do número de discos disponíveis. O ONTAP Deploy seleciona o tipo de grupo RAID apropriado. Se houver discos suficientes alocados ao nó, ele usa RAID-DP; caso contrário, cria um agregado raiz RAID-4. |
Ao adicionar capacidade a uma VM ONTAP Select usando RAID de software, o administrador deve considerar o tamanho da unidade física e o número de unidades necessárias. Para mais detalhes, consulte a seção "Aumentar a capacidade de armazenamento" .
Semelhante aos sistemas FAS e AFF , somente unidades com capacidades iguais ou maiores podem ser adicionadas a um grupo RAID existente. Unidades com maior capacidade têm o tamanho adequado. Se você estiver criando novos grupos RAID, o tamanho do novo grupo RAID deve corresponder ao tamanho do grupo RAID existente para garantir que o desempenho geral agregado não se deteriore.
Associe um disco ONTAP Select ao disco ESX correspondente
Os discos ONTAP Select geralmente são rotulados como NET xy. Você pode usar o seguinte comando ONTAP para obter o UUID do disco:
<system name>::> disk show NET-1.1 Disk: NET-1.1 Model: Micron_5100_MTFD Serial Number: 1723175C0B5E UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000 BPS: 512 Physical Size: 894.3GB Position: shared Checksum Compatibility: advanced_zoned Aggregate: - Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
No shell do ESXi, você pode inserir o seguinte comando para piscar o LED de um determinado disco físico (identificado por seu naa.unique-id).
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
Falhas de múltiplas unidades ao usar RAID de software
É possível que um sistema se depare com uma situação em que várias unidades estejam com falha ao mesmo tempo. O comportamento do sistema depende da proteção RAID agregada e do número de unidades com falha.
Um agregado RAID4 pode sobreviver a uma falha de disco, um agregado RAID-DP pode sobreviver a duas falhas de disco e um agregado RAID-TEC pode sobreviver a três falhas de disco.
Se o número de discos com falha for menor que o número máximo de falhas suportado pelo tipo RAID e se um disco reserva estiver disponível, o processo de reconstrução será iniciado automaticamente. Se não houver discos reservas disponíveis, o agregado fornecerá dados em um estado degradado até que discos reservas sejam adicionados.
Se o número de discos com falha for maior que o número máximo de falhas suportado pelo tipo de RAID, o plex local será marcado como com falha e o estado agregado será degradado. Os dados são fornecidos pelo segundo plex residente no parceiro de alta disponibilidade. Isso significa que quaisquer solicitações de E/S para o nó 1 são enviadas pela porta de interconexão de cluster e0e (iSCSI) para os discos fisicamente localizados no nó 2. Se o segundo plex também falhar, o agregado será marcado como com falha e os dados ficarão indisponíveis.
Um plex com falha deve ser excluído e recriado para que o espelhamento adequado dos dados seja retomado. Observe que uma falha em vários discos, resultando na degradação de um agregado de dados, também resulta na degradação de um agregado raiz. O ONTAP Select usa o esquema de particionamento raiz-dados-dados (RDD) para dividir cada unidade física em uma partição raiz e duas partições de dados. Portanto, a perda de um ou mais discos pode afetar vários agregados, incluindo a raiz local ou a cópia do agregado raiz remoto, bem como o agregado de dados local e a cópia do agregado de dados remoto.
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
|
Para testar ou simular uma ou várias falhas de unidade, use o storage disk fail -disk NET-x.y -immediate comando. Se houver um sobressalente no sistema, o agregado começará a ser reconstruído. Você pode verificar o status da reconstrução usando o comando storage aggregate show . Você pode remover a unidade simulada com falha usando o ONTAP Deploy. Observe que o ONTAP marcou a unidade como Broken . A unidade não está realmente quebrada e pode ser adicionada novamente usando o ONTAP Deploy. Para apagar o rótulo "Quebrado", digite os seguintes comandos na CLI do ONTAP Select :
|
set advanced disk unfail -disk NET-x.y -spare true disk show -broken
A saída do último comando deve estar vazia.
NVRAM virtualizada
Os sistemas NetApp FAS são tradicionalmente equipados com uma placa PCI NVRAM física. Esta placa é uma placa de alto desempenho que contém memória flash não volátil que proporciona um aumento significativo no desempenho de gravação. Ela faz isso concedendo ao ONTAP a capacidade de confirmar imediatamente as gravações recebidas de volta ao cliente. Ela também pode agendar a movimentação de blocos de dados modificados de volta para mídias de armazenamento mais lentas em um processo conhecido como desescalonamento.
Sistemas comuns normalmente não são equipados com esse tipo de equipamento. Portanto, a funcionalidade da placa NVRAM foi virtualizada e colocada em uma partição no disco de inicialização do sistema ONTAP Select . É por esse motivo que o posicionamento do disco virtual do sistema da instância é extremamente importante.