Serviços de configuração RAID do software ONTAP Select para armazenamento anexado local
RAID de software é uma camada de abstração RAID implementada dentro da pilha de software ONTAP. Ele fornece a mesma funcionalidade que a camada RAID em uma plataforma ONTAP tradicional, como o FAS. A camada RAID executa cálculos de paridade de unidade e fornece proteção contra falhas individuais de unidade em um nó ONTAP Select.
Independente das configurações RAID de hardware, o ONTAP Select também fornece uma opção RAID de software. Uma controladora RAID de hardware pode não estar disponível ou pode ser indesejável em certos ambientes, como quando o ONTAP Select é implantado em um hardware comum de fator forma pequeno. O RAID de software expande as opções de implantação disponíveis para incluir esses ambientes. Para ativar o RAID de software em seu ambiente, aqui estão alguns pontos a serem lembrados:
-
Está disponível com uma licença Premium ou Premium XL.
-
Ele suporta apenas unidades SSD ou NVMe (requer licença Premium XL) para discos raiz e de dados ONTAP.
-
Ele requer um disco de sistema separado para a partição de inicialização ONTAP Select VM.
-
Escolha um disco separado, uma unidade SSD ou uma unidade NVMe, para criar um datastore para os discos do sistema (NVRAM, placa Boot/CF, Coredump e Mediator em uma configuração de vários nós).
-
|
|
Configuração RAID de software para armazenamento anexado local
Ao usar o RAID de software, a ausência de uma controladora RAID de hardware é ideal, mas, se um sistema tiver uma controladora RAID existente, ele deve seguir os seguintes requisitos:
-
Você deve desabilitar o controlador RAID de hardware para que os discos possam ser apresentados diretamente ao sistema (um JBOD). Geralmente, essa alteração pode ser feita no BIOS do controlador RAID.
-
Ou o controlador RAID de hardware deve estar no modo SAS HBA. Por exemplo, algumas configurações de BIOS permitem um modo "AHCI" além do RAID, que você pode optar por habilitar o modo JBOD. Isso permite uma passagem, para que as unidades físicas possam ser vistas como estão no host.
Dependendo do número máximo de unidades suportadas pelo controlador, um controlador adicional pode ser necessário. Com o modo SAS HBA, certifique-se de que o controlador de E/S (SAS HBA) seja compatível com uma velocidade mínima de 6 Gbps. No entanto, a NetApp recomenda uma velocidade de 12 Gbps.
Nenhum outro modo ou configuração de controlador RAID de hardware é suportado. Por exemplo, alguns controladores permitem suporte a RAID 0, o que pode habilitar artificialmente a passagem de discos, mas as implicações podem ser indesejáveis. O tamanho suportado de discos físicos (somente SSD) está entre 200 GB e 16 TB.
|
Os administradores precisam acompanhar quais unidades estão em uso pela VM ONTAP Select e evitar o uso inadvertido dessas unidades no host. |
Discos físicos e virtuais do ONTAP Select
Para configurações com controladores RAID de hardware, a redundância de disco físico é fornecida pelo controlador RAID. O ONTAP Select é apresentado com um ou mais VMDKs a partir do qual o administrador do ONTAP pode configurar agregados de dados. Esses VMDKs são distribuídos em um formato RAID 0 porque o uso do software ONTAP RAID é redundante, ineficiente e ineficaz devido à resiliência fornecida no nível de hardware. Além disso, os VMDKs usados para discos do sistema estão no mesmo datastore que os VMDKs usados para armazenar dados do usuário.
Ao usar RAID de software, o ONTAP Deploy apresenta ao ONTAP Select um conjunto de VMDKs e Mapeamentos de Dispositivos Brutos [RDMs] de discos físicos para SSDs e dispositivos de E/S de passagem ou DirectPath para NVMe.
As figuras a seguir mostram esse relacionamento com mais detalhes, destacando a diferença entre os discos virtualizados usados para os internos da VM do ONTAP Select e os discos físicos usados para armazenar dados do usuário.
RAID de software ONTAP Select: Uso de discos virtualizados e RDMs
Os discos do sistema (VMDKs) residem no mesmo datastore e no mesmo disco físico. O disco NVRAM virtual requer uma Mídia rápida e durável. Portanto, somente armazenamentos de dados do tipo NVMe e SSD são compatíveis.
Os discos do sistema (VMDKs) residem no mesmo datastore e no mesmo disco físico. O disco NVRAM virtual requer uma Mídia rápida e durável. Portanto, somente armazenamentos de dados do tipo NVMe e SSD são compatíveis. Ao usar unidades NVMe para dados, o disco do sistema também deve ser um dispositivo NVMe por motivos de desempenho. Um bom candidato para o disco do sistema em uma configuração all NVMe é uma placa INTEL Optane.
|
Com a versão atual, não é possível separar ainda mais os discos do sistema ONTAP Select em vários armazenamentos de dados ou várias unidades físicas. |
Cada disco de dados é dividido em três partes: uma pequena partição raiz (stripe) e duas partições de tamanho igual para criar dois discos de dados vistos na VM ONTAP Select . As partições usam o esquema de Dados Raiz (RD2), conforme mostrado nas figuras a seguir, para um cluster de nó único e para um nó em um par de alta disponibilidade (HA).
P
denota uma unidade de paridade, DP
denota uma unidade de paridade dupla e S
denota uma unidade sobressalente.
Particionamento de disco RDD para clusters de nó único
-
Partição de disco RDD para clusters multinode (pares HA)*
O RAID de software ONTAP oferece suporte aos seguintes tipos de RAID: RAID 4, RAID-DP e RAID-TEC. Essas são as mesmas construções RAID usadas pelas plataformas FAS e AFF . Para provisionamento raiz, o ONTAP Select oferece suporte apenas a RAID 4 e RAID-DP. Ao usar RAID-TEC para o agregado de dados, a proteção geral é RAID-DP. O ONTAP Select HA usa uma arquitetura sem compartilhamento que replica a configuração de cada nó para o outro nó. Isso significa que cada nó deve armazenar sua partição raiz e uma cópia da partição raiz do seu par. Um disco de dados tem uma única partição raiz. Isso significa que o número mínimo de discos de dados varia dependendo se o nó ONTAP Select faz parte de um par de HA.
Para clusters de nó único, todas as partições de dados são usadas para armazenar dados locais (ativos). Para nós que fazem parte de um par de HA, uma partição de dados é usada para armazenar dados locais (ativos) para esse nó e a segunda partição de dados é usada para espelhar dados ativos do par de HA.
Dispositivos de passagem (DirectPath IO) vs. Mapas de dispositivos brutos (RDMs)
Os hipervisores ESX e KVM não oferecem suporte a discos NVMe como Raw Device Maps (RDMs). Para permitir que o ONTAP Select assuma o controle direto dos discos NVMe, você deve configurar essas unidades como dispositivos de passagem no ESX ou KVM. Ao configurar um dispositivo NVMe como um dispositivo de passagem, ele requer suporte do BIOS do servidor e pode ser necessário reinicializar o host. Além disso, há limites para o número de dispositivos de passagem que podem ser atribuídos por host, que podem variar dependendo da plataforma. No entanto, o ONTAP Deploy limita isso a 14 dispositivos NVMe por nó ONTAP Select . Isso significa que a configuração NVMe fornece uma densidade de IOPs (IOPs/TB) muito alta em detrimento da capacidade total. Como alternativa, se você deseja uma configuração de alto desempenho com maior capacidade de armazenamento, a configuração recomendada é uma VM ONTAP Select de tamanho grande, uma placa INTEL Optane para o disco do sistema e um número nominal de unidades SSD para armazenamento de dados.
|
Para aproveitar ao máximo a performance do NVMe, considere o tamanho de VM do ONTAP Select grande. |
Há uma diferença adicional entre dispositivos de passagem e RDMs. Os RDMs podem ser mapeados para uma VM em execução. Dispositivos de passagem exigem uma reinicialização da VM. Isso significa que qualquer procedimento de substituição ou expansão de capacidade (adição de unidade) de disco NVMe exigirá uma reinicialização da VM ONTAP Select . A operação de substituição e expansão de capacidade (adição de unidade) de disco é conduzida por um fluxo de trabalho no ONTAP Deploy. O ONTAP Deploy gerencia a reinicialização do ONTAP Select para clusters de nó único e o failover/failback para pares de alta disponibilidade. No entanto, é importante observar a diferença entre trabalhar com unidades de dados SSD (nenhuma reinicialização/failover do ONTAP Select é necessária) e trabalhar com unidades de dados NVMe (reinicialização/failover do ONTAP Select é necessária).
Provisionamento de disco físico e virtual
Para proporcionar uma experiência de usuário mais simplificada, o ONTAP Deploy provisiona automaticamente os discos do sistema (virtuais) do datastore especificado (disco do sistema físico) e os anexa à VM ONTAP Select. Esta operação ocorre automaticamente durante a configuração inicial para que a VM ONTAP Select possa inicializar. Os RDMs são particionados e o agregado raiz é construído automaticamente. Se o nó ONTAP Select fizer parte de um par de HA, as partições de dados serão atribuídas automaticamente a um pool de storage local e a um pool de storage espelhado. Essa atribuição ocorre automaticamente durante as operações de criação de cluster e operações de adição de storage.
Como os discos de dados na VM ONTAP Select estão associados aos discos físicos subjacentes, há implicações de desempenho para a criação de configurações com um número maior de discos físicos.
|
O tipo de grupo RAID do agregado raiz depende do número de discos disponíveis. O ONTAP Deploy escolhe o tipo de grupo RAID apropriado. Se tiver discos suficientes alocados ao nó, ele usará RAID-DP, caso contrário, criará um agregado raiz RAID-4. |
Ao adicionar capacidade a uma VM ONTAP Select usando RAID de software, o administrador deve considerar o tamanho da unidade física e o número de unidades necessárias. Para obter detalhes, consulte "Aumentar a capacidade de storage" .
Semelhante aos sistemas FAS e AFF , você só pode adicionar unidades com capacidades iguais ou maiores a um grupo RAID existente. Unidades com maior capacidade têm o tamanho adequado. Se você estiver criando novos grupos RAID, o tamanho do novo grupo RAID deve corresponder ao tamanho do grupo RAID existente para garantir que o desempenho geral agregado não se deteriore.
Associe um disco ONTAP Select ao disco ESX ou KVM correspondente
Os discos ONTAP Select são geralmente rotulados NET x.y. Você pode usar o seguinte comando ONTAP para obter o UUID do disco:
<system name>::> disk show NET-1.1
Disk: NET-1.1
Model: Micron_5100_MTFD
Serial Number: 1723175C0B5E
UID: *500A0751:175C0B5E*:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000
BPS: 512
Physical Size: 894.3GB
Position: shared
Checksum Compatibility: advanced_zoned
Aggregate: -
Plex: -This UID can be matched with the device UID displayed in the ‘storage devices’ tab for the ESX host
No shell do ESXi ou KVM, você pode inserir o seguinte comando para piscar o LED de um determinado disco físico (identificado por seu naa.unique-id).
esxcli storage core device set -d <naa_id> -l=locator -L=<seconds>
cat /sys/block/<block_device_id>/device/wwid
Várias falhas de unidade ao usar o software RAID
É possível que um sistema encontre uma situação em que várias unidades estejam em um estado com falha ao mesmo tempo. O comportamento do sistema depende da proteção RAID agregada e do número de unidades com falha.
Um agregado RAID4 pode sobreviver a uma falha de disco, um agregado RAID-DP pode sobreviver a duas falhas de disco e um agregado RAID-TEC pode sobreviver a três falhas de discos.
Se o número de discos com falha for menor que o número máximo de falhas que o tipo RAID suporta e se um disco sobressalente estiver disponível, o processo de reconstrução será iniciado automaticamente. Se os discos sobressalentes não estiverem disponíveis, o agregado exibirá dados em estado degradado até que os discos sobressalentes sejam adicionados.
Se o número de discos com falha for maior que o número máximo de falhas suportado pelo tipo RAID, o Plex local será marcado como com falha e o estado agregado será degradado. Os dados são fornecidos pelo segundo Plex residente no parceiro de HA. Isso significa que todas as solicitações de e/S para o nó 1 são enviadas através da porta de interconexão de cluster e0e (iSCSI) para os discos localizados fisicamente no nó 2. Se o segundo Plex também falhar, o agregado é marcado como com falha e os dados não estão disponíveis.
Um plex com falha deve ser excluído e recriado para que o espelhamento correto dos dados seja retomado. Observe que uma falha em vários discos, resultando na degradação de um agregado de dados, também resulta na degradação de um agregado raiz. O ONTAP Select usa o esquema de particionamento raiz-dados-dados (RDD) para dividir cada unidade física em uma partição raiz e duas partições de dados. Portanto, a perda de um ou mais discos pode afetar vários agregados, incluindo a raiz local ou a cópia do agregado raiz remoto, bem como o agregado de dados local e a cópia do agregado de dados remoto.
Um plex com falha é excluído e recriado no exemplo de saída a seguir:
C3111E67::> storage aggregate plex delete -aggregate aggr1 -plex plex1 Warning: Deleting plex "plex1" of mirrored aggregate "aggr1" in a non-shared HA configuration will disable its synchronous mirror protection and disable negotiated takeover of node "sti-rx2540-335a" when aggregate "aggr1" is online. Do you want to continue? {y|n}: y [Job 78] Job succeeded: DONE C3111E67::> storage aggregate mirror -aggregate aggr1 Info: Disks would be added to aggregate "aggr1" on node "sti-rx2540-335a" in the following manner: Second Plex RAID Group rg0, 5 disks (advanced_zoned checksum, raid_dp) Usable Physical Position Disk Type Size Size ---------- ------------------------- ---------- -------- -------- shared NET-3.2 SSD - - shared NET-3.3 SSD - - shared NET-3.4 SSD 208.4GB 208.4GB shared NET-3.5 SSD 208.4GB 208.4GB shared NET-3.12 SSD 208.4GB 208.4GB Aggregate capacity available for volume use would be 526.1GB. 625.2GB would be used from capacity license. Do you want to continue? {y|n}: y C3111E67::> storage aggregate show-status -aggregate aggr1 Owner Node: sti-rx2540-335a Aggregate: aggr1 (online, raid_dp, mirrored) (advanced_zoned checksums) Plex: /aggr1/plex0 (online, normal, active, pool0) RAID Group /aggr1/plex0/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-1.1 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.2 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.3 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.10 0 SSD - 205.1GB 447.1GB (normal) shared NET-1.11 0 SSD - 205.1GB 447.1GB (normal) Plex: /aggr1/plex3 (online, normal, active, pool1) RAID Group /aggr1/plex3/rg0 (normal, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size Size Status -------- --------------------------- ---- ----- ------ -------- -------- ---------- shared NET-3.2 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.3 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.4 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.5 1 SSD - 205.1GB 447.1GB (normal) shared NET-3.12 1 SSD - 205.1GB 447.1GB (normal) 10 entries were displayed..
|
Para testar ou simular uma ou várias falhas de unidade, use o set advanced disk unfail -disk NET-x.y -spare true disk show -broken A saída para o último comando deve estar vazia. |
NVRAM virtualizada
Os sistemas NetApp FAS são tradicionalmente equipados com uma placa PCI NVRAM física. Este cartão é um cartão de alto desempenho que contém memória flash não volátil que fornece um aumento significativo no desempenho de gravação. Ele faz isso concedendo ao ONTAP a capacidade de reconhecer imediatamente as gravações recebidas de volta ao cliente. Ele também pode programar o movimento de blocos de dados modificados de volta para Mídia de armazenamento mais lenta em um processo conhecido como destaging.
Os sistemas comuns normalmente não estão equipados com este tipo de equipamento. Portanto, a funcionalidade da placa NVRAM foi virtualizada e colocada em uma partição no disco de inicialização do sistema ONTAP Select. É por esta razão que o posicionamento do disco virtual do sistema da instância é extremamente importante.