Criar e operar cargas de trabalho bem arquitetadas.
O Workload Factory, o pacote de gerenciamento da NetApp para Amazon FSx for NetApp ONTAP, ajuda você a manter e operar configurações de armazenamento e banco de dados confiáveis, seguras, eficientes e econômicas, alinhadas ao AWS Well-Architected Framework. O Workload Factory fornece análises diárias das suas cargas de trabalho de armazenamento e banco de dados, recomendações e correções automáticas para promover operações saudáveis. Ao automatizar esse processo, o Workload Factory minimiza erros humanos e garante consistência na gestão da carga de trabalho.
Como funciona
O NetApp Workload Factory analisa diariamente os sistemas de arquivos Amazon FSx for NetApp ONTAP, Microsoft SQL Server e as implementações de banco de dados Oracle. A análise fornece status bem arquitetado, insights e recomendações. Você pode corrigir automaticamente problemas de configuração para atender às melhores práticas e operar com eficiência.
Após a conclusão da análise diária, as configurações aparecem como "otimizadas" ou "não otimizadas" no painel de controle do Well-architected para a implantação. Você encontrará a pontuação total de otimização, problemas de configuração por categoria e uma lista de problemas de configuração e recomendações. Você pode consultar as recomendações para problemas de configuração. Alguns problemas podem ser corrigidos automaticamente pelo Workload Factory, enquanto outros exigem intervenção manual. Nesse caso, o Workload Factory fornece instruções detalhadas para ajudá-lo a implementar as alterações recomendadas.
Você pode descartar a análise de configurações que não se aplicam aos seus ambientes. Isso evita alertas desnecessários e resultados de otimização imprecisos. Ao descartar uma análise de configuração específica, Workload Factory não inclui a configuração na pontuação total de otimização.
Por que isso importa
Workload Factory aplica as melhores práticas a grandes ambientes de storage ou banco de dados, combinando avaliação contínua com insights de recomendações e remediação. Correções automatizadas reduzem erros humanos, garantem gerenciamento uniforme e mantêm o desempenho e a confiabilidade. Correções aplicadas no console do Workload Factory reduzem erros humanos e garantem gerenciamento uniforme. A automação garante que as configurações sejam aplicadas corretamente e mantidas, preservando o desempenho e a confiabilidade em toda a sua infraestrutura de cargas de trabalho.
Comece a usar o Workload Factory para detectar e corrigir configurações incorretas.
Para começar a usar o Workload Factory, inscreva-se, adicione credenciais e estabeleça conectividade para gerenciar recursos da AWS e otimizar cargas de trabalho usando Amazon FSx for NetApp ONTAP.
Melhores práticas e recomendações para cargas de trabalho de armazenamento
O Workload Factory avalia as configurações de storage para fornecer uma visão detalhada das melhores práticas de configuração do ONTAP e para garantir a conformidade com o AWS Well-Architected Framework. A avaliação também recomenda melhorias e correções.
A análise bem arquitetada categoriza as configurações nos seguintes pilares da estrutura: confiabilidade, segurança, excelência operacional, otimização de custos e eficiência de desempenho.
Confiabilidade
A confiabilidade garante que as cargas de trabalho executem suas funções pretendidas de forma correta e consistente, mesmo quando ocorrem interrupções.
-
*Agendar backups do FSx para ONTAP *
FSx for ONTAP: Fazer backup dos seus volumes ajuda a atender às necessidades de retenção de dados e conformidade. Use FSx for ONTAP backup para configurar backups automatizados e retenção para seus dados.
-
Agendar capturas de tela locais
Agende snapshots locais para backups eficientes e restaurações rápidas. Os instantâneos são imagens instantâneas e pontuais dos seus volumes.
-
Replicação entre regiões
A replicação entre regiões garante que seus dados sejam replicados para outra região da AWS, proporcionando maior durabilidade e disponibilidade dos dados. Workload Factory recomenda configurar a replicação entre regiões para auxiliar na recuperação de desastres e na conformidade.
-
Configurar replicação de dados
Para aumentar a confiabilidade dos dados, os dados podem ser replicados para um sistema de arquivos FSx for ONTAP na mesma região ou em outra região. Configure a replicação de dados para dar suporte à migração, recuperação de desastres e retenção de longo prazo em diferentes sistemas de arquivos.
-
Aumentar o limite de capacidade do SSD
A capacidade de armazenamento SSD não deve exceder 80% de utilização de forma contínua. Isso pode afetar as operações de leitura e gravação de dados na camada de armazenamento do seu pool de capacidade e impactar a capacidade de throughput do seu sistema de arquivos. A falta de capacidade pode resultar em volumes de dados que se tornam somente leitura, e os serviços que tentam gravar novos dados podem falhar.
-
Verificar a correspondência dos rótulos para garantir a confiabilidade dos dados
Os rótulos da política de snapshot do volume de origem e os rótulos da política de replicação devem corresponder para garantir a confiabilidade dos dados.
-
Aumentar o limite de capacidade de arquivos
O limite de capacidade de arquivos deve ser aumentado para evitar atingir o limite de capacidade do volume. A baixa capacidade de armazenamento (inodes) impede a gravação de dados adicionais no volume. A Workload Factory recomenda manter a utilização da capacidade de arquivos disponível abaixo de 80% de forma contínua. É necessário ter capacidade de armazenamento disponível para criar novos arquivos no volume.
Segurança
A segurança enfatiza a proteção de dados, sistemas e ativos por meio de avaliações de risco e estratégias de mitigação.
-
Habilitar ARP/AI
NetApp Autonomous Ransomware Protection com IA (ARP/AI) ajuda a proteger seus volumes contra ameaças de ransomware. Workload Factory recomenda habilitar ARP/AI para todos os volumes.
-
Acesso não autorizado a volumes
Volumes que fornecem dados de aplicativos usando iSCSI não devem permitir acesso NAS em paralelo. A Workload Factory recomenda que os volumes acessados via protocolo iSCSI sejam restritos a quaisquer protocolos adicionais.
Excelência operacional
A excelência operacional concentra-se em fornecer a arquitetura e o valor comercial mais otimizados.
-
Ativar gerenciamento automático de capacidade
O gerenciamento automático de capacidade deve ser ativado para garantir regularmente que a camada SSD não exceda o limite.
-
Limite de utilização da capacidade de volume
A Workload Factory recomenda que a capacidade de volume não exceda 80% de utilização de forma contínua. Isso pode afetar as operações de leitura e gravação de dados em seu aplicativo. O aumento da capacidade de volume pode ser manual ou automático, utilizando a função de crescimento automático de volume.
-
Utilização do volume quase total
Quando um volume estiver próximo da capacidade máxima, a Workload Factory recomenda tomar medidas para aumentar a capacidade do volume e evitar possíveis interrupções nos aplicativos.
-
Modo de escrita de relacionamento em cache
Para um desempenho ideal, o Workload Factory recomenda o modo de gravação de relacionamento de cache que melhor se adapte à sua carga de trabalho. O modo write-around oferece melhor desempenho para cargas de trabalho com muitas leituras e arquivos pequenos, enquanto o modo write-back oferece melhor desempenho para cargas de trabalho com muitas gravações e arquivos grandes.
-
Otimizar o tamanho do volume de cache
A NetApp Workload Factory recomenda ativar o dimensionamento automático e a limpeza em volumes de cache para manter o tamanho ideal e concentrar o cache nos dados mais acessados, visando eficiência máxima.
-
Relatórios lógicos de Storage VM
A Workload Factory recomenda que a configuração de relatório padrão seja definida como lógica para uma VM de armazenamento, a fim de proporcionar melhor visibilidade do uso de armazenamento no nível do volume.
Otimização de custos
A otimização de custos ajuda você a obter o máximo valor para o seu negócio enquanto mantém os custos baixos.
-
Otimize o Custo Total de Propriedade (TCO) por meio da hierarquização de dados frios
O armazenamento em camadas de dados frios deve ser ativado para reduzir a utilização da camada de armazenamento SSD. Recomenda-se aplicar uma política de escalonamento a cada volume. O FSx para ONTAP examina os dados continuamente para detectar dados inativos e movê-los para a camada de armazenamento de alta capacidade sem interrupção.
-
Aumente a eficiência do armazenamento
É necessário habilitar recursos de eficiência de armazenamento — compactação, compressão e deduplicação — para otimizar a utilização do espaço de armazenamento e reduzir o custo da camada SSD.
-
Exclusão desnecessária de snapshots e backups
Instantâneos e backups que não são mais necessários devem ser excluídos para reduzir custos.
-
Dispositivos de bloco órfãos
Após um dispositivo de bloco não ser usado por sete dias, a Workload Factory recomenda arquivar os dados do dispositivo de bloco ou excluir o dispositivo de bloco não utilizado para reduzir custos.
Melhores práticas e recomendações para cargas de trabalho de banco de dados
O Workload Factory fornece um conjunto de práticas recomendadas e boas práticas para operar cargas de trabalho de banco de dados bem arquitetadas. A análise bem arquitetada avalia as configurações e definições do Microsoft SQL Server e do Oracle Database relacionadas ao dimensionamento do armazenamento, layout do armazenamento, configuração do armazenamento, computação, aplicação (SQL Server) e resiliência.
Dimensionamento de armazenamento
-
Nível de armazenamento
Para obter o melhor desempenho de armazenamento, crie volumes FSx for ONTAP na camada SSD primária. Usar a camada de pool de capacidade pode tornar o desempenho mais lento e aumentar a latência.
-
Espaço disponível no sistema de arquivos
Para otimizar o desempenho do armazenamento, defina a capacidade do sistema de arquivos para 1,35 vezes o tamanho total dos seus volumes.
As porcentagens de espaço livre do sistema de arquivos são as seguintes:
-
Subprovisionado: < 35%
-
Otimizado: 35-100%
-
Provisão excessiva: > 100%
-
-
Tamanho do disco rígido
Assegure o dimensionamento correto e o monitoramento regular da unidade de log do SQL Server para evitar problemas como reversão de transações, indisponibilidade do banco de dados, corrupção de dados e degradação de desempenho causados por uma unidade de log cheia.
As porcentagens de tamanho das unidades de registro são as seguintes:
-
Subprovisionado: < 20%
-
Otimizado: 20-30%
-
Provisão excessiva: > 30%
-
-
Tamanho da unidade TempDB
Assegure o dimensionamento correto e o monitoramento regular do TempDB do SQL Server para otimizar o desempenho e manter a estabilidade geral. Um TempDB configurado corretamente evita problemas de desempenho e instabilidade. Espaço insuficiente ou alta contenção podem levar à lentidão nas consultas, timeouts de aplicativos e falhas do sistema.
As porcentagens de tamanho da unidade TempDB são as seguintes:
-
Subprovisionado: < 10%
-
Otimizado: 10-20%
-
Provisão excessiva: > 20%
-
Layout de armazenamento
-
Posicionamento de arquivos de dados (.mdf)
Separe os arquivos de dados e de log em unidades diferentes para melhorar o desempenho, permitir agendamentos de backup independentes e aprimorar a funcionalidade de restauração. Para bancos de dados menores, separe os caminhos LUN de dados e de log em volumes diferentes. Essa separação é necessária para mais de um banco de dados grande (> 500 GiB).
-
Posicionamento de arquivos de log (.ldf)
Separe os arquivos de dados e de log em unidades diferentes para melhorar o desempenho, permitir agendamentos de backup independentes e aprimorar a funcionalidade de restauração. Para bancos de dados menores, separe os caminhos LUN de dados e de log em volumes diferentes. Essa separação é necessária para mais de um banco de dados grande (> 500 GiB).
-
Posicionamento do TempDB
Isole as operações de E/S do TempDB e evite conflitos de E/S com outros bancos de dados, colocando o TempDB em sua própria unidade dedicada. Essa otimização melhora o desempenho e a estabilidade geral do SQL Server. A falha em fazer isso pode resultar em gargalos significativos de E/S, desempenho de consulta mais lento e potencial instabilidade do sistema.
Configuração de armazenamento
-
* Configuração do ONTAP *
Entidade Contexto Recomendação Volume
-
Provisionamento dinâmico (-space-guarantee = none)
-
Ajuste automático de tamanho ativado
-
Modo de redimensionamento automático = crescer
-
Reserva fracionária = 0%
-
Reserva de cópia instantânea = 0%
-
Exclusão automática de instantâneos (volume/mais antigo primeiro)
-
Gerenciamento de espaço - tente primeiro = volume_crescer
Para otimizar a eficiência e a relação custo-benefício do armazenamento, configure as opções de provisionamento dinâmico, dimensionamento automático e gerenciamento de espaço para seus volumes FSx para ONTAP . Sem provisionamento dinâmico (thin provisioning), o armazenamento é alocado antecipadamente, levando a um uso ineficiente e custos mais altos devido ao superprovisionamento; a alocação estática resulta no pagamento por capacidade não utilizada, aumentando as despesas; a falta de alocação dinâmica prejudica a escalabilidade e a flexibilidade, impactando o desempenho; e sem a recuperação de espaço, os dados excluídos ocupam espaço, reduzindo a eficiência.
Volume
-
Política de camadas = somente instantâneo
-
Dias mínimos de resfriamento por camadas = 7
Para obter o melhor desempenho do banco de dados e a máxima eficiência de custos, a Workload Factory recomenda mover apenas os snapshots para a camada de capacidade. Essa estratégia garante alto desempenho e, ao mesmo tempo, reduz custos. É especialmente recomendável fazer o armazenamento em camadas de snapshots com mais de 7 dias.
LUN
Tipo de SO = windows_2008
O valor do tipo de sistema operacional do LUN ONTAP deve corresponder ao esquema de particionamento do sistema operacional para alcançar o alinhamento de E/S. Uma configuração incorreta pode resultar em desempenho abaixo do ideal.
LUN
Reserva de espaço ativada
Quando a reserva de espaço está habilitada, o ONTAP reserva espaço suficiente no volume para que as gravações nesses LUNs não falhem devido à falta de espaço em disco.
LUN
Alocação de espaço ativada
Essa opção garante que o FSx para ONTAP notifique o host EC2 quando o volume estiver cheio e não puder aceitar gravações. Essa configuração também permite que o FSx para ONTAP recupere espaço automaticamente quando o SQL Server no host EC2 exclui dados. Se desativado, podem ocorrer falhas de gravação e o espaço pode ser utilizado de forma ineficiente.
-
-
Configuração de armazenamento do Windows
Entidade Contexto Recomendação E/S de múltiplos caminhos da Microsoft (MPIO)
-
Status = Ativado
-
Política = Round Robin
-
Número de sessões = 5
Para garantir o tempo de atividade ideal e a consistência do acesso aos dados para bancos de dados Microsoft SQL Server no EC2 com LUNs subjacentes provisionados no FSx for ONTAP, a Workload Factory recomenda habilitar e configurar o Multipath I/O (MPIO). O MPIO oferece múltiplos caminhos para o FSx no ONTAP, aprimorando tanto a resiliência quanto o desempenho. Essa prática recomendada protege contra possíveis perdas de dados ou períodos de inatividade, mantendo o acesso aos dados mesmo que um componente falhe.
Tamanho da unidade de alocação
Tamanho da unidade de alocação NTFS = 64 KB
Defina o tamanho da unidade de alocação NTFS para 64 KB para melhor aproveitar o espaço de disco, reduzir a fragmentação e melhorar o desempenho de leitura/gravação de arquivos. A falha em configurar isso corretamente pode levar ao uso ineficiente do disco e à degradação do desempenho.
-
Calcular
-
Calcular o dimensionamento correto
Para garantir o desempenho ideal e a relação custo-benefício da sua instância EC2 do SQL Server, recomendamos o dimensionamento adequado com base nas demandas da sua carga de trabalho. Se a sua instância atual estiver com recursos insuficientes, a atualização aumentará a capacidade de CPU, memória e E/S. Se o sistema estiver superdimensionado, o downgrade manterá o desempenho e, ao mesmo tempo, reduzirá os custos.
-
Atualização do sistema operacional
Workload Factory recomenda a aplicação das atualizações mais recentes para garantir a segurança, proteger os bancos de dados do SQL Server contra vulnerabilidades e melhorar a confiabilidade do sistema.
-
Configurações do adaptador de rede
A configuração precisa do escalonamento do lado de recebimento (RSS) é essencial para o desempenho ideal da rede em instâncias do Microsoft SQL Server. O RSS distribui o processamento de rede entre vários processadores, evitando gargalos e melhorando o desempenho do sistema. A Workload Factory recomenda as seguintes configurações de RSS:
-
Desativar recursos de descarregamento de TCP: Certifique-se de que todos os recursos de descarregamento de TCP estejam desativados.
-
Número de filas de recebimento: Defina como 8 se o número de vCPUs for maior que 8. Defina para o número de vCPUs se vCPUs ≤ 8.
-
Perfil RSS: Definido como NUMAStatic.
-
Número base do processador: definido como 2.
Seguindo essas configurações, você melhorará o desempenho e a confiabilidade de suas instâncias do Microsoft SQL Server. Sugerimos que você teste as configurações recomendadas para determinar as melhorias de desempenho antes de fazer alterações em seu ambiente de produção.
-
Aplicação (SQL Server)
-
Licença
A avaliação e a recomendação de licenciamento do SQL Server são fornecidas no nível do host.
Não otimizado: Uma licença é considerada "não otimizada" quando o Workload Factory detecta que sua infraestrutura de banco de dados não utiliza nenhum dos recursos da licença de software comercial pela qual você está pagando. Uma licença não otimizada pode resultar em custos desnecessários.
Otimizado: Uma licença é considerada "otimizada" quando a licença de software comercial para seus bancos de dados atende aos seus requisitos de desempenho.
-
Patch do Microsoft SQL Server
Workload Factory recomenda a aplicação das atualizações mais recentes para garantir a segurança, proteger os bancos de dados do SQL Server contra vulnerabilidades e melhorar a confiabilidade do sistema.
-
MAXDOP
Defina o Grau Máximo de Paralelismo (MAXDOP) para otimizar o desempenho da consulta, equilibrando o processamento paralelo. A configuração precisa do MAXDOP melhora o desempenho e a eficiência. Definir MAXDOP para 4, 8 ou 16 geralmente proporciona os melhores resultados na maioria dos casos de uso. Recomendamos que você teste sua carga de trabalho e monitore quaisquer tipos de espera relacionados ao paralelismo, como CXPACKET.
Confiabilidade
-
*Agendar backups do FSx para ONTAP *
Fazer backup dos seus volumes do Microsoft SQL Server é crucial para atender aos requisitos de retenção de dados e conformidade. Use FSx for ONTAP backup para configurar backups automáticos e retenção dos seus dados do SQL Server.
-
Agendar capturas de tela locais
Agende snapshots locais para backups eficientes e restaurações rápidas. Os instantâneos são imagens instantâneas e pontuais dos seus volumes.
-
Replicação entre regiões
A replicação entre regiões garante que seus dados sejam replicados para outra região da AWS, proporcionando maior durabilidade e disponibilidade dos dados. Workload Factory recomenda configurar a replicação entre regiões para auxiliar na recuperação de desastres e na conformidade.
Melhores práticas e recomendações para cargas de trabalho do Exchange Virtual Server
Workload Factory fornece as melhores práticas e recomendações para operar cargas de trabalho do Amazon Elastic VMware Service (Exchange Virtual Server) com arquitetura adequada. A análise de arquitetura adequada avalia as configurações do Exchange Virtual Server para ajudar a garantir que seus ambientes VMware estejam otimizados para confiabilidade, segurança, excelência operacional, otimização de custos e eficiência de desempenho. Na guia de status de arquitetura adequada no VMware, você encontrará insights e recomendações para ajudar a implementar as melhores práticas de arquitetura adequada para seus ambientes Exchange Virtual Server.
A análise bem arquitetada categoriza as configurações nos seguintes pilares da estrutura: reliability e security.
Confiabilidade
A confiabilidade garante que as cargas de trabalho executem suas funções pretendidas de forma correta e consistente, mesmo quando ocorrem interrupções.
-
resiliência do Exchange Virtual Server
Certifique-se de que os nós do seu cluster Exchange Virtual Server estejam distribuídos corretamente entre os grupos de posicionamento de partições. Todos os nós devem ser membros de um único grupo de posicionamento de partições configurado com quatro ou mais partições. O posicionamento correto das partições garante que os nós do seu cluster Exchange Virtual Server estejam distribuídos por várias partições de hardware com isolamento de falhas dentro de uma zona de disponibilidade da AWS. O desalinhamento pode resultar em perda significativa de poder de processamento ou tempo de inatividade caso uma partição falhe.
Segurança
A segurança enfatiza a proteção de dados, sistemas e ativos por meio de avaliações de risco e estratégias de mitigação.
-
Gerenciamento de nós de cluster
Certifique-se de que os nós do seu cluster Exchange Virtual Server tenham a proteção adequada contra parada e encerramento do EC2 configurada. Os nós ESXi do Exchange Virtual Server devem ser gerenciados exclusivamente usando vCenter ou outras ferramentas de gerenciamento em nível VMware. Sem as proteções adequadas no nível do EC2, os nós podem ser interrompidos ou encerrados acidentalmente a partir do console do EC2, o que pode levar à indisponibilidade de dados da máquina virtual ou perda de dados.