Visão geral de categorização de dados
Reduza seus custos de storage habilitando a disposição automatizada de dados inativos em storage de objetos de baixo custo. Os dados ativos permanecem em SSDs ou HDDs de alta performance, enquanto os dados inativos são dispostos em camadas em storage de objetos de baixo custo. Isso permite recuperar espaço no storage primário e reduzir o storage secundário.
A disposição de dados em categorias é baseada na tecnologia FabricPool. O Cloud Volumes ONTAP fornece categorização de dados para todos os clusters do Cloud Volumes ONTAP sem uma licença adicional. Quando você ativa a disposição de dados em categorias, os dados dispostos em camadas no storage de objetos incorrem em cobranças. Consulte a documentação do seu provedor de nuvem para obter detalhes sobre os custos de armazenamento de objetos.
Categorização de dados no AWS
Ao habilitar a disposição de dados em categorias na AWS, o Cloud Volumes ONTAP usa o EBS como uma camada de desempenho para dados ativos e o AWS S3 como uma camada de capacidade para dados inativos.
- Camada de performance
-
A categoria de performance pode ser SSDs de uso geral (GP3 ou GP2) ou SSDs IOPS provisionados (IO1).
A disposição em camadas dos dados no storage de objetos não é recomendada quando se usa HDDs otimizados para taxa de transferência (st1).
- Camada de capacidade
-
Um sistema Cloud Volumes ONTAP categoriza dados inativos em um único bucket do S3.
O BlueXP cria um único bucket do S3 para cada ambiente de trabalho e o nomeia Fabric-pool-cluster unique identifier. Não é criado um bucket S3 diferente para cada volume.
Quando o BlueXP cria o bucket S3, ele usa as seguintes configurações padrão:
-
Classe de armazenamento: Padrão
-
Encriptação predefinida: Desativada
-
Bloquear acesso público: Bloquear todo o acesso público
-
Propriedade do objeto: ACLs habilitadas
-
Controle de versão do bucket: Desativado
-
Bloqueio de objetos: Desativado
-
- Classes de armazenamento
-
A classe de armazenamento padrão para dados em camadas na AWS é Standard. O padrão é ideal para dados acessados com frequência armazenados em várias zonas de disponibilidade.
Se você não planeja acessar os dados inativos, você pode reduzir seus custos de armazenamento alterando a classe de armazenamento para um dos seguintes: Intelligent Tiering, One-Zone unless Access, Standard-unreallow Access ou S3 Glacier Instant Retrieval. Quando você altera a classe de armazenamento, os dados inativos começam na classe de armazenamento padrão e passam para a classe de armazenamento selecionada, se os dados não forem acessados após 30 dias.
Os custos de acesso são maiores se você acessar os dados, então leve isso em consideração antes de alterar a classe de storage. "Documentação do Amazon S3: Saiba mais sobre as classes de armazenamento do Amazon S3".
Você pode selecionar uma classe de armazenamento ao criar o ambiente de trabalho e pode alterá-la a qualquer momento depois. Para obter instruções sobre como alterar a classe de armazenamento, "Disposição em camadas dos dados inativos em storage de objetos de baixo custo"consulte .
A classe de storage para disposição de dados em categorias é de todo o sistema, não é por volume.
Categorização de dados no Azure
Ao habilitar a categorização de dados no Azure, o Cloud Volumes ONTAP usa discos gerenciados do Azure como uma categoria de performance para dados ativos e o storage Blob do Azure como uma categoria de capacidade para dados inativos.
- Camada de performance
-
A camada de performance pode ser SSDs ou HDDs.
- Camada de capacidade
-
Um sistema Cloud Volumes ONTAP categoriza dados inativos em um único contêiner de Blob.
O BlueXP cria uma nova conta de storage com um contêiner para cada ambiente de trabalho do Cloud Volumes ONTAP. O nome da conta de armazenamento é aleatório. Não é criado um recipiente diferente para cada volume.
O BlueXP cria a conta de armazenamento com as seguintes configurações:
-
Camada de acesso: Quente
-
Desempenho: Padrão
-
Redundância: Armazenamento localmente redundante (LRS)
-
Conta: StorageV2 (finalidade geral v2)
-
Exigir transferência segura para operações de API REST: Ativado
-
Acesso à chave da conta de armazenamento: Ativado
-
Versão mínima de TLS: Versão 1,2
-
Criptografia de infraestrutura: Desativada
-
- Camadas de acesso ao storage
-
A camada de acesso de storage padrão para dados em camadas no Azure é o nível hot. A camada quente é ideal para dados acessados com frequência na camada de capacidade.
Se você não planeja acessar os dados inativos no nível de capacidade, pode escolher o nível de storage cool, onde os dados inativos são retidos por um mínimo de 30 dias. Você também pode optar pelo nível cold, onde os dados inativos são armazenados por um mínimo de 90 dias. Com base em seus requisitos de storage e considerações de custo, você pode selecionar o nível mais adequado às suas necessidades. Quando você altera o nível de storage para COOL ou COLD, os dados do nível de capacidade inativo são movidos diretamente para o nível de storage frio ou frio. As camadas fria e fria oferecem custos de storage menores em comparação com a camada quente, mas elas geram custos de acesso mais altos. Portanto, leve isso em consideração antes de alterar a camada de storage. Consulte a "Documentação do Microsoft Azure: Saiba mais sobre os níveis de acesso ao armazenamento do Azure Blob".
Você pode selecionar uma camada de storage ao criar o ambiente de trabalho e alterá-la a qualquer momento. Para obter detalhes sobre como alterar a camada de storage, "Disposição em camadas dos dados inativos em storage de objetos de baixo custo"consulte .
A camada de acesso a storage para categorização de dados é de todo o sistema, não é por volume.
Categorização de dados no Google Cloud
Ao habilitar a categorização de dados no Google Cloud, o Cloud Volumes ONTAP usa discos persistentes como uma categoria de performance para dados ativos e um bucket do Google Cloud Storage como uma categoria de capacidade para dados inativos.
- Camada de performance
-
A camada de performance pode ser discos persistentes de SSD, discos persistentes balanceados ou discos persistentes padrão.
- Camada de capacidade
-
Um sistema Cloud Volumes ONTAP alinha dados inativos com um único bucket do Google Cloud Storage.
O BlueXP cria um bucket para cada ambiente de trabalho e o nomeia Fabric-pool-cluster unique identifier. Não é criado um intervalo diferente para cada volume.
Quando o BlueXP cria o bucket, ele usa as seguintes configurações padrão:
-
Tipo de localização: Região
-
Classe de armazenamento: Padrão
-
Acesso público: Sujeito a ACLs de objeto
-
Controle de acesso: Refinado
-
Proteção: Nenhuma
-
Criptografia de dados: Chave gerenciada pelo Google
-
- Classes de armazenamento
-
A classe de armazenamento padrão para dados em camadas é a classe Standard Storage. Se os dados forem acessados com pouca frequência, você poderá reduzir seus custos de armazenamento alterando para Nearline Storage ou Coldline Storage. Quando você altera a classe de armazenamento, os dados inativos subsequentes são movidos diretamente para a classe que você selecionou.
Todos os dados inativos existentes manterão a classe de armazenamento padrão quando você alterar a classe de armazenamento. Para alterar a classe de storage de dados inativos existentes, você deve executar a designação manualmente. Os custos de acesso são maiores se você acessar os dados, então leve isso em consideração antes de alterar a classe de storage. Para saber mais, "Documentação do Google Cloud: Classes de armazenamento" consulte .
Você pode selecionar uma camada de storage ao criar o ambiente de trabalho e alterá-la a qualquer momento. Para obter detalhes sobre como alterar a classe de armazenamento, "Disposição em camadas dos dados inativos em storage de objetos de baixo custo"consulte .
A classe de storage para disposição de dados em categorias é de todo o sistema, não é por volume.
Disposição de dados em categorias e limites de capacidade
Se você habilitar a disposição de dados em categorias, o limite de capacidade de um sistema permanecerá o mesmo. O limite se estende pela camada de performance e pela camada de capacidade.
Políticas de disposição em camadas de volume
Para habilitar a disposição de dados em categorias, você deve selecionar uma política de disposição em categorias de volume ao criar, modificar ou replicar um volume. Pode selecionar uma política diferente para cada volume.
Algumas políticas de disposição em categorias têm um período de resfriamento mínimo associado, que define o tempo em que os dados do usuário em um volume precisam permanecer inativos para que os dados sejam considerados "frios" e movidos para o nível de capacidade. O período de resfriamento começa quando os dados são gravados no agregado.
Você pode alterar o período mínimo de resfriamento e o limite agregado padrão de 50% (mais sobre isso abaixo). "Saiba como alterar o período de arrefecimento" e "saiba como alterar o limite". |
O BlueXP permite que você escolha uma das seguintes políticas de disposição em categorias de volume ao criar ou modificar um volume:
- Apenas Snapshot
-
Depois que um agregado atinge a capacidade de 50%, o Cloud Volumes ONTAP classifica os dados inativos dos usuários das cópias Snapshot que não estão associados ao sistema de arquivos ativo à categoria de capacidade. O período de resfriamento é de aproximadamente 2 dias.
Se forem lidos, os blocos de dados inativos na camada de capacidade aquecem e são movidos para a categoria de performance.
- Tudo
-
Todos os dados (não incluindo metadados) são imediatamente marcados como frios e dispostos em camadas no storage de objetos o mais rápido possível. Não há necessidade de esperar 48 horas para que novos blocos em um volume fiquem frios. Observe que os blocos localizados no volume antes da política tudo ser definida exigem 48 horas para ficarem frios.
Se lidos, os blocos de dados inativos na categoria de nuvem não são gravados de volta na categoria de performance. Esta política está disponível a partir do ONTAP 9.6.
- Auto
-
Depois que um agregado atinge a capacidade de 50%, o Cloud Volumes ONTAP dispõe de blocos de dados inativos em um volume para uma categoria de capacidade. Os dados inativos incluem não apenas cópias Snapshot, mas também dados de usuários inativos do sistema de arquivos ativo. O período de resfriamento é de aproximadamente 31 dias.
Esta política é suportada a partir do Cloud Volumes ONTAP 9,4.
Se forem lidos por leituras aleatórias, os blocos de dados inativos na camada de capacidade aquecem e migram para a camada de performance. Se forem lidos por leituras sequenciais, como as associadas a verificações de índice e antivírus, os blocos de dados inativos permanecem inativos e não se movem para o nível de desempenho.
- Nenhum
-
Mantém os dados de um volume na categoria de performance, impedindo que ele seja migrado para a categoria de capacidade.
Ao replicar um volume, você pode escolher se deseja categorizar os dados em storage de objetos. Se o fizer, o BlueXP aplica a política Backup ao volume de proteção de dados. A partir do Cloud Volumes ONTAP 9,6, a política de disposição em camadas All substitui a política de backup.
A desativação do Cloud Volumes ONTAP afeta o período de resfriamento
Os blocos de dados são resfriados por exames de resfriamento. Durante este processo, os blocos que não foram usados têm a temperatura do bloco movida (resfriada) para o próximo valor mais baixo. O tempo de resfriamento padrão depende da política de disposição em categorias de volume:
-
Auto: 31 dias
-
Somente snapshot: 2 dias
O Cloud Volumes ONTAP deve estar em execução para que o exame de arrefecimento funcione. Se o Cloud Volumes ONTAP estiver desligado, o resfriamento também parará. Como resultado, você pode experimentar tempos de resfriamento mais longos.
Quando o Cloud Volumes ONTAP é desligado, a temperatura de cada bloco é preservada até que você reinicie o sistema. Por exemplo, se a temperatura de um bloco for 5 quando você desligar o sistema, a temperatura ainda será 5 quando você ligar o sistema novamente. |
Configuração de categorização de dados
Para obter instruções e uma lista de configurações suportadas, "Disposição em camadas dos dados inativos em storage de objetos de baixo custo"consulte .