Configure a fonte de dados do Dremio com o StorageGRID
Por Angela Cheng
O Dremio dá suporte a uma variedade de fontes de dados, incluindo armazenamento de objetos baseado na nuvem ou no local. Você pode configurar o Dremio para usar o StorageGRID como fonte de dados de armazenamento de objetos.
Configurar a fonte de dados do Dremio
Pré-requisitos
-
Um URL de endpoint do StorageGRID S3, um ID de chave de acesso do locatário S3 e chave de acesso secreta.
-
Recomendação de configuração do StorageGRID: Desativar a compactação (desativada por padrão). Dremio usa o intervalo de bytes get para buscar diferentes intervalos de bytes dentro do mesmo objeto simultaneamente durante a consulta. O tamanho típico para solicitações de intervalo de bytes é 1MB. O objeto comprimido degrada a gama de bytes OBTENHA desempenho.
Instrução
-
Na página Datasets do Dremio, clique em assinar para adicionar uma fonte, selecione 'Amazon S3'.
-
Insira um nome para esta nova fonte de dados, ID da chave de acesso ao locatário do StorageGRID S3 e chave de acesso secreto.
-
Marque a caixa 'criptografar conexão' se estiver usando https para conexão com o endpoint StorageGRID S3. Se estiver usando CA cert autoassinado para este endpoint S3, siga a instrução de guia Dremio para adicionar este CA cert no servidor Dremio <JAVA_HOME>/jre/lib/security sample screenshot
-
Clique em "Opções avançadas", verifique "Ativar modo de compatibilidade"
-
Em Propriedades de conexão, clique em Adicionar propriedades e adicione essas s3a propriedades.
-
fs.s3a.connection.o padrão máximo é 100. Se os conjuntos de dados do S3 incluírem ficheiros Parquet grandes com 100 ou mais colunas, tem de introduzir um valor superior a 100. Consulte o guia Dremio para obter esta definição.
Nome Valor fs.s3a.endpoint
_ Endpoint do cliente StorageGRID S3:port>_
fs.s3a.path.style.access
verdadeiro
fs.s3a.connection.maximum
_ valor de cliente maior que 100>_
Captura de tela de amostra
-
Configure outras opções do Dremio de acordo com os requisitos da sua organização ou aplicação.
-
Clique no botão Salvar para criar esta nova fonte de dados.
-
Depois que a fonte de dados StorageGRID for adicionada com sucesso, uma lista de buckets será exibida no painel esquerdo. * Captura de tela de amostra*