Configurar el origen de datos de Dremio con StorageGRID
Por Angela Cheng
Dremio admite una variedad de fuentes de datos, incluido el almacenamiento de objetos en las instalaciones o basado en cloud. Puede configurar Dremio para que utilice StorageGRID como origen de datos de almacenamiento de objetos.
Configurar el origen de datos de Dremio
Requisitos previos
-
Una URL de extremo de StorageGRID S3, un ID de clave de acceso de inquilino S3 y una clave de acceso secreta.
-
Recomendación de configuración de StorageGRID: Deshabilitar la compresión (deshabilitada de forma predeterminada).
Dremio utiliza el rango de bytes GET para recuperar diferentes rangos de bytes dentro del mismo objeto simultáneamente durante la consulta. El tamaño típico de las solicitudes de rango de bytes es 1MB. El objeto comprimido degrada el RENDIMIENTO DE LA OBTENCIÓN por rango de bytes.
Instrucción
-
En la página Dremio Datasets, haga clic en el signo + para agregar una fuente, seleccione 'Amazon S3'.
-
Introduzca un nombre para este nuevo origen de datos, ID de clave de acceso de inquilino de StorageGRID S3 y clave de acceso secreta.
-
Active la casilla 'Cifrar conexión' si utiliza https para la conexión al punto final StorageGRID S3.
Si utiliza el certificado de CA autofirmado para este punto final S3, siga las instrucciones de la guía de Dremio para agregar este certificado de CA al servidor <JAVA_HOME>/jre/lib/security + de Dremio
Captura de pantalla de ejemplo -
Haga clic en 'Opciones avanzadas', seleccione 'Activar modo de compatibilidad'
-
En Propiedades de conexión, haga clic en + Agregar propiedades y agregue estas S3A propiedades.
-
fs.s3a.connection.el valor por defecto máximo es 100. Si los conjuntos de datos S3 incluyen archivos de parquet grandes con 100 o más columnas, debe introducir un valor mayor que 100. Consulte la guía de Dremio para conocer este ajuste.
Nombre Valor fs.s3a.endpoint
<StorageGRID S3 endpoint:Port>
fs.s3a.path.style.access
verdadero
fs.s3a.conexión.máximo
<un valor mayor que 100>
Captura de pantalla de ejemplo
-
Configure otras opciones de Dremio según los requisitos de su organización o aplicación.
-
Haga clic en el botón Guardar para crear este nuevo origen de datos.
-
Una vez que el origen de datos StorageGRID se haya agregado correctamente, se mostrará una lista de cubos en el panel izquierdo.
Captura de pantalla de ejemplo