Administre conectores de Amazon Q Business

Ver información sobre un conector

Puede ver información sobre la configuración de un conector y los orígenes de datos integrados.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
Desde la página de inventario de Bases de conocimiento y conectores, seleccione el conector que desea ver.
Para ver los detalles del conector, seleccione y seleccione Administrar conector.

Esta página muestra el estado Publicado, el estado de incrustación de los orígenes de datos, el modo de incrustación, la lista de todos los orígenes de datos incrustados, etc.

El menú Acciones le permite administrar el conector si desea realizar cambios.

Edite un conector

Puede actualizar un conector cambiando algunos ajustes o puede agregar o eliminar orígenes de datos.

Cada vez que agrega, modifica o elimina fuentes de datos del conector, GenAI necesita enviar la información de origen de datos a Amazon Q Business para que se vuelva a indexar. La sincronización es incremental, por lo que Amazon Q Business solo procesa los objetos de tu volumen de FSx para ONTAP que se han agregado, modificado o eliminado desde la última sincronización.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
En la página de inventario de bases de conocimientos y conectores, seleccione el conector que desea actualizar.
Selecciona y selecciona Administrar conector.

Esta página muestra el estado Publicado, el estado de incrustación de los orígenes de datos, el modo de incrustación, la lista de todos los orígenes de datos incrustados, etc.
Seleccione el menú Acciones y seleccione Editar conector.

En la página Editar conector, puede cambiar el nombre del conector, la descripción, el modelo de incrustación, la habilitación de barandillas de datos y la política de instantáneas utilizada para el volumen que contiene el conector.

Cada escaneo de la fuente de datos, que incluye la incrustación, incurre en un costo. Si habilita las barandillas de datos después de crear un conector, la fuente de datos se escanea de nuevo y conlleva costes.

Seleccione Guardar después de haber realizado los cambios.

Agregue orígenes de datos adicionales a un conector

Puede incrustar orígenes de datos adicionales en el conector para rellenarlo con datos adicionales de la organización.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
En la página de inventario de Knowledge Bases & Connectors, seleccione el conector en el que desea agregar el origen de datos.
Selecciona y selecciona Añadir fuente de datos.
Seleccione el tipo de fuente de datos que desea agregar:
- Agregar el sistema de archivos FSx para ONTAP (usar archivos de un volumen FSx para ONTAP existente)
- Agregar sistema de archivos (utilizar archivos de un recurso compartido SMB o NFS genérico)

Agregar un sistema de archivos FSx para ONTAP

Seleccione un sistema de archivos: Seleccione el sistema de archivos FSX for ONTAP donde residen sus archivos de origen de datos y seleccione Siguiente.
Selecciona un volumen: Selecciona el volumen en el que residen tus archivos de origen de datos y selecciona Siguiente.

Al seleccionar los archivos almacenados mediante el protocolo SMB, deberá introducir la información de Active Directory, que incluye el dominio, la dirección IP, el nombre de usuario y la contraseña.
Seleccione una fuente de datos: Seleccione la ubicación de la fuente de datos en función de dónde haya guardado los archivos. Esto puede ser un volumen completo, o simplemente una carpeta o subcarpeta específica en el volumen, y seleccione Siguiente.

Configuraciones: Configure cómo la fuente de datos ingiere información de sus archivos y qué archivos incluye en los escaneos:

Definir fuente de datos: En la sección Estrategia de Chunking, defina cómo el motor GenAI divide el contenido de la fuente de datos en fragmentos cuando la fuente de datos se integra con una base de conocimientos. Puede elegir una de las siguientes estrategias:
- * Fragmentación de varias frases*: Organiza la información de su fuente de datos en fragmentos definidos por frases. Puedes elegir cuántas oraciones componen cada fragmento (hasta 100).
- * Fragmento basado en superposición *: Organiza la información de su fuente de datos en fragmentos definidos por caracteres que pueden superponerse a fragmentos vecinos. Puedes elegir el tamaño de cada fragmento en caracteres, y cuánto se superpone cada fragmento con fragmentos adyacentes. Puede configurar un tamaño de fragmento de entre 50 y 3000 caracteres, y un porcentaje de superposición de entre 1 y 99%.
  
  La elección de un alto porcentaje de superposición puede aumentar en gran medida los requisitos de almacenamiento con solo pequeñas mejoras en la precisión de la recuperación.
Filtrado de archivos: Configure qué archivos se incluyen en los escaneos:
- En la sección File Types support, elija incluir todos los tipos de archivos o seleccionar tipos de archivos individuales para incluirlos en los escaneos de fuentes de datos.
  
  Si incluye imágenes o archivos PDF, NetApp Workload Factory for GenAI analiza el texto de las imágenes (incluidas las imágenes en documentos PDF), y esto implica un costo mayor.
Al incluir datos de texto de imágenes, GenAI no puede enmascarar la información de identificación personal (PII) de la imagen a medida que los datos de texto escaneados se envían desde su entorno a AWS. Sin embargo, una vez almacenados los datos, todos los PII se enmascaran en la base de datos de GenAI.

Su elección para incluir archivos de imagen en los escaneos está relacionada con el modelo de chat de la base de conocimientos. Si incluye archivos de imagen en los escaneos, el modelo de chat debe admitir imágenes. Si se seleccionan aquí tipos de archivo de imagen, no puede cambiar la base de conocimientos a un modelo de chat que no admita archivos de imagen.

En la sección Filtro de tiempo de modificación de archivo, elija habilitar o deshabilitar la inclusión de archivos en función de su tiempo de modificación. Si activa el filtrado de tiempo de modificación, seleccione un intervalo de fechas de la lista.

Si incluye archivos basados en un rango de fechas de modificación, en cuanto el rango de fechas no se cumpla (los archivos no se han modificado dentro del rango de fechas especificado), los archivos se excluirán de la exploración periódica y el origen de datos no incluirá estos archivos.

En la sección Permission Aware, que solo está disponible cuando el origen de datos que seleccionó está en un volumen que utiliza el protocolo SMB, puede habilitar o deshabilitar las respuestas con permiso:
- Activado: Los usuarios del chatbot que accedan a esta base de conocimientos solo obtendrán respuestas a las consultas de las fuentes de datos a las que tengan acceso.
- Deshabilitado: Los usuarios del chatbot recibirán respuestas usando contenido de todas las fuentes de datos integradas.
Seleccione Agregar para agregar esta fuente de datos a su base de conocimientos.

Agregar un sistema de archivos NFS genérico

Seleccionar un sistema de archivos: Ingrese la dirección IP o FQDN para el host del sistema de archivos donde residen los archivos de origen de datos, elija el protocolo NFS para el recurso compartido de red y seleccione Siguiente.

Seleccione una fuente de datos: Seleccione la ubicación de la fuente de datos en función de dónde haya guardado los archivos. Esto puede ser un volumen completo, o simplemente una carpeta o subcarpeta específica en el volumen, y seleccione Siguiente.

En algunos casos, podría ser necesario introducir manualmente el nombre de la exportación NFS y seleccionar Recuperar directorios para ver los directorios disponibles. Puede seleccionar la exportación completa o solo carpetas específicas.

Configuraciones: Configure cómo la fuente de datos ingiere información de sus archivos y qué archivos incluye en los escaneos:

Definir fuente de datos: En la sección Estrategia de Chunking, defina cómo el motor GenAI divide el contenido de la fuente de datos en fragmentos cuando la fuente de datos se integra con una base de conocimientos. Puede elegir una de las siguientes estrategias:
- * Fragmentación de varias frases*: Organiza la información de su fuente de datos en fragmentos definidos por frases. Puedes elegir cuántas oraciones componen cada fragmento (hasta 100).
- * Fragmento basado en superposición *: Organiza la información de su fuente de datos en fragmentos definidos por caracteres que pueden superponerse a fragmentos vecinos. Puedes elegir el tamaño de cada fragmento en caracteres, y cuánto se superpone cada fragmento con fragmentos adyacentes. Puede configurar un tamaño de fragmento de entre 50 y 3000 caracteres, y un porcentaje de superposición de entre 1 y 99%.
  
  La elección de un alto porcentaje de superposición puede aumentar en gran medida los requisitos de almacenamiento con solo pequeñas mejoras en la precisión de la recuperación.
Filtrado de archivos: Configure qué archivos se incluyen en los escaneos:
- En la sección File Types support, elija incluir todos los tipos de archivos o seleccionar tipos de archivos individuales para incluirlos en los escaneos de fuentes de datos.
  
  Si incluye imágenes o archivos PDF, NetApp Workload Factory for GenAI analiza el texto de las imágenes (incluidas las imágenes en documentos PDF), y esto implica un costo mayor.
Al incluir datos de texto de imágenes, GenAI no puede enmascarar la información de identificación personal (PII) de la imagen a medida que los datos de texto escaneados se envían desde su entorno a AWS. Sin embargo, una vez almacenados los datos, todos los PII se enmascaran en la base de datos de GenAI.

Su elección para incluir archivos de imagen en los escaneos está relacionada con el modelo de chat de la base de conocimientos. Si incluye archivos de imagen en los escaneos, el modelo de chat debe admitir imágenes. Si se seleccionan aquí tipos de archivo de imagen, no puede cambiar la base de conocimientos a un modelo de chat que no admita archivos de imagen.

En la sección Filtro de tiempo de modificación de archivo, elija habilitar o deshabilitar la inclusión de archivos en función de su tiempo de modificación. Si activa el filtrado de tiempo de modificación, seleccione un intervalo de fechas de la lista.

Si incluye archivos basados en un rango de fechas de modificación, en cuanto el rango de fechas no se cumpla (los archivos no se han modificado dentro del rango de fechas especificado), los archivos se excluirán de la exploración periódica y el origen de datos no incluirá estos archivos.

Seleccione Agregar fuente de datos para agregar esta fuente de datos a su base de conocimientos.

Agregar un sistema de archivos SMB genérico

Seleccionar sistema de archivos:
1. Ingrese la dirección IP o FQDN del host del sistema de archivos donde residen los archivos de origen de datos.
2. Seleccione el protocolo SMB para el recurso compartido de red.
3. Ingrese la información de Active Directory, que incluye el dominio, la dirección IP, el nombre de usuario y la contraseña.
4. Seleccione Siguiente.

Seleccione una fuente de datos: Seleccione la ubicación de la fuente de datos en función de dónde haya guardado los archivos. Esto puede ser un volumen completo, o simplemente una carpeta o subcarpeta específica en el volumen, y seleccione Siguiente.

En algunos casos, podría ser necesario introducir manualmente el nombre del recurso compartido SMB y seleccionar Recuperar directorios para ver los directorios disponibles. Puede seleccionar todo el recurso compartido o solo algunas carpetas.

Configuraciones: Configure cómo la fuente de datos ingiere información de sus archivos y qué archivos incluye en los escaneos:

Definir fuente de datos: En la sección Estrategia de Chunking, defina cómo el motor GenAI divide el contenido de la fuente de datos en fragmentos cuando la fuente de datos se integra con una base de conocimientos. Puede elegir una de las siguientes estrategias:
- * Fragmentación de varias frases*: Organiza la información de su fuente de datos en fragmentos definidos por frases. Puedes elegir cuántas oraciones componen cada fragmento (hasta 100).
- * Fragmento basado en superposición *: Organiza la información de su fuente de datos en fragmentos definidos por caracteres que pueden superponerse a fragmentos vecinos. Puedes elegir el tamaño de cada fragmento en caracteres, y cuánto se superpone cada fragmento con fragmentos adyacentes. Puede configurar un tamaño de fragmento de entre 50 y 3000 caracteres, y un porcentaje de superposición de entre 1 y 99%.
  
  La elección de un alto porcentaje de superposición puede aumentar en gran medida los requisitos de almacenamiento con solo pequeñas mejoras en la precisión de la recuperación.
Consciente de permisos: habilitar o deshabilitar respuestas que tengan en cuenta los permisos:
- Activado: Los usuarios del chatbot que accedan a esta base de conocimientos solo obtendrán respuestas a las consultas de las fuentes de datos a las que tengan acceso.
- Deshabilitado: Los usuarios del chatbot recibirán respuestas usando contenido de todas las fuentes de datos integradas.
Filtrado de archivos: Configure qué archivos se incluyen en los escaneos:
- En la sección File Types support, elija incluir todos los tipos de archivos o seleccionar tipos de archivos individuales para incluirlos en los escaneos de fuentes de datos.
  
  Si incluye imágenes o archivos PDF, NetApp Workload Factory for GenAI analiza el texto de las imágenes (incluidas las imágenes en documentos PDF), y esto implica un costo mayor.
Al incluir datos de texto de imágenes, GenAI no puede enmascarar la información de identificación personal (PII) de la imagen a medida que los datos de texto escaneados se envían desde su entorno a AWS. Sin embargo, una vez almacenados los datos, todos los PII se enmascaran en la base de datos de GenAI.

Su elección para incluir archivos de imagen en los escaneos está relacionada con el modelo de chat de la base de conocimientos. Si incluye archivos de imagen en los escaneos, el modelo de chat debe admitir imágenes. Si se seleccionan aquí tipos de archivo de imagen, no puede cambiar la base de conocimientos a un modelo de chat que no admita archivos de imagen.

En la sección Filtro de tiempo de modificación de archivo, elija habilitar o deshabilitar la inclusión de archivos en función de su tiempo de modificación. Si activa el filtrado de tiempo de modificación, seleccione un intervalo de fechas de la lista.

Si incluye archivos basados en un rango de fechas de modificación, en cuanto el rango de fechas no se cumpla (los archivos no se han modificado dentro del rango de fechas especificado), los archivos se excluirán de la exploración periódica y el origen de datos no incluirá estos archivos.

Seleccione Agregar fuente de datos para agregar esta fuente de datos a su base de conocimientos.

Resultado

El origen de datos está integrado en el conector.

Sincronice sus orígenes de datos con un conector

Las fuentes de datos se sincronizan automáticamente con el conector asociado una vez al día para que cualquier cambio en la fuente de datos se refleje en Amazon Q Business. Si realiza cambios en cualquiera de sus orígenes de datos y desea sincronizar (escanear) los datos inmediatamente, puede realizar una sincronización a petición.

La sincronización es incremental, por lo que Amazon Q Business solo procesa los objetos de los orígenes de datos que se han agregado, modificado o eliminado desde la última sincronización.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
Desde el menú Bases de conocimiento y conectores, seleccione el conector que desea sincronizar.
Selecciona y selecciona Administrar conector.
Seleccione el menú Acciones y seleccione Escanear ahora.

Verá un mensaje que indica que se están escaneando las fuentes de datos y un mensaje final cuando se complete el análisis.

Resultado

El conector se sincroniza con las fuentes de datos adjuntas y Amazon Q Business comenzará a utilizar la información más reciente de sus fuentes de datos.

Pausar o reanudar una sincronización programada

Si desea pausar o reanudar la siguiente sincronización (escaneo) de los orígenes de datos, puede hacerlo en cualquier momento. Es posible que deba pausar la siguiente sincronización programada si va a realizar cambios en un origen de datos y no desea que la sincronización se produzca durante la ventana de cambio.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
En la página de inventario de conectores, seleccione el conector para el que desea pausar o reanudar las exploraciones.
Selecciona y selecciona Administrar conector.
Seleccione el menú Acciones y seleccione Escanear > Pausar escaneo programado o Escanear > Reanudar escaneo programado.

Verá un mensaje que indica que el siguiente análisis programado se ha pausado o reanudado.

Eliminar un conector

Si ya no necesita un conector, puede eliminarlo. Cuando se elimina un conector, se elimina de Workload Factory y se elimina el volumen que contiene el conector. La eliminación de un conector no es reversible.

Al suprimir un conector, también debe desasociar el conector de cualquier agente con el que esté asociado para suprimir completamente todos los recursos asociados al conector.

Pasos

Inicie sesión en Workload Factory utilizando uno de los"experiencias de consola" .
En el icono Cargas de trabajo de IA, seleccione Implementar y gestionar.
En la página de inventario de bases de conocimientos y conectores, seleccione el conector que desea suprimir.
Selecciona y selecciona Administrar conector.
Seleccione el menú Acciones y seleccione Borrar conector.
En el cuadro de diálogo Eliminar conector, confirme que desea eliminarlo y seleccione Eliminar.

Resultado

Se elimina el conector de Workload Factory y se elimina su volumen asociado.

Administre conectores de Amazon Q Business

Creating your file...

Ver información sobre un conector

Edite un conector

Agregue orígenes de datos adicionales a un conector

Sincronice sus orígenes de datos con un conector

Pausar o reanudar una sincronización programada

Eliminar un conector