Más información sobre la clasificación de BlueXP
La clasificación de BlueXP (Cloud Data Sense) es un servicio de gobernanza de datos para BlueXP que analiza tus fuentes de datos corporativas on-premises y en la nube para asignar y clasificar datos, así como para identificar la información privada. Esto puede ayudarle a reducir los riesgos de seguridad y de cumplimiento de normativas, a reducir los costes de almacenamiento y a facilitar los proyectos de migración de datos.
IMPORTANTE
A partir de mayo de 2024 con la versión 1,31, la clasificación de BlueXP ahora está disponible como funcionalidad básica en BlueXP sin coste adicional. No se requiere licencia de clasificación o suscripción. También hemos centrado la funcionalidad de clasificación de BlueXP en sistemas de almacenamiento de NetApp, por lo que algunas características no utilizadas o infrautilizadas han quedado obsoletas.
Los usuarios que hayan estado utilizando versiones heredadas 1,30 o anteriores seguirán pudiendo usar esa versión hasta que caduque su suscripción.
Funciones
La clasificación de BlueXP utiliza la inteligencia artificial (IA), el procesamiento del lenguaje natural (NLP) y el aprendizaje automático (ML) para entender el contenido que escanea y, así, extraer entidades y categorizar el contenido debidamente. Esto permite la clasificación de BlueXP para proporcionar las siguientes áreas de funcionalidad.
La clasificación de BlueXP proporciona varias herramientas que pueden ayudarte en tus tareas de cumplimiento de normativas. Puedes usar la clasificación de BlueXP para lo siguiente:
-
Identificación de la Información personal de identificación (PII).
-
Identificar un amplio alcance de información personal confidencial según las normativas de privacidad del RGPD, la CCPA, el PCI y la HIPAA.
-
Responda a las solicitudes de acceso de sujetos de datos (DSAR) en función del nombre o la dirección de correo electrónico.
La clasificación de BlueXP puede identificar los datos a los que podría correr riesgo de acceder con fines criminales. Puedes usar la clasificación de BlueXP para lo siguiente:
-
Identifique todos los archivos y directorios (recursos compartidos y carpetas) con permisos abiertos que se exponen a toda la organización o al público.
-
Identifique los datos confidenciales que se encuentran fuera de la ubicación inicial dedicada.
-
Cumpla con las políticas de retención de datos.
-
Utilice Policies para detectar automáticamente nuevos problemas de seguridad para que el personal de seguridad pueda actuar inmediatamente.
La clasificación de BlueXP proporciona herramientas que pueden ayudarte con el TCO (TCO) de tu almacenamiento. Puedes usar la clasificación de BlueXP para lo siguiente:
-
Aumente la eficiencia del almacenamiento identificando datos duplicados o no relacionados con la empresa.
-
Ahorre en costes de almacenamiento identificando los datos inactivos que puede establecer niveles en almacenamiento de objetos más económico. "Obtenga más información sobre la organización en niveles en sistemas Cloud Volumes ONTAP". "Obtenga más información acerca de la organización en niveles desde sistemas ONTAP en las instalaciones".
Entornos de trabajo y fuentes de datos compatibles
La clasificación de BlueXP puede analizar y analizar datos estructurados y no estructurados a partir de los siguientes tipos de entornos de trabajo y fuentes de datos:
Entornos de trabajo
-
Cloud Volumes ONTAP (implementado en AWS, Azure o GCP)
-
Clústeres de ONTAP en las instalaciones
-
StorageGRID
-
Azure NetApp Files
-
Amazon FSX para ONTAP
-
NetApp Volumes para Google Cloud
Fuentes de datos
-
Recursos compartidos de archivos NetApp
-
Bases de datos:
-
Servicio de bases de datos relacionales de Amazon (Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
Servidor SQL (MSSQL)
-
La clasificación de BlueXP es compatible con las versiones de NFS 3.x, 4,0 y 4,1, y las versiones de CIFS 1.x, 2,0, 2,1 y 3,0.
Coste
La clasificación de BlueXP ahora es gratuita. No se requiere licencia de clasificación ni suscripción de pago.
Costes de infraestructura
-
Para instalar la clasificación de BlueXP en la nube, es necesario poner en marcha una instancia de nube, lo que se genera en los cargos del proveedor de nube en el que se la pone en marcha. Consulte el tipo de instancia que se pone en marcha en cada cloud proveedor. No hay coste si instalas la clasificación de BlueXP en un sistema on-premises.
-
Para la clasificación de BlueXP es necesario que hayas puesto en marcha un conector BlueXP. En muchos casos ya tiene un conector debido a otros servicios y almacenamiento que está utilizando en BlueXP. La instancia de Connector representa cargos del proveedor de cloud en el que se ha puesto en marcha. Consulte "tipo de instancia que se pone en marcha para cada proveedor de cloud". No hay costo si instala el conector en un sistema local.
Costes de transferencia de datos
Los costes de la transferencia de datos dependen de su configuración. Si la instancia de clasificación y el origen de datos de BlueXP se encuentran en la misma zona y región de disponibilidad, no hay costes de transferencia de datos. Pero si el origen de datos, como un sistema Cloud Volumes ONTAP, se encuentra en una zona o región de disponibilidad diferente, su proveedor de cloud le cobrará los costes de transferencia de datos. Consulte estos enlaces para obtener más información:
La instancia de clasificación de BlueXP
Cuando pones en marcha la clasificación de BlueXP en la nube, BlueXP pone en marcha la instancia en la misma subred que Connector. "Más información sobre conectores."
Tenga en cuenta lo siguiente acerca de la instancia predeterminada:
-
En AWS, la clasificación de BlueXP se ejecuta en un "instancia m6i.4xlarge" Con un disco GP2 de 500 GIB. La imagen del sistema operativo es Amazon Linux 2. Cuando se implementa en AWS, puede elegir un tamaño de instancia más pequeño si va a escanear una pequeña cantidad de datos.
-
En Azure, la clasificación BlueXP se ejecuta en "VM Standard_D16s_v3"un con un disco de 500 GiB. La imagen del sistema operativo es Ubuntu 22,04.
-
En GCP, la clasificación de BlueXP se ejecuta en un "n2-Standard-16 VM"disco persistente estándar de 500 GiB. La imagen del sistema operativo es Ubuntu 22,04.
-
En las regiones en las que la instancia predeterminada no está disponible, la clasificación de BlueXP se ejecuta en una instancia alternativa. "Consulte los tipos de instancia alternativa".
-
La instancia se denomina CloudCompliance con un hash generado (UUID) concatenado. Por ejemplo: CloudCompliance-16bb6564-38ad-4080-9a92-36f5fd2f71c7
-
Solo se pone en marcha una instancia de clasificación de BlueXP por cada Connector.
También puedes poner en marcha la clasificación de BlueXP en un host Linux on-premises o en un host de tu proveedor de nube preferido. El software funciona exactamente de la misma manera, independientemente del método de instalación que elija. Las actualizaciones del software de clasificación de BlueXP se automatizan siempre que la instancia tenga acceso a Internet.
La instancia debe permanecer ejecutándose en todo momento porque la clasificación de BlueXP analiza los datos de forma continua. |
Desplegar en diferentes tipos de instancia
Puedes poner en marcha la clasificación de BlueXP en un sistema con menos CPU y menos RAM.
Tamaño del sistema | Especificaciones | Limitaciones |
---|---|---|
Extra grande |
32 CPU, 128 GB de RAM, SSD de 1 TiB |
Puede escanear hasta 500 millones de archivos. |
Grande (predeterminado) |
16 CPU, 64 GB de RAM, 500 GIB de SSD |
Puede escanear hasta 250 millones de archivos. |
Al poner en marcha la clasificación de BlueXP en Azure o GCP, envía un correo electrónico a ng-contact-data-sense@netapp.com para obtener ayuda si quieres usar un tipo de instancia más pequeño.
Funcionamiento de la clasificación de BlueXP
En un nivel alto, la clasificación de BlueXP funciona así:
-
Implementas una instancia de clasificación de BlueXP en BlueXP.
-
Puede activar la asignación de alto nivel o el análisis de alto nivel en uno o más orígenes de datos.
-
La clasificación de BlueXP analiza los datos mediante un proceso de aprendizaje de IA.
-
Utilice las consolas y herramientas de informes que se proporcionan con el fin de ayudarle en sus esfuerzos de cumplimiento de normativas y gobierno.
Cómo funcionan las exploraciones
Después de habilitar la clasificación de BlueXP y seleccionar los repositorios que desea analizar (estos son los volúmenes, esquemas de base de datos u otros datos de usuario), comienza de inmediato a analizar los datos para identificar los datos personales y confidenciales. Debería centrarse en analizar los datos de producción en directo en la mayoría de los casos en lugar de realizar backups, duplicados o sitios de recuperación ante desastres. A continuación, la clasificación de BlueXP asigna sus datos de organización, categoriza cada archivo e identifica y extrae entidades y patrones predefinidos en los datos. El resultado de la exploración es un índice de información personal, información personal confidencial, categorías de datos y tipos de archivo.
La clasificación de BlueXP se conecta a los datos igual que cualquier otro cliente ya que se monta en los volúmenes de NFS y CIFS. Se accede automáticamente a los volúmenes NFS como de solo lectura, mientras que se necesitan proporcionar credenciales de Active Directory para analizar volúmenes CIFS.
Tras el análisis inicial, la clasificación de BlueXP analiza continuamente los datos por turnos para detectar los cambios incrementales (por este motivo es importante mantener la instancia en ejecución).
Puede activar y desactivar las exploraciones a nivel de volumen o en el nivel de esquema de base de datos.
¿Cuál es la diferencia entre las exploraciones de asignación y clasificación
La clasificación de BlueXP te permite ejecutar un análisis general de «asignaciones» en fuentes de datos seleccionadas. La asignación sólo ofrece una descripción general de alto nivel de los datos, mientras que la clasificación proporciona un análisis profundo de los datos. La asignación se puede realizar en sus orígenes de datos muy rápidamente porque no tiene acceso a los archivos para ver los datos dentro.
A muchos usuarios les gusta esta funcionalidad porque quieren analizar rápidamente sus datos para identificar los orígenes de datos que requieren más investigación y, a continuación, pueden habilitar análisis de clasificación solo en los orígenes o volúmenes de datos necesarios.
En la siguiente tabla se muestran algunas de las diferencias:
Función | Clasificación | Asignación |
---|---|---|
Velocidad de escaneado |
Lento |
Y rápido |
precios |
Libre |
Libre |
Capacidad |
Limitado a 500 TB |
Limitado a 500 TB |
Lista de tipos de archivo y capacidad utilizada |
Sí |
Sí |
Número de archivos y capacidad utilizada |
Sí |
Sí |
Antigüedad y tamaño de los archivos |
Sí |
Sí |
Capacidad de ejecutar una "Informe de asignación de datos" |
Sí |
Sí |
Página de investigación de datos para ver los detalles del archivo |
Sí |
No |
Buscar nombres dentro de los archivos |
Sí |
No |
Cree "normativas" que proporcionan resultados de búsqueda personalizados |
Sí |
No |
Capacidad para ejecutar otros informes |
Sí |
No |
Posibilidad de ver metadatos de archivos* |
No |
Sí |
*Los siguientes metadatos se extraen de los archivos durante los escaneos de mapeo:
-
Entorno de trabajo
-
Tipo de entorno de trabajo
-
Repositorio de almacenamiento
-
Tipo de archivo
-
Capacidad utilizada
-
Número de archivos
-
Tamaño de archivo
-
Creación de archivos
-
Último acceso al archivo
-
Última modificación del archivo
-
Hora de detección de archivo
-
Extracción de permisos
Diferencias en el panel de control:
Función | Asignar y clasificar | Asignar |
---|---|---|
Datos obsoletos |
Sí |
Sí |
Datos no empresariales |
Sí |
Sí |
Archivos duplicados |
Sí |
Sí |
Políticas predefinidas |
Sí |
No |
Políticas personalizadas |
Sí |
Sí |
Informe DDA |
Sí |
Sí |
Informe de asignación |
Sí |
Sí |
Detección del nivel de sensibilidad |
Sí |
No |
Datos confidenciales con amplios permisos |
Sí |
No |
Permisos abiertos |
Sí |
Sí |
Antigüedad de los datos |
Sí |
Sí |
Tamaño de los datos |
Sí |
Sí |
Categorías |
Sí |
No |
Tipos de archivo |
Sí |
Sí |
Diferencias en el panel de cumplimiento:
Función | Asignar y clasificar | Asignar |
---|---|---|
Información personal |
Sí |
No |
Información personal confidencial |
Sí |
No |
Informe de evaluación de riesgos de privacidad |
Sí |
No |
Informe HIPAA |
Sí |
No |
Informe PCI DSS |
Sí |
No |
La investigación filtra las diferencias:
Función | Asignar y clasificar | Asignar |
---|---|---|
Normativas |
Sí |
Sí |
Tipo de entorno de trabajo |
Sí |
Sí |
Entorno de trabajo |
Sí |
Sí |
Repositorio de almacenamiento |
Sí |
Sí |
Tipo de archivo |
Sí |
Sí |
Tamaño de archivo |
Sí |
Sí |
Hora de creación |
Sí |
Sí |
Hora de detección |
Sí |
Sí |
Última modificación |
Sí |
Sí |
Último acceso |
Sí |
Sí |
Permisos abiertos |
Sí |
Sí |
Ruta del directorio de archivos |
Sí |
Sí |
Categoría |
Sí |
No |
Nivel de sensibilidad |
Sí |
No |
Número de identificadores |
Sí |
No |
Datos personales |
Sí |
No |
Datos personales confidenciales |
Sí |
No |
Sujeto de datos |
Sí |
No |
Duplicados |
Sí |
Sí |
Estado de clasificación |
Sí |
El estado es siempre «Información limitada» |
Evento de análisis de adquisición |
Sí |
Sí |
Hash de archivo |
Sí |
Sí |
Número de usuarios con acceso |
Sí |
Sí |
Permisos de usuario/grupo |
Sí |
Sí |
Propietario del archivo |
Sí |
Sí |
Tipo de directorio |
Sí |
Sí |
Con qué rapidez escanea los datos de clasificación de BlueXP
La velocidad de análisis se ve afectada por la latencia de la red, la latencia del disco, el ancho de banda de la red, el tamaño del entorno y los tamaños de distribución de archivos.
-
Al realizar escaneos de mapeo, la clasificación de BlueXP puede analizar entre 100-150 TIBs de datos al día.
-
Al realizar análisis de clasificación, la clasificación de BlueXP puede analizar entre 15-40 TIBs de datos al día.
Información que clasifica BlueXP
La clasificación de BlueXP recopila, indexa y asigna categorías a tus datos (archivos). Los datos que indexa la clasificación de BlueXP incluyen los siguientes:
-
Metadatos estándar sobre archivos: Tipo de archivo, tamaño, fecha de creación y modificación, etc.
-
Datos personales: Información de identificación personal (PII) como direcciones de correo electrónico, números de identificación o números de tarjetas de crédito. "Más información sobre datos personales".
-
Datos personales sensibles: Tipos especiales de información personal sensible (SPII), como datos de salud, origen étnico u opiniones políticas, según lo definido por el RGPD y otras regulaciones de privacidad. "Más información sobre datos personales confidenciales".
-
Categorías: La clasificación de BlueXP toma los datos que escaneó y los divide en diferentes tipos de categorías. Las categorías son temas basados en el análisis de IA del contenido y los metadatos de cada archivo. "Más información sobre categorías".
-
Tipos: La clasificación de BlueXP toma los datos que escaneó y los desglosa por tipo de archivo. "Obtenga más información sobre los tipos".
-
Reconocimiento de entidades de nombre: La clasificación BlueXP utiliza la IA para extraer los nombres naturales de las personas de los documentos. "Obtenga información sobre cómo responder a las solicitudes de acceso a sujetos de datos".
Información general sobre redes
BlueXP implementa la instancia de clasificación de BlueXP con un grupo de seguridad que permite las conexiones HTTP de entrada desde la instancia de Connector.
Cuando se utiliza BlueXP en el modo SaaS, la conexión a BlueXP se establece a través de HTTPS, y los datos privados que se envían entre su navegador y la instancia de clasificación de BlueXP se protegen con un cifrado integral mediante TLS 1,2, lo que significa que NetApp y terceros no podrán leerlo.
Las reglas salientes están completamente abiertas. Se necesita acceso a Internet para instalar y actualizar el software de clasificación de BlueXP y para enviar las métricas de uso.
Si tiene requisitos estrictos de red, "Obtén más información sobre los extremos que contactos de clasificación de BlueXP".
Roles de usuario en la clasificación BlueXP
El rol asignado a cada usuario proporciona diferentes capacidades dentro de BlueXP y dentro de la clasificación BlueXP . Si quiere más información, consulte lo siguiente:
-
"Roles de IAM de BlueXP " (Cuando se utiliza BlueXP en modo estándar)
-
"Roles de cuenta de BlueXP " (Cuando se utiliza BlueXP en modo restringido o en modo privado)