Skip to main content
BlueXP classification
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Más información sobre la clasificación de BlueXP

Colaboradores netapp-tonacki amgrissino netapp-ahibbard netapp-bcammett

La clasificación de BlueXP (Cloud Data Sense) es un servicio de gobernanza de datos para BlueXP que analiza tus fuentes de datos corporativas on-premises y en la nube para asignar y clasificar datos, así como para identificar la información privada. Esto puede ayudarle a reducir los riesgos de seguridad y de cumplimiento de normativas, a reducir los costes de almacenamiento y a facilitar los proyectos de migración de datos.

Importante A partir de la versión 1,31, la clasificación BlueXP  está disponible como funcionalidad principal con BlueXP . Sin cargo adicional. No se requiere licencia de clasificación o suscripción. + Si has estado usando la versión heredada 1,30 o anterior, esa versión está disponible hasta que caduque tu suscripción. "Vea una lista de características anticuadas".

Funciones

La clasificación de BlueXP utiliza la inteligencia artificial (IA), el procesamiento del lenguaje natural (NLP) y el aprendizaje automático (ML) para entender el contenido que escanea y, así, extraer entidades y categorizar el contenido debidamente. Esto permite la clasificación de BlueXP para proporcionar las siguientes áreas de funcionalidad.

Mantenga el cumplimiento normativo

La clasificación de BlueXP proporciona varias herramientas que pueden ayudarte en tus tareas de cumplimiento de normativas. Puedes usar la clasificación de BlueXP para lo siguiente:

  • Identificación de la Información personal de identificación (PII).

  • Identificar un amplio alcance de información personal confidencial según las normativas de privacidad del RGPD, la CCPA, el PCI y la HIPAA.

  • Responda a las solicitudes de acceso de sujetos de datos (DSAR) en función del nombre o la dirección de correo electrónico.

Refuerce la seguridad

La clasificación de BlueXP puede identificar los datos a los que podría correr riesgo de acceder con fines criminales. Puedes usar la clasificación de BlueXP para lo siguiente:

  • Identifique todos los archivos y directorios (recursos compartidos y carpetas) con permisos abiertos que se exponen a toda la organización o al público.

  • Identifique los datos confidenciales que se encuentran fuera de la ubicación inicial dedicada.

  • Cumpla con las políticas de retención de datos.

  • Utilice Policies para detectar automáticamente nuevos problemas de seguridad para que el personal de seguridad pueda actuar de inmediato.

Optimice la utilización del almacenamiento

La clasificación de BlueXP proporciona herramientas que pueden ayudarte con el TCO (TCO) de tu almacenamiento. Puedes usar la clasificación de BlueXP para lo siguiente:

Entornos de trabajo y fuentes de datos compatibles

La clasificación de BlueXP puede analizar y analizar datos estructurados y no estructurados a partir de los siguientes tipos de entornos de trabajo y fuentes de datos:

Entornos de trabajo

  • Amazon FSX para ONTAP

  • Azure NetApp Files

  • Cloud Volumes ONTAP (implementado en AWS, Azure o GCP)

  • Clústeres de ONTAP en las instalaciones

  • StorageGRID

Fuentes de datos

  • Recursos compartidos de archivos NetApp

  • Bases de datos:

    • Servicio de bases de datos relacionales de Amazon (Amazon RDS)

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • Servidor SQL (MSSQL)

La clasificación de BlueXP es compatible con las versiones de NFS 3.x, 4,0 y 4,1, y las versiones de CIFS 1.x, 2,0, 2,1 y 3,0.

Coste

La clasificación BlueXP  es de uso gratuito. No se requiere licencia de clasificación ni suscripción de pago.

Costes de infraestructura

  • Para instalar la clasificación de BlueXP en la nube, es necesario poner en marcha una instancia de nube, lo que se genera en los cargos del proveedor de nube en el que se la pone en marcha. Consulte el tipo de instancia que se pone en marcha en cada cloud proveedor. No hay coste si instalas la clasificación de BlueXP en un sistema on-premises.

  • Para la clasificación de BlueXP es necesario que hayas puesto en marcha un conector BlueXP. En muchos casos ya tiene un conector debido a otros servicios y almacenamiento que está utilizando en BlueXP. La instancia de Connector representa cargos del proveedor de cloud en el que se ha puesto en marcha. Consulte "tipo de instancia que se pone en marcha para cada proveedor de cloud". No hay costo si instala el conector en un sistema local.

Costes de transferencia de datos

Los costes de la transferencia de datos dependen de su configuración. Si la instancia de clasificación y el origen de datos de BlueXP se encuentran en la misma zona y región de disponibilidad, no hay costes de transferencia de datos. Pero si el origen de datos, como un sistema Cloud Volumes ONTAP, se encuentra en una zona o región de disponibilidad diferente, su proveedor de cloud le cobrará los costes de transferencia de datos. Consulte estos enlaces para obtener más información:

La instancia de clasificación de BlueXP

Cuando pones en marcha la clasificación de BlueXP en la nube, BlueXP pone en marcha la instancia en la misma subred que Connector. "Más información sobre conectores."

Un diagrama que muestra una instancia de BlueXP y una instancia de clasificación de BlueXP que se ejecuta en tu proveedor de cloud.

Tenga en cuenta lo siguiente acerca de la instancia predeterminada:

  • En AWS, la clasificación de BlueXP se ejecuta en un "instancia m6i.4xlarge" Con un disco GP2 de 500 GIB. La imagen del sistema operativo es Amazon Linux 2. Cuando se implementa en AWS, puede elegir un tamaño de instancia más pequeño si va a escanear una pequeña cantidad de datos.

  • En Azure, la clasificación BlueXP  se ejecuta en "VM Standard_D16s_v3"un con un disco de 500 GiB. La imagen del sistema operativo es Ubuntu 22,04.

  • En GCP, la clasificación de BlueXP  se ejecuta en un "n2-Standard-16 VM"disco persistente estándar de 500 GiB. La imagen del sistema operativo es Ubuntu 22,04.

  • En las regiones en las que la instancia predeterminada no está disponible, la clasificación de BlueXP se ejecuta en una instancia alternativa. "Consulte los tipos de instancia alternativa".

  • La instancia se denomina CloudCompliance con un hash generado (UUID) concatenado. Por ejemplo: CloudCompliance-16bb6564-38ad-4080-9a92-36f5fd2f71c7

  • Solo se pone en marcha una instancia de clasificación de BlueXP por cada Connector.

También puedes poner en marcha la clasificación de BlueXP en un host Linux on-premises o en un host de tu proveedor de nube preferido. El software funciona exactamente de la misma manera, independientemente del método de instalación que elija. Las actualizaciones del software de clasificación BlueXP se automatizan siempre que la instancia tenga acceso a Internet.

Consejo La instancia debe permanecer ejecutándose en todo momento porque la clasificación de BlueXP analiza los datos de forma continua.

Desplegar en diferentes tipos de instancia

Revise las siguientes especificaciones para los tipos de instancias:

Tamaño del sistema Especificaciones Limitaciones

Extra grande

32 CPU, 128 GB de RAM, SSD de 1 TiB

Puede escanear hasta 500 millones de archivos.

Grande (predeterminado)

16 CPU, 64 GB de RAM, 500 GIB de SSD

Puede escanear hasta 250 millones de archivos.

Al poner en marcha la clasificación de BlueXP en Azure o GCP, envía un correo electrónico a ng-contact-data-sense@netapp.com para obtener ayuda si quieres usar un tipo de instancia más pequeño.

Cómo funciona el escaneo de clasificación BlueXP 

En un nivel alto, el escaneo de clasificación BlueXP  funciona de la siguiente manera:

  1. Implementas una instancia de clasificación de BlueXP en BlueXP.

  2. Puede activar la asignación de alto nivel (denominada Mapping Only exploraciones) o la exploración de nivel profundo (denominada Map & Classify exploraciones) en uno o más orígenes de datos.

  3. La clasificación de BlueXP analiza los datos mediante un proceso de aprendizaje de IA.

  4. Utilice las consolas y herramientas de informes que se proporcionan con el fin de ayudarle en sus esfuerzos de cumplimiento de normativas y gobierno.

Después de habilitar la clasificación de BlueXP y seleccionar los repositorios que desea analizar (estos son los volúmenes, esquemas de base de datos u otros datos de usuario), comienza de inmediato a analizar los datos para identificar los datos personales y confidenciales. Debería centrarse en analizar los datos de producción en directo en la mayoría de los casos en lugar de realizar backups, duplicados o sitios de recuperación ante desastres. A continuación, la clasificación de BlueXP asigna sus datos de organización, categoriza cada archivo e identifica y extrae entidades y patrones predefinidos en los datos. El resultado de la exploración es un índice de información personal, información personal confidencial, categorías de datos y tipos de archivo.

La clasificación de BlueXP se conecta a los datos igual que cualquier otro cliente ya que se monta en los volúmenes de NFS y CIFS. Se accede automáticamente a los volúmenes NFS como de solo lectura, mientras que se necesitan proporcionar credenciales de Active Directory para analizar volúmenes CIFS.

Un diagrama que muestra una instancia de BlueXP y una instancia de clasificación de BlueXP que se ejecuta en tu proveedor de cloud. La instancia de clasificación de BlueXP se conecta a volúmenes y bases de datos NFS y CIFS para analizarlos.

Después de la exploración inicial, la clasificación BlueXP  analiza continuamente los datos de forma por turnos para detectar cambios incrementales. Por eso es importante mantener la instancia en ejecución.

Puede habilitar y deshabilitar escaneos a nivel de volumen o a nivel de esquema de base de datos.

Nota La BlueXP classification no impone un límite en la cantidad de datos que puede escanear. Cada conector admite el escaneo y la visualización de 500 TiB de datos. Para escanear más de 500 TiB de datos,"instalar otro conector" entonces"Implementar otra instancia de BlueXP classification" . La interfaz de usuario de BlueXP muestra datos de un solo conector. Para obtener sugerencias sobre cómo ver datos de varios conectores, consulte"Trabaje con varios conectores" .

¿Cuál es la diferencia entre las exploraciones de asignación y clasificación

Puede realizar dos tipos de exploraciones en la clasificación BlueXP :

  • Los escaneos de solo mapeo proporcionan solo una visión general de alto nivel de sus datos y se realizan en fuentes de datos seleccionadas. Los escaneos de solo mapeo toman menos tiempo que los escaneos de mapas y clasificación porque no acceden a los archivos para ver los datos dentro. Es posible que desee realizar esta operación inicialmente para identificar áreas de investigación y, a continuación, realizar una exploración de Mapa y Clasificación en dichas áreas.

  • Los escaneos Map & Classify proporcionan un escaneo profundo de sus datos.

Para obtener más información sobre las diferencias entre las exploraciones de asignación y clasificación, consulte "¿Cuál es la diferencia entre las exploraciones de mapeo y clasificación?".

Información que clasifica BlueXP 

La clasificación BlueXP  recopila, indexa y asigna categorías a los siguientes datos:

  • Metadatos estándar sobre archivos: Tipo de archivo, tamaño, fecha de creación y modificación, etc.

  • Datos personales: Información de identificación personal (PII) como direcciones de correo electrónico, números de identificación o números de tarjetas de crédito, que la clasificación BlueXP  identifica usando palabras, cadenas y patrones específicos en los archivos. "Más información sobre datos personales".

  • Datos personales sensibles: Tipos especiales de información personal sensible (SPII), como datos de salud, origen étnico u opiniones políticas, según lo definido por el Reglamento General de Protección de Datos (GDPR) y otras regulaciones de privacidad. "Más información sobre datos personales confidenciales".

  • Categorías: La clasificación de BlueXP toma los datos que escaneó y los divide en diferentes tipos de categorías. Las categorías son temas basados en el análisis de IA del contenido y los metadatos de cada archivo. "Más información sobre categorías".

  • Tipos: La clasificación de BlueXP toma los datos que escaneó y los desglosa por tipo de archivo. "Obtenga más información sobre los tipos".

  • Reconocimiento de entidades de nombre: La clasificación BlueXP  utiliza IA para extraer los nombres naturales de las personas de los documentos. "Obtenga información sobre cómo responder a las solicitudes de acceso a sujetos de datos".

Información general sobre redes

La clasificación de BlueXP pone en marcha un único servidor o clúster, donde quieras, tanto en la nube como on-premises. Los servidores se conectan mediante protocolos estándar a los orígenes de datos e indexan los hallazgos de un clúster Elasticsearch, que también se implementa en los mismos servidores. Esto hace posible la compatibilidad con entornos multicloud, entre clouds, de cloud privado y en las instalaciones.

BlueXP implementa la instancia de clasificación de BlueXP con un grupo de seguridad que permite las conexiones HTTP de entrada desde la instancia de Connector.

Cuando usa BlueXP  en modo SaaS, la conexión a BlueXP  se establece a través de HTTPS, y los datos privados que se envían entre su navegador y la instancia de clasificación de BlueXP  se protegen con un cifrado integral que usa TLS 1,2, lo que significa que ni NetApp ni terceros podrán leerlo.

Las reglas salientes están completamente abiertas. Se necesita acceso a Internet para instalar y actualizar el software de clasificación de BlueXP y para enviar las métricas de uso.