Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Découvrez la classification BlueXP

Contributeurs

La classification BlueXP (Cloud Data Sense) est un service de gouvernance des données pour BlueXP qui analyse vos sources de données cloud et sur site pour cartographier et classer les données, et identifier les informations privées. Cela peut réduire les risques liés à la sécurité et à la conformité, diminuer les coûts de stockage et vous aider dans vos projets de migration des données.

IMPORTANT

À partir de mai 2024 avec la version 1.31, la classification BlueXP est désormais disponible en tant que fonctionnalité clé dans BlueXP, sans frais supplémentaires. Aucune licence de classification ni aucun abonnement n'est requis. Nous avons également concentré la fonctionnalité de classification BlueXP sur les systèmes de stockage NetApp. Ainsi, certaines fonctionnalités inutilisées ou sous-utilisées ont été désapprouvées.

Les utilisateurs qui utilisent des versions 1.30 ou antérieures héritées pourront continuer à utiliser cette version jusqu'à expiration de leur abonnement.

Caractéristiques

La classification BlueXP utilise l'intelligence artificielle (IA), le traitement du langage naturel (NLP) et LE machine learning (ML) pour comprendre le contenu qu'il analyse afin d'extraire des entités et de répartir le contenu par catégorie. Ceci permet à la classification BlueXP de fournir les domaines de fonctionnalité suivants.

Préservez la conformité

La classification BlueXP offre plusieurs outils qui vous aident dans vos efforts de conformité. Vous pouvez utiliser la classification BlueXP pour :

  • Identifier les informations à caractère personnel

  • Identifier une vaste portée des données personnelles sensibles, conformément aux réglementations en matière de confidentialité, RGPD, CCPA, PCI et HIPAA.

  • Répondez aux demandes d'accès aux données (DSAR, Data Subject Access Requests) en fonction de votre nom ou de votre adresse e-mail.

Renforcez la sécurité

La classification BlueXP permet d'identifier les données potentiellement menacées d'accès à des fins criminelles. Vous pouvez utiliser la classification BlueXP pour :

  • Identifiez tous les fichiers et répertoires (partages et dossiers) avec les autorisations ouvertes exposées à l'ensemble de votre organisation ou au public.

  • Identifiez les données sensibles qui se trouvent en dehors de l'emplacement initial dédié.

  • Respectez les règles de conservation des données.

  • Utilisez Policies pour détecter automatiquement les nouveaux problèmes de sécurité afin que le personnel de sécurité puisse agir immédiatement.

Optimiser l'utilisation du stockage

La classification BlueXP fournit des outils qui vous aideront à maîtriser votre TCO. Vous pouvez utiliser la classification BlueXP pour :

Environnements de travail et sources de données pris en charge

La classification BlueXP peut analyser et analyser les données structurées et non structurées à partir des types d'environnements de travail et de sources de données suivants :

Environnements de travail

  • Cloud Volumes ONTAP (déployé dans AWS, Azure ou GCP)

  • Clusters ONTAP sur site

  • Azure NetApp Files

  • Amazon FSX pour ONTAP

  • Google Cloud NetApp volumes

Sources de données

  • Partages de fichiers NetApp

  • Bases de données :

    • Amazon Relational Database Service (Amazon RDS)

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • Serveur SQL (MSSQL)

La classification BlueXP prend en charge les versions NFS 3.x et CIFS 1.x, 2.0, 2.1 et 3.0.

Le coût

La classification BlueXP est désormais gratuite. Aucune licence de classification ou abonnement payant n'est nécessaire.

Coûts d'infrastructure

  • L'installation de la classification BlueXP dans le cloud nécessite le déploiement d'une instance cloud, ce qui entraîne des frais du fournisseur cloud où il est déployé. Voir type d'instance déployé pour chaque fournisseur cloud. L'installation de la classification BlueXP sur un système sur site est gratuit.

  • Pour classification BlueXP, vous devez avoir déployé un connecteur BlueXP. Dans de nombreux cas, vous disposez déjà d'un connecteur en raison d'autres services et stockages que vous utilisez dans BlueXP. L'instance de connecteur entraîne des frais supplémentaires du fournisseur cloud sur lequel elle est déployée. Voir la "type d'instance déployé pour chaque fournisseur cloud". L'installation du connecteur sur un système sur site est gratuite.

Coûts de transfert de données

Les coûts de transfert de données dépendent de votre configuration. Si l'instance de classification BlueXP et la source de données se trouvent dans la même zone de disponibilité et dans la même région, aucun coût de transfert de données n'est applicable. Mais si la source de données, comme un système Cloud Volumes ONTAP, se trouve dans une zone de disponibilité ou une région différente, les coûts de transfert des données vous seront facturés par votre fournisseur cloud. Consultez ces liens pour en savoir plus :

Instance de classification BlueXP

Lorsque vous déployez la classification BlueXP dans le cloud, BlueXP déploie l'instance dans le même sous-réseau que le connecteur. "En savoir plus sur les connecteurs."

Diagramme illustrant une instance BlueXP et une instance de classification BlueXP exécutée dans votre fournisseur cloud.

Voici la liste des éléments suivants pour l'instance par défaut :

  • Dans AWS, la classification BlueXP s'exécute sur un "instance m6i.4xlarge" Avec un disque GP2 de 500 Gio. L'image du système d'exploitation est Amazon Linux 2. Lorsqu'elle est déployée dans AWS, vous pouvez choisir une instance de plus petite taille si vous analysez un petit volume de données.

  • Dans Azure, la classification BlueXP s'exécute sur un "Machine virtuelle standard_D16s_v3" Avec un disque de 500 Gio. L'image du système d'exploitation est CentOS 7.9.

  • Dans GCP, la classification BlueXP s'exécute dans un "n2-standard-16 VM" Avec un disque persistant standard de 500 Gio. L'image du système d'exploitation est CentOS 7.9.

  • Dans les régions où l'instance par défaut n'est pas disponible, la classification BlueXP s'exécute sur une autre instance. "Voir les autres types d'instances".

  • L'instance s'appelle CloudCompliance avec un hachage (UUID) généré concaténé. Par exemple : CloudCompliance-16bb6564-38ad-4080-9a92-36f5fd2f71c7

  • Chaque connecteur ne déploie qu'une seule instance de classification BlueXP.

Vous pouvez également déployer la classification BlueXP sur un hôte Linux sur site ou sur un hôte de votre fournisseur cloud préféré. Le logiciel fonctionne exactement de la même manière quelle que soit la méthode d'installation choisie. Les mises à niveau du logiciel de classification BlueXP sont automatisées tant que l'instance dispose d'un accès Internet.

Astuce L'instance doit rester en cours d'exécution en permanence, car la classification BlueXP analyse les données en continu.

Déploiement sur différents types d'instances

Vous pouvez déployer la classification BlueXP sur un système avec moins de processeurs et moins de RAM.

Taille du système Caractéristiques Limites

Très grand

32 processeurs, 128 Go de RAM, SSD de 1 Tio

Peut analyser jusqu'à 500 millions de fichiers.

Grand (par défaut)

16 processeurs, 64 Go de RAM, SSD de 500 Gio

Peut analyser jusqu'à 250 millions de fichiers.

Lorsque vous déployez la classification BlueXP dans Azure ou GCP, envoyez un e-mail à ng-contact-data-sense@netapp.com pour obtenir de l'aide si vous souhaitez utiliser un type d'instance plus petit.

Fonctionnement de la classification BlueXP

À un niveau élevé, la classification BlueXP fonctionne comme suit :

  1. Déployez une instance de classification BlueXP dans BlueXP.

  2. Vous activez la cartographie de haut niveau ou la numérisation de haut niveau sur une ou plusieurs sources de données.

  3. La classification BlueXP analyse les données à l'aide d'un processus d'apprentissage par l'IA.

  4. Vous utilisez les tableaux de bord et les outils de génération de rapports fournis pour vous aider dans vos efforts de conformité et de gouvernance.

Fonctionnement des acquisitions

Une fois que vous avez activé la classification BlueXP et sélectionné les référentiels à analyser (il s'agit des volumes, des schémas de base de données ou d'autres données utilisateur), l'analyse des données commence immédiatement pour identifier les données personnelles et sensibles. Dans la plupart des cas, il est préférable de se concentrer sur l'analyse des données de production en direct plutôt que sur des sauvegardes, des miroirs ou des sites de reprise sur incident. Ensuite, la classification BlueXP mappe vos données d'entreprise, classe chaque fichier, puis identifie et extrait des entités et des modèles prédéfinis dans les données. Le résultat de l'analyse est un index des informations personnelles, des données personnelles sensibles, des catégories de données et des types de fichiers.

La classification BlueXP se connecte aux données comme n'importe quel autre client en montant des volumes NFS et CIFS. Les volumes NFS sont automatiquement accessibles en lecture seule, tandis que vous devez fournir des identifiants Active Directory pour analyser les volumes CIFS.

Diagramme illustrant une instance BlueXP et une instance de classification BlueXP exécutée dans votre fournisseur cloud. L'instance de classification BlueXP se connecte aux volumes NFS et CIFS et aux bases de données pour les analyser.

Après l'analyse initiale, la classification BlueXP analyse en continu vos données à séquence périodique pour détecter les modifications incrémentielles (c'est pourquoi il est important de maintenir l'instance en fonctionnement).

Vous pouvez activer et désactiver les analyses au niveau du volume ou au niveau du schéma de la base de données.

Quelle est la différence entre les acquisitions de mappage et de classification

La classification BlueXP vous permet d'exécuter une analyse générale du « mappage » sur des sources de données sélectionnées. La cartographie ne fournit qu'une vue d'ensemble de haut niveau de vos données, tandis que Classification permet une analyse approfondie de vos données. Le mappage peut être effectué très rapidement sur vos sources de données car il n'accède pas aux fichiers pour voir les données à l'intérieur.

De nombreux utilisateurs apprécient cette fonctionnalité car ils souhaitent analyser rapidement leurs données afin d'identifier les sources de données qui nécessitent davantage de recherche. Ils ne peuvent ensuite activer des analyses de classification que sur les sources ou volumes de données requis.

Le tableau ci-dessous présente certaines des différences :

Fonction Classement Mappage

Vitesse de numérisation

Lentes

Rapides

Tarifs

Libre

Libre

Puissance

Limité à 500 To

Limité à 500 To

Liste des types de fichiers et de la capacité utilisée

Oui.

Oui.

Nombre de fichiers et capacité utilisée

Oui.

Oui.

Âge et taille des fichiers

Oui.

Oui.

Exécution d'un "Rapport de mappage de données"

Oui.

Oui.

Page Data Investigation pour afficher les détails du fichier

Oui.

Non

Rechercher des noms dans les fichiers

Oui.

Non

Création "stratégies" fournissant des résultats de recherche personnalisés

Oui.

Non

Possibilité d'exécuter d'autres rapports

Oui.

Non

Possibilité de voir les métadonnées des fichiers*

Non

Oui.

*Les métadonnées suivantes sont extraites des fichiers lors des analyses de mappage :

  • Environnement de travail

  • Type d'environnement de travail

  • Référentiel de stockage

  • Type de fichier

  • Capacité utilisée

  • Nombre de fichiers

  • Taille du fichier

  • Création de fichier

  • Dernier accès au fichier

  • Dernier fichier modifié

  • Heure de découverte du fichier

  • Extraction des autorisations

Différences du tableau de bord de gouvernance :

Fonction Cartographiez et classez Carte

Les données obsolètes

Oui.

Oui.

Données non commerciales

Oui.

Oui.

Fichiers dupliqués

Oui.

Oui.

Des règles prédéfinies

Oui.

Non

Règles personnalisées

Oui.

Oui.

Rapport DDA

Oui.

Oui.

Rapport de mappage

Oui.

Oui.

Détection du niveau de sensibilité

Oui.

Non

Données sensibles avec autorisations étendues

Oui.

Non

Ouvrez les autorisations

Oui.

Oui.

Âge des données

Oui.

Oui.

Taille des données

Oui.

Oui.

Catégories

Oui.

Non

Types de fichiers

Oui.

Oui.

Différences du tableau de bord de conformité :

Fonction Cartographiez et classez Carte

Informations personnelles

Oui.

Non

Informations personnelles sensibles

Oui.

Non

Rapport sur l'évaluation des risques en matière de confidentialité

Oui.

Non

Rapport HIPAA

Oui.

Non

Rapport PCI DSS

Oui.

Non

Différences de filtres d'enquête :

Fonction Cartographiez et classez Carte

Stratégies

Oui.

Oui.

Type d'environnement de travail

Oui.

Oui.

Environnement de travail

Oui.

Oui.

Référentiel de stockage

Oui.

Oui.

Type de fichier

Oui.

Oui.

Taille du fichier

Oui.

Oui.

Heure de création

Oui.

Oui.

Heure découverte

Oui.

Oui.

Dernière modification

Oui.

Oui.

Dernier accès

Oui.

Oui.

Ouvrez les autorisations

Oui.

Oui.

Chemin du répertoire de fichiers

Oui.

Oui.

Catégorie

Oui.

Non

Niveau de sensibilité

Oui.

Non

Nombre d'identificateurs

Oui.

Non

Données personnelles

Oui.

Non

Données personnelles sensibles

Oui.

Non

Sujet des données

Oui.

Non

Doublons

Oui.

Oui.

Statut de classification

Oui.

Le statut est toujours « informations limitées »

Événement d'analyse d'acquisition

Oui.

Oui.

Hachage de fichier

Oui.

Oui.

Nombre d'utilisateurs ayant accès

Oui.

Oui.

Autorisations utilisateur/groupe

Oui.

Oui.

Propriétaire du fichier

Oui.

Oui.

Type de répertoire

Oui.

Oui.

La rapidité avec laquelle la classification BlueXP analyse les données

La vitesse de analyse est affectée par la latence du réseau, la latence des disques, la bande passante réseau, la taille de l'environnement et la taille de la distribution de fichiers.

  • Lors d'analyses de mappage, la classification BlueXP peut analyser entre 100-150 Tibs de données par jour.

  • Lors des analyses de classification, la classification BlueXP peut analyser entre 15-40 Tibs de données par jour.

Informations indexées par la classification BlueXP

La classification BlueXP collecte, indexe et attribue des catégories à vos données (fichiers). Les données index par classification BlueXP sont les suivantes :

  • Métadonnées standard la classification BlueXP collecte les métadonnées standard relatives aux fichiers : le type de fichier, sa taille, ses dates de création et de modification, etc.

  • Données personnelles : informations personnelles (PII) telles que les adresses électroniques, les numéros d'identification ou les numéros de carte de crédit. "En savoir plus sur les données personnelles".

  • Données personnelles sensibles : types particuliers d'informations personnelles sensibles (SPII), telles que les données de santé, l'origine ethnique ou les opinions politiques, tels que définis par le RGPD et d'autres réglementations sur la confidentialité. "En savoir plus sur les données personnelles sensibles".

  • Catégories: La classification BlueXP prend les données qu'il a analysées et les divise en différents types de catégories. Les catégories sont des rubriques basées sur l'analyse par IA du contenu et des métadonnées de chaque fichier. "En savoir plus sur les catégories".

  • Types : la classification BlueXP prend les données analysées et les répartit par type de fichier. "En savoir plus sur les types".

  • Reconnaissance des noms d'entités : la classification BlueXP utilise l'IA pour extraire les noms naturels des personnes des documents. "Découvrez comment répondre aux demandes d'accès aux données".

Présentation du réseau

BlueXP déploie l'instance de classification BlueXP avec un groupe de sécurité qui active les connexions HTTP entrantes à partir de l'instance du connecteur.

Lorsque vous utilisez BlueXP en mode SaaS, la connexion à BlueXP est desservie par HTTPS et les données privées envoyées entre votre navigateur et l'instance de classification BlueXP sont sécurisées avec un chiffrement de bout en bout à l'aide de TLS 1.2. NetApp et des tiers ne peuvent donc pas les lire.

Les règles sortantes sont complètement ouvertes. Un accès à Internet est nécessaire pour installer et mettre à niveau le logiciel de classification BlueXP et pour envoyer des metrics d'utilisation.

Si vous avez des exigences de mise en réseau strictes, "Découvrez les terminaux que la classification BlueXP contacte".

Accès des utilisateurs aux informations de conformité

Le rôle attribué à chaque utilisateur offre des fonctionnalités différentes dans BlueXP et dans la classification BlueXP :

  • Un Account Admin peut gérer les paramètres de conformité et afficher les informations de conformité pour tous les environnements de travail.

  • Un Workspace Admin peut gérer les paramètres de conformité et afficher les informations de conformité uniquement pour les systèmes auxquels ils disposent d'autorisations d'accès. Si un administrateur d'espace de travail ne peut pas accéder à un environnement de travail dans BlueXP, il ne peut pas voir d'informations de conformité pour l'environnement de travail dans l'onglet de classification BlueXP.

  • Les utilisateurs disposant du rôle Compliance Viewer peuvent uniquement afficher les informations de conformité et générer des rapports pour les systèmes auxquels ils sont autorisés à accéder. Ces utilisateurs ne peuvent pas activer/désactiver la lecture des volumes, compartiments ou schémas de base de données.