Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Découvrez la classification BlueXP

Contributeurs

La classification BlueXP (Cloud Data Sense) est un service de gouvernance des données pour BlueXP qui analyse vos sources de données cloud et sur site pour cartographier et classer les données, et identifier les informations privées. Cela peut réduire les risques liés à la sécurité et à la conformité, diminuer les coûts de stockage et vous aider dans vos projets de migration des données.

Caractéristiques

La classification BlueXP utilise l'intelligence artificielle (IA), le traitement du langage naturel (NLP) et LE machine learning (ML) pour comprendre le contenu qu'il analyse afin d'extraire des entités et de répartir le contenu par catégorie. Ceci permet à la classification BlueXP de fournir les domaines de fonctionnalité suivants.

Préservez la conformité

La classification BlueXP offre plusieurs outils qui vous aident dans vos efforts de conformité. Vous pouvez utiliser la classification BlueXP pour :

  • Identifier les informations à caractère personnel

  • Identifier une vaste portée des données personnelles sensibles, conformément aux réglementations en matière de confidentialité, RGPD, CCPA, PCI et HIPAA.

  • Répondez aux demandes d'accès aux données (DSAR, Data Subject Access Requests) en fonction de votre nom ou de votre adresse e-mail.

  • Déterminez si des identifiants uniques de vos bases de données sont trouvés dans des fichiers d'autres référentiels, en drestant votre propre liste de « données personnelles » identifiée dans les analyses de classification BlueXP.

  • Avertir certains utilisateurs par e-mail lorsque des fichiers contiennent certains RP (vous définissez ce critère à l'aide de "Stratégies") de sorte que vous puissiez décider d'un plan d'action.

Renforcez la sécurité

La classification BlueXP permet d'identifier les données potentiellement menacées d'accès à des fins criminelles. Vous pouvez utiliser la classification BlueXP pour :

  • Identifiez tous les fichiers et répertoires (partages et dossiers) avec les autorisations ouvertes exposées à l'ensemble de votre organisation ou au public.

  • Identifiez les données sensibles qui se trouvent en dehors de l'emplacement initial dédié.

  • Respectez les règles de conservation des données.

  • Utilisez Policies pour avertir automatiquement le personnel de sécurité de nouveaux problèmes de sécurité afin qu'il puisse agir immédiatement.

  • Ajoutez des balises personnalisées aux fichiers (par exemple, "doit être déplacé") et affectez un utilisateur BlueXP pour que cette personne puisse posséder des mises à jour des fichiers.

  • Afficher et modifier "Étiquettes Azure information protection (AIP)" dans vos fichiers.

Optimiser l'utilisation du stockage

La classification BlueXP fournit des outils qui vous aideront à maîtriser votre TCO. Vous pouvez utiliser la classification BlueXP pour :

  • Amélioration de l'efficacité du stockage grâce à l'identification des données dupliquées ou non liées à l'activité. Vous pouvez utiliser ces informations pour décider si vous voulez déplacer ou supprimer certains fichiers.

  • Supprimez des fichiers qui semblent non sécurisés ou trop risqués pour l'éviter dans votre système de stockage, ou qui ont été identifiés en double. Vous pouvez utiliser Policies pour supprimer automatiquement des fichiers qui correspondent à certains critères.

  • Réduisez les coûts du stockage en identifiant les données inactives que vous pouvez déplacer vers un stockage objet moins coûteux. "En savoir plus sur le Tiering des systèmes Cloud Volumes ONTAP". "En savoir plus sur le Tiering à partir des systèmes ONTAP sur site".

Accélérez la migration des données

La classification BlueXP peut être utilisée pour analyser vos données sur site avant de les migrer vers le cloud public ou privé. Vous pouvez utiliser la classification BlueXP pour :

  • Permet d'afficher la taille des données et si l'une des données contient des informations sensibles avant de les déplacer.

  • Filtrez les données source (en fonction de plus de 25 types de critères) pour pouvoir déplacer uniquement les fichiers requis vers la destination. Les données inutiles ne sont pas déplacées.

  • Déplacez, copiez ou synchronisez uniquement les données requises dans le référentiel cloud de manière automatique et continue.

Sources de données prises en charge

La classification BlueXP peut analyser et analyser des données structurées et non structurées à partir des types de sources de données suivants :

NetApp:

  • Cloud Volumes ONTAP (déployé dans AWS, Azure ou GCP)

  • Clusters ONTAP sur site

  • StorageGRID

  • Azure NetApp Files

  • Amazon FSX pour ONTAP

  • Cloud Volumes Service pour Google Cloud

Non NetApp:

  • Dell EMC Isilon

  • Pure Storage

  • Nutanix

  • Tout autre fournisseur de stockage

Cloud:

  • Amazon S3

  • Google Cloud Storage

  • OneDrive

  • SharePoint Online

  • SharePoint sur site (SharePoint Server)

  • Google Drive

Bases de données:

  • Amazon Relational Database Service (Amazon RDS)

  • MongoDB

  • MySQL

  • Oracle

  • PostgreSQL

  • SAP HANA

  • Serveur SQL (MSSQL)

La classification BlueXP prend en charge les versions NFS 3.x et CIFS 1.x, 2.0, 2.1 et 3.0.

Le coût

  • Le coût d'utilisation de la classification BlueXP dépend de la quantité de données que vous analysez. Les 1 premiers To de données analysés par le système de classification BlueXP dans un espace de travail BlueXP sont gratuits pendant 30 jours. Cela inclut toutes les données issues de tous les environnements de travail et de toutes les sources de données. Un abonnement à AWS, Azure, GCP Marketplace ou une licence BYOL de NetApp est requis pour continuer l'analyse des données après ce point. Voir "tarifs" pour plus d'informations.

  • L'installation de la classification BlueXP dans le cloud nécessite le déploiement d'une instance cloud, ce qui entraîne des frais du fournisseur cloud où il est déployé. Voir type d'instance déployé pour chaque fournisseur cloud. L'installation de la classification BlueXP sur un système sur site est gratuit.

  • Pour classification BlueXP, vous devez avoir déployé un connecteur BlueXP. Dans de nombreux cas, vous disposez déjà d'un connecteur en raison d'autres services et stockages que vous utilisez dans BlueXP. L'instance de connecteur entraîne des frais supplémentaires du fournisseur cloud sur lequel elle est déployée. Voir la "type d'instance déployé pour chaque fournisseur cloud". L'installation du connecteur sur un système sur site est gratuite.

Coûts de transfert de données

Les coûts de transfert de données dépendent de votre configuration. Si l'instance de classification BlueXP et la source de données se trouvent dans la même zone de disponibilité et dans la même région, aucun coût de transfert de données n'est applicable. Mais si la source de données, telle qu'un système Cloud Volumes ONTAP ou un compartiment S3, se trouve dans une autre zone ou région de disponibilité, vous serez facturé par votre fournisseur cloud pour les coûts de transfert de données. Consultez ces liens pour en savoir plus :

Instance de classification BlueXP

Lorsque vous déployez la classification BlueXP dans le cloud, BlueXP déploie l'instance dans le même sous-réseau que le connecteur. "En savoir plus sur les connecteurs."

Diagramme illustrant une instance BlueXP et une instance de classification BlueXP exécutée dans votre fournisseur cloud.

Voici la liste des éléments suivants pour l'instance par défaut :

  • Dans AWS, la classification BlueXP s'exécute sur un "instance m6i.4xlarge" Avec un disque GP2 de 500 Gio. L'image du système d'exploitation est Amazon Linux 2. Lorsqu'elle est déployée dans AWS, vous pouvez choisir une instance de plus petite taille si vous analysez un petit volume de données.

  • Dans Azure, la classification BlueXP s'exécute sur un "Machine virtuelle standard_D16s_v3" Avec un disque de 500 Gio. L'image du système d'exploitation est CentOS 7.9.

  • Dans GCP, la classification BlueXP s'exécute dans un "n2-standard-16 VM" Avec un disque persistant standard de 500 Gio. L'image du système d'exploitation est CentOS 7.9.

  • Dans les régions où l'instance par défaut n'est pas disponible, la classification BlueXP s'exécute sur une autre instance. "Voir les autres types d'instances".

  • L'instance s'appelle CloudCompliance avec un hachage (UUID) généré concaténé. Par exemple : CloudCompliance-16bb6564-38ad-4080-9a92-36f5fd2f71c7

  • Chaque connecteur ne déploie qu'une seule instance de classification BlueXP.

Vous pouvez également déployer la classification BlueXP sur un hôte Linux sur site ou sur un hôte de votre fournisseur cloud préféré. Le logiciel fonctionne exactement de la même manière quelle que soit la méthode d'installation choisie. Les mises à niveau du logiciel de classification BlueXP sont automatisées tant que l'instance dispose d'un accès Internet.

Astuce L'instance doit rester en cours d'exécution en permanence, car la classification BlueXP analyse les données en continu.

Utilisation d'un type d'instance plus petit

Vous pouvez déployer la classification BlueXP sur un système avec moins de processeurs et moins de RAM, mais l'utilisation de systèmes moins puissants comporte certaines limitations.

Taille du système Caractéristiques Limites

Très grand

32 processeurs, 128 Go de RAM, SSD de 1 Tio

Peut analyser jusqu'à 500 millions de fichiers.

Grand (par défaut)

16 processeurs, 64 Go de RAM, SSD de 500 Gio

Peut analyser jusqu'à 250 millions de fichiers.

Moyen

8 processeurs, 32 Go de RAM, SSD de 200 Gio

Numérisation plus lente et numérisation jusqu'à 1 million de fichiers uniquement.

Petit

8 processeurs, 16 Go de RAM, SSD de 100 Gio

Mêmes limites que « Moyen », plus la capacité d'identifier "noms des sujets de données" les fichiers internes sont désactivés.

Lorsque vous déployez la classification BlueXP dans le cloud sur AWS, vous pouvez choisir une instance de grande/moyenne/petite. Lorsque vous déployez la classification BlueXP dans Azure ou GCP, envoyez un e-mail à ng-contact-data-sense@netapp.com pour obtenir de l'aide si vous souhaitez utiliser l'un de ces autres systèmes. Nous devrons travailler avec vous pour déployer ces autres configurations clouds.

Lors du déploiement de la classification BlueXP sur site, il vous suffit d'utiliser un hôte Linux avec d'autres spécifications. Vous n'avez pas besoin de contacter NetApp pour obtenir de l'aide.

Fonctionnement de la classification BlueXP

À un niveau élevé, la classification BlueXP fonctionne comme suit :

  1. Déployez une instance de classification BlueXP dans BlueXP.

  2. Vous activez la cartographie de haut niveau ou la numérisation de haut niveau sur une ou plusieurs sources de données.

  3. La classification BlueXP analyse les données à l'aide d'un processus d'apprentissage par l'IA.

  4. Vous utilisez les tableaux de bord et les outils de génération de rapports fournis pour vous aider dans vos efforts de conformité et de gouvernance.

Fonctionnement des acquisitions

Une fois que vous avez activé la classification BlueXP et sélectionné les référentiels à analyser (il s'agit des volumes, des compartiments, des schémas de base de données ou des données utilisateur OneDrive ou SharePoint), l'analyse des données commence immédiatement pour identifier les données personnelles et sensibles. Dans la plupart des cas, il est préférable de se concentrer sur l'analyse des données de production en direct plutôt que sur des sauvegardes, des miroirs ou des sites de reprise sur incident. Ensuite, la classification BlueXP mappe vos données d'entreprise, classe chaque fichier, puis identifie et extrait des entités et des modèles prédéfinis dans les données. Le résultat de l'analyse est un index des informations personnelles, des données personnelles sensibles, des catégories de données et des types de fichiers.

La classification BlueXP se connecte aux données comme n'importe quel autre client en montant des volumes NFS et CIFS. Les volumes NFS sont automatiquement accessibles en lecture seule, tandis que vous devez fournir des identifiants Active Directory pour analyser les volumes CIFS.

Diagramme illustrant une instance BlueXP et une instance de classification BlueXP exécutée dans votre fournisseur cloud. L'instance de classification BlueXP se connecte aux volumes NFS et CIFS, aux compartiments S3, aux comptes OneDrive et aux bases de données pour les analyser.

Après l'analyse initiale, la classification BlueXP analyse en continu vos données à séquence périodique pour détecter les modifications incrémentielles (c'est pourquoi il est important de maintenir l'instance en fonctionnement).

Vous pouvez activer et désactiver les analyses au niveau du volume, au niveau du compartiment, au niveau du schéma de la base de données, au niveau utilisateur OneDrive et au niveau du site SharePoint.

Quelle est la différence entre les acquisitions de mappage et de classification

La classification BlueXP vous permet d'exécuter une analyse générale du « mappage » sur des sources de données sélectionnées. La cartographie ne fournit qu'une vue d'ensemble de haut niveau de vos données, tandis que Classification permet une analyse approfondie de vos données. Le mappage peut être effectué très rapidement sur vos sources de données car il n'accède pas aux fichiers pour voir les données à l'intérieur.

De nombreux utilisateurs apprécient cette fonctionnalité car ils souhaitent analyser rapidement leurs données afin d'identifier les sources de données qui nécessitent davantage de recherche. Ils ne peuvent ensuite activer des analyses de classification que sur les sources ou volumes de données requis.

Le tableau ci-dessous présente certaines des différences :

Fonction Classement Mappage

Vitesse de numérisation

Lentes

Rapides

Liste des types de fichiers et de la capacité utilisée

Oui.

Oui.

Nombre de fichiers et capacité utilisée

Oui.

Oui.

Âge et taille des fichiers

Oui.

Oui.

Exécution d'un "Rapport de mappage de données"

Oui.

Oui.

Page Data Investigation pour afficher les détails du fichier

Oui.

Non

Rechercher des noms dans les fichiers

Oui.

Non

Création "stratégies" fournissant des résultats de recherche personnalisés

Oui.

Non

Catégoriser les données à l'aide d'étiquettes AIP et de balises d'état

Oui.

Non

Copier, supprimer et déplacer des fichiers source

Oui.

Non

Possibilité d'exécuter d'autres rapports

Oui.

Non

La rapidité avec laquelle la classification BlueXP analyse les données

La vitesse de analyse est affectée par la latence du réseau, la latence des disques, la bande passante réseau, la taille de l'environnement et la taille de la distribution de fichiers.

  • Lors d'analyses de mappage, la classification BlueXP peut analyser entre 100-150 Tibs de données par jour et par nœud d'analyse.

  • Lors des analyses de classification, la classification BlueXP peut analyser entre 15-40 Tibs de données par jour et par nœud d'analyse.

Informations indexées par la classification BlueXP

La classification BlueXP collecte, indexe et attribue des catégories à vos données (fichiers). Les données index par classification BlueXP sont les suivantes :

Métadonnées standard

La classification BlueXP collecte les métadonnées standard sur les fichiers : le type de fichier, sa taille, les dates de création et de modification, etc.

Données personnelles

Informations personnelles identifiables telles que les adresses électroniques, les numéros d'identification ou les numéros de carte de crédit. "En savoir plus sur les données personnelles".

Données personnelles sensibles

Des types spéciaux d'informations sensibles, comme les données de santé, l'origine ethnique ou les opinions politiques, tels que définis par le RGPD et d'autres réglementations sur la confidentialité. "En savoir plus sur les données personnelles sensibles".

Catégories

La classification BlueXP récupère les données qu'il a analysées et les divise en différents types de catégories. Les catégories sont des rubriques basées sur l'analyse par IA du contenu et des métadonnées de chaque fichier. "En savoir plus sur les catégories".

Types

La classification BlueXP répartit les données analysées par type de fichier. "En savoir plus sur les types".

Reconnaissance de l'entité de nom

La classification BlueXP utilise l'IA pour extraire le nom des personnes physiques des documents. "Découvrez comment répondre aux demandes d'accès aux données".

Présentation du réseau

BlueXP déploie l'instance de classification BlueXP avec un groupe de sécurité qui active les connexions HTTP entrantes à partir de l'instance du connecteur.

Lorsque vous utilisez BlueXP en mode SaaS, la connexion à BlueXP est desservie par HTTPS et les données privées envoyées entre votre navigateur et l'instance de classification BlueXP sont sécurisées avec un chiffrement de bout en bout à l'aide de TLS 1.2. NetApp et des tiers ne peuvent donc pas les lire.

Les règles sortantes sont complètement ouvertes. Un accès à Internet est nécessaire pour installer et mettre à niveau le logiciel de classification BlueXP et pour envoyer des metrics d'utilisation.

Si vous avez des exigences de mise en réseau strictes, "Découvrez les terminaux que la classification BlueXP contacte".

Accès des utilisateurs aux informations de conformité

Le rôle attribué à chaque utilisateur offre des fonctionnalités différentes dans BlueXP et dans la classification BlueXP :

  • Un Account Admin peut gérer les paramètres de conformité et afficher les informations de conformité pour tous les environnements de travail.

  • Un Workspace Admin peut gérer les paramètres de conformité et afficher les informations de conformité uniquement pour les systèmes auxquels ils disposent d'autorisations d'accès. Si un administrateur d'espace de travail ne peut pas accéder à un environnement de travail dans BlueXP, il ne peut pas voir d'informations de conformité pour l'environnement de travail dans l'onglet de classification BlueXP.

  • Les utilisateurs disposant du rôle Compliance Viewer peuvent uniquement afficher les informations de conformité et générer des rapports pour les systèmes auxquels ils sont autorisés à accéder. Ces utilisateurs ne peuvent pas activer/désactiver la lecture des volumes, compartiments ou schémas de base de données. Ces utilisateurs ne peuvent pas non plus copier, déplacer ou supprimer des fichiers.