Découvrez la classification BlueXP
La classification BlueXP (Cloud Data Sense) est un service de gouvernance des données pour BlueXP qui analyse vos sources de données cloud et sur site pour cartographier et classer les données, et identifier les informations privées. Cela peut réduire les risques liés à la sécurité et à la conformité, diminuer les coûts de stockage et vous aider dans vos projets de migration des données.
|
À partir de la version 1.31, la classification BlueXP est disponible en tant que fonctionnalité clé de BlueXP . Il n'y a pas de frais supplémentaires. Aucune licence de classification ni aucun abonnement n'est requis. + si vous utilisez la version 1.30 ou antérieure, cette version est disponible jusqu'à expiration de votre abonnement. "Voir la liste des fonctions obsolètes". |
Caractéristiques
La classification BlueXP utilise l'intelligence artificielle (IA), le traitement du langage naturel (NLP) et LE machine learning (ML) pour comprendre le contenu qu'il analyse afin d'extraire des entités et de répartir le contenu par catégorie. Ceci permet à la classification BlueXP de fournir les domaines de fonctionnalité suivants.
La classification BlueXP offre plusieurs outils qui vous aident dans vos efforts de conformité. Vous pouvez utiliser la classification BlueXP pour :
-
Identifier les informations à caractère personnel
-
Identifier une vaste portée des données personnelles sensibles, conformément aux réglementations en matière de confidentialité, RGPD, CCPA, PCI et HIPAA.
-
Répondez aux demandes d'accès aux données (DSAR, Data Subject Access Requests) en fonction de votre nom ou de votre adresse e-mail.
La classification BlueXP permet d'identifier les données potentiellement menacées d'accès à des fins criminelles. Vous pouvez utiliser la classification BlueXP pour :
-
Identifiez tous les fichiers et répertoires (partages et dossiers) avec les autorisations ouvertes exposées à l'ensemble de votre organisation ou au public.
-
Identifiez les données sensibles qui se trouvent en dehors de l'emplacement initial dédié.
-
Respectez les règles de conservation des données.
-
Utilisez Policies pour détecter automatiquement les nouveaux problèmes de sécurité afin que le personnel de sécurité puisse agir immédiatement.
La classification BlueXP fournit des outils qui vous aideront à maîtriser votre TCO. Vous pouvez utiliser la classification BlueXP pour :
-
Amélioration de l'efficacité du stockage grâce à l'identification des données dupliquées ou non liées à l'activité.
-
Réduisez les coûts du stockage en identifiant les données inactives que vous pouvez déplacer vers un stockage objet moins coûteux. "En savoir plus sur le Tiering des systèmes Cloud Volumes ONTAP". "En savoir plus sur le Tiering à partir des systèmes ONTAP sur site".
Environnements de travail et sources de données pris en charge
La classification BlueXP peut analyser et analyser les données structurées et non structurées à partir des types d'environnements de travail et de sources de données suivants :
Environnements de travail
-
Amazon FSX pour ONTAP
-
Azure NetApp Files
-
Cloud Volumes ONTAP (déployé dans AWS, Azure ou GCP)
-
Clusters ONTAP sur site
-
StorageGRID
Sources de données
-
Partages de fichiers NetApp
-
Bases de données :
-
Amazon Relational Database Service (Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
Serveur SQL (MSSQL)
-
La classification BlueXP prend en charge les versions NFS 3.x, 4.0 et 4.1, ainsi que les versions CIFS 1.x, 2.0, 2.1 et 3.0.
Le coût
La classification BlueXP est gratuite. Aucune licence de classification ou abonnement payant n'est nécessaire.
Coûts d'infrastructure
-
L'installation de la classification BlueXP dans le cloud nécessite le déploiement d'une instance cloud, ce qui entraîne des frais du fournisseur cloud où il est déployé. Voir type d'instance déployé pour chaque fournisseur cloud. L'installation de la classification BlueXP sur un système sur site est gratuit.
-
Pour classification BlueXP, vous devez avoir déployé un connecteur BlueXP. Dans de nombreux cas, vous disposez déjà d'un connecteur en raison d'autres services et stockages que vous utilisez dans BlueXP. L'instance de connecteur entraîne des frais supplémentaires du fournisseur cloud sur lequel elle est déployée. Voir la "type d'instance déployé pour chaque fournisseur cloud". L'installation du connecteur sur un système sur site est gratuite.
Coûts de transfert de données
Les coûts de transfert de données dépendent de votre configuration. Si l'instance de classification BlueXP et la source de données se trouvent dans la même zone de disponibilité et dans la même région, aucun coût de transfert de données n'est applicable. Mais si la source de données, comme un système Cloud Volumes ONTAP, se trouve dans une zone de disponibilité ou une région différente, les coûts de transfert des données vous seront facturés par votre fournisseur cloud. Consultez ces liens pour en savoir plus :
Instance de classification BlueXP
Lorsque vous déployez la classification BlueXP dans le cloud, BlueXP déploie l'instance dans le même sous-réseau que le connecteur. "En savoir plus sur les connecteurs."
Voici la liste des éléments suivants pour l'instance par défaut :
-
Dans AWS, la classification BlueXP s'exécute sur un "instance m6i.4xlarge" Avec un disque GP2 de 500 Gio. L'image du système d'exploitation est Amazon Linux 2. Lorsqu'elle est déployée dans AWS, vous pouvez choisir une instance de plus petite taille si vous analysez un petit volume de données.
-
Dans Azure, la classification BlueXP s'exécute sur un avec un "Machine virtuelle standard_D16s_v3"disque de 500 Gio. L'image du système d'exploitation est Ubuntu 22.04.
-
Dans GCP, la classification BlueXP s'exécute sur un avec un "n2-standard-16 VM"disque persistant standard de 500 Gio. L'image du système d'exploitation est Ubuntu 22.04.
-
Dans les régions où l'instance par défaut n'est pas disponible, la classification BlueXP s'exécute sur une autre instance. "Voir les autres types d'instances".
-
L'instance s'appelle CloudCompliance avec un hachage (UUID) généré concaténé. Par exemple : CloudCompliance-16bb6564-38ad-4080-9a92-36f5fd2f71c7
-
Chaque connecteur ne déploie qu'une seule instance de classification BlueXP.
Vous pouvez également déployer la classification BlueXP sur un hôte Linux sur site ou sur un hôte de votre fournisseur cloud préféré. Le logiciel fonctionne exactement de la même manière quelle que soit la méthode d'installation choisie. Les mises à niveau du logiciel de classification BlueXP sont automatisées tant que l'instance dispose d'un accès Internet.
|
L'instance doit rester en cours d'exécution en permanence, car la classification BlueXP analyse les données en continu. |
Déployer sur différents types d'instances
Consultez les spécifications suivantes pour les types d’instances :
Taille du système | Caractéristiques | Limites |
---|---|---|
Très grand |
32 processeurs, 128 Go de RAM, SSD de 1 Tio |
Peut analyser jusqu'à 500 millions de fichiers. |
Grand (par défaut) |
16 processeurs, 64 Go de RAM, SSD de 500 Gio |
Peut analyser jusqu'à 250 millions de fichiers. |
Lorsque vous déployez la classification BlueXP dans Azure ou GCP, envoyez un e-mail à ng-contact-data-sense@netapp.com pour obtenir de l'aide si vous souhaitez utiliser un type d'instance plus petit.
Fonctionnement de la numérisation de classification BlueXP
À un niveau élevé, la numérisation de classification BlueXP fonctionne comme suit :
-
Déployez une instance de classification BlueXP dans BlueXP.
-
Vous activez la cartographie de haut niveau (appelée Mapping Only scans) ou la numérisation de niveau profond (appelée Map & Classify scans) sur une ou plusieurs sources de données.
-
La classification BlueXP analyse les données à l'aide d'un processus d'apprentissage par l'IA.
-
Vous utilisez les tableaux de bord et les outils de génération de rapports fournis pour vous aider dans vos efforts de conformité et de gouvernance.
Une fois que vous avez activé la classification BlueXP et sélectionné les référentiels à analyser (il s'agit des volumes, des schémas de base de données ou d'autres données utilisateur), l'analyse des données commence immédiatement pour identifier les données personnelles et sensibles. Dans la plupart des cas, il est préférable de se concentrer sur l'analyse des données de production en direct plutôt que sur des sauvegardes, des miroirs ou des sites de reprise sur incident. Ensuite, la classification BlueXP mappe vos données d'entreprise, classe chaque fichier, puis identifie et extrait des entités et des modèles prédéfinis dans les données. Le résultat de l'analyse est un index des informations personnelles, des données personnelles sensibles, des catégories de données et des types de fichiers.
La classification BlueXP se connecte aux données comme n'importe quel autre client en montant des volumes NFS et CIFS. Les volumes NFS sont automatiquement accessibles en lecture seule, tandis que vous devez fournir des identifiants Active Directory pour analyser les volumes CIFS.
Après l'analyse initiale, la classification BlueXP analyse en continu vos données selon une séquence périodique pour détecter les modifications incrémentielles. C'est pourquoi il est important de maintenir l'instance en cours d'exécution.
Vous pouvez activer et désactiver les analyses au niveau du volume ou au niveau du schéma de base de données.
|
La BlueXP classification n'impose pas de limite à la quantité de données qu'elle peut analyser. Chaque connecteur prend en charge la numérisation et l'affichage de 500 Tio de données. Pour scanner plus de 500 Tio de données,"installer un autre connecteur" alors"déployer une autre instance de BlueXP classification" . L'interface utilisateur BlueXP affiche les données d'un seul connecteur. Pour obtenir des conseils sur l'affichage des données de plusieurs connecteurs, consultez"Utilisation de plusieurs connecteurs" . |
Quelle est la différence entre les acquisitions de mappage et de classification
Vous pouvez effectuer deux types d'acquisitions dans la classification BlueXP :
-
Les acquisitions cartographiques uniquement ne fournissent qu'une vue d'ensemble de haut niveau de vos données et sont effectuées sur des sources de données sélectionnées. Les analyses de cartographie uniquement prennent moins de temps que les analyses de cartographie et de classification, car elles n'accèdent pas aux fichiers pour voir les données qu'ils contiennent. Vous pouvez commencer par identifier les domaines de recherche, puis effectuer une analyse carte et classification sur ces domaines.
-
Cartographiez et classifiez les acquisitions fournissent une analyse de niveau profond de vos données.
Pour plus de détails sur les différences entre les analyses de mappage et de classification, voir "Quelle est la différence entre les acquisitions de mappage et de classification ?".
Informations catégorisées par la classification BlueXP
La classification BlueXP collecte, indexe et attribue des catégories aux données suivantes :
-
Métadonnées standard à propos des fichiers : le type de fichier, sa taille, ses dates de création et de modification, etc.
-
Données personnelles : informations personnelles identifiables (IIP) telles que les adresses électroniques, les numéros d'identification ou les numéros de carte de crédit, que la classification BlueXP identifie en utilisant des mots, des chaînes et des modèles spécifiques dans les fichiers. "En savoir plus sur les données personnelles".
-
Données personnelles sensibles : types particuliers d'informations personnelles sensibles (SPII), telles que les données de santé, l'origine ethnique ou les opinions politiques, tels que définis par le Règlement général sur la protection des données (RGPD) et d'autres réglementations sur la confidentialité. "En savoir plus sur les données personnelles sensibles".
-
Catégories: La classification BlueXP prend les données qu'il a analysées et les divise en différents types de catégories. Les catégories sont des rubriques basées sur l'analyse par IA du contenu et des métadonnées de chaque fichier. "En savoir plus sur les catégories".
-
Types : la classification BlueXP prend les données analysées et les répartit par type de fichier. "En savoir plus sur les types".
-
Reconnaissance des noms d'entités : la classification BlueXP utilise l'IA pour extraire les noms naturels des personnes des documents. "Découvrez comment répondre aux demandes d'accès aux données".
Présentation du réseau
La classification BlueXP déploie un serveur ou un cluster unique, où que vous soyez, dans le cloud ou sur site. Les serveurs se connectent via des protocoles standard aux sources de données et indexent les résultats dans un cluster Elasticsearch, qui est également déployé sur les mêmes serveurs. Cela permet la prise en charge des environnements multicloud, cross-cloud, cloud privé et sur site.
BlueXP déploie l'instance de classification BlueXP avec un groupe de sécurité qui active les connexions HTTP entrantes à partir de l'instance du connecteur.
Lorsque vous utilisez BlueXP en mode SaaS, la connexion à BlueXP est assurée via HTTPS et les données privées envoyées entre votre navigateur et l'instance de classification BlueXP sont sécurisées avec un chiffrement de bout en bout à l'aide de TLS 1.2, ce qui signifie que NetApp et des tiers ne peuvent pas les lire.
Les règles sortantes sont complètement ouvertes. Un accès à Internet est nécessaire pour installer et mettre à niveau le logiciel de classification BlueXP et pour envoyer des metrics d'utilisation.
Si vous avez des exigences de mise en réseau strictes, "Découvrez les terminaux que la classification BlueXP contacte".