Scopri di più sulla classificazione BlueXP
La classificazione BlueXP (Cloud Data Sense) è un servizio di governance dei dati per BlueXP che analizza le origini dati on-premise e cloud aziendali per mappare e classificare i dati e identificare informazioni private. In questo modo è possibile ridurre i rischi di sicurezza e conformità, ridurre i costi di storage e assistere i progetti di migrazione dei dati.
|
A partire dalla versione 1,31, la classificazione BlueXP è disponibile come funzionalità di base con BlueXP . Non sono previsti costi aggiuntivi. Non è richiesta alcuna licenza di classificazione o abbonamento. + se si utilizza la versione legacy 1,30 o precedente, tale versione è disponibile fino alla scadenza dell'abbonamento. "Vedere un elenco delle funzioni obsolete". |
Caratteristiche
La classificazione BlueXP utilizza l'intelligenza artificiale (ai), l'elaborazione del linguaggio naturale (NLP) e l'apprendimento automatico (ML) per comprendere il contenuto che esegue la scansione al fine di estrarre le entità e classificare il contenuto di conseguenza. Ciò consente alla classificazione BlueXP di fornire le seguenti aree di funzionalità.
La classificazione BlueXP offre diversi strumenti che possono aiutare a soddisfare le tue esigenze di conformità. È possibile utilizzare la classificazione BlueXP per:
-
Identificare le informazioni personali identificabili (PII).
-
Identificare un'ampia gamma di informazioni personali sensibili come richiesto dalle normative sulla privacy GDPR, CCPA, PCI e HIPAA.
-
Rispondere alle richieste di accesso dei soggetti dati (DSAR) in base al nome o all'indirizzo e-mail.
La classificazione BlueXP è in grado di identificare i dati potenzialmente a rischio per l'accesso a scopi criminali. È possibile utilizzare la classificazione BlueXP per:
-
Identificare tutti i file e le directory (condivisioni e cartelle) con autorizzazioni aperte che sono esposte all'intera organizzazione o al pubblico.
-
Identificare i dati sensibili che risiedono al di fuori della posizione iniziale dedicata.
-
Rispettare le policy di conservazione dei dati.
-
Utilizzare Policies per rilevare automaticamente i nuovi problemi di sicurezza, in modo che il personale addetto alla sicurezza possa intervenire immediatamente.
La classificazione BlueXP offre strumenti che possono aiutare con il TCO (Total Cost of Ownership) dello storage. È possibile utilizzare la classificazione BlueXP per:
-
Aumenta l'efficienza dello storage identificando dati duplicati o non correlati al business.
-
Risparmia i costi dello storage identificando i dati inattivi che puoi tierare per uno storage a oggetti meno costoso. "Scopri di più sul tiering dei sistemi Cloud Volumes ONTAP". "Scopri di più sul tiering dei sistemi ONTAP on-premise".
Ambienti di lavoro e origini dati supportati
La classificazione BlueXP può analizzare e analizzare dati strutturati e non strutturati provenienti dai seguenti tipi di ambienti di lavoro e origini dati:
Ambienti di lavoro
-
Amazon FSX per ONTAP
-
Azure NetApp Files
-
Cloud Volumes ONTAP (implementato in AWS, Azure o GCP)
-
Cluster ONTAP on-premise
-
StorageGRID
Origini dati
-
Condivisioni di file NetApp
-
Database:
-
Amazon Relational Database Service (Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server (MSSQL)
-
La classificazione BlueXP supporta le versioni NFS 3.x, 4.0 e 4.1 e CIFS 1.x, 2.0, 2.1 e 3.0.
Costo
La classificazione BlueXP è gratuita. Non è richiesta alcuna licenza di classificazione o abbonamento a pagamento.
Costi delle infrastrutture
-
L'installazione della classificazione BlueXP nel cloud richiede l'implementazione di un'istanza di cloud, con conseguente addebito da parte del provider di cloud in cui viene implementata. Vedere il tipo di istanza implementata per ciascun cloud provider. L'installazione della classificazione BlueXP su un sistema on-premise non richiede alcun costo.
-
La classificazione BlueXP richiede l'implementazione di un connettore BlueXP. In molti casi si dispone già di un connettore a causa di altri servizi e storage utilizzati in BlueXP. L'istanza del connettore comporta addebiti da parte del cloud provider in cui viene implementata. Vedere "tipo di istanza implementata per ciascun cloud provider". L'installazione del connettore su un sistema on-premise non richiede alcun costo.
Costi di trasferimento dei dati
I costi di trasferimento dei dati dipendono dalla configurazione. Se l'istanza di classificazione BlueXP e l'origine dati si trovano nella stessa zona di disponibilità e nella stessa regione, non ci sono costi di trasferimento dei dati. Ma se l'origine dei dati, ad esempio un sistema Cloud Volumes ONTAP, si trova in una zona o regione di disponibilità diversa, i costi di trasferimento dei dati verranno addebitati dal provider cloud. Per ulteriori informazioni, consulta i seguenti link:
L'istanza di classificazione BlueXP
Quando si implementa la classificazione BlueXP nel cloud, BlueXP implementa l'istanza nella stessa sottorete del connettore. "Scopri di più sui connettori."
Tenere presente quanto segue sull'istanza predefinita:
-
In AWS, la classificazione BlueXP viene eseguita su un "m6i.4xlarge instance" Con un disco GP2 da 500 GiB. L'immagine del sistema operativo è Amazon Linux 2. Una volta implementato in AWS, è possibile scegliere una dimensione di istanza inferiore se si esegue la scansione di una piccola quantità di dati.
-
In Azure, la classificazione BlueXP viene eseguita su a "Standard_D16s_v3 VM" con un disco da 500 GiB. L'immagine del sistema operativo è Ubuntu 22,04.
-
Nella GCP, la classificazione BlueXP viene eseguita su un "n2-standard-16 VM" con un disco persistente standard GiB 500. L'immagine del sistema operativo è Ubuntu 22,04.
-
Nelle regioni in cui l'istanza predefinita non è disponibile, la classificazione BlueXP viene eseguita su un'istanza alternativa. "Vedere i tipi di istanza alternativi".
-
L'istanza è denominata CloudCompliance con un hash generato (UUID) concatenato ad essa. Ad esempio: CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7
-
Per ogni connettore viene implementata una sola istanza di classificazione BlueXP.
Puoi anche implementare la classificazione BlueXP su un host Linux on-premise o su un host nel tuo cloud provider preferito. Il software funziona esattamente allo stesso modo, indipendentemente dal metodo di installazione scelto. Gli aggiornamenti del software di classificazione BlueXP sono automatizzati finché l'istanza ha accesso a Internet.
|
L'istanza deve rimanere sempre in esecuzione perché la classificazione BlueXP esegue continuamente la scansione dei dati. |
Distribuire su diversi tipi di istanza
Esaminare le seguenti specifiche per i tipi di istanza:
Dimensioni del sistema | Specifiche | Limitazioni |
---|---|---|
Extra large |
32 CPU, 128 GB di RAM, 1 TiB SSD |
Scansione di fino a 500 milioni di file. |
Grande (impostazione predefinita) |
16 CPU, 64 GB di RAM, SSD da 500 GiB |
Scansione di fino a 250 milioni di file. |
Quando implementi la classificazione BlueXP in Azure o GCP, invia un'email ng-contact-data-sense@netapp.com per assistenza se desideri utilizzare un tipo di istanza più piccolo.
Come funziona la scansione della classificazione BlueXP
A un livello elevato, la scansione di classificazione BlueXP funziona come segue:
-
Si implementa un'istanza della classificazione BlueXP in BlueXP.
-
È possibile abilitare la mappatura di alto livello (denominata Mapping only Scans) o la scansione di alto livello (denominata Map & Classify Scans) su una o più origini dati.
-
La classificazione BlueXP esegue la scansione dei dati utilizzando un processo di apprendimento ai.
-
Utilizza le dashboard e i tool di reporting forniti per aiutarti nelle tue attività di compliance e governance.
Una volta attivata la classificazione BlueXP e selezionati i repository da analizzare (volumi, schemi di database o altri dati utente), viene avviata immediatamente la scansione dei dati per identificare i dati personali e sensibili. Nella maggior parte dei casi, è consigliabile concentrarsi sulla scansione dei dati di produzione in tempo reale anziché su backup, mirror o siti DR. Quindi, la classificazione BlueXP mappa i dati dell'organizzazione, categorizza ogni file e identifica ed estrae entità e modelli predefiniti nei dati. Il risultato della scansione è un indice di informazioni personali, informazioni personali sensibili, categorie di dati e tipi di file.
La classificazione BlueXP si connette ai dati come qualsiasi altro client montando volumi NFS e CIFS. Ai volumi NFS viene automaticamente eseguito l'accesso in sola lettura, mentre è necessario fornire le credenziali Active Directory per eseguire la scansione dei volumi CIFS.
Dopo la scansione iniziale, la classificazione BlueXP esegue la scansione continua dei dati in modo round robin per rilevare le modifiche incrementali. Per questo motivo è importante mantenere in esecuzione l'istanza.
È possibile abilitare e disabilitare le scansioni a livello di volume o a livello di schema del database.
|
La BlueXP classification non impone limiti alla quantità di dati che può analizzare. Ogni connettore supporta la scansione e la visualizzazione di 500 TiB di dati. Per scansionare più di 500 TiB di dati,"installare un altro connettore" Poi"distribuire un'altra istanza della BlueXP classification" . L'interfaccia utente BlueXP visualizza i dati di un singolo connettore. Per suggerimenti sulla visualizzazione dei dati da più connettori, vedere"Utilizzare più connettori" . |
Qual è la differenza tra le scansioni di mappatura e classificazione
È possibile eseguire due tipi di scansioni nella classificazione BlueXP :
-
Le scansioni solo mappatura forniscono solo una panoramica di alto livello dei vostri dati e vengono eseguite su origini dati selezionate. Le scansioni di sola mappatura richiedono meno tempo delle scansioni di mappatura e classificazione perché non accedono ai file per visualizzare i dati al loro interno. Si consiglia di eseguire questa operazione inizialmente per identificare le aree di ricerca e quindi eseguire una scansione Map & Classify su tali aree.
-
Le scansioni Map & Classify forniscono una scansione profonda dei vostri dati.
Per informazioni dettagliate sulle differenze tra le scansioni Mapping e Classification, vedere "Qual è la differenza tra le scansioni di mappatura e classificazione?".
Informazioni classificate dalla classificazione BlueXP
La classificazione BlueXP raccoglie, indicizza e assegna categorie ai seguenti dati:
-
Metadati standard sui file: Il tipo di file, le sue dimensioni, le date di creazione e modifica, e così via.
-
Dati personali: Informazioni personali identificabili (PII) quali indirizzi e-mail, numeri di identificazione o numeri di carta di credito, che la classificazione BlueXP identifica utilizzando parole, stringhe e modelli specifici nei file. "Scopri di più sui dati personali".
-
Dati personali sensibili: Tipi speciali di dati personali sensibili (SPII), quali dati sanitari, origine etnica o opinioni politiche, come definito dal regolamento generale sulla protezione dei dati (GDPR) e da altre normative sulla privacy. "Scopri di più sui dati personali sensibili".
-
Categorie: La classificazione BlueXP prende i dati sottoposti a scansione e li divide in diversi tipi di categorie. Le categorie sono argomenti basati sull'analisi ai del contenuto e dei metadati di ciascun file. "Scopri di più sulle categorie".
-
Tipi: La classificazione BlueXP prende i dati sottoposti a scansione e li suddivide in base al tipo di file. "Scopri di più sui tipi".
-
Riconoscimento delle entità dei nomi: La classificazione BlueXP utilizza l'intelligenza artificiale per estrarre i nomi naturali delle persone dai documenti. "Scopri come rispondere alle richieste di accesso ai soggetti dati".
Panoramica delle reti
La classificazione BlueXP implementa un singolo server, o cluster, ovunque tu scelga, nel cloud o on-premise. I server si connettono alle origini dati tramite protocolli standard e indicizzano i risultati in un cluster Elasticsearch, anch'esso distribuito sugli stessi server. In questo modo è possibile supportare ambienti multicloud, multicloud, cloud privato e on-premise.
BlueXP implementa l'istanza di classificazione BlueXP con un gruppo di protezione che abilita le connessioni HTTP in entrata dall'istanza del connettore.
Quando si utilizza BlueXP in modalità SaaS, la connessione a BlueXP viene fornita tramite HTTPS e i dati privati inviati tra il browser e l'istanza di classificazione BlueXP vengono protetti con la crittografia end-to-end tramite TLS 1,2, il che significa che NetApp e terze parti non possono leggerli.
Le regole in uscita sono completamente aperte. L'accesso a Internet è necessario per installare e aggiornare il software di classificazione BlueXP e per inviare metriche di utilizzo.
Se hai requisiti di rete rigorosi, "Scopri gli endpoint che BlueXP classifica a contatto con".