Scopri di più sulla classificazione BlueXP
La classificazione BlueXP (Cloud Data Sense) è un servizio di governance dei dati per BlueXP che analizza le origini dati on-premise e cloud aziendali per mappare e classificare i dati e identificare informazioni private. In questo modo è possibile ridurre i rischi di sicurezza e conformità, ridurre i costi di storage e assistere i progetti di migrazione dei dati.
IMPORTANTE
A partire da maggio 2024 con la versione 1,31, la classificazione BlueXP è ora disponibile come funzionalità core all'interno di BlueXP senza costi aggiuntivi. Non è richiesta alcuna licenza di classificazione o abbonamento. Abbiamo concentrato la funzionalità di classificazione BlueXP anche sui sistemi storage NetApp, per cui alcune funzionalità non utilizzate o sottoutilizzate sono state abbandonate.
Gli utenti che utilizzano versioni precedenti o precedenti della versione 1,30 continueranno a utilizzare tale versione fino alla scadenza dell'abbonamento.
Caratteristiche
La classificazione BlueXP utilizza l'intelligenza artificiale (ai), l'elaborazione del linguaggio naturale (NLP) e l'apprendimento automatico (ML) per comprendere il contenuto che esegue la scansione al fine di estrarre le entità e classificare il contenuto di conseguenza. Ciò consente alla classificazione BlueXP di fornire le seguenti aree di funzionalità.
La classificazione BlueXP offre diversi strumenti che possono aiutare a soddisfare le tue esigenze di conformità. È possibile utilizzare la classificazione BlueXP per:
-
Identificare le informazioni personali identificabili (PII).
-
Identificare un'ampia gamma di informazioni personali sensibili come richiesto dalle normative sulla privacy GDPR, CCPA, PCI e HIPAA.
-
Rispondere alle richieste di accesso dei soggetti dati (DSAR) in base al nome o all'indirizzo e-mail.
La classificazione BlueXP è in grado di identificare i dati potenzialmente a rischio per l'accesso a scopi criminali. È possibile utilizzare la classificazione BlueXP per:
-
Identificare tutti i file e le directory (condivisioni e cartelle) con autorizzazioni aperte che sono esposte all'intera organizzazione o al pubblico.
-
Identificare i dati sensibili che risiedono al di fuori della posizione iniziale dedicata.
-
Rispettare le policy di conservazione dei dati.
-
Utilizzare Policies per rilevare automaticamente i nuovi problemi di sicurezza, in modo che il personale addetto alla sicurezza possa intervenire immediatamente.
La classificazione BlueXP offre strumenti che possono aiutare con il TCO (Total Cost of Ownership) dello storage. È possibile utilizzare la classificazione BlueXP per:
-
Aumenta l'efficienza dello storage identificando dati duplicati o non correlati al business.
-
Risparmia i costi dello storage identificando i dati inattivi che puoi tierare per uno storage a oggetti meno costoso. "Scopri di più sul tiering dei sistemi Cloud Volumes ONTAP". "Scopri di più sul tiering dei sistemi ONTAP on-premise".
Ambienti di lavoro e origini dati supportati
La classificazione BlueXP può analizzare e analizzare dati strutturati e non strutturati provenienti dai seguenti tipi di ambienti di lavoro e origini dati:
Ambienti di lavoro
-
Cloud Volumes ONTAP (implementato in AWS, Azure o GCP)
-
Cluster ONTAP on-premise
-
StorageGRID
-
Azure NetApp Files
-
Amazon FSX per ONTAP
-
Google Cloud NetApp Volumes
Origini dati
-
Condivisioni di file NetApp
-
Database:
-
Amazon Relational Database Service (Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server (MSSQL)
-
La classificazione BlueXP supporta le versioni NFS 3.x e CIFS 1.x, 2,0, 2,1 e 3,0.
Costo
La classificazione BlueXP è ora gratuita da utilizzare. Non è richiesta alcuna licenza di classificazione o abbonamento a pagamento.
Costi delle infrastrutture
-
L'installazione della classificazione BlueXP nel cloud richiede l'implementazione di un'istanza di cloud, con conseguente addebito da parte del provider di cloud in cui viene implementata. Vedere il tipo di istanza implementata per ciascun cloud provider. L'installazione della classificazione BlueXP su un sistema on-premise non richiede alcun costo.
-
La classificazione BlueXP richiede l'implementazione di un connettore BlueXP. In molti casi si dispone già di un connettore a causa di altri servizi e storage utilizzati in BlueXP. L'istanza del connettore comporta addebiti da parte del cloud provider in cui viene implementata. Vedere "tipo di istanza implementata per ciascun cloud provider". L'installazione del connettore su un sistema on-premise non richiede alcun costo.
Costi di trasferimento dei dati
I costi di trasferimento dei dati dipendono dalla configurazione. Se l'istanza di classificazione BlueXP e l'origine dati si trovano nella stessa zona di disponibilità e nella stessa regione, non ci sono costi di trasferimento dei dati. Ma se l'origine dei dati, ad esempio un sistema Cloud Volumes ONTAP, si trova in una zona o regione di disponibilità diversa, i costi di trasferimento dei dati verranno addebitati dal provider cloud. Per ulteriori informazioni, consulta i seguenti link:
L'istanza di classificazione BlueXP
Quando si implementa la classificazione BlueXP nel cloud, BlueXP implementa l'istanza nella stessa sottorete del connettore. "Scopri di più sui connettori."
Tenere presente quanto segue sull'istanza predefinita:
-
In AWS, la classificazione BlueXP viene eseguita su un "m6i.4xlarge instance" Con un disco GP2 da 500 GiB. L'immagine del sistema operativo è Amazon Linux 2. Una volta implementato in AWS, è possibile scegliere una dimensione di istanza inferiore se si esegue la scansione di una piccola quantità di dati.
-
In Azure, la classificazione BlueXP viene eseguita su un "Standard_D16s_v3 VM" Con un disco da 500 GiB. L'immagine del sistema operativo è CentOS 7.9.
-
In GCP, la classificazione BlueXP viene eseguita su un "n2-standard-16 VM" Con un disco persistente standard da 500 GiB. L'immagine del sistema operativo è CentOS 7.9.
-
Nelle regioni in cui l'istanza predefinita non è disponibile, la classificazione BlueXP viene eseguita su un'istanza alternativa. "Vedere i tipi di istanza alternativi".
-
L'istanza è denominata CloudCompliance con un hash generato (UUID) concatenato ad essa. Ad esempio: CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7
-
Per ogni connettore viene implementata una sola istanza di classificazione BlueXP.
Puoi anche implementare la classificazione BlueXP su un host Linux on-premise o su un host nel tuo cloud provider preferito. Il software funziona esattamente allo stesso modo, indipendentemente dal metodo di installazione scelto. Gli aggiornamenti del software di classificazione BlueXP sono automatizzati finché l'istanza dispone di accesso a Internet.
L'istanza deve rimanere sempre in esecuzione perché la classificazione BlueXP esegue continuamente la scansione dei dati. |
Distribuire su diversi tipi di istanza
Puoi implementare la classificazione BlueXP su un sistema con meno CPU e meno RAM.
Dimensioni del sistema | Specifiche | Limitazioni |
---|---|---|
Extra large |
32 CPU, 128 GB di RAM, 1 TiB SSD |
Scansione di fino a 500 milioni di file. |
Grande (impostazione predefinita) |
16 CPU, 64 GB di RAM, SSD da 500 GiB |
Scansione di fino a 250 milioni di file. |
Quando implementi la classificazione BlueXP in Azure o GCP, invia un'email ng-contact-data-sense@netapp.com per assistenza se desideri utilizzare un tipo di istanza più piccolo.
Come funziona la classificazione BlueXP
Ad alto livello, la classificazione BlueXP funziona come segue:
-
Si implementa un'istanza della classificazione BlueXP in BlueXP.
-
È possibile attivare la mappatura ad alto livello o la scansione a livello profondo su una o più origini dati.
-
La classificazione BlueXP esegue la scansione dei dati utilizzando un processo di apprendimento ai.
-
Utilizza le dashboard e i tool di reporting forniti per aiutarti nelle tue attività di compliance e governance.
Come funzionano le scansioni
Una volta attivata la classificazione BlueXP e selezionati i repository da analizzare (volumi, schemi di database o altri dati utente), viene avviata immediatamente la scansione dei dati per identificare i dati personali e sensibili. Nella maggior parte dei casi, è consigliabile concentrarsi sulla scansione dei dati di produzione in tempo reale anziché su backup, mirror o siti DR. Quindi, la classificazione BlueXP mappa i dati dell'organizzazione, categorizza ogni file e identifica ed estrae entità e modelli predefiniti nei dati. Il risultato della scansione è un indice di informazioni personali, informazioni personali sensibili, categorie di dati e tipi di file.
La classificazione BlueXP si connette ai dati come qualsiasi altro client montando volumi NFS e CIFS. Ai volumi NFS viene automaticamente eseguito l'accesso in sola lettura, mentre è necessario fornire le credenziali Active Directory per eseguire la scansione dei volumi CIFS.
Dopo la scansione iniziale, la classificazione BlueXP analizza continuamente i dati in modo round-robin per rilevare le modifiche incrementali (è per questo che è importante mantenere l'istanza in esecuzione).
È possibile attivare e disattivare le scansioni a livello di volume o a livello di schema del database.
Qual è la differenza tra le scansioni di mappatura e classificazione
La classificazione BlueXP consente di eseguire una scansione generale di "mappatura" su origini dati selezionate. La mappatura fornisce solo una panoramica di alto livello dei dati, mentre la classificazione fornisce una scansione di alto livello dei dati. Il mapping può essere eseguito sulle origini dati molto rapidamente perché non accede ai file per vedere i dati all'interno.
Molti utenti apprezzano questa funzionalità perché desiderano eseguire rapidamente la scansione dei dati per identificare le origini dati che richiedono una maggiore ricerca e quindi possono abilitare le scansioni di classificazione solo su quelle origini dati o volumi richiesti.
La tabella seguente mostra alcune delle differenze:
Funzione | Classificazione | Mappatura |
---|---|---|
Velocità di scansione |
Lento |
Veloce |
Prezzi |
Gratuito |
Gratuito |
Capacità |
Limitata a 500 TB |
Limitata a 500 TB |
Elenco dei tipi di file e della capacità utilizzata |
Sì |
Sì |
Numero di file e capacità utilizzata |
Sì |
Sì |
Età e dimensioni dei file |
Sì |
Sì |
Capacità di eseguire un "Report di mappatura dei dati" |
Sì |
Sì |
Pagina di analisi dei dati per visualizzare i dettagli del file |
Sì |
No |
Cercare i nomi all'interno dei file |
Sì |
No |
Creare "policy" che forniscono risultati di ricerca personalizzati |
Sì |
No |
Possibilità di eseguire altri report |
Sì |
No |
Possibilità di visualizzare i metadati dei file* |
No |
Sì |
*I seguenti metadati vengono estratti dai file durante le scansioni di mappatura:
-
Ambiente di lavoro
-
Tipo di ambiente di lavoro
-
Repository di storage
-
Tipo di file
-
Capacità utilizzata
-
Numero di file
-
Dimensione del file
-
Creazione di file
-
Ultimo accesso al file
-
Ultima modifica al file
-
Ora di rilevamento file
-
Estrazione delle autorizzazioni
Differenze del dashboard di governance:
Funzione | Mappa e classifica | Mappa |
---|---|---|
Dati obsoleti |
Sì |
Sì |
Dati non aziendali |
Sì |
Sì |
File duplicati |
Sì |
Sì |
Criteri predefiniti |
Sì |
No |
Criteri personalizzati |
Sì |
Sì |
Rapporto DDA |
Sì |
Sì |
Rapporto di mappatura |
Sì |
Sì |
Rilevamento del livello di sensibilità |
Sì |
No |
Dati sensibili con autorizzazioni estese |
Sì |
No |
Autorizzazioni aperte |
Sì |
Sì |
Età dei dati |
Sì |
Sì |
Dimensioni dei dati |
Sì |
Sì |
Categorie |
Sì |
No |
Tipi di file |
Sì |
Sì |
Differenze del dashboard di conformità:
Funzione | Mappa e classifica | Mappa |
---|---|---|
Informazioni personali |
Sì |
No |
Informazioni personali sensibili |
Sì |
No |
Report di valutazione sui rischi legati alla privacy |
Sì |
No |
Report HIPAA |
Sì |
No |
Report PCI DSS |
Sì |
No |
Differenze tra i filtri di analisi:
Funzione | Mappa e classifica | Mappa |
---|---|---|
Policy |
Sì |
Sì |
Tipo di ambiente di lavoro |
Sì |
Sì |
Ambiente di lavoro |
Sì |
Sì |
Repository di storage |
Sì |
Sì |
Tipo di file |
Sì |
Sì |
Dimensione del file |
Sì |
Sì |
Ora di creazione |
Sì |
Sì |
Tempo scoperto |
Sì |
Sì |
Ultima modifica |
Sì |
Sì |
Ultimo accesso |
Sì |
Sì |
Autorizzazioni aperte |
Sì |
Sì |
Percorso directory file |
Sì |
Sì |
Categoria |
Sì |
No |
Livello di sensibilità |
Sì |
No |
Numero di identificatori |
Sì |
No |
Dati personali |
Sì |
No |
Dati personali sensibili |
Sì |
No |
Soggetto interessato |
Sì |
No |
Duplicati |
Sì |
Sì |
Stato di classificazione |
Sì |
Lo stato è sempre "informazioni riservate" |
Evento di analisi della scansione |
Sì |
Sì |
Hash file |
Sì |
Sì |
Numero di utenti con accesso |
Sì |
Sì |
Autorizzazioni utente/gruppo |
Sì |
Sì |
Proprietario del file |
Sì |
Sì |
Tipo di directory |
Sì |
Sì |
Con quale rapidità la classificazione BlueXP esegue la scansione dei dati
La velocità di scansione è influenzata dalla latenza di rete, dalla latenza del disco, dalla larghezza di banda della rete, dalle dimensioni dell'ambiente e dalle dimensioni della distribuzione dei file.
-
Quando si eseguono scansioni di mappatura, la classificazione BlueXP può eseguire la scansione tra 100-150 Tibs di dati al giorno.
-
Quando si eseguono le scansioni di classificazione, la classificazione BlueXP può eseguire la scansione tra 15-40 Tibs di dati al giorno.
Informazioni classificate dalla classificazione BlueXP
La classificazione BlueXP raccoglie, indicizza e assegna categorie ai dati (file). I dati indicizzati dalla classificazione BlueXP includono quanto segue:
-
Metadati standard sui file: Il tipo di file, le sue dimensioni, le date di creazione e modifica, e così via.
-
Dati personali: Dati personali (PII) quali indirizzi e-mail, numeri di identificazione o numeri di carta di credito. "Scopri di più sui dati personali".
-
Dati personali sensibili: Tipi speciali di dati personali sensibili (SPii), quali dati sanitari, origine etnica o opinioni politiche, come definito dal GDPR e da altre normative sulla privacy. "Scopri di più sui dati personali sensibili".
-
Categorie: La classificazione BlueXP prende i dati sottoposti a scansione e li divide in diversi tipi di categorie. Le categorie sono argomenti basati sull'analisi ai del contenuto e dei metadati di ciascun file. "Scopri di più sulle categorie".
-
Tipi: La classificazione BlueXP prende i dati sottoposti a scansione e li suddivide in base al tipo di file. "Scopri di più sui tipi".
-
Riconoscimento entità nome: La classificazione BlueXP utilizza l'intelligenza artificiale per estrarre i nomi naturali delle persone dai documenti. "Scopri come rispondere alle richieste di accesso ai soggetti dati".
Panoramica delle reti
BlueXP implementa l'istanza di classificazione BlueXP con un gruppo di protezione che abilita le connessioni HTTP in entrata dall'istanza del connettore.
Quando si utilizza BlueXP in modalità SaaS, la connessione a BlueXP viene servita su HTTPS e i dati privati inviati tra il browser e l'istanza di classificazione BlueXP sono protetti con una crittografia end-to-end basata su TLS 1,2, il che significa che NetApp e terze parti non possono leggerla.
Le regole in uscita sono completamente aperte. L'accesso a Internet è necessario per installare e aggiornare il software di classificazione BlueXP e per inviare metriche di utilizzo.
Se hai requisiti di rete rigorosi, "Scopri gli endpoint che BlueXP classifica a contatto con".
Ruoli utente nella classificazione BlueXP
Il ruolo assegnato a ciascun utente offre diverse funzionalità all'interno di BlueXP e della classificazione BlueXP . Per ulteriori informazioni, fare riferimento a quanto segue:
-
"Ruoli IAM di BlueXP " (Quando si utilizza BlueXP in modalità standard)
-
"Ruoli degli account BlueXP " (Quando si utilizza BlueXP in modalità limitata o privata)