Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Scopri di più sulla classificazione BlueXP

Collaboratori

La classificazione BlueXP (Cloud Data Sense) è un servizio di governance dei dati per BlueXP che analizza le origini dati on-premise e cloud aziendali per mappare e classificare i dati e identificare informazioni private. In questo modo è possibile ridurre i rischi di sicurezza e conformità, ridurre i costi di storage e assistere i progetti di migrazione dei dati.

Caratteristiche

La classificazione BlueXP utilizza l'intelligenza artificiale (ai), l'elaborazione del linguaggio naturale (NLP) e l'apprendimento automatico (ML) per comprendere il contenuto che esegue la scansione al fine di estrarre le entità e classificare il contenuto di conseguenza. Ciò consente alla classificazione BlueXP di fornire le seguenti aree di funzionalità.

Mantenere la conformità

La classificazione BlueXP offre diversi strumenti che possono aiutare a soddisfare le tue esigenze di conformità. È possibile utilizzare la classificazione BlueXP per:

  • Identificare le informazioni personali identificabili (PII).

  • Identificare un'ampia gamma di informazioni personali sensibili come richiesto dalle normative sulla privacy GDPR, CCPA, PCI e HIPAA.

  • Rispondere alle richieste di accesso dei soggetti dati (DSAR) in base al nome o all'indirizzo e-mail.

  • Identificare se gli identificatori univoci dei database sono presenti nei file di altri repository, creando in pratica un elenco personalizzato di "dati personali" identificati nelle scansioni di classificazione di BlueXP.

  • Notifica ad alcuni utenti via email quando i file contengono determinati dati PII (si definiscono questi criteri utilizzando "Policy") in modo da poter decidere un piano d'azione.

Rafforzare la sicurezza

La classificazione BlueXP è in grado di identificare i dati potenzialmente a rischio per l'accesso a scopi criminali. È possibile utilizzare la classificazione BlueXP per:

  • Identificare tutti i file e le directory (condivisioni e cartelle) con autorizzazioni aperte che sono esposte all'intera organizzazione o al pubblico.

  • Identificare i dati sensibili che risiedono al di fuori della posizione iniziale dedicata.

  • Rispettare le policy di conservazione dei dati.

  • Utilizza Policies per notificare automaticamente al personale addetto alla sicurezza i nuovi problemi di sicurezza in modo che possa intervenire immediatamente.

  • Aggiungere tag personalizzati ai file (ad esempio, "deve essere spostato") e assegnare un utente BlueXP in modo che la persona possa possedere gli aggiornamenti dei file.

  • Visualizzare e modificare "Etichette AIP (Azure Information Protection)" nei file.

Ottimizzare l'utilizzo dello storage

La classificazione BlueXP offre strumenti che possono aiutare con il TCO (Total Cost of Ownership) dello storage. È possibile utilizzare la classificazione BlueXP per:

  • Aumenta l'efficienza dello storage identificando dati duplicati o non correlati al business. È possibile utilizzare queste informazioni per decidere se si desidera spostare o eliminare determinati file.

  • Eliminare i file che sembrano insicuri o troppo rischiosi da lasciare nel sistema storage o che sono stati identificati come duplicati. È possibile utilizzare Policies per eliminare automaticamente i file che corrispondono a determinati criteri.

  • Risparmia i costi dello storage identificando i dati inattivi che puoi tierare per uno storage a oggetti meno costoso. "Scopri di più sul tiering dei sistemi Cloud Volumes ONTAP". "Scopri di più sul tiering dei sistemi ONTAP on-premise".

Accelera la migrazione dei dati

La classificazione BlueXP può essere utilizzata per eseguire la scansione dei dati on-premise prima di eseguirne la migrazione nel cloud pubblico o privato. È possibile utilizzare la classificazione BlueXP per:

  • Visualizzare le dimensioni dei dati e se questi contengono informazioni riservate prima di spostarli.

  • Filtrare i dati di origine (in base a oltre 25 tipi di criteri) in modo da poter spostare solo i file richiesti nella destinazione - i dati non necessari non vengono spostati.

  • Sposta, copia o sincronizza automaticamente e continuamente solo i dati richiesti nel repository cloud.

Origini dati supportate

La classificazione BlueXP è in grado di eseguire la scansione e l'analisi di dati strutturati e non strutturati provenienti dai seguenti tipi di origini dati:

NetApp:

  • Cloud Volumes ONTAP (implementato in AWS, Azure o GCP)

  • Cluster ONTAP on-premise

  • StorageGRID

  • Azure NetApp Files

  • Amazon FSX per ONTAP

  • Cloud Volumes Service per Google Cloud

Non NetApp:

  • Dell EMC Isilon

  • Storage puro

  • Nutanix

  • Qualsiasi altro vendor di storage

Cloud:

  • Amazon S3

  • Storage Google Cloud

  • OneDrive

  • SharePoint Online

  • SharePoint on-premise (SharePoint Server)

  • Google Drive

Database:

  • Amazon Relational Database Service (Amazon RDS)

  • MongoDB

  • MySQL

  • Oracle

  • PostgreSQL

  • SAP HANA

  • SQL Server (MSSQL)

La classificazione BlueXP supporta le versioni NFS 3.x e CIFS 1.x, 2,0, 2,1 e 3,0.

Costo

  • Il costo per l'utilizzo della classificazione BlueXP dipende dalla quantità di dati che si sta eseguendo la scansione. I primi 1 TB di dati che la classificazione BlueXP scansiona in un'area di lavoro BlueXP sono gratuiti per 30 giorni. Sono inclusi tutti i dati provenienti da tutti gli ambienti di lavoro e le origini dati. Per continuare la scansione dei dati dopo tale data, è necessario un abbonamento a AWS, Azure o GCP Marketplace o una licenza BYOL di NetApp. Vedere "prezzi" per ulteriori informazioni.

  • L'installazione della classificazione BlueXP nel cloud richiede l'implementazione di un'istanza di cloud, con conseguente addebito da parte del provider di cloud in cui viene implementata. Vedere il tipo di istanza implementata per ciascun cloud provider. L'installazione della classificazione BlueXP su un sistema on-premise non richiede alcun costo.

  • La classificazione BlueXP richiede l'implementazione di un connettore BlueXP. In molti casi si dispone già di un connettore a causa di altri servizi e storage utilizzati in BlueXP. L'istanza del connettore comporta addebiti da parte del cloud provider in cui viene implementata. Vedere "tipo di istanza implementata per ciascun cloud provider". L'installazione del connettore su un sistema on-premise non richiede alcun costo.

Costi di trasferimento dei dati

I costi di trasferimento dei dati dipendono dalla configurazione. Se l'istanza di classificazione BlueXP e l'origine dati si trovano nella stessa zona di disponibilità e nella stessa regione, non ci sono costi di trasferimento dei dati. Tuttavia, se l'origine dati, come un sistema Cloud Volumes ONTAP o un bucket S3, si trova in una _area o regione di disponibilità diversa, il tuo cloud provider addebiterà i costi di trasferimento dei dati. Per ulteriori informazioni, consulta i seguenti link:

L'istanza di classificazione BlueXP

Quando si implementa la classificazione BlueXP nel cloud, BlueXP implementa l'istanza nella stessa sottorete del connettore. "Scopri di più sui connettori."

Diagramma che mostra un'istanza di BlueXP e un'istanza di classificazione BlueXP in esecuzione nel provider cloud.

Tenere presente quanto segue sull'istanza predefinita:

  • In AWS, la classificazione BlueXP viene eseguita su un "m6i.4xlarge instance" Con un disco GP2 da 500 GiB. L'immagine del sistema operativo è Amazon Linux 2. Una volta implementato in AWS, è possibile scegliere una dimensione di istanza inferiore se si esegue la scansione di una piccola quantità di dati.

  • In Azure, la classificazione BlueXP viene eseguita su un "Standard_D16s_v3 VM" Con un disco da 500 GiB. L'immagine del sistema operativo è CentOS 7.9.

  • In GCP, la classificazione BlueXP viene eseguita su un "n2-standard-16 VM" Con un disco persistente standard da 500 GiB. L'immagine del sistema operativo è CentOS 7.9.

  • Nelle regioni in cui l'istanza predefinita non è disponibile, la classificazione BlueXP viene eseguita su un'istanza alternativa. "Vedere i tipi di istanza alternativi".

  • L'istanza è denominata CloudCompliance con un hash generato (UUID) concatenato ad essa. Ad esempio: CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7

  • Per ogni connettore viene implementata una sola istanza di classificazione BlueXP.

Puoi anche implementare la classificazione BlueXP su un host Linux on-premise o su un host nel tuo cloud provider preferito. Il software funziona esattamente allo stesso modo, indipendentemente dal metodo di installazione scelto. Gli aggiornamenti del software di classificazione BlueXP sono automatizzati finché l'istanza dispone di accesso a Internet.

Suggerimento L'istanza deve rimanere sempre in esecuzione perché la classificazione BlueXP esegue continuamente la scansione dei dati.

Utilizzando un tipo di istanza più piccolo

È possibile implementare la classificazione BlueXP su un sistema con meno CPU e meno RAM, ma ci sono alcune limitazioni quando si utilizzano questi sistemi meno potenti.

Dimensioni del sistema Specifiche Limitazioni

Extra large

32 CPU, 128 GB di RAM, 1 TiB SSD

Scansione di fino a 500 milioni di file.

Grande (impostazione predefinita)

16 CPU, 64 GB di RAM, SSD da 500 GiB

Scansione di fino a 250 milioni di file.

Medio

8 CPU, 32 GB di RAM, SSD da 200 GiB

Scansione più lenta e scansione di un massimo di 1 milione di file.

Piccolo

8 CPU, 16 GB di RAM, SSD da 100 GiB

Stesse limitazioni del "Medio", più la capacità di identificare "nomi dei soggetti dei dati" l'interno dei file è disattivato.

Quando si implementa la classificazione BlueXP nel cloud su AWS, è possibile scegliere un'istanza grande/media/piccola. Quando implementi la classificazione BlueXP in Azure o GCP, invia un'email ng-contact-data-sense@netapp.com per assistenza se desideri utilizzare uno di questi sistemi alternativi. Dovremo collaborare con te per implementare queste altre configurazioni cloud.

Quando si implementa la classificazione BlueXP on-premise, basta utilizzare un host Linux con specifiche alternative. Non è necessario contattare NetApp per assistenza.

Come funziona la classificazione BlueXP

Ad alto livello, la classificazione BlueXP funziona come segue:

  1. Si implementa un'istanza della classificazione BlueXP in BlueXP.

  2. È possibile attivare la mappatura ad alto livello o la scansione a livello profondo su una o più origini dati.

  3. La classificazione BlueXP esegue la scansione dei dati utilizzando un processo di apprendimento ai.

  4. Utilizza le dashboard e i tool di reporting forniti per aiutarti nelle tue attività di compliance e governance.

Come funzionano le scansioni

Dopo aver attivato la classificazione BlueXP e selezionato i repository da analizzare (volumi, bucket, schemi di database o dati utente di OneDrive o SharePoint), viene avviata immediatamente la scansione dei dati per identificare i dati personali e sensibili. Nella maggior parte dei casi, è consigliabile concentrarsi sulla scansione dei dati di produzione in tempo reale anziché su backup, mirror o siti DR. Quindi, la classificazione BlueXP mappa i dati dell'organizzazione, categorizza ogni file e identifica ed estrae entità e modelli predefiniti nei dati. Il risultato della scansione è un indice di informazioni personali, informazioni personali sensibili, categorie di dati e tipi di file.

La classificazione BlueXP si connette ai dati come qualsiasi altro client montando volumi NFS e CIFS. Ai volumi NFS viene automaticamente eseguito l'accesso in sola lettura, mentre è necessario fornire le credenziali Active Directory per eseguire la scansione dei volumi CIFS.

Diagramma che mostra un'istanza di BlueXP e un'istanza di classificazione BlueXP in esecuzione nel provider cloud. L'istanza di classificazione BlueXP si connette a volumi NFS e CIFS, bucket S3, account OneDrive e database per eseguirne la scansione.

Dopo la scansione iniziale, la classificazione BlueXP analizza continuamente i dati in modo round-robin per rilevare le modifiche incrementali (è per questo che è importante mantenere l'istanza in esecuzione).

È possibile attivare e disattivare le scansioni a livello di volume, a livello di bucket, a livello di schema del database, a livello di utente OneDrive e a livello di sito SharePoint.

Qual è la differenza tra le scansioni di mappatura e classificazione

La classificazione BlueXP consente di eseguire una scansione generale di "mappatura" su origini dati selezionate. La mappatura fornisce solo una panoramica di alto livello dei dati, mentre la classificazione fornisce una scansione di alto livello dei dati. Il mapping può essere eseguito sulle origini dati molto rapidamente perché non accede ai file per vedere i dati all'interno.

Molti utenti apprezzano questa funzionalità perché desiderano eseguire rapidamente la scansione dei dati per identificare le origini dati che richiedono una maggiore ricerca e quindi possono abilitare le scansioni di classificazione solo su quelle origini dati o volumi richiesti.

La tabella seguente mostra alcune delle differenze:

Funzione Classificazione Mappatura

Velocità di scansione

Lento

Veloce

Elenco dei tipi di file e della capacità utilizzata

Numero di file e capacità utilizzata

Età e dimensioni dei file

Capacità di eseguire un "Report di mappatura dei dati"

Pagina di analisi dei dati per visualizzare i dettagli del file

No

Cercare i nomi all'interno dei file

No

Creare "policy" che forniscono risultati di ricerca personalizzati

No

Categorizzare i dati utilizzando le etichette AIP e i tag di stato

No

Copiare, eliminare e spostare i file di origine

No

Possibilità di eseguire altri report

No

Con quale rapidità la classificazione BlueXP esegue la scansione dei dati

La velocità di scansione è influenzata dalla latenza di rete, dalla latenza del disco, dalla larghezza di banda della rete, dalle dimensioni dell'ambiente e dalle dimensioni della distribuzione dei file.

  • Quando si eseguono scansioni Mapping, la classificazione BlueXP può eseguire la scansione tra 100-150 Tibers di dati al giorno, per nodo dello scanner.

  • Quando si eseguono scansioni di classificazione, la classificazione BlueXP è in grado di eseguire la scansione tra 15-40 Tibers di dati al giorno, per nodo dello scanner.

Informazioni indicizzati dalla classificazione BlueXP

La classificazione BlueXP raccoglie, indicizza e assegna categorie ai dati (file). I dati indicizzati dalla classificazione BlueXP includono quanto segue:

Metadati standard

La classificazione BlueXP raccoglie i metadati standard relativi ai file: Il tipo di file, le dimensioni, le date di creazione e modifica e così via.

Dati personali

Informazioni personali come indirizzi e-mail, numeri di identificazione o numeri di carta di credito. "Scopri di più sui dati personali".

Dati personali sensibili

Tipi speciali di informazioni sensibili, come dati sanitari, origine etnica o opinioni politiche, come definito dal GDPR e da altre normative sulla privacy. "Scopri di più sui dati personali sensibili".

Categorie

La classificazione BlueXP prende i dati sottoposti a scansione e li divide in diversi tipi di categorie. Le categorie sono argomenti basati sull'analisi ai del contenuto e dei metadati di ciascun file. "Scopri di più sulle categorie".

Tipi

La classificazione BlueXP prende i dati sottoposti a scansione e li suddivide in base al tipo di file. "Scopri di più sui tipi".

Riconoscimento entità nome

La classificazione BlueXP utilizza l'ai per estrarre i nomi delle persone fisiche dai documenti. "Scopri come rispondere alle richieste di accesso ai soggetti dati".

Panoramica delle reti

BlueXP implementa l'istanza di classificazione BlueXP con un gruppo di protezione che abilita le connessioni HTTP in entrata dall'istanza del connettore.

Quando si utilizza BlueXP in modalità SaaS, la connessione a BlueXP viene servita su HTTPS e i dati privati inviati tra il browser e l'istanza di classificazione BlueXP sono protetti con una crittografia end-to-end basata su TLS 1,2, il che significa che NetApp e terze parti non possono leggerla.

Le regole in uscita sono completamente aperte. L'accesso a Internet è necessario per installare e aggiornare il software di classificazione BlueXP e per inviare metriche di utilizzo.

Accesso dell'utente alle informazioni di conformità

Il ruolo assegnato a ciascun utente offre diverse funzionalità all'interno di BlueXP e all'interno della classificazione BlueXP:

  • Un account Admin può gestire le impostazioni di conformità e visualizzare le informazioni di conformità per tutti gli ambienti di lavoro.

  • Un Workspace Admin può gestire le impostazioni di conformità e visualizzare le informazioni di conformità solo per i sistemi ai quali è consentito l'accesso. Se un amministratore dell'area di lavoro non riesce ad accedere a un ambiente di lavoro in BlueXP, non può visualizzare alcuna informazione di conformità per l'ambiente di lavoro nella scheda di classificazione di BlueXP.

  • Gli utenti con il ruolo Compliance Viewer possono solo visualizzare le informazioni di conformità e generare report per i sistemi ai quali sono autorizzati ad accedere. Questi utenti non possono attivare/disattivare la scansione di volumi, bucket o schemi di database. Questi utenti non possono copiare, spostare o eliminare i file.