Skip to main content
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Scopri di più sulla classificazione BlueXP

Collaboratori

La classificazione BlueXP (Cloud Data Sense) è un servizio di governance dei dati per BlueXP che analizza le origini dati on-premise e cloud aziendali per mappare e classificare i dati e identificare informazioni private. In questo modo è possibile ridurre i rischi di sicurezza e conformità, ridurre i costi di storage e assistere i progetti di migrazione dei dati.

IMPORTANTE

A partire da maggio 2024 con la versione 1,31, la classificazione BlueXP è ora disponibile come funzionalità core all'interno di BlueXP senza costi aggiuntivi. Non è richiesta alcuna licenza di classificazione o abbonamento. Abbiamo concentrato la funzionalità di classificazione BlueXP anche sui sistemi storage NetApp, per cui alcune funzionalità non utilizzate o sottoutilizzate sono state abbandonate.

Gli utenti che utilizzano versioni precedenti o precedenti della versione 1,30 continueranno a utilizzare tale versione fino alla scadenza dell'abbonamento.

Caratteristiche

La classificazione BlueXP utilizza l'intelligenza artificiale (ai), l'elaborazione del linguaggio naturale (NLP) e l'apprendimento automatico (ML) per comprendere il contenuto che esegue la scansione al fine di estrarre le entità e classificare il contenuto di conseguenza. Ciò consente alla classificazione BlueXP di fornire le seguenti aree di funzionalità.

Mantenere la conformità

La classificazione BlueXP offre diversi strumenti che possono aiutare a soddisfare le tue esigenze di conformità. È possibile utilizzare la classificazione BlueXP per:

  • Identificare le informazioni personali identificabili (PII).

  • Identificare un'ampia gamma di informazioni personali sensibili come richiesto dalle normative sulla privacy GDPR, CCPA, PCI e HIPAA.

  • Rispondere alle richieste di accesso dei soggetti dati (DSAR) in base al nome o all'indirizzo e-mail.

Rafforzare la sicurezza

La classificazione BlueXP è in grado di identificare i dati potenzialmente a rischio per l'accesso a scopi criminali. È possibile utilizzare la classificazione BlueXP per:

  • Identificare tutti i file e le directory (condivisioni e cartelle) con autorizzazioni aperte che sono esposte all'intera organizzazione o al pubblico.

  • Identificare i dati sensibili che risiedono al di fuori della posizione iniziale dedicata.

  • Rispettare le policy di conservazione dei dati.

  • Utilizzare Policies per rilevare automaticamente i nuovi problemi di sicurezza, in modo che il personale addetto alla sicurezza possa intervenire immediatamente.

Ottimizzare l'utilizzo dello storage

La classificazione BlueXP offre strumenti che possono aiutare con il TCO (Total Cost of Ownership) dello storage. È possibile utilizzare la classificazione BlueXP per:

Ambienti di lavoro e origini dati supportati

La classificazione BlueXP può analizzare e analizzare dati strutturati e non strutturati provenienti dai seguenti tipi di ambienti di lavoro e origini dati:

Ambienti di lavoro

  • Cloud Volumes ONTAP (implementato in AWS, Azure o GCP)

  • Cluster ONTAP on-premise

  • StorageGRID

  • Azure NetApp Files

  • Amazon FSX per ONTAP

  • Google Cloud NetApp Volumes

Origini dati

  • Condivisioni di file NetApp

  • Database:

    • Amazon Relational Database Service (Amazon RDS)

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • SQL Server (MSSQL)

La classificazione BlueXP supporta le versioni NFS 3.x, 4.0 e 4.1 e CIFS 1.x, 2.0, 2.1 e 3.0.

Costo

La classificazione BlueXP è ora gratuita da utilizzare. Non è richiesta alcuna licenza di classificazione o abbonamento a pagamento.

Costi delle infrastrutture

  • L'installazione della classificazione BlueXP nel cloud richiede l'implementazione di un'istanza di cloud, con conseguente addebito da parte del provider di cloud in cui viene implementata. Vedere il tipo di istanza implementata per ciascun cloud provider. L'installazione della classificazione BlueXP su un sistema on-premise non richiede alcun costo.

  • La classificazione BlueXP richiede l'implementazione di un connettore BlueXP. In molti casi si dispone già di un connettore a causa di altri servizi e storage utilizzati in BlueXP. L'istanza del connettore comporta addebiti da parte del cloud provider in cui viene implementata. Vedere "tipo di istanza implementata per ciascun cloud provider". L'installazione del connettore su un sistema on-premise non richiede alcun costo.

Costi di trasferimento dei dati

I costi di trasferimento dei dati dipendono dalla configurazione. Se l'istanza di classificazione BlueXP e l'origine dati si trovano nella stessa zona di disponibilità e nella stessa regione, non ci sono costi di trasferimento dei dati. Ma se l'origine dei dati, ad esempio un sistema Cloud Volumes ONTAP, si trova in una zona o regione di disponibilità diversa, i costi di trasferimento dei dati verranno addebitati dal provider cloud. Per ulteriori informazioni, consulta i seguenti link:

L'istanza di classificazione BlueXP

Quando si implementa la classificazione BlueXP nel cloud, BlueXP implementa l'istanza nella stessa sottorete del connettore. "Scopri di più sui connettori."

Diagramma che mostra un'istanza di BlueXP e un'istanza di classificazione BlueXP in esecuzione nel provider cloud.

Tenere presente quanto segue sull'istanza predefinita:

  • In AWS, la classificazione BlueXP viene eseguita su un "m6i.4xlarge instance" Con un disco GP2 da 500 GiB. L'immagine del sistema operativo è Amazon Linux 2. Una volta implementato in AWS, è possibile scegliere una dimensione di istanza inferiore se si esegue la scansione di una piccola quantità di dati.

  • In Azure, la classificazione BlueXP  viene eseguita su a "Standard_D16s_v3 VM" con un disco da 500 GiB. L'immagine del sistema operativo è Ubuntu 22,04.

  • Nella GCP, la classificazione BlueXP  viene eseguita su un "n2-standard-16 VM" con un disco persistente standard GiB 500. L'immagine del sistema operativo è Ubuntu 22,04.

  • Nelle regioni in cui l'istanza predefinita non è disponibile, la classificazione BlueXP viene eseguita su un'istanza alternativa. "Vedere i tipi di istanza alternativi".

  • L'istanza è denominata CloudCompliance con un hash generato (UUID) concatenato ad essa. Ad esempio: CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7

  • Per ogni connettore viene implementata una sola istanza di classificazione BlueXP.

Puoi anche implementare la classificazione BlueXP su un host Linux on-premise o su un host nel tuo cloud provider preferito. Il software funziona esattamente allo stesso modo, indipendentemente dal metodo di installazione scelto. Gli aggiornamenti del software di classificazione BlueXP sono automatizzati finché l'istanza dispone di accesso a Internet.

Suggerimento L'istanza deve rimanere sempre in esecuzione perché la classificazione BlueXP esegue continuamente la scansione dei dati.

Distribuire su diversi tipi di istanza

Puoi implementare la classificazione BlueXP su un sistema con meno CPU e meno RAM.

Dimensioni del sistema Specifiche Limitazioni

Extra large

32 CPU, 128 GB di RAM, 1 TiB SSD

Scansione di fino a 500 milioni di file.

Grande (impostazione predefinita)

16 CPU, 64 GB di RAM, SSD da 500 GiB

Scansione di fino a 250 milioni di file.

Quando implementi la classificazione BlueXP in Azure o GCP, invia un'email ng-contact-data-sense@netapp.com per assistenza se desideri utilizzare un tipo di istanza più piccolo.

Come funziona la classificazione BlueXP

Ad alto livello, la classificazione BlueXP funziona come segue:

  1. Si implementa un'istanza della classificazione BlueXP in BlueXP.

  2. È possibile attivare la mappatura ad alto livello o la scansione a livello profondo su una o più origini dati.

  3. La classificazione BlueXP esegue la scansione dei dati utilizzando un processo di apprendimento ai.

  4. Utilizza le dashboard e i tool di reporting forniti per aiutarti nelle tue attività di compliance e governance.

Come funzionano le scansioni

Una volta attivata la classificazione BlueXP e selezionati i repository da analizzare (volumi, schemi di database o altri dati utente), viene avviata immediatamente la scansione dei dati per identificare i dati personali e sensibili. Nella maggior parte dei casi, è consigliabile concentrarsi sulla scansione dei dati di produzione in tempo reale anziché su backup, mirror o siti DR. Quindi, la classificazione BlueXP mappa i dati dell'organizzazione, categorizza ogni file e identifica ed estrae entità e modelli predefiniti nei dati. Il risultato della scansione è un indice di informazioni personali, informazioni personali sensibili, categorie di dati e tipi di file.

La classificazione BlueXP si connette ai dati come qualsiasi altro client montando volumi NFS e CIFS. Ai volumi NFS viene automaticamente eseguito l'accesso in sola lettura, mentre è necessario fornire le credenziali Active Directory per eseguire la scansione dei volumi CIFS.

Diagramma che mostra un'istanza di BlueXP e un'istanza di classificazione BlueXP in esecuzione nel provider cloud. L'istanza di classificazione BlueXP si connette ai volumi e ai database NFS e CIFS per analizzarli.

Dopo la scansione iniziale, la classificazione BlueXP analizza continuamente i dati in modo round-robin per rilevare le modifiche incrementali (è per questo che è importante mantenere l'istanza in esecuzione).

È possibile attivare e disattivare le scansioni a livello di volume o a livello di schema del database.

Qual è la differenza tra le scansioni di mappatura e classificazione

La classificazione BlueXP consente di eseguire una scansione generale di "mappatura" su origini dati selezionate. La mappatura fornisce solo una panoramica di alto livello dei dati, mentre la classificazione fornisce una scansione di alto livello dei dati. Il mapping può essere eseguito sulle origini dati molto rapidamente perché non accede ai file per vedere i dati all'interno.

Molti utenti apprezzano questa funzionalità perché desiderano eseguire rapidamente la scansione dei dati per identificare le origini dati che richiedono una maggiore ricerca e quindi possono abilitare le scansioni di classificazione solo su quelle origini dati o volumi richiesti.

La tabella seguente mostra alcune delle differenze:

Funzione Classificazione Mappatura

Velocità di scansione

Lento

Veloce

Prezzi

Gratuito

Gratuito

Capacità

Limitata a 500 TB

Limitata a 500 TB

Elenco dei tipi di file e della capacità utilizzata

Numero di file e capacità utilizzata

Età e dimensioni dei file

Capacità di eseguire un "Report di mappatura dei dati"

Pagina di analisi dei dati per visualizzare i dettagli del file

No

Cercare i nomi all'interno dei file

No

Creare "policy" che forniscono risultati di ricerca personalizzati

No

Possibilità di eseguire altri report

No

Possibilità di visualizzare i metadati dei file*

No

*I seguenti metadati vengono estratti dai file durante le scansioni di mappatura:

  • Ambiente di lavoro

  • Tipo di ambiente di lavoro

  • Repository di storage

  • Tipo di file

  • Capacità utilizzata

  • Numero di file

  • Dimensione del file

  • Creazione di file

  • Ultimo accesso al file

  • Ultima modifica al file

  • Ora di rilevamento file

  • Estrazione delle autorizzazioni

Differenze del dashboard di governance:
Funzione Mappa e classifica Mappa

Dati obsoleti

Dati non aziendali

File duplicati

Criteri predefiniti

No

Criteri personalizzati

Rapporto DDA

Rapporto di mappatura

Rilevamento del livello di sensibilità

No

Dati sensibili con autorizzazioni estese

No

Autorizzazioni aperte

Età dei dati

Dimensioni dei dati

Categorie

No

Tipi di file

Differenze del dashboard di conformità:
Funzione Mappa e classifica Mappa

Informazioni personali

No

Informazioni personali sensibili

No

Report di valutazione sui rischi legati alla privacy

No

Report HIPAA

No

Report PCI DSS

No

Differenze tra i filtri di analisi:
Funzione Mappa e classifica Mappa

Policy

Tipo di ambiente di lavoro

Ambiente di lavoro

Repository di storage

Tipo di file

Dimensione del file

Ora di creazione

Tempo scoperto

Ultima modifica

Ultimo accesso

Autorizzazioni aperte

Percorso directory file

Categoria

No

Livello di sensibilità

No

Numero di identificatori

No

Dati personali

No

Dati personali sensibili

No

Soggetto interessato

No

Duplicati

Stato di classificazione

Lo stato è sempre "informazioni riservate"

Evento di analisi della scansione

Hash file

Numero di utenti con accesso

Autorizzazioni utente/gruppo

Proprietario del file

Tipo di directory

Con quale rapidità la classificazione BlueXP esegue la scansione dei dati

La velocità di scansione è influenzata dalla latenza di rete, dalla latenza del disco, dalla larghezza di banda della rete, dalle dimensioni dell'ambiente e dalle dimensioni della distribuzione dei file.

  • Quando si eseguono scansioni di mappatura, la classificazione BlueXP può eseguire la scansione tra 100-150 Tibs di dati al giorno.

  • Quando si eseguono le scansioni di classificazione, la classificazione BlueXP può eseguire la scansione tra 15-40 Tibs di dati al giorno.

Informazioni classificate dalla classificazione BlueXP 

La classificazione BlueXP raccoglie, indicizza e assegna categorie ai dati (file). I dati indicizzati dalla classificazione BlueXP includono quanto segue:

  • Metadati standard sui file: Il tipo di file, le sue dimensioni, le date di creazione e modifica, e così via.

  • Dati personali: Dati personali (PII) quali indirizzi e-mail, numeri di identificazione o numeri di carta di credito. "Scopri di più sui dati personali".

  • Dati personali sensibili: Tipi speciali di dati personali sensibili (SPii), quali dati sanitari, origine etnica o opinioni politiche, come definito dal GDPR e da altre normative sulla privacy. "Scopri di più sui dati personali sensibili".

  • Categorie: La classificazione BlueXP prende i dati sottoposti a scansione e li divide in diversi tipi di categorie. Le categorie sono argomenti basati sull'analisi ai del contenuto e dei metadati di ciascun file. "Scopri di più sulle categorie".

  • Tipi: La classificazione BlueXP prende i dati sottoposti a scansione e li suddivide in base al tipo di file. "Scopri di più sui tipi".

  • Riconoscimento entità nome: La classificazione BlueXP utilizza l'intelligenza artificiale per estrarre i nomi naturali delle persone dai documenti. "Scopri come rispondere alle richieste di accesso ai soggetti dati".

Panoramica delle reti

BlueXP implementa l'istanza di classificazione BlueXP con un gruppo di protezione che abilita le connessioni HTTP in entrata dall'istanza del connettore.

Quando si utilizza BlueXP in modalità SaaS, la connessione a BlueXP viene servita su HTTPS e i dati privati inviati tra il browser e l'istanza di classificazione BlueXP sono protetti con una crittografia end-to-end basata su TLS 1,2, il che significa che NetApp e terze parti non possono leggerla.

Le regole in uscita sono completamente aperte. L'accesso a Internet è necessario per installare e aggiornare il software di classificazione BlueXP e per inviare metriche di utilizzo.

Ruoli utente nella classificazione BlueXP 

Il ruolo assegnato a ciascun utente offre diverse funzionalità all'interno di BlueXP  e della classificazione BlueXP . Per ulteriori informazioni, fare riferimento a quanto segue: