BlueXPの分類について説明します
BlueXPの分類(Cloud Data Sense)は、BlueXP向けのデータガバナンスサービスです。オンプレミスとクラウドの社内データソースをスキャンしてデータのマッピングと分類を行い、個人情報を特定します。これにより、セキュリティとコンプライアンスのリスクを軽減し、ストレージコストを削減し、データ移行プロジェクトを支援できます。
|
バージョン1.31以降では、BlueXP 分類がBlueXP のコア機能として使用できます。追加料金はかかりません。分類ライセンスまたはサブスクリプションは必要ありません。+旧バージョン1.30以前を使用していた場合は、サブスクリプションの有効期限が切れるまでそのバージョンを利用できます。"廃止された機能の一覧を見る"です。 |
特徴
BlueXPの分類では、人工知能(AI)、自然言語処理(NLP)、機械学習(ML)を使用してスキャンされるコンテンツを把握し、エンティティを抽出し、それに応じてコンテンツを分類します。これにより、BlueXPでは次の機能が提供されます。
BlueXPには、コンプライアンスへの取り組みに役立ついくつかのツールが用意されています。BlueXPの分類を使用すると、次の処理を実行できます。
-
個人識別情報( PII )を識別します。
-
GDPR、CCPA、PCI、HIPAAの各プライバシー規制の要件に応じて、機密性の高い個人情報の範囲を特定します。
-
名前または電子メールアドレスに基づいてデータサブジェクトアクセス要求(dsar)に応答します。
BlueXPでは、犯罪目的でアクセスされるリスクのあるデータを分類して特定できます。BlueXPの分類を使用すると、次の処理を実行できます。
-
組織全体またはパブリックに公開されているオープンな権限を持つすべてのファイルとディレクトリ(共有およびフォルダ)を特定します。
-
初期の専用の場所以外に存在する機密データを特定します。
-
データ保持ポリシーに準拠
-
セキュリティスタッフがすぐに対処できるように、Policiesを使用して新しいセキュリティの問題を自動的に検出します。
BlueXPは、ストレージの総所有コスト(TCO)に役立つツールを備えています。BlueXPの分類を使用すると、次の処理を実行できます。
-
重複データやビジネス以外のデータを特定することで、ストレージ効率を向上させます。
-
アクセス頻度の低いデータを特定して低コストのオブジェクトストレージに階層化できるため、ストレージコストを削減できます。 "Cloud Volumes ONTAP システムからの階層化の詳細については、こちらをご覧ください"です。 "オンプレミスのONTAP システムからの階層化の詳細については、こちらをご覧ください"です。
サポートされている作業環境とデータソース
BlueXPは、次のタイプの作業環境とデータソースから構造化データと非構造化データをスキャンして分析できます。
作業環境
-
Amazon FSx for ONTAP
-
Azure NetApp Files
-
Cloud Volumes ONTAP ( AWS 、 Azure 、 GCP に導入)
-
オンプレミスの ONTAP クラスタ
-
StorageGRID
データソース
-
NetAppファイル共有
-
データベース:
-
Amazon リレーショナルデータベースサービス( Amazon RDS )
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server ( MSSQL )
-
BlueXPの分類では、NFSバージョン3.x、4.0、4.1、CIFSバージョン1.x、2.0、2.1、3.0がサポートされます。
コスト
BlueXP 分類は無料で使用できます。分類ライセンスや有料サブスクリプションは必要ありません。
インフラコスト
-
BlueXPをクラウドにインストールするにはクラウドインスタンスを導入する必要があるため、導入先のクラウドプロバイダから料金が請求されます。を参照して 各クラウドに導入されるインスタンスのタイプ プロバイダBlueXP分類をオンプレミスシステムにインストールすればコストはかかりません。
-
BlueXPに分類されるためには、BlueXPコネクタが導入されている必要があります。多くの場合、BlueXPで使用している他のストレージとサービスのためにコネクタが既に存在します。Connector インスタンスを使用すると、導入先のクラウドプロバイダから料金が発生します。を参照してください "クラウドプロバイダごとに導入されるインスタンスのタイプ"。コネクタをオンプレミスシステムにインストールしても、コストはかかりません。
データ転送コスト
データ転送のコストは設定によって異なります。BlueXP分類インスタンスとデータソースが同じアベイラビリティゾーンとリージョンにある場合、データ転送コストは発生しません。ただし、Cloud Volumes ONTAPシステムなどのデータソースが_ different_アベイラビリティゾーンまたはリージョンにある場合、データ転送のコストはクラウドプロバイダから請求されます。詳細については、次のリンクを参照してください。
BlueXP分類インスタンス
BlueXP 分類をクラウドに導入すると、BlueXP はコネクタと同じサブネットにインスタンスを導入します。 "コネクタの詳細については、こちらをご覧ください。"
デフォルトのインスタンスについては、次の点に注意してください。
-
AWSでは、BlueXP 分類は500GiBのgp2ディスクを搭載したで実行され "m6i.4xlargeインスタンス"ます。オペレーティングシステムイメージは Amazon Linux 2 です。AWSに導入した場合、少量のデータをスキャンする場合は、インスタンスサイズを小さくすることができます。
-
Azureでは、BlueXP 分類は、ディスクが500GiBのAで実行され"Standard_D16s_v3 VM"ます。オペレーティングシステムのイメージはUbuntu 22.04です。
-
GCPでは、BlueXP 分類は500GiB標準永続ディスクを備えた上で実行され"N2-standard-16 VM"ます。オペレーティングシステムのイメージはUbuntu 22.04です。
-
デフォルトのインスタンスを使用できない地域では、BlueXPの分類は別のインスタンスで実行されます。"別のインスタンスタイプを参照してください"です。
-
インスタンスの名前は CloudCompliancy_with で、生成されたハッシュ( UUID )を連結しています。例: _CloudCompliion-16bb6564-38ad-40802-9a92-36f5fd2f71c7
-
コネクタごとに導入されるBlueXP分類インスタンスは1つだけです。
BlueXPの分類は、オンプレミスのLinuxホストや希望するクラウドプロバイダのホストに導入することもできます。どのインストール方法を選択しても、ソフトウェアはまったく同じように機能します。インスタンスがインターネットにアクセスできる限り、BlueXP 分類ソフトウェアのアップグレードは自動化されます。
|
BlueXPの分類ではデータが継続的にスキャンされるため、インスタンスは常に実行されたままにしておく必要があります。 |
さまざまなインスタンスタイプに導入
インスタンス タイプについては、次の仕様を確認してください。
システムサイズ | 仕様 | 制限事項 |
---|---|---|
特大 |
CPU×32、128GB RAM、1TiB SSD |
最大5億個のファイルをスキャンできます。 |
Large (デフォルト) |
CPU×16、64GB RAM、500GiB SSD |
最大2億5、000万個のファイルをスキャンできます。 |
AzureまたはGCPにBlueXP 分類を導入する際に、より小さいインスタンスタイプを使用する場合は、ng-contact-data-sense@ NetApp .comまでEメールで支援を要請してください。
BlueXP 分類スキャンの仕組み
大まかに言うと、BlueXP 分類スキャンは次のように機能します。
-
BlueXPでBlueXP分類のインスタンスを導入します。
-
1つ以上のデータソースで高レベルマッピング(_Mapping only_scans)またはディープレベルスキャン(_Map & classify_scans)を有効にします。
-
BlueXPの分類では、AI学習プロセスを使用してデータがスキャンされます。
-
提供されているダッシュボードとレポートツールを使用して、コンプライアンスとガバナンスの取り組みを支援します。
BlueXPの分類を有効にしてスキャンするリポジトリ(ボリューム、データベーススキーマ、その他のユーザデータ)を選択すると、すぐにデータのスキャンが開始され、個人データと機密データが特定されます。ほとんどの場合、バックアップ、ミラー、DRサイトではなく、本番環境のライブデータのスキャンに重点を置いてください。次に、BlueXPの分類によって組織データがマッピングされ、各ファイルが分類され、データ内のエンティティと事前定義されたパターンが特定されて抽出されます。スキャンの結果は、個人情報、機密性の高い個人情報、データカテゴリ、およびファイルタイプのインデックスです。
BlueXPは、他のクライアントと同様に、NFSボリュームとCIFSボリュームをマウントすることでデータに接続します。NFS ボリュームには読み取り専用で自動的にアクセスされますが、 CIFS ボリュームをスキャンするためには Active Directory のクレデンシャルを指定する必要があります。
最初のスキャン後、BlueXP 分類はラウンドロビン方式でデータを継続的にスキャンし、増分変更を検出します。そのため、インスタンスを実行し続けることが重要です。
ボリューム レベルまたはデータベース スキーマ レベルでスキャンを有効または無効にすることができます。
|
BlueXP classificationでは、スキャンできるデータの量に制限はありません。各コネクタは 500 TiB のデータのスキャンと表示をサポートします。 500TiB以上のデータをスキャンするには、"別のコネクタをインストールする"それから"BlueXP classificationの別のインスタンスを展開する"。 BlueXP UI には、単一のコネクタからのデータが表示されます。複数のコネクタからデータを表示するヒントについては、"複数のコネクタの操作" 。 |
マッピングスキャンと分類スキャンの違いは何ですか
BlueXP 分類では、次の2種類のスキャンを実行できます。
-
マッピングのみのスキャンデータの概要のみが表示され、選択したデータソースで実行されます。マッピングのみのスキャンでは、ファイルにアクセスして内部のデータを確認する必要がないため、マップおよび分類スキャンよりも時間がかかりません。最初にこれを実行して調査領域を特定し、それらの領域に対してMap & Classifyスキャンを実行することもできます。
-
スキャンのマップと分類データの詳細なスキャンを提供します。
マッピングスキャンと分類スキャンの違いの詳細については、を参照してください"マッピングスキャンと分類スキャンの違いは何ですか?"。
BlueXP 分類によって分類される情報
BlueXP 分類では、次のデータを収集してインデックスを作成し、カテゴリを割り当てます。
-
*標準メタデータ*ファイルについて:ファイルの種類、サイズ、作成日、変更日など。
-
個人データ:電子メールアドレス、識別番号、クレジットカード番号などの個人識別情報(PII)。BlueXP 分類では、ファイル内の特定の単語、文字列、パターンを使用して識別されます。"個人データの詳細については、こちらをご覧ください"です。
-
機密性の高い個人データ:一般データ保護規則(GDPR)およびその他のプライバシー規制で定義されている、健康データ、民族起源、政治的意見などの特別な種類の機密個人情報(SPII)。"機密性の高い個人データの詳細をご覧ください"です。
-
カテゴリ: BlueXP 分類は、スキャンしたデータをさまざまなカテゴリに分類します。カテゴリは、各ファイルのコンテンツとメタデータの AI 分析に基づくトピックです。"カテゴリの詳細については、こちらをご覧ください"です。
-
types: BlueXP 分類では、スキャンしたデータをファイルの種類別に分類します。"タイプの詳細については、こちらをご覧ください"です。
-
名前エンティティ認識: BlueXP 分類は、AIを使用してドキュメントから人の自然な名前を抽出します。"データ主体のアクセスリクエストへの対応について説明します"です。
ネットワークの概要
BlueXPはクラウドかオンプレミスかを問わず、単一のサーバ(クラスタ)を任意の場所に導入できます。サーバは標準プロトコルでデータソースに接続し、同じサーバにも導入されているElasticsearchクラスタの結果をインデックス化します。これにより、マルチクラウド、クロスクラウド、プライベートクラウド、オンプレミス環境のサポートが可能になります。
BlueXPでは、コネクタインスタンスからのインバウンドHTTP接続を可能にするセキュリティグループとともにBlueXP分類インスタンスを導入します。
BlueXP をSaaSモードで使用する場合、BlueXP への接続はHTTPSを介して提供され、ブラウザとBlueXP 分類インスタンス間で送信されるプライベートデータは、TLS 1.2を使用したエンドツーエンドの暗号化で保護されます。これは、NetAppとサードパーティがそれを読み取ることができないことを意味します。
アウトバウンドルールは完全にオープンです。BlueXP分類ソフトウェアのインストールとアップグレード、使用状況の指標の送信には、インターネットアクセスが必要です。
ネットワークに関する厳しい要件がある場合は、を"BlueXP分類の連絡先となるエンドポイントについて説明します"参照してください。