Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

BlueXPの分類について説明します

共同作成者

BlueXPの分類(Cloud Data Sense)は、BlueXP向けのデータガバナンスサービスです。オンプレミスとクラウドの社内データソースをスキャンしてデータのマッピングと分類を行い、個人情報を特定します。これにより、セキュリティとコンプライアンスのリスクを軽減し、ストレージコストを削減し、データ移行プロジェクトを支援できます。

の機能

BlueXPの分類では、人工知能(AI)、自然言語処理(NLP)、機械学習(ML)を使用してスキャンされるコンテンツを把握し、エンティティを抽出し、それに応じてコンテンツを分類します。これにより、BlueXPでは次の機能が提供されます。

コンプライアンスを維持

BlueXPには、コンプライアンスへの取り組みに役立ついくつかのツールが用意されています。BlueXPの分類を使用すると、次の処理を実行できます。

  • 個人識別情報( PII )を識別します。

  • GDPR、CCPA、PCI、HIPAAの各プライバシー規制の要件に応じて、機密性の高い個人情報の範囲を特定します。

  • 名前または電子メールアドレスに基づいてデータサブジェクトアクセス要求(dsar)に応答します。

  • データベースの一意の識別子が他のリポジトリのファイルに含まれているかどうかを特定します。基本的には、BlueXPの分類スキャンで特定された「個人データ」の独自のリストを作成します。

  • ファイルに特定のPIIが含まれている場合は、電子メールで特定のユーザーに通知します(を使用してこの基準を定義します "ポリシー")では、アクションプランを決定することができます。

セキュリティの強化

BlueXPでは、犯罪目的でアクセスされるリスクのあるデータを分類して特定できます。BlueXPの分類を使用すると、次の処理を実行できます。

  • 組織全体またはパブリックに公開されているオープンな権限を持つすべてのファイルとディレクトリ(共有およびフォルダ)を特定します。

  • 初期の専用の場所以外に存在する機密データを特定します。

  • データ保持ポリシーに準拠

  • 新しいセキュリティ問題をセキュリティスタッフに自動的に通知して、ただちに対処できるようにするには、_Policies_を使用します。

  • カスタムタグをファイルに追加し(「移動が必要」など)、BlueXPユーザーを割り当てて、ユーザーがファイルの更新を所有できるようにします。

  • 表示と変更 "Azure Information Protection ( AIP )ラベル" ファイルに保存できます。

ストレージ使用量を最適化

BlueXPは、ストレージの総所有コスト(TCO)に役立つツールを備えています。BlueXPの分類を使用すると、次の処理を実行できます。

データ移行を高速化

BlueXPの分類を使用すると、オンプレミスのデータをパブリッククラウドやプライベートクラウドに移行する前にスキャンできます。BlueXPの分類を使用すると、次の処理を実行できます。

  • データのサイズ、および移動前に機密情報が含まれているデータがないかどうかを確認する。

  • ソースデータを(25種類以上の基準に基づいて)フィルタリングして、必要なファイルのみを宛先に移動できるようにします。不要なデータは移動されません。

  • 必要なデータのみをクラウドリポジトリに自動的かつ継続的に移動、コピー、同期

サポートされているデータソース

BlueXPの分類では、次のタイプのデータソースから構造化データと非構造化データをスキャンして分析できます。

ネットアップ:

  • Cloud Volumes ONTAP ( AWS 、 Azure 、 GCP に導入)

  • オンプレミスの ONTAP クラスタ

  • StorageGRID

  • Azure NetApp Files の特長

  • ONTAP 対応の Amazon FSX

  • Cloud Volumes Service for Google Cloud

ネットアップ以外:

  • Dell EMC Isilon の

  • Pure Storageの略

  • Nutanix

  • その他のストレージベンダー

クラウド:

  • Amazon S3

  • Google クラウドストレージ

  • OneDrive

  • SharePoint Online

  • SharePointオンプレミス(SharePoint Server)

  • Googleドライブ

データベース:

  • Amazon リレーショナルデータベースサービス( Amazon RDS )

  • MongoDB

  • MySQL

  • Oracle の場合

  • PostgreSQL

  • SAP HANA のサポート

  • SQL Server ( MSSQL )

BlueXPの分類では、NFSバージョン3.xとCIFSバージョン1.x、2.0、2.1、3.0がサポートされます。

コスト

  • BlueXPの分類を使用するコストは、スキャンするデータの量によって異なります。BlueXPワークスペースでBlueXPの分類によってスキャンされる最初の1TBのデータは30日間無料です。これには、すべての作業環境とデータソースのすべてのデータが含まれます。この時点以降もデータのスキャンを続行するには、 AWS 、 Azure 、 GCP Marketplace 、またはネットアップの BYOL ライセンスのサブスクリプションが必要です。を参照してください "価格設定" を参照してください。

  • BlueXPをクラウドにインストールするにはクラウドインスタンスを導入する必要があるため、導入先のクラウドプロバイダから料金が請求されます。を参照してください 各クラウドに導入されるインスタンスのタイプ プロバイダ。BlueXP分類をオンプレミスシステムにインストールすればコストはかかりません。

  • BlueXPに分類されるためには、BlueXPコネクタが導入されている必要があります。多くの場合、BlueXPで使用している他のストレージとサービスのためにコネクタが既に存在します。Connector インスタンスを使用すると、導入先のクラウドプロバイダから料金が発生します。を参照してください "クラウドプロバイダごとに導入されるインスタンスのタイプ"。コネクタをオンプレミスシステムにインストールしても、コストはかかりません。

データ転送コスト

データ転送のコストは設定によって異なります。BlueXP分類インスタンスとデータソースが同じアベイラビリティゾーンとリージョンにある場合、データ転送コストは発生しません。ただし、 Cloud Volumes ONTAP システムや S3 バケットなどのデータソースが _different _Availability Zone またはリージョンにある場合は、クラウドプロバイダにデータ転送コストが請求されます。詳細については、次のリンクを参照してください。

BlueXP分類インスタンス

BlueXP分類をクラウドに導入すると、BlueXPはコネクタと同じサブネットにインスタンスを導入します。 "コネクタの詳細については、こちらをご覧ください。"

クラウドプロバイダで実行されているBlueXPインスタンスとBlueXP分類インスタンスを示す図。

デフォルトのインスタンスについては、次の点に注意してください。

  • AWSでは、BlueXPの分類はで実行されます "m6i.4xlargeインスタンス" 500GiBのgp2ディスクを使用した場合。オペレーティングシステムイメージは Amazon Linux 2 です。AWSに導入した場合、少量のデータをスキャンする場合は、インスタンスサイズを小さくすることができます。

  • Azureでは、BlueXPの分類はで実行されます "Standard_D16s_v3 VM" 500GiBのディスクオペレーティングシステムイメージは CentOS 7.9 です。

  • GCPでは、BlueXPの分類はで実行されます "N2-standard-16 VM" 500GiB Standard永続ディスクを使用した場合。オペレーティングシステムイメージは CentOS 7.9 です。

  • デフォルトのインスタンスを使用できない地域では、BlueXPの分類は別のインスタンスで実行されます。 "別のインスタンスタイプを参照してください"

  • インスタンスの名前は CloudCompliancy_with で、生成されたハッシュ( UUID )を連結しています。例: _CloudCompliion-16bb6564-38ad-40802-9a92-36f5fd2f71c7

  • コネクタごとに導入されるBlueXP分類インスタンスは1つだけです。

BlueXPの分類は、オンプレミスのLinuxホストや希望するクラウドプロバイダのホストに導入することもできます。どのインストール方法を選択しても、ソフトウェアはまったく同じように機能します。インスタンスにインターネットアクセスがあれば、BlueXP分類ソフトウェアのアップグレードは自動で実行されます。

ヒント BlueXPの分類ではデータが継続的にスキャンされるため、インスタンスは常に実行されたままにしておく必要があります。

小さいインスタンスタイプを使用しています

CPUとRAMの数が少ないシステムにBlueXPの分類を導入することもできますが、使用するシステムにはいくつかの制限があります。

システムサイズ 仕様 制限

特大

CPU×32、128GB RAM、1TiB SSD

最大5億個のファイルをスキャンできます。

Large (デフォルト)

CPU×16、64GB RAM、500GiB SSD

最大2億5、000万個のファイルをスキャンできます。

CPU×8、32GB RAM、200GiB SSD

スキャンに時間がかかり、スキャンできるファイルは最大 100 万個です。

小規模

CPU×8、16GB RAM、100GiB SSD

「中」と同じ制限に加えて、特定する機能 "データ主体名" 内部ファイルは無効です。

AWSのクラウドにBlueXPの分類を導入する場合は、大規模、中規模、小規模のインスタンスを選択できます。AzureまたはGCPにBlueXPの分類を導入する際に、これらの代替システムのいずれかを使用する場合は、ng-contact-data-sense@netapp.comまでEメールで支援を要請してください。これらの他のクラウド構成を導入するには、お客様と協力する必要があります。

BlueXPの分類をオンプレミスに導入する場合は、別の仕様のLinuxホストを使用するだけです。ネットアップにお問い合わせいただく必要はありません。

BlueXPの分類の仕組み

BlueXPの分類の概要は次のようになります。

  1. BlueXPでBlueXP分類のインスタンスを導入します。

  2. 1つ以上のデータソースで、概要レベルのマッピングまたは詳細レベルのスキャンを有効にします。

  3. BlueXPの分類では、AI学習プロセスを使用してデータがスキャンされます。

  4. 提供されているダッシュボードとレポートツールを使用して、コンプライアンスとガバナンスの取り組みを支援します。

スキャンの動作

BlueXPの分類を有効にしてスキャンするリポジトリ(ボリューム、バケット、データベーススキーマ、OneDriveまたはSharePointのユーザデータ)を選択すると、すぐにデータのスキャンが開始され、個人データと機密データが特定されます。ほとんどの場合、バックアップ、ミラー、DRサイトではなく、本番環境のライブデータのスキャンに重点を置いてください。次に、BlueXPの分類によって組織データがマッピングされ、各ファイルが分類され、データ内のエンティティと事前定義されたパターンが特定されて抽出されます。スキャンの結果は、個人情報、機密性の高い個人情報、データカテゴリ、およびファイルタイプのインデックスです。

BlueXPは、他のクライアントと同様に、NFSボリュームとCIFSボリュームをマウントすることでデータに接続します。NFS ボリュームには読み取り専用で自動的にアクセスされますが、 CIFS ボリュームをスキャンするためには Active Directory のクレデンシャルを指定する必要があります。

クラウドプロバイダで実行されているBlueXPインスタンスとBlueXP分類インスタンスを示す図。BlueXP分類インスタンスは、NFSボリュームとCIFSボリューム、S3バケット、OneDriveアカウント、データベースに接続してスキャンします。

初回スキャン後、BlueXPの分類ではラウンドロビン方式でデータが継続的にスキャンされ、差分の変更が検出されます(そのため、インスタンスを常に実行しておくことが重要です)。

スキャンは、ボリュームレベル、バケットレベル、データベーススキーマレベル、 OneDrive ユーザレベル、 SharePoint サイトレベルで有効または無効にできます。

マッピングスキャンと分類スキャンの違いは何ですか

BlueXPの分類を使用すると、選択したデータソースに対して一般的な「マッピング」スキャンを実行できます。マッピングではデータの概要のみが示され、分類ではデータの詳細なスキャンが提供されます。データソースでは、ファイルにアクセスしてデータを参照できないため、マッピングは短時間で完了します。

多くのユーザは、この機能を気に入っています。たとえば、より多くの調査が必要なデータソースをすばやくスキャンして特定したうえで、必要なデータソースやボリュームに対してのみ分類スキャンを有効にする必要があるからです。

次の表に、いくつかの相違点を示します。

フィーチャー( Feature ) 分類 マッピング

スキャン速度

遅い

高速

ファイルタイプと使用済み容量のリスト

はい。

はい。

ファイル数と使用済み容量

はい。

はい。

ファイルの経過時間とサイズ

はい。

はい。

を実行する機能 "データマッピングレポート"

はい。

はい。

[ データ調査 ] ページでファイルの詳細を確認します

はい。

いいえ

ファイル内の名前を検索します

はい。

いいえ

作成 "ポリシー" カスタムの検索結果が表示されます

はい。

いいえ

AIP ラベルおよびステータスタグを使用してデータを分類します

はい。

いいえ

ソースファイルをコピー、削除、および移動します

はい。

いいえ

他のレポートを実行できます

はい。

いいえ

BlueXPの分類によるデータのスキャン速度

スキャン速度は、ネットワークレイテンシ、ディスクレイテンシ、ネットワーク帯域幅、環境のサイズ、およびファイル配信サイズによって左右されます。

  • マッピングスキャンを実行する場合、BlueXPの分類では、スキャナノードごとに1日に100~150TiBのデータをスキャンできます。

  • 分類スキャンを実行する場合、BlueXPの分類では、スキャナノードごとに1日あたり15~40TiBのデータをスキャンできます。

BlueXPの分類の指標となる情報

BlueXPの分類では、データ(ファイル)の収集とインデックス作成が行われ、カテゴリが割り当てられます。BlueXP分類のインデックスには、次のデータが含まれています。

標準メタデータ

BlueXPは分類されるため、ファイルの種類、サイズ、作成日や変更日など、ファイルに関する標準的なメタデータが収集されます。

個人データ

メールアドレス、識別番号、クレジットカード番号など、個人を特定できる情報。 "個人データの詳細については、こちらをご覧ください"

機密性の高い個人データ

GDPR やその他のプライバシー規制で定義されている、健康データ、民族的起源、政治的見解などの機密情報の特殊な種類。 "機密性の高い個人データの詳細をご覧ください"

カテゴリ

BlueXPは、スキャンしたデータをさまざまなカテゴリに分類します。カテゴリは、各ファイルのコンテンツとメタデータの AI 分析に基づくトピックです。 "カテゴリの詳細については、こちらをご覧ください"

タイプ( Types )

BlueXPは、スキャンしたデータをファイルタイプ別に分類して分類します。 "タイプの詳細については、こちらをご覧ください"

名前エンティティ認識

BlueXPの分類では、AIを使用してドキュメントから自然人の名前を抽出します。 "データ主体のアクセスリクエストへの対応について説明します"

ネットワークの概要

BlueXPでは、コネクタインスタンスからのインバウンドHTTP接続を可能にするセキュリティグループとともにBlueXP分類インスタンスを導入します。

SaaSモードでBlueXPを使用している場合、BlueXPへの接続はHTTPS経由で提供され、ブラウザとBlueXP分類インスタンスの間で送信されるプライベートデータは、TLS 1.2を使用したエンドツーエンドの暗号化で保護されます。つまり、NetAppやサードパーティはデータを読み取ることができません。

アウトバウンドルールは完全にオープンです。BlueXP分類ソフトウェアのインストールとアップグレード、使用状況の指標の送信には、インターネットアクセスが必要です。

コンプライアンス情報へのユーザアクセス

各ユーザに割り当てられたロールは、BlueXPとBlueXPで異なる機能を提供します。

  • * アカウント管理者 * は、コンプライアンス設定を管理し、すべての作業環境のコンプライアンス情報を表示できます。

  • * ワークスペース管理者 * は、アクセス権を持つシステムについてのみ、コンプライアンス設定を管理し、コンプライアンス情報を表示できます。ワークスペース管理者がBlueXPの作業環境にアクセスできない場合、BlueXPの分類タブには作業環境のコンプライアンス情報が表示されません。

  • コンプライアンスビューア * の役割を持つユーザーは、アクセス権を持つシステムのコンプライアンス情報を表示し、レポートを生成することのみができます。これらのユーザは、ボリューム、バケット、またはデータベーススキーマのスキャンを有効または無効にすることはできません。これらのユーザーは、ファイルのコピー、移動、または削除もできません。