BlueXPの分類について説明します
BlueXPの分類(Cloud Data Sense)は、BlueXP向けのデータガバナンスサービスです。オンプレミスとクラウドの社内データソースをスキャンしてデータのマッピングと分類を行い、個人情報を特定します。これにより、セキュリティとコンプライアンスのリスクを軽減し、ストレージコストを削減し、データ移行プロジェクトを支援できます。
重要
2024年5月にバージョン1.31から、BlueXPのコア機能としてBlueXPの分類が追加料金なしで利用できるようになりました。分類ライセンスまたはサブスクリプションは必要ありません。また、BlueXPの分類機能もNetAppストレージシステムに重点を置いているため、一部の未使用の機能やあまり使用されていない機能は廃止されました。
旧バージョン1.30以前を使用していたユーザーは、サブスクリプションが期限切れになるまでそのバージョンを引き続き使用できます。
特徴
BlueXPの分類では、人工知能(AI)、自然言語処理(NLP)、機械学習(ML)を使用してスキャンされるコンテンツを把握し、エンティティを抽出し、それに応じてコンテンツを分類します。これにより、BlueXPでは次の機能が提供されます。
BlueXPには、コンプライアンスへの取り組みに役立ついくつかのツールが用意されています。BlueXPの分類を使用すると、次の処理を実行できます。
-
個人識別情報( PII )を識別します。
-
GDPR、CCPA、PCI、HIPAAの各プライバシー規制の要件に応じて、機密性の高い個人情報の範囲を特定します。
-
名前または電子メールアドレスに基づいてデータサブジェクトアクセス要求(dsar)に応答します。
BlueXPでは、犯罪目的でアクセスされるリスクのあるデータを分類して特定できます。BlueXPの分類を使用すると、次の処理を実行できます。
-
組織全体またはパブリックに公開されているオープンな権限を持つすべてのファイルとディレクトリ(共有およびフォルダ)を特定します。
-
初期の専用の場所以外に存在する機密データを特定します。
-
データ保持ポリシーに準拠
-
新しいセキュリティの問題を自動的に検出するには、_Policies_を使用します。これにより、セキュリティ担当者はすぐに対処できます。
BlueXPは、ストレージの総所有コスト(TCO)に役立つツールを備えています。BlueXPの分類を使用すると、次の処理を実行できます。
-
重複データやビジネス以外のデータを特定することで、ストレージ効率を向上させます。
-
アクセス頻度の低いデータを特定して低コストのオブジェクトストレージに階層化できるため、ストレージコストを削減できます。 "Cloud Volumes ONTAP システムからの階層化の詳細については、こちらをご覧ください"です。 "オンプレミスのONTAP システムからの階層化の詳細については、こちらをご覧ください"です。
サポートされている作業環境とデータソース
BlueXPは、次のタイプの作業環境とデータソースから構造化データと非構造化データをスキャンして分析できます。
作業環境
-
Cloud Volumes ONTAP ( AWS 、 Azure 、 GCP に導入)
-
オンプレミスの ONTAP クラスタ
-
StorageGRID
-
Azure NetApp Files
-
Amazon FSx for ONTAP
-
Google Cloud NetAppボリューム
データソース
-
NetAppファイル共有
-
データベース:
-
Amazon リレーショナルデータベースサービス( Amazon RDS )
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server ( MSSQL )
-
BlueXPの分類では、NFSバージョン3.x、4.0、4.1、CIFSバージョン1.x、2.0、2.1、3.0がサポートされます。
コスト
BlueXPの分類機能を無料で使用できるようになりました。分類ライセンスや有料サブスクリプションは必要ありません。
インフラコスト
-
BlueXPをクラウドにインストールするにはクラウドインスタンスを導入する必要があるため、導入先のクラウドプロバイダから料金が請求されます。を参照して 各クラウドに導入されるインスタンスのタイプ プロバイダBlueXP分類をオンプレミスシステムにインストールすればコストはかかりません。
-
BlueXPに分類されるためには、BlueXPコネクタが導入されている必要があります。多くの場合、BlueXPで使用している他のストレージとサービスのためにコネクタが既に存在します。Connector インスタンスを使用すると、導入先のクラウドプロバイダから料金が発生します。を参照してください "クラウドプロバイダごとに導入されるインスタンスのタイプ"。コネクタをオンプレミスシステムにインストールしても、コストはかかりません。
データ転送コスト
データ転送のコストは設定によって異なります。BlueXP分類インスタンスとデータソースが同じアベイラビリティゾーンとリージョンにある場合、データ転送コストは発生しません。ただし、Cloud Volumes ONTAPシステムなどのデータソースが_ different_アベイラビリティゾーンまたはリージョンにある場合、データ転送のコストはクラウドプロバイダから請求されます。詳細については、次のリンクを参照してください。
BlueXP分類インスタンス
BlueXP 分類をクラウドに導入すると、BlueXP はコネクタと同じサブネットにインスタンスを導入します。 "コネクタの詳細については、こちらをご覧ください。"
デフォルトのインスタンスについては、次の点に注意してください。
-
AWSでは、BlueXP 分類は500GiBのgp2ディスクを搭載したで実行され "m6i.4xlargeインスタンス"ます。オペレーティングシステムイメージは Amazon Linux 2 です。AWSに導入した場合、少量のデータをスキャンする場合は、インスタンスサイズを小さくすることができます。
-
Azureでは、BlueXP 分類は、ディスクが500GiBのAで実行され"Standard_D16s_v3 VM"ます。オペレーティングシステムのイメージはUbuntu 22.04です。
-
GCPでは、BlueXP 分類は500GiB標準永続ディスクを備えた上で実行され"N2-standard-16 VM"ます。オペレーティングシステムのイメージはUbuntu 22.04です。
-
デフォルトのインスタンスを使用できない地域では、BlueXPの分類は別のインスタンスで実行されます。"別のインスタンスタイプを参照してください"です。
-
インスタンスの名前は CloudCompliancy_with で、生成されたハッシュ( UUID )を連結しています。例: _CloudCompliion-16bb6564-38ad-40802-9a92-36f5fd2f71c7
-
コネクタごとに導入されるBlueXP分類インスタンスは1つだけです。
BlueXPの分類は、オンプレミスのLinuxホストや希望するクラウドプロバイダのホストに導入することもできます。どのインストール方法を選択しても、ソフトウェアはまったく同じように機能します。インスタンスにインターネットアクセスがあれば、BlueXP分類ソフトウェアのアップグレードは自動で実行されます。
BlueXPの分類ではデータが継続的にスキャンされるため、インスタンスは常に実行されたままにしておく必要があります。 |
さまざまなインスタンスタイプに導入
BlueXP 分類は、CPUとRAMの数が少ないシステムに導入できます。
システムサイズ | 仕様 | 制限事項 |
---|---|---|
特大 |
CPU×32、128GB RAM、1TiB SSD |
最大5億個のファイルをスキャンできます。 |
Large (デフォルト) |
CPU×16、64GB RAM、500GiB SSD |
最大2億5、000万個のファイルをスキャンできます。 |
AzureまたはGCPにBlueXP 分類を導入する際に、より小さいインスタンスタイプを使用する場合は、ng-contact-data-sense@ NetApp .comまでEメールで支援を要請してください。
BlueXPの分類の仕組み
BlueXPの分類の概要は次のようになります。
-
BlueXPでBlueXP分類のインスタンスを導入します。
-
1つ以上のデータソースで、概要レベルのマッピングまたは詳細レベルのスキャンを有効にします。
-
BlueXPの分類では、AI学習プロセスを使用してデータがスキャンされます。
-
提供されているダッシュボードとレポートツールを使用して、コンプライアンスとガバナンスの取り組みを支援します。
スキャンの動作
BlueXPの分類を有効にしてスキャンするリポジトリ(ボリューム、データベーススキーマ、その他のユーザデータ)を選択すると、すぐにデータのスキャンが開始され、個人データと機密データが特定されます。ほとんどの場合、バックアップ、ミラー、DRサイトではなく、本番環境のライブデータのスキャンに重点を置いてください。次に、BlueXPの分類によって組織データがマッピングされ、各ファイルが分類され、データ内のエンティティと事前定義されたパターンが特定されて抽出されます。スキャンの結果は、個人情報、機密性の高い個人情報、データカテゴリ、およびファイルタイプのインデックスです。
BlueXPは、他のクライアントと同様に、NFSボリュームとCIFSボリュームをマウントすることでデータに接続します。NFS ボリュームには読み取り専用で自動的にアクセスされますが、 CIFS ボリュームをスキャンするためには Active Directory のクレデンシャルを指定する必要があります。
初回スキャン後、BlueXPの分類ではラウンドロビン方式でデータが継続的にスキャンされ、差分の変更が検出されます(そのため、インスタンスを常に実行しておくことが重要です)。
スキャンは、ボリュームレベルまたはデータベーススキーマレベルで有効または無効にすることができます。
マッピングスキャンと分類スキャンの違いは何ですか
BlueXPの分類を使用すると、選択したデータソースに対して一般的な「マッピング」スキャンを実行できます。マッピングではデータの概要のみが示され、分類ではデータの詳細なスキャンが提供されます。データソースでは、ファイルにアクセスしてデータを参照できないため、マッピングは短時間で完了します。
多くのユーザは、この機能を気に入っています。たとえば、より多くの調査が必要なデータソースをすばやくスキャンして特定したうえで、必要なデータソースやボリュームに対してのみ分類スキャンを有効にする必要があるからです。
次の表に、いくつかの相違点を示します。
機能 | 分類 | マッピング |
---|---|---|
スキャン速度 |
遅い |
高速 |
価格設定 |
無料 |
無料 |
容量 |
最大500TB |
最大500TB |
ファイルタイプと使用済み容量のリスト |
はい |
はい |
ファイル数と使用済み容量 |
はい |
はい |
ファイルの経過時間とサイズ |
はい |
はい |
を実行する機能"データマッピングレポート" |
はい |
はい |
[ データ調査 ] ページでファイルの詳細を確認します |
はい |
いいえ |
ファイル内の名前を検索します |
はい |
いいえ |
カスタム検索結果を提供する作成"ポリシー" |
はい |
いいえ |
他のレポートを実行できます |
はい |
いいえ |
ファイルからメタデータを表示する機能* |
いいえ |
はい |
*マッピングスキャン中に、次のメタデータがファイルから抽出されます。
-
作業環境
-
作業環境のタイプ
-
ストレージリポジトリ
-
ファイルタイプ
-
使用済み容量
-
ファイル数
-
ファイルサイズ
-
ファイル作成
-
ファイルの最終アクセス
-
ファイルの最終変更日
-
ファイル検出時刻
-
権限の抽出
ガバナンスダッシュボードの違い:
機能 | マッピングと分類 | マップ |
---|---|---|
古いデータ |
はい |
はい |
ビジネス以外のデータ |
はい |
はい |
重複ファイル |
はい |
はい |
事前定義済みポリシー |
はい |
いいえ |
カスタムポリシー |
はい |
はい |
DDAレポート |
はい |
はい |
マッピングレポート |
はい |
はい |
感度レベル検出 |
はい |
いいえ |
幅広い権限を持つ機密データ |
はい |
いいえ |
オープンアクセス権 |
はい |
はい |
データの使用年数 |
はい |
はい |
データのサイズ |
はい |
はい |
カテゴリ |
はい |
いいえ |
ファイルの種類 |
はい |
はい |
コンプライアンスダッシュボードの違い:
機能 | マッピングと分類 | マップ |
---|---|---|
個人情報 |
はい |
いいえ |
機密性の高い個人情報 |
はい |
いいえ |
プライバシーリスクアセスメントレポート |
はい |
いいえ |
HIPAAレポート |
はい |
いいえ |
PCI DSS レポート |
はい |
いいえ |
調査フィルタの違い:
機能 | マッピングと分類 | マップ |
---|---|---|
ポリシー |
はい |
はい |
作業環境のタイプ |
はい |
はい |
作業環境 |
はい |
はい |
ストレージリポジトリ |
はい |
はい |
ファイルタイプ |
はい |
はい |
ファイルサイズ |
はい |
はい |
時刻を作成しました |
はい |
はい |
検出時刻 |
はい |
はい |
最終更新日 |
はい |
はい |
最終アクセス |
はい |
はい |
オープンアクセス権 |
はい |
はい |
ファイルディレクトリパス |
はい |
はい |
カテゴリ |
はい |
いいえ |
感度レベル |
はい |
いいえ |
IDの数 |
はい |
いいえ |
個人データ |
はい |
いいえ |
機密性の高い個人データ |
はい |
いいえ |
データ主体 |
はい |
いいえ |
重複 |
はい |
はい |
分類ステータス |
はい |
ステータスは常に「限定的なインサイト」です。 |
スキャン分析イベント |
はい |
はい |
ファイルハッシュ |
はい |
はい |
アクセス権を持つユーザの数 |
はい |
はい |
ユーザ/グループの権限 |
はい |
はい |
ファイルの所有者 |
はい |
はい |
ディレクトリタイプ |
はい |
はい |
BlueXPの分類によるデータのスキャン速度
スキャン速度は、ネットワークレイテンシ、ディスクレイテンシ、ネットワーク帯域幅、環境のサイズ、およびファイル配信サイズによって左右されます。
-
マッピングスキャンを実行する場合、BlueXPでは1日に100~150TiBのデータをスキャンできます。
-
分類スキャンを実行する場合、BlueXPの分類では1日に15~40TiBのデータをスキャンできます。
BlueXP 分類によって分類される情報
BlueXPの分類では、データ(ファイル)の収集とインデックス作成が行われ、カテゴリが割り当てられます。BlueXP分類のインデックスには、次のデータが含まれています。
-
*標準メタデータ*ファイルについて:ファイルの種類、サイズ、作成日、変更日など。
-
個人データ:メールアドレス、識別番号、クレジットカード番号などの個人識別情報(PII)。"個人データの詳細については、こちらをご覧ください"です。
-
機密性の高い個人データ: GDPRおよびその他のプライバシー規制で定義されている、健康データ、民族起源、政治的意見などの特別な種類の機密個人情報(SPii)。"機密性の高い個人データの詳細をご覧ください"です。
-
カテゴリ: BlueXP 分類は、スキャンしたデータをさまざまなカテゴリに分類します。カテゴリは、各ファイルのコンテンツとメタデータの AI 分析に基づくトピックです。"カテゴリの詳細については、こちらをご覧ください"です。
-
types: BlueXP 分類では、スキャンしたデータをファイルの種類別に分類します。"タイプの詳細については、こちらをご覧ください"です。
-
名前エンティティ認識: BlueXP 分類は、AIを使用してドキュメントから人の自然な名前を抽出します。"データ主体のアクセスリクエストへの対応について説明します"です。
ネットワークの概要
BlueXPでは、コネクタインスタンスからのインバウンドHTTP接続を可能にするセキュリティグループとともにBlueXP分類インスタンスを導入します。
SaaSモードでBlueXPを使用している場合、BlueXPへの接続はHTTPS経由で提供され、ブラウザとBlueXP分類インスタンスの間で送信されるプライベートデータは、TLS 1.2を使用したエンドツーエンドの暗号化で保護されます。つまり、NetAppやサードパーティはデータを読み取ることができません。
アウトバウンドルールは完全にオープンです。BlueXP分類ソフトウェアのインストールとアップグレード、使用状況の指標の送信には、インターネットアクセスが必要です。
ネットワークに関する厳しい要件がある場合は、を"BlueXP分類の連絡先となるエンドポイントについて説明します"参照してください。
BlueXP 分類でのユーザロール
各ユーザに割り当てられたロールは、BlueXP 内およびBlueXP 分類内で異なる機能を提供します。詳細については、次を参照してください。
-
"BlueXP IAMロール"(標準モードでBlueXP を使用している場合)
-
"BlueXP アカウントノロール"(制限モードまたはプライベートモードでBlueXP を使用する場合)