NetApp Data Classificationでデータソースをスキャンする
NetApp Data Classification は、選択したリポジトリ内のデータ (ボリューム、データベース スキーマ、またはその他のユーザー データ) をスキャンして、個人データや機密データを識別します。次に、データ分類により組織のデータがマッピングされ、各ファイルが分類され、データ内の定義済みパターンが識別されます。スキャンの結果は、個人情報、機密個人情報、データ カテゴリ、およびファイル タイプのインデックスです。
最初のスキャンの後、データ分類はラウンドロビン方式でデータを継続的にスキャンし、増分変更を検出します。そのため、インスタンスを実行し続けることが重要です。
ボリューム レベルまたはデータベース スキーマ レベルでスキャンを有効または無効にすることができます。
マッピングスキャンと分類スキャンの違いは何ですか?
データ分類では、次の 2 種類のスキャンを実行できます。
-
マッピングのみのスキャン は、データの概要のみを提供し、選択されたデータ ソースに対して実行されます。マッピングのみのスキャンでは、ファイルにアクセスして内部のデータを確認する必要がないため、マップおよび分類スキャンよりも時間がかかりません。最初にこれを実行して研究領域を特定し、次にそれらの領域に対してマップと分類のスキャンを実行することをお勧めします。
-
マップと分類スキャン は、データの詳細なスキャンを提供します。
以下の表にいくつかの違いを示します。
特徴 | スキャンをマップして分類する | マッピングのみのスキャン |
---|---|---|
スキャン速度 |
遅い |
速い |
料金 |
空き |
空き |
容量 |
500 TiB に制限されます* |
500 TiB に制限されます* |
ファイルの種類と使用容量の一覧 |
はい |
はい |
ファイル数と使用容量 |
はい |
はい |
ファイルの古さとサイズ |
はい |
はい |
実行する能力"データマッピングレポート" |
はい |
はい |
ファイルの詳細を表示するためのデータ調査ページ |
はい |
いいえ |
ファイル内の名前を検索する |
はい |
いいえ |
作成する"保存されたクエリ"カスタム検索結果を提供する |
はい |
いいえ |
他のレポートを実行する機能 |
はい |
いいえ |
ファイルのメタデータを表示する機能** |
いいえ |
はい |
{アスタリスク} データ分類では、スキャンできるデータの量に制限はありません。各コンソール エージェントは、500 TiB のデータのスキャンと表示をサポートします。500TiB以上のデータをスキャンするには、"別のコンソールエージェントをインストールする"それから"別のデータ分類インスタンスをデプロイする"。+ コンソール UI には、単一のコネクタからのデータが表示されます。複数のコンソールエージェントからデータを表示するヒントについては、"複数のコンソールエージェントを操作する" 。
{アスタリスク}{アスタリスク} マッピング スキャン中にファイルから次のメタデータが抽出されます。
-
システム
-
システムタイプ
-
ストレージリポジトリ
-
ファイル タイプ
-
使用済み容量
-
ファイル数
-
ファイル サイズ
-
ファイル作成
-
ファイルの最終アクセス
-
ファイルの最終更新日時
-
ファイル発見時刻
-
権限の抽出
ガバナンス ダッシュボードの違い:
特徴 | マップと分類 | マップ |
---|---|---|
古いデータ |
はい |
はい |
非ビジネスデータ |
はい |
はい |
重複したファイル |
はい |
はい |
定義済みの保存済みクエリ |
はい |
いいえ |
デフォルトの保存クエリ |
はい |
はい |
DDAレポート |
はい |
はい |
マッピングレポート |
はい |
はい |
感度レベル検出 |
はい |
いいえ |
幅広い権限を持つ機密データ |
はい |
いいえ |
オープン権限 |
はい |
はい |
データの時代 |
はい |
はい |
データのサイズ |
はい |
はい |
カテゴリ |
はい |
いいえ |
ファイルの種類 |
はい |
はい |
コンプライアンス ダッシュボードの違い:
特徴 | マップと分類 | マップ |
---|---|---|
個人情報 |
はい |
いいえ |
機密個人情報 |
はい |
いいえ |
プライバシーリスク評価レポート |
はい |
いいえ |
HIPAAレポート |
はい |
いいえ |
PCI DSSレポート |
はい |
いいえ |
調査フィルターの違い:
特徴 | マップと分類 | マップ |
---|---|---|
保存されたクエリ |
はい |
はい |
システムタイプ |
はい |
はい |
システム |
はい |
はい |
ストレージリポジトリ |
はい |
はい |
ファイル タイプ |
はい |
はい |
ファイル サイズ |
はい |
はい |
作成時間 |
はい |
はい |
発見された時間 |
はい |
はい |
最終更新日 |
はい |
はい |
最終アクセス |
はい |
はい |
オープン権限 |
はい |
はい |
ファイルディレクトリパス |
はい |
はい |
カテゴリ |
はい |
いいえ |
感度レベル |
はい |
いいえ |
識別子の数 |
はい |
いいえ |
個人データ |
はい |
いいえ |
機密性の高い個人データ |
はい |
いいえ |
データ主体 |
はい |
いいえ |
重複 |
はい |
はい |
分類ステータス |
はい |
ステータスは常に「限られた洞察」です |
スキャン分析イベント |
はい |
はい |
ファイルハッシュ |
はい |
はい |
アクセス権を持つユーザーの数 |
はい |
はい |
ユーザー/グループの権限 |
はい |
はい |
ファイルの所有者 |
はい |
はい |
ディレクトリタイプ |
はい |
はい |
データ分類はどのくらい速くデータをスキャンしますか
スキャン速度は、ネットワーク遅延、ディスク遅延、ネットワーク帯域幅、環境サイズ、ファイル配布サイズの影響を受けます。
-
マッピングのみのスキャンを実行する場合、データ分類では 1 日あたり 100 ~ 150 TiB のデータがスキャンされます。
-
マップと分類スキャンを実行する場合、データ分類では 1 日あたり 15 ~ 40 TiB のデータがスキャンされます。