Skip to main content
NetApp Data Classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

使用NetApp数据分类扫描数据源

贡献者 netapp-ahibbard

NetApp数据分类会扫描您选择的存储库(卷、数据库模式或其他用户数据)中的数据,以识别个人和敏感数据。然后,数据分类会映射您的组织数据、对每个文件进行分类并识别数据中的预定义模式。扫描结果是个人信息、敏感个人信息、数据类别和文件类型的索引。

初始扫描后,数据分类将以循环方式持续扫描您的数据以检测增量变化。这就是为什么保持实例运行很重要。

您可以在卷级别或数据库模式级别启用和禁用扫描。

映射扫描和分类扫描之间有什么区别

您可以在数据分类中进行两种类型的扫描:

  • 仅映射扫描仅提供数据的高级概览,并在选定的数据源上执行。仅映射扫描比映射和分类扫描花费的时间更少,因为它们不访问文件来查看其中的数据。您可能希望首先执行此操作来确定研究领域,然后对这些领域执行地图和分类扫描。

  • 地图和分类扫描 为您的数据提供深层扫描。

下表显示了一些差异:

功能 映射和分类扫描 仅映射扫描

扫描速度

定价

可用

可用

容量

限制为 500 TiB*

限制为 500 TiB*

文件类型和已用容量列表

文件数量和已用容量

文件的年龄和大小

能够运行"数据映射报告"

数据调查页面查看文件详细信息

在文件中搜索名称

创造"已保存的查询"提供自定义搜索结果

能够运行其他报告

能够查看文件中的元数据**

* 数据分类不会对其可以扫描的数据量施加限制。每个控制台代理支持扫描和显示 500 TiB 的数据。要扫描超过 500 TiB 的数据,"安装另一个控制台代理"然后"部署另一个数据分类实例"。+ 控制台 UI 显示来自单个连接器的数据。有关查看来自多个控制台代理的数据的提示,请参阅"使用多个控制台代理"

** 在映射扫描期间从文件中提取以下元数据:

  • 系统

  • 系统类型

  • 存储库

  • 文件类型

  • 已用容量

  • 文件数

  • 文件大小

  • 文件创建

  • 文件上次访问

  • 文件上次修改时间

  • 文件发现时间

  • 权限提取

治理仪表板差异:
功能 地图和分类 映射

过时的数据

非业务数据

重复文件

预定义保存的查询

默认保存的查询

DDA 报告

地图报告

灵敏度等级检测

具有广泛权限的敏感数据

开放权限

数据时代

数据大小

类别

文件类型

合规性仪表板差异:
功能 地图和分类 映射

个人信息

敏感个人信息

隐私风险评估报告

HIPAA 报告

PCI DSS 报告

调查过滤器差异:
功能 地图和分类 映射

已保存的查询

系统类型

系统

存储库

文件类型

文件大小

创建时间

发现时间

上次修改时间

上次访问

开放权限

文件目录路径

类别

敏感度等级

标识符数量

个人数据

敏感个人数据

数据主体

重复项

分类状态

状态始终为“见解有限”

扫描分析事件

文件哈希

有访问权限的用户数

用户/组权限

文件所有者

目录类型

数据分类扫描数据的速度有多快

扫描速度受网络延迟、磁盘延迟、网络带宽、环境大小、文件分布大小等影响。

  • 执行仅映射扫描时,数据分类每天可以扫描 100 到 150 TiB 的数据。

  • 执行地图和分类扫描时,数据分类每天可以扫描 15 到 40 TiB 的数据。