使用NetApp数据分类扫描数据源
NetApp数据分类会扫描您选择的存储库(卷、数据库模式或其他用户数据)中的数据,以识别个人和敏感数据。然后,数据分类会映射您的组织数据、对每个文件进行分类并识别数据中的预定义模式。扫描结果是个人信息、敏感个人信息、数据类别和文件类型的索引。
初始扫描后,数据分类将以循环方式持续扫描您的数据以检测增量变化。这就是为什么保持实例运行很重要。
您可以在卷级别或数据库模式级别启用和禁用扫描。
映射扫描和分类扫描之间有什么区别
您可以在数据分类中进行两种类型的扫描:
-
仅映射扫描仅提供数据的高级概览,并在选定的数据源上执行。仅映射扫描比映射和分类扫描花费的时间更少,因为它们不访问文件来查看其中的数据。您可能希望首先执行此操作来确定研究领域,然后对这些领域执行地图和分类扫描。
-
地图和分类扫描 为您的数据提供深层扫描。
下表显示了一些差异:
功能 | 映射和分类扫描 | 仅映射扫描 |
---|---|---|
扫描速度 |
慢 |
快 |
定价 |
可用 |
可用 |
容量 |
限制为 500 TiB* |
限制为 500 TiB* |
文件类型和已用容量列表 |
是 |
是 |
文件数量和已用容量 |
是 |
是 |
文件的年龄和大小 |
是 |
是 |
能够运行"数据映射报告" |
是 |
是 |
数据调查页面查看文件详细信息 |
是 |
否 |
在文件中搜索名称 |
是 |
否 |
创造"已保存的查询"提供自定义搜索结果 |
是 |
否 |
能够运行其他报告 |
是 |
否 |
能够查看文件中的元数据** |
否 |
是 |
* 数据分类不会对其可以扫描的数据量施加限制。每个控制台代理支持扫描和显示 500 TiB 的数据。要扫描超过 500 TiB 的数据,"安装另一个控制台代理"然后"部署另一个数据分类实例"。+ 控制台 UI 显示来自单个连接器的数据。有关查看来自多个控制台代理的数据的提示,请参阅"使用多个控制台代理"。
** 在映射扫描期间从文件中提取以下元数据:
-
系统
-
系统类型
-
存储库
-
文件类型
-
已用容量
-
文件数
-
文件大小
-
文件创建
-
文件上次访问
-
文件上次修改时间
-
文件发现时间
-
权限提取
治理仪表板差异:
功能 | 地图和分类 | 映射 |
---|---|---|
过时的数据 |
是 |
是 |
非业务数据 |
是 |
是 |
重复文件 |
是 |
是 |
预定义保存的查询 |
是 |
否 |
默认保存的查询 |
是 |
是 |
DDA 报告 |
是 |
是 |
地图报告 |
是 |
是 |
灵敏度等级检测 |
是 |
否 |
具有广泛权限的敏感数据 |
是 |
否 |
开放权限 |
是 |
是 |
数据时代 |
是 |
是 |
数据大小 |
是 |
是 |
类别 |
是 |
否 |
文件类型 |
是 |
是 |
合规性仪表板差异:
功能 | 地图和分类 | 映射 |
---|---|---|
个人信息 |
是 |
否 |
敏感个人信息 |
是 |
否 |
隐私风险评估报告 |
是 |
否 |
HIPAA 报告 |
是 |
否 |
PCI DSS 报告 |
是 |
否 |
调查过滤器差异:
功能 | 地图和分类 | 映射 |
---|---|---|
已保存的查询 |
是 |
是 |
系统类型 |
是 |
是 |
系统 |
是 |
是 |
存储库 |
是 |
是 |
文件类型 |
是 |
是 |
文件大小 |
是 |
是 |
创建时间 |
是 |
是 |
发现时间 |
是 |
是 |
上次修改时间 |
是 |
是 |
上次访问 |
是 |
是 |
开放权限 |
是 |
是 |
文件目录路径 |
是 |
是 |
类别 |
是 |
否 |
敏感度等级 |
是 |
否 |
标识符数量 |
是 |
否 |
个人数据 |
是 |
否 |
敏感个人数据 |
是 |
否 |
数据主体 |
是 |
否 |
重复项 |
是 |
是 |
分类状态 |
是 |
状态始终为“见解有限” |
扫描分析事件 |
是 |
是 |
文件哈希 |
是 |
是 |
有访问权限的用户数 |
是 |
是 |
用户/组权限 |
是 |
是 |
文件所有者 |
是 |
是 |
目录类型 |
是 |
是 |
数据分类扫描数据的速度有多快
扫描速度受网络延迟、磁盘延迟、网络带宽、环境大小、文件分布大小等影响。
-
执行仅映射扫描时,数据分类每天可以扫描 100 到 150 TiB 的数据。
-
执行地图和分类扫描时,数据分类每天可以扫描 15 到 40 TiB 的数据。