获得私有数据的可见性和控制权
通过查看有关组织中个人数据和敏感个人数据的详细信息来控制您的私有数据。您还可以通过查看数据中的 Cloud Compliance 类别和文件类型来获得可见性。
默认情况下, " 云合规性 " 信息板会显示所有工作环境和数据库的合规性数据。
如果只想查看某些工作环境的数据, 选择这些工作环境。
个人数据
Cloud Compliance 会自动识别数据中的特定字词,字符串和模式( Reex )。例如,个人身份信息( Personal Identification" , Pi2 ),信用卡号,社会保险号,银行帐号等。 请参见完整列表。
对于某些类型的个人数据, Cloud Compliance 会使用 proximity validation_来 验证其结果。通过查找与所发现的个人数据相邻的一个或多个预定义关键字来进行验证。例如, Cloud Compliance 会标识一个美国如果在 SSN 旁边看到一个接近词,则将社会安全号( SSN )作为 SSN ,例如 _SSN 或 _社交 安全 _ 。 以下列表 显示 Cloud Compliance 何时使用接近验证。
查看包含个人数据的文件
-
在 Cloud Manager 顶部,单击 * 云合规性 * ,然后单击 * 信息板 * 选项卡。
-
要调查所有个人数据的详细信息,请单击个人数据百分比旁边的图标。
-
要调查特定类型的个人数据的详细信息,请单击 * 全部查看 * ,然后单击特定类型的个人数据的 * 调查结果 * 图标。
-
通过搜索,排序,展开特定文件的详细信息,单击 * 调查结果 * 以查看屏蔽信息或下载文件列表来调查数据。
-
您还可以筛选调查页面的内容,以便仅显示要查看的结果。通过顶级选项卡,您可以查看文件(非结构化数据)或数据库(结构化数据)中的数据。
然后,您可以筛选工作环境,存储库,类别,私有数据,文件类型, 上次修改日期,以及 S3 对象的权限是否允许公有访问。
个人数据的类型
文件中的个人数据可以是常规个人数据或国家标识符。第三列确定 Cloud Compliance 是否使用 接近验证 以验证其对标识符的发现。
Type | 标识符 | 是否进行接近验证? |
---|---|---|
常规 |
电子邮件地址 |
否 |
信用卡号 |
否 |
|
IBAN 编号(国际银行帐号) |
否 |
|
国家标识符 |
比利时 ID ( Numero National ) |
是的。 |
巴西 ID ( CPF ) |
是的。 |
|
Bulgarian" ID ( UCN ) |
是的。 |
|
加利福尼亚驾驶执照 |
是的。 |
|
克罗地亚语 ID ( OIB ) |
是的。 |
|
塞浦路斯税务识别号( TIC ) |
是的。 |
|
捷克语 / 斯洛伐克语 ID |
是的。 |
|
丹麦语 ID (常驻代表) |
是的。 |
|
荷兰语 ID ( BSN ) |
是的。 |
|
爱沙尼亚语 ID |
是的。 |
|
芬兰语 ID ( HETU ) |
是的。 |
|
法国税务识别号( SPI ) |
是的。 |
|
德国税务识别号( Steuerliche Identifikationsnummer ) |
是的。 |
|
希族 ID |
是的。 |
|
匈牙利税务标识号 |
是的。 |
|
爱尔兰 ID ( PPs ) |
是的。 |
|
以色列 ID |
是的。 |
|
意大利税务标识号 |
是的。 |
|
Latvian ID |
是的。 |
|
立陶宛语 ID |
是的。 |
|
卢森堡 ID |
是的。 |
|
马耳他 ID |
是的。 |
|
波兰语 ID ( PESEL ) |
是的。 |
|
葡萄牙税务识别号( NIF ) |
是的。 |
|
罗马尼亚语 ID ( CNP ) |
是的。 |
|
斯洛文尼亚语 ID ( EMO ) |
是的。 |
|
南非 ID |
是的。 |
|
西班牙语税务标识号 |
是的。 |
|
瑞典语 ID |
是的。 |
|
英国ID ( Nino ) |
是的。 |
|
美国社会保险号( SSN ) |
是的。 |
敏感的个人数据
Cloud Compliance 会根据隐私法规的定义自动识别特殊类型的敏感个人信息,例如 "《一般数据保护条例》第 9 条和第 10 条"。例如,有关个人健康,种族或性取向的信息。 请参见完整列表。
Cloud Compliance 使用人工智能( AI ),自然语言处理( NLP ),机器学习( ML )和认知计算( CC )来了解其扫描内容的含义,以便提取实体并对其进行相应的分类。
例如,一个敏感的 GDPR 数据类别是种族起源。由于其 NLP 功能, Cloud Compliance 可以区分 "George is Convency" (表示《一般数据保护条例》第 9 条中指定的敏感数据)与 "George is eating Mexican f尽 " 这两种句子之间的区别。
扫描敏感个人数据时,仅支持英语。稍后将添加对更多语言的支持。 |
查看包含敏感个人数据的文件
-
在 Cloud Manager 顶部,单击 * 云合规性 * 。
-
要调查所有敏感个人数据的详细信息,请单击敏感个人数据百分比旁边的图标。
-
要调查特定类型的敏感个人数据的详细信息,请单击 * 查看全部 * ,然后单击特定类型的敏感个人数据的 * 调查结果 * 图标。
-
通过搜索,排序,展开特定文件的详细信息,单击 * 调查结果 * 以查看屏蔽信息或下载文件列表来调查数据。
敏感个人数据的类型
Cloud Compliance 可在文件中找到的敏感个人数据包括:
- 《刑事诉讼参考》
-
有关自然人的犯罪和犯罪的数据。
- 《种族参考》
-
与自然人的种族或种族有关的数据。
- 运行状况参考
-
有关自然人健康的数据。
- ICD-9-CM 医疗代码
-
医疗和健康行业使用的代码。
- ICD-10-CM 医疗代码
-
医疗和健康行业使用的代码。
- 《理念参考》
-
与自然人的理念相关的数据。
- 《宗教信仰参考》
-
有关自然人的宗教信仰的数据。
- 性寿命或方向参考
-
有关自然人的性生活或性取向的数据。
类别
Cloud Compliance 会获取所扫描的数据并将其划分为不同类型的类别。类别是基于 AI 对每个文件的内容和元数据的分析而得出的主题。 查看类别列表。
类别可以通过向您显示所拥有的信息类型来帮助您了解数据的变化。例如,恢复或员工合同等类别可以包含敏感数据。调查结果时,您可能会发现员工合同存储在不安全的位置。然后,您可以更正此问题描述。
类别仅支持英语。稍后将添加对更多语言的支持。 |
按类别查看文件
-
在 Cloud Manager 顶部,单击 * 云合规性 * 。
-
直接从主屏幕中单击前 4 个类别之一的 * 调查结果 * 图标,或者单击 * 查看全部 * ,然后单击任意类别的图标。
-
通过搜索,排序,展开特定文件的详细信息,单击 * 调查结果 * 以查看屏蔽信息或下载文件列表来调查数据。
类别类型
Cloud Compliance 会按如下方式对您的数据进行分类:
- 财务
-
-
资产负债表
-
采购订单
-
发票
-
季度报告
-
- 人力资源
-
-
后台检查
-
薪酬计划
-
员工合同
-
员工审核
-
运行状况
-
恢复
-
- 法律
-
-
NDAS
-
供应商 - 客户合同
-
- 营销
-
-
营销活动
-
会议
-
- 操作
-
-
审核报告
-
- 销售
-
-
销售订单
-
- 服务
-
-
RFI
-
RFP
-
SOW
-
培训
-
- 支持
-
-
投诉和服务单
-
- 元数据类别
-
-
应用程序数据
-
归档文件
-
音频
-
业务应用程序数据
-
CAD 文件
-
代码
-
数据库和索引文件
-
设计文件
-
通过电子邮件发送应用程序数据
-
可执行文件
-
财务应用程序数据
-
运行状况应用程序数据
-
映像
-
日志
-
其他文档
-
其他演示文稿
-
其他电子表格
-
视频
-
文件类型
Cloud Compliance 会获取所扫描的数据,并按文件类型对其进行细分。查看文件类型有助于控制敏感数据,因为您可能会发现某些文件类型存储不正确。 请参见文件类型列表。
例如,您可能存储的 CAD 文件包含有关您的组织的非常敏感的信息。如果这些文件不安全,您可以通过限制权限或将文件移动到其他位置来控制敏感数据。
查看文件类型
-
在 Cloud Manager 顶部,单击 * 云合规性 * 。
-
直接从主屏幕中单击前 4 种文件类型之一的 * 调查结果 * 图标,或者单击 * 查看全部 * ,然后单击任意文件类型的图标。
-
通过搜索,排序,展开特定文件的详细信息,单击 * 调查结果 * 以查看屏蔽信息或下载文件列表来调查数据。
文件类型
Cloud Compliance 会扫描所有文件以获取类别和元数据洞察力,并在信息板的文件类型部分显示所有文件类型。
但是,当 Cloud Compliance 检测到个人身份信息( PiD )或执行 DSAL 搜索时,仅支持以下文件格式: .PDF , .docx , .DOC , .PPTX , .XLS , .XLSX , .CSV , .TXT , .RTF 和 .JSON 。
查看特定工作环境中的数据
您可以筛选 " 云合规性 " 信息板的内容,以查看所有工作环境和数据库的合规性数据,或者仅查看特定工作环境的合规性数据。
筛选信息板时, Cloud Compliance 会将合规性数据和报告范围仅限于您选择的工作环境。
-
单击筛选器下拉列表,选择要查看其数据的工作环境,然后单击 * 查看 * 。
发现的信息准确性
NetApp 无法保证 Cloud Compliance 所识别的个人数据和敏感个人数据的 100% 准确性。您应始终通过查看数据来验证此信息。
根据我们的测试,下表显示了 Cloud Compliance 发现的信息的准确性。我们将其细分为 precis度 _ 和 _recall :
- 精确度
-
正确识别 Cloud Compliance 的可能性。例如,个人数据的精确率为 90% 意味着,在被确定包含个人信息的 10 个文件中,有 9 个文件实际上包含个人信息。每 10 个文件中就有 1 个是误报文件。
- 重新调用
-
云合规性找到所需内容的可能性。例如,个人数据的重新调用率为 70% ,这意味着 Cloud Compliance 可以识别贵组织中实际包含个人信息的 10 个文件中的 7 个文件。Cloud Compliance 会丢失 30% 的数据,并且不会显示在信息板中。
Cloud Compliance 采用受控可用性版本,我们会不断提高结果的准确性。这些改进功能将在未来的 Cloud Compliance 版本中自动提供。
Type | 精确度 | 重新调用 |
---|---|---|
个人数据—常规 |
90% 到 95% |
60%-80% |
个人数据—国家 / 地区标识符 |
30% 到 60% |
40%-60% |
敏感的个人数据 |
80%-95% |
20%-30% |
类别 |
90% 到 97% |
60%-80% |
每个文件列表报告中包含的内容( CSV 文件)
您可以从每个调查页面下载包含已标识文件详细信息的文件列表( CSV 格式)。如果结果超过 10 , 000 个,则列表中仅显示排名前 10 , 000 位的结果。
每个文件列表包含以下信息:
-
文件名
-
位置类型
-
Working environment
-
存储库
-
协议
-
文件路径
-
文件类型
-
类别
-
个人信息
-
敏感的个人信息
-
删除检测日期
删除检测日期用于标识文件被删除或移动的日期。这样,您就可以确定何时移动了敏感文件。已删除的文件不属于信息板或 " 调查 " 页面上显示的文件编号。这些文件仅显示在 CSV 报告中。