简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

私有数据的类别

提供者 netapp-tonacki 下载此页面的 PDF

Cloud Data sense 可以在卷, Amazon S3 分段,数据库和 OneDrive 文件夹中识别多种类型的私有数据。请参见以下类别。

提示 如果您需要 Cloud Data sense 识别其他私有数据类型,例如其他国家 / 地区 ID 号或医疗保健标识符,请根据您的请求向 ng-contact-data-sense@netapp.com 发送电子邮件。

个人数据的类型

文件中的个人数据可以是常规个人数据或国家标识符。第三列标识 Cloud Data sense 是否使用 "接近验证" 以验证其对标识符的发现。

请注意,如果要扫描数据库服务器,您可以将这些数据添加到文件中的个人数据列表中。Data DataSIF_ 功能允许您通过选择数据库表中的列来选择 Fusion sense 在其扫描中查找的其他标识符。请参见 "使用 Data Fusion 添加个人数据标识符" 了解详细信息。

类型 标识符 是否进行接近验证?

常规

电子邮件地址

信用卡号

IBAN 编号(国际银行帐号)

IP 地址

国家标识符

奥地利 SSN

是的。

比利时 ID ( Numero National )

是的。

巴西 ID ( CPF )

是的。

Bulgarian" ID ( UCN )

是的。

加利福尼亚驾驶执照

是的。

克罗地亚语 ID ( OIB )

是的。

塞浦路斯税务识别号( TIC )

是的。

捷克语 / 斯洛伐克语 ID

是的。

丹麦语 ID (常驻代表)

是的。

荷兰语 ID ( BSN )

是的。

爱沙尼亚语 ID

是的。

芬兰语 ID ( HETU )

是的。

法国税务识别号( SPI )

是的。

德国税务识别号( Steuerliche Identifikationsnummer )

是的。

希族 ID

是的。

匈牙利税务标识号

是的。

爱尔兰 ID ( PPs )

是的。

以色列 ID

是的。

意大利税务标识号

是的。

Latvian ID

是的。

立陶宛语 ID

是的。

卢森堡 ID

是的。

马耳他 ID

是的。

波兰语 ID ( PESEL )

是的。

葡萄牙税务识别号( NIF )

是的。

罗马尼亚语 ID ( CNP )

是的。

斯洛文尼亚语 ID ( EMO )

是的。

南非 ID

是的。

西班牙语税务标识号

是的。

瑞典语 ID

是的。

英国ID ( Nino )

是的。

美国社会保险号( SSN )

是的。

敏感个人数据的类型

Cloud Data sense 可以在文件中找到的敏感个人数据包括:

《刑事诉讼参考》

有关自然人的犯罪和犯罪的数据。

《种族参考》

与自然人的种族或种族有关的数据。

运行状况参考

有关自然人健康的数据。

ICD-9-CM 医疗代码

医疗和健康行业使用的代码。

ICD-10-CM 医疗代码

医疗和健康行业使用的代码。

《理念参考》

与自然人的理念相关的数据。

《政治观点参考》

与自然人的政治观点相关的数据。

《宗教信仰参考》

有关自然人的宗教信仰的数据。

性寿命或方向参考

有关自然人的性生活或性取向的数据。

类别类型

Cloud Data sense 可按如下方式对数据进行分类:其中大多数类别均可获得英语,德语和西班牙语的认可。

类别 类型 英语 德语 西班牙语

财务

资产负债表

采购订单

发票

季度报告

人力资源

后台检查

薪酬计划

员工合同

员工审核

运行状况

恢复

法律

NDAS

供应商 - 客户合同

营销

营销活动

会议

操作

审核报告

销售

销售订单

服务

RFI

RFP

SOW

培训

支持

投诉和服务单

此外,还支持以下元数据类别:

类别 英语 德语 西班牙语

应用程序数据

归档文件

音频

业务应用程序数据

CAD 文件

数据库和索引文件

设计文件

通过电子邮件发送应用程序数据

可执行文件

财务应用程序数据

运行状况应用程序数据

映像

日志

其他文档

其他演示文稿

其他电子表格

其他 " 未知 "

视频

文件类型

Cloud Data sense 会扫描所有文件以获取类别和元数据洞察力,并在信息板的文件类型部分显示所有文件类型。

但是,当 Data sense 检测到个人身份信息( Pii )或执行 DSAL 搜索时,仅支持以下文件格式: .CSV , .dcm , .DICOM、 .DOC , .docx , .json , .PDF , .PPTX , .RTV , .TXT , .XLS 和 .XLSX 。

发现的信息准确性

NetApp 无法保证 Cloud Data sense 识别的个人数据和敏感个人数据的 100% 准确性。您应始终通过查看数据来验证此信息。

根据我们的测试,下表显示了 Data sense 所发现的信息的准确性。我们将其细分为 precis度 _ 和 _recall

精确度

正确识别数据感知所发现的可能性。例如,个人数据的精确率为 90% 意味着,在被确定包含个人信息的 10 个文件中,有 9 个文件实际上包含个人信息。每 10 个文件中就有 1 个是误报文件。

重新调用

数据感知找到应做之事的可能性。例如,个人数据的重新调用率为 70% ,这意味着 Data sense 可以识别贵组织中实际包含个人信息的 10 个文件中的 7 个文件。数据感知可能会丢失 30% 的数据,并且不会显示在信息板中。

我们不断提高结果的准确性。这些改进功能将在未来的 Data sense 版本中自动提供。

类型 精确度 重新调用

个人数据—常规

90% 到 95%

60%-80%

个人数据—国家 / 地区标识符

30% 到 60%

40%-60%

敏感的个人数据

80%-95%

20%-30%

类别

90% 到 97%

60%-80%