私有数据的类别
BlueXP分类可以在卷和数据库中识别多种类型的私有数据。
BlueXP分类可识别两种类型的个人数据:
-
个人身份信息(Pi2)
-
敏感个人信息(SPi)
如果您需要BlueXP分类来识别其他私有数据类型、例如其他国家/地区ID编号或医疗保健标识符、请发送电子邮件至ng-contact-data-sense@netapp.com并附上您的请求。 |
个人数据的类型
在文件中找到的个人数据或个人身份信息(Pix)可以是一般个人数据或国家标识符。下表中的第三列标识了BlueXP分类是否使用 "接近验证" 以验证其对标识符的发现。
表中列出了可识别这些项目的语言。
Type | 标识符 | 是否进行接近验证? | 英语 | 德语 | 西班牙语 | 法语 | Japanese: |
---|---|---|---|---|---|---|---|
常规 |
信用卡号 |
否 |
✓ |
✓ |
✓ |
✓ |
|
数据主题 |
否 |
✓ |
✓ |
✓ |
|||
电子邮件地址 |
否 |
✓ |
✓ |
✓ |
✓ |
||
IBAN编号(国际银行账号) |
否 |
✓ |
✓ |
✓ |
✓ |
||
IP 地址 |
否 |
✓ |
✓ |
✓ |
✓ |
||
Password |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
国家标识符 |
澳大利亚 TFN (税务文件编号) |
是的。 |
✓ |
✓ |
✓ |
||
澳大利亚驾驶执照 |
是的。 |
✓ |
✓ |
✓ |
|||
澳大利亚医疗保健计划编号 |
是的。 |
✓ |
✓ |
✓ |
|||
澳大利亚护照编号 |
是的。 |
✓ |
✓ |
✓ |
|||
奥地利 SSN |
是的。 |
✓ |
✓ |
✓ |
|||
比利时 ID ( Numero National ) |
是的。 |
✓ |
✓ |
✓ |
|||
博茨瓦纳身份卡(Omang)编号 |
是的。 |
✓ |
✓ |
✓ |
|||
博茨瓦纳的护照编号 |
是的。 |
✓ |
✓ |
✓ |
|||
巴西 ID ( CPF ) |
是的。 |
✓ |
✓ |
✓ |
|||
英国护照 |
是的。 |
✓ |
✓ |
✓ |
|||
Bulgarian" ID ( UCN ) |
是的。 |
✓ |
✓ |
✓ |
|||
克罗地亚语 ID ( OIB ) |
是的。 |
✓ |
✓ |
✓ |
|||
塞浦路斯税务识别号( TIC ) |
是的。 |
✓ |
✓ |
✓ |
|||
捷克语 / 斯洛伐克语 ID |
是的。 |
✓ |
✓ |
✓ |
|||
丹麦语 ID (常驻代表) |
是的。 |
✓ |
✓ |
✓ |
|||
荷兰语 ID ( BSN ) |
是的。 |
✓ |
✓ |
✓ |
|||
爱沙尼亚语 ID |
是的。 |
✓ |
✓ |
✓ |
|||
芬兰语 ID ( HETU ) |
是的。 |
✓ |
✓ |
✓ |
|||
法语版驱动程序许可证 |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
法语 ID |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
法语 INSEE |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
法语社会保障号码 |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
法国税务识别号( SPI ) |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
德语ID (Personalausweisnummer) |
是的。 |
✓ |
✓ |
✓ |
|||
银行转账的德国内部ID |
是的。 |
✓ |
✓ |
✓ |
|||
德国社会保障号码(Sozialversicherungsnummer) |
是的。 |
✓ |
✓ |
✓ |
|||
德国税务识别号( Steuerliche Identifikationsnummer ) |
是的。 |
✓ |
✓ |
✓ |
|||
希族 ID |
是的。 |
✓ |
✓ |
✓ |
|||
匈牙利税务标识号 |
是的。 |
✓ |
✓ |
✓ |
|||
爱尔兰 ID ( PPs ) |
是的。 |
✓ |
✓ |
✓ |
|||
以色列 ID |
是的。 |
✓ |
✓ |
✓ |
|||
意大利税务标识号 |
是的。 |
✓ |
✓ |
✓ |
|||
日语个人标识号(个人和公司) |
是的。 |
✓ |
✓ |
✓ |
✓ |
||
Latvian ID |
是的。 |
✓ |
✓ |
✓ |
|||
立陶宛语 ID |
是的。 |
✓ |
✓ |
✓ |
|||
卢森堡 ID |
是的。 |
✓ |
✓ |
✓ |
|||
马耳他 ID |
是的。 |
✓ |
✓ |
✓ |
|||
国家卫生服务( NHS )编号 |
是的。 |
✓ |
✓ |
✓ |
|||
新西兰银行帐户 |
是的。 |
✓ |
✓ |
✓ |
|||
新西兰驾驶执照 |
是的。 |
✓ |
✓ |
✓ |
|||
新西兰IRD编号(税务ID) |
是的。 |
✓ |
✓ |
✓ |
|||
新西兰NHI (国家健康指数)编号 |
是的。 |
✓ |
✓ |
✓ |
|||
新西兰的护照编号 |
是的。 |
✓ |
✓ |
✓ |
|||
波兰语 ID ( PESEL ) |
是的。 |
✓ |
✓ |
✓ |
|||
葡萄牙税务识别号( NIF ) |
是的。 |
✓ |
✓ |
✓ |
|||
罗马尼亚语 ID ( CNP ) |
是的。 |
✓ |
✓ |
✓ |
|||
新加坡国家注册身份卡(NRIC) |
是的。 |
✓ |
✓ |
✓ |
|||
斯洛文尼亚语 ID ( EMO ) |
是的。 |
✓ |
✓ |
✓ |
|||
南非 ID |
是的。 |
✓ |
✓ |
✓ |
|||
西班牙语税务标识号 |
是的。 |
✓ |
✓ |
✓ |
|||
瑞典语 ID |
是的。 |
✓ |
✓ |
✓ |
|||
德克萨斯驱动程序许可证 |
是的。 |
✓ |
✓ |
✓ |
|||
英国ID ( Nino ) |
是的。 |
✓ |
✓ |
✓ |
|||
美国加州驾驶执照 |
是的。 |
✓ |
✓ |
✓ |
|||
美国印第安纳州驾驶执照 |
是的。 |
✓ |
✓ |
✓ |
|||
美国纽约驱动程序许可证 |
是的。 |
✓ |
✓ |
✓ |
|||
美国社会保险号( SSN ) |
是的。 |
✓ |
✓ |
✓ |
敏感个人数据的类型
BlueXP分类可以在文件中找到以下敏感个人信息(SPii)。
目前,此类别中的项目只能识别为英语。
-
刑事诉讼参考:有关自然人刑事定罪和犯罪的数据。
-
种族参考:有关自然人的种族或族裔出身的数据。
-
健康参考:有关自然人健康的数据。
-
ICD-9-CM医疗代码:医疗和卫生行业使用的代码。
-
ICD-10-CM医疗代码:医疗和卫生行业使用的代码。
-
哲学信仰参考:有关自然人哲学信仰的数据。
-
政治意见参考资料:关于自然人政治意见的数据。
-
宗教信仰参考:有关自然人宗教信仰的数据。
-
性生活或性取向参考:有关自然人的性生活或性取向的数据。
类别类型
BlueXP分类可按如下方式对数据进行分类。
其中大多数类别均可获得英语,德语和西班牙语的认可。
类别 | Type | 英语 | 德语 | 西班牙语 |
---|---|---|---|---|
财务 |
资产负债表 |
✓ |
✓ |
✓ |
采购订单 |
✓ |
✓ |
✓ |
|
发票 |
✓ |
✓ |
✓ |
|
季度报告 |
✓ |
✓ |
✓ |
|
人力资源 |
后台检查 |
✓ |
✓ |
|
薪酬计划 |
✓ |
✓ |
✓ |
|
员工合同 |
✓ |
✓ |
||
员工审核 |
✓ |
✓ |
||
运行状况 |
✓ |
✓ |
||
恢复 |
✓ |
✓ |
✓ |
|
法律 |
NDAS |
✓ |
✓ |
✓ |
供应商 - 客户合同 |
✓ |
✓ |
✓ |
|
营销 |
营销活动 |
✓ |
✓ |
✓ |
会议 |
✓ |
✓ |
✓ |
|
操作 |
审核报告 |
✓ |
✓ |
✓ |
销售 |
销售订单 |
✓ |
✓ |
|
服务 |
RFI |
✓ |
✓ |
|
RFP |
✓ |
✓ |
||
SOW |
✓ |
✓ |
✓ |
|
培训 |
✓ |
✓ |
✓ |
|
支持 |
投诉和服务单 |
✓ |
✓ |
✓ |
此外,还会对以下元数据进行分类,并使用相同的受支持语言进行标识:
-
应用程序数据
-
归档文件
-
音频
-
BlueXP分类中的分层
业务应用程序数据 -
CAD 文件
-
代码
-
已损坏
-
数据库和索引文件
-
设计文件
-
通过电子邮件发送应用程序数据
-
加密(entropy得分较高的文件)
-
可执行文件
-
财务应用程序数据
-
运行状况应用程序数据
-
映像
-
日志
-
其他文档
-
其他演示文稿
-
其他电子表格
-
其他 " 未知 "
-
受密码保护的文件
-
结构化数据
-
视频
-
零字节文件
文件类型
BlueXP分类会扫描所有文件以查看类别和元数据洞察力、并在信息板的文件类型部分显示所有文件类型。
但是、当BlueXP分类检测到个人身份信息(PII)或执行DSAR搜索时、仅支持以下文件格式:
.CSV、.dcm、.Dicom、.DOC、.docx、 .json、.PDF、.PPTX、.RTV、.TXT、 .XLS、.XLSX、文档、工作表和幻灯片
发现的信息准确性
NetApp无法保证BlueXP分类确定的个人数据和敏感个人数据的100%准确性。您应始终通过查看数据来验证此信息。
根据我们的测试、下表显示了BlueXP分类所发现的信息的准确性。我们将其细分为 precis度 _ 和 _recall :
- 精确度
-
已正确标识BlueXP分类所发现的概率。例如,个人数据的精确率为 90% 意味着,在被确定包含个人信息的 10 个文件中,有 9 个文件实际上包含个人信息。每 10 个文件中就有 1 个是误报文件。
- 重新调用
-
BlueXP分类查找其应执行的操作的概率。例如、个人数据的恢复率为70%意味着BlueXP分类可以识别出组织中实际包含个人信息的10个文件中的7个文件。BlueXP分类会遗漏30%的数据、并且不会显示在信息板中。
我们不断提高结果的准确性。这些改进将在未来的BlueXP分类版本中自动提供。
Type | 精确度 | 重新调用 |
---|---|---|
个人数据—常规 |
90% 到 95% |
60%-80% |
个人数据—国家 / 地区标识符 |
30% 到 60% |
40%-60% |
敏感的个人数据 |
80%-95% |
20%-30% |
类别 |
90% 到 97% |
60%-80% |