Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

BlueXP  分类中的私有数据类别

贡献者

BlueXP分类可以在卷和数据库中识别多种类型的私有数据。

BlueXP  分类可识别两种类型的个人数据:

  • 个人身份信息(Pi2)

  • 敏感个人信息(SPi)

提示 如果您需要通过BlueXP  分类来识别其他私有数据类型、例如其他国家/地区ID编号或医疗保健标识符、请联系您的客户经理。

个人数据的类型

在文件中找到的个人数据或个人身份信息(Pix)可以是一般个人数据或国家标识符。下表中的第三列标识了BlueXP  分类是否使用"接近验证"来验证其标识符发现结果。

表中列出了可识别这些项目的语言。

键入 标识符 是否进行接近验证? 英语 德语 西班牙语 法语 日语

常规

信用卡号

数据主题

电子邮件地址

IBAN编号(国际银行账号)

IP 地址

密码

国家标识符

澳大利亚 TFN (税务文件编号)

澳大利亚驾驶执照

澳大利亚医疗保健计划编号

澳大利亚护照编号

奥地利 SSN

比利时 ID ( Numero National )

博茨瓦纳身份卡(Omang)编号

博茨瓦纳的护照编号

巴西 ID ( CPF )

英国护照

Bulgarian" ID ( UCN )

加拿大银行信息号码-账号

加拿大银行信息号码-过境号码

加拿大公民/永久居民编号- PR卡编号(UCI)

加拿大驾驶执照-艾伯塔省

加拿大驾驶执照-不列颠哥伦比亚省

加拿大驾驶执照-省

加拿大驾驶执照-新不伦瑞克省

加拿大驾驶执照-纽芬兰和拉布拉多

加拿大驾驶执照-西北地区

加拿大驾驶执照- Nova籍

加拿大驾驶执照-努纳武特

加拿大驾驶执照-安大略省

加拿大驾驶执照-爱德华王子岛省

加拿大驾驶执照-魁北克省

加拿大驾驶执照-萨斯喀彻温省

加拿大驾驶执照-照可

加拿大健康卡号码- Alberta Phin

加拿大健康卡号码-不列颠哥伦比亚省Phin

加拿大健康卡号码-省卫生卡号码-省卫生卡号码

加拿大健康卡号码- Phin

加拿大健康卡号码-纽芬兰和拉布拉多·潘

加拿大健康卡号码-西北地区Phin

加拿大健康卡号- Nova籍Phin

加拿大健康卡号-努纳武特·菲安

加拿大健康卡号码- Ontario Phin

加拿大健康卡号码-爱德华王子岛省Phin

加拿大健康卡号码-魁北克省Phin

加拿大健康卡号-萨斯喀彻温省Phin

加拿大健康卡号码- AHOHUOHUOHOO PHIN

加拿大护照号码

加拿大社会保险号码(单)

克罗地亚语 ID ( OIB )

塞浦路斯税务识别号( TIC )

捷克语 / 斯洛伐克语 ID

丹麦语 ID (常驻代表)

荷兰语 ID ( BSN )

爱沙尼亚语 ID

芬兰语 ID ( HETU )

法语版驱动程序许可证

法语ID

法语 INSEE

法语社会保障号码

法国税务识别号( SPI )

德语ID (Personalausweisnummer)

银行转账的德国内部ID

德国社会保障号码(Sozialversicherungsnummer)

德国税务识别号( Steuerliche Identifikationsnummer )

希族 ID

匈牙利税务标识号

爱尔兰 ID ( PPs )

以色列 ID

意大利税务标识号

日语个人标识号(个人和公司)

Latvian ID

立陶宛语 ID

卢森堡 ID

马耳他 ID

国家卫生服务( NHS )编号

新西兰银行帐户

新西兰驾驶执照

新西兰IRD编号(税务ID)

新西兰NHI (国家健康指数)编号

新西兰的护照编号

波兰语 ID ( PESEL )

葡萄牙税务识别号( NIF )

罗马尼亚语 ID ( CNP )

新加坡国家注册身份卡(NRIC)

斯洛文尼亚语 ID ( EMO )

南非 ID

西班牙语税务标识号

瑞典语 ID

英国ID (Nino)

美国加州驾驶执照

美国印第安纳州驾驶执照

美国纽约驱动程序许可证

美国德州驾驶证

美国社会保险号( SSN )

敏感个人数据的类型

BlueXP  分类可以在文件中找到以下敏感个人信息(SPii)。

目前,此类别中的项目只能识别为英语。

  • 刑事诉讼参考:有关自然人刑事定罪和犯罪的数据。

  • 种族参考:有关自然人的种族或族裔出身的数据。

  • 健康参考:有关自然人健康的数据。

  • ICD-9-CM医疗代码:医疗和卫生行业使用的代码。

  • ICD-10-CM医疗代码:医疗和卫生行业使用的代码。

  • 哲学信仰参考:有关自然人哲学信仰的数据。

  • 政治意见参考资料:关于自然人政治意见的数据。

  • 宗教信仰参考:有关自然人宗教信仰的数据。

  • 性生活或性取向参考:有关自然人的性生活或性取向的数据。

类别类型

BlueXP分类可按如下方式对数据进行分类。

其中大多数类别均可获得英语,德语和西班牙语的认可。

类别 键入 英语 德语 西班牙语

财务

资产负债表

采购订单

发票

季度报告

人力资源

后台检查

薪酬计划

员工合同

员工审核

运行状况

恢复

法律

NDAS

供应商 - 客户合同

营销

营销活动

会议

操作

审核报告

销售

销售订单

服务

RFI

RFP

SOW

培训

支持

投诉和服务单

此外,还会对以下元数据进行分类,并使用相同的受支持语言进行标识:

  • 应用程序数据

  • 归档文件

  • 音频

  • BlueXP  分类业务应用程序数据中的面包屑

  • CAD 文件

  • 代码

  • 已损坏

  • 数据库和索引文件

  • 设计文件

  • 通过电子邮件发送应用程序数据

  • 加密(entropy得分较高的文件)

  • 可执行文件

  • 财务应用程序数据

  • 运行状况应用程序数据

  • 映像

  • 日志

  • 其他文档

  • 其他演示文稿

  • 其他电子表格

  • 其他 " 未知 "

  • 受密码保护的文件

  • 结构化数据

  • 视频

  • 零字节文件

文件类型

BlueXP分类会扫描所有文件以查看类别和元数据洞察力、并在信息板的文件类型部分显示所有文件类型。

但是、当BlueXP分类检测到个人身份信息(PII)或执行DSAR搜索时、仅支持以下文件格式:

.CSV, .DCM, .DOC, .DOCX, .JSON, .PDF, .PPTX, .RTF, .TXT, .XLS, .XLSX, Docs, Sheets, and Slides

发现的信息准确性

NetApp无法保证BlueXP分类确定的个人数据和敏感个人数据的100%准确性。您应始终通过查看数据来验证此信息。

根据我们的测试、下表显示了BlueXP分类所发现的信息的准确性。我们将其细分为 precis度 _ 和 _recall

精确度

已正确标识BlueXP分类所发现的概率。例如,个人数据的精确率为 90% 意味着,在被确定包含个人信息的 10 个文件中,有 9 个文件实际上包含个人信息。每 10 个文件中就有 1 个是误报文件。

重新调用

BlueXP分类查找其应执行的操作的概率。例如、个人数据的恢复率为70%意味着BlueXP分类可以识别出组织中实际包含个人信息的10个文件中的7个文件。BlueXP分类会遗漏30%的数据、并且不会显示在信息板中。

我们不断提高结果的准确性。这些改进将在未来的BlueXP分类版本中自动提供。

键入 精确度 重新调用

个人数据—常规

90% 到 95%

60% 到 80%

个人数据—国家 / 地区标识符

30% 到 60%

40% 到 60%

敏感的个人数据

80% 到 95%

20% 到 30%

类别

90% 到 97%

60% 到 80%