Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

私有数据的类别

贡献者

BlueXP分类可以在卷和数据库中识别多种类型的私有数据。

BlueXP分类可识别两种类型的个人数据:

  • 个人身份信息(Pi2)

  • 敏感个人信息(SPi)

提示 如果您需要BlueXP分类来识别其他私有数据类型、例如其他国家/地区ID编号或医疗保健标识符、请发送电子邮件至ng-contact-data-sense@netapp.com并附上您的请求。

个人数据的类型

在文件中找到的个人数据或个人身份信息(Pix)可以是一般个人数据或国家标识符。下表中的第三列标识了BlueXP分类是否使用 "接近验证" 以验证其对标识符的发现。

表中列出了可识别这些项目的语言。

Type 标识符 是否进行接近验证? 英语 德语 西班牙语 法语 Japanese:

常规

信用卡号

数据主题

电子邮件地址

IBAN编号(国际银行账号)

IP 地址

Password

是的。

国家标识符

澳大利亚 TFN (税务文件编号)

是的。

澳大利亚驾驶执照

是的。

澳大利亚医疗保健计划编号

是的。

澳大利亚护照编号

是的。

奥地利 SSN

是的。

比利时 ID ( Numero National )

是的。

博茨瓦纳身份卡(Omang)编号

是的。

博茨瓦纳的护照编号

是的。

巴西 ID ( CPF )

是的。

英国护照

是的。

Bulgarian" ID ( UCN )

是的。

克罗地亚语 ID ( OIB )

是的。

塞浦路斯税务识别号( TIC )

是的。

捷克语 / 斯洛伐克语 ID

是的。

丹麦语 ID (常驻代表)

是的。

荷兰语 ID ( BSN )

是的。

爱沙尼亚语 ID

是的。

芬兰语 ID ( HETU )

是的。

法语版驱动程序许可证

是的。

法语 ID

是的。

法语 INSEE

是的。

法语社会保障号码

是的。

法国税务识别号( SPI )

是的。

德语ID (Personalausweisnummer)

是的。

银行转账的德国内部ID

是的。

德国社会保障号码(Sozialversicherungsnummer)

是的。

德国税务识别号( Steuerliche Identifikationsnummer )

是的。

希族 ID

是的。

匈牙利税务标识号

是的。

爱尔兰 ID ( PPs )

是的。

以色列 ID

是的。

意大利税务标识号

是的。

日语个人标识号(个人和公司)

是的。

Latvian ID

是的。

立陶宛语 ID

是的。

卢森堡 ID

是的。

马耳他 ID

是的。

国家卫生服务( NHS )编号

是的。

新西兰银行帐户

是的。

新西兰驾驶执照

是的。

新西兰IRD编号(税务ID)

是的。

新西兰NHI (国家健康指数)编号

是的。

新西兰的护照编号

是的。

波兰语 ID ( PESEL )

是的。

葡萄牙税务识别号( NIF )

是的。

罗马尼亚语 ID ( CNP )

是的。

新加坡国家注册身份卡(NRIC)

是的。

斯洛文尼亚语 ID ( EMO )

是的。

南非 ID

是的。

西班牙语税务标识号

是的。

瑞典语 ID

是的。

德克萨斯驱动程序许可证

是的。

英国ID ( Nino )

是的。

美国加州驾驶执照

是的。

美国印第安纳州驾驶执照

是的。

美国纽约驱动程序许可证

是的。

美国社会保险号( SSN )

是的。

敏感个人数据的类型

BlueXP分类可以在文件中找到以下敏感个人信息(SPii)。

目前,此类别中的项目只能识别为英语。

  • 刑事诉讼参考:有关自然人刑事定罪和犯罪的数据。

  • 种族参考:有关自然人的种族或族裔出身的数据。

  • 健康参考:有关自然人健康的数据。

  • ICD-9-CM医疗代码:医疗和卫生行业使用的代码。

  • ICD-10-CM医疗代码:医疗和卫生行业使用的代码。

  • 哲学信仰参考:有关自然人哲学信仰的数据。

  • 政治意见参考资料:关于自然人政治意见的数据。

  • 宗教信仰参考:有关自然人宗教信仰的数据。

  • 性生活或性取向参考:有关自然人的性生活或性取向的数据。

类别类型

BlueXP分类可按如下方式对数据进行分类。

其中大多数类别均可获得英语,德语和西班牙语的认可。

类别 Type 英语 德语 西班牙语

财务

资产负债表

采购订单

发票

季度报告

人力资源

后台检查

薪酬计划

员工合同

员工审核

运行状况

恢复

法律

NDAS

供应商 - 客户合同

营销

营销活动

会议

操作

审核报告

销售

销售订单

服务

RFI

RFP

SOW

培训

支持

投诉和服务单

此外,还会对以下元数据进行分类,并使用相同的受支持语言进行标识:

  • 应用程序数据

  • 归档文件

  • 音频

  • BlueXP分类中的分层
    业务应用程序数据

  • CAD 文件

  • 代码

  • 已损坏

  • 数据库和索引文件

  • 设计文件

  • 通过电子邮件发送应用程序数据

  • 加密(entropy得分较高的文件)

  • 可执行文件

  • 财务应用程序数据

  • 运行状况应用程序数据

  • 映像

  • 日志

  • 其他文档

  • 其他演示文稿

  • 其他电子表格

  • 其他 " 未知 "

  • 受密码保护的文件

  • 结构化数据

  • 视频

  • 零字节文件

文件类型

BlueXP分类会扫描所有文件以查看类别和元数据洞察力、并在信息板的文件类型部分显示所有文件类型。

但是、当BlueXP分类检测到个人身份信息(PII)或执行DSAR搜索时、仅支持以下文件格式:

.CSV、.dcm、.Dicom、.DOC、.docx、 .json、.PDF、.PPTX、.RTV、.TXT、 .XLS、.XLSX、文档、工作表和幻灯片

发现的信息准确性

NetApp无法保证BlueXP分类确定的个人数据和敏感个人数据的100%准确性。您应始终通过查看数据来验证此信息。

根据我们的测试、下表显示了BlueXP分类所发现的信息的准确性。我们将其细分为 precis度 _ 和 _recall

精确度

已正确标识BlueXP分类所发现的概率。例如,个人数据的精确率为 90% 意味着,在被确定包含个人信息的 10 个文件中,有 9 个文件实际上包含个人信息。每 10 个文件中就有 1 个是误报文件。

重新调用

BlueXP分类查找其应执行的操作的概率。例如、个人数据的恢复率为70%意味着BlueXP分类可以识别出组织中实际包含个人信息的10个文件中的7个文件。BlueXP分类会遗漏30%的数据、并且不会显示在信息板中。

我们不断提高结果的准确性。这些改进将在未来的BlueXP分类版本中自动提供。

Type 精确度 重新调用

个人数据—常规

90% 到 95%

60%-80%

个人数据—国家 / 地区标识符

30% 到 60%

40%-60%

敏感的个人数据

80%-95%

20%-30%

类别

90% 到 97%

60%-80%