Skip to main content
NetApp Data Classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

NetApp数据分类中的私有数据类别

贡献者 netapp-ahibbard

NetApp数据分类可以在您的卷和数据库中识别多种类型的私有数据。

数据分类识别两种类型的个人数据:

  • 个人身份信息(PII)

  • 敏感个人信息(SPII)

提示 如果您需要数据分类来识别其他私人数据类型,例如额外的国民身份证号码或医疗保健标识符,请联系您的客户经理。

个人数据的类型

文件中的个人数据或_个人身份信息_(PII)可以是一般个人数据或国家标识符。下表第三列标识数据分类是否使用"接近度验证"验证其对标识符的发现。

表中标明了可以识别这些项目的语言。

类型 标识符 接近度验证? 英语 德语 西班牙语 法语 日语

常规

信用卡号码

数据主体

电子邮件地址

IBAN 号码(国际银行账户号码)

IP 地址

密码

国家标识符

澳大利亚 TFN(税号)

澳大利亚驾驶执照

澳大利亚医疗保险号码

澳大利亚护照号码

奥地利社会安全号码

比利时身份证(国民身份证)

博茨瓦纳身份证(奥芒)号码

博茨瓦纳护照号码

巴西身份证 (CPF)

英国护照

保加利亚身份证 (UCN)

加拿大银行信息号码 - 账号

加拿大银行信息号码 - 过境号码

加拿大公民/永久居民号码 - PR 卡号码 (UCI)

加拿大驾驶执照 - 艾伯塔省

加拿大驾驶执照 - 不列颠哥伦比亚省

加拿大驾驶执照 - 曼尼托巴省

加拿大驾驶执照 - 新不伦瑞克省

加拿大驾驶执照 - 纽芬兰和拉布拉多

加拿大驾驶执照 - 西北地区

加拿大驾驶执照 - 新斯科舍省

加拿大驾驶执照 - 努纳武特地区

加拿大驾照 - 安大略省

加拿大驾驶执照 - 爱德华王子岛

加拿大驾驶执照 - 魁北克

加拿大驾驶执照 - 萨斯喀彻温省

加拿大育空地区驾驶执照

加拿大健康卡号码 - 艾伯塔省 PHIN

加拿大健康卡号码 - 不列颠哥伦比亚省 PHIN

加拿大健康卡号码 - 曼尼托巴省 PHIN

加拿大健康卡号码 - PHIN

加拿大健康卡号码 - 纽芬兰和拉布拉多省 PHIN

加拿大健康卡号码 - 西北地区 PHIN

加拿大健康卡号码 - 新斯科舍省 PHIN

加拿大健康卡号码 - 努纳武特地区 PHIN

加拿大健康卡号码 - 安大略省 PHIN

加拿大健康卡号码 - 爱德华王子岛 PHIN

加拿大健康卡号码 - 魁北克 PHIN

加拿大健康卡号码 - 萨斯喀彻温省 PHIN

加拿大健康卡号码 - 育空地区 PHIN

加拿大护照号码

加拿大社会保险号(SIN)

克罗地亚身份证 (OIB)

塞浦路斯税务识别号(TIC)

捷克/斯洛伐克身份证

丹麦身份证 (CPR)

荷兰身份证 (BSN)

爱沙尼亚身份证

芬兰身份证 (HETU)

法国驾照

法国身份证

法国国家统计局

法国社会保障号码

法国税务识别号(SPI)

德国身份证 (Personalausweisnummer)

德国银行转账内部 ID

德国社会保障号 (Sozialversicherungsnummer)

德国纳税识别号 (Steuerliche Identifikationsnummer)

希腊身份证

匈牙利税务识别号

爱尔兰身份证 (PPS)

以色列身份证

意大利税务识别号

日本个人身份证号码(个人和公司)

拉脱维亚身份证

立陶宛身份证

卢森堡身份证

马耳他身份证

国家医疗服务体系 (NHS) 号码

新西兰银行账户

新西兰驾驶执照

新西兰税务局 (IRD) 号码(税号)

新西兰 NHI(国民健康指数)号码

新西兰护照号码

波兰身份证 (PESEL)

葡萄牙税务识别号(NIF)

罗马尼亚身份证 (CNP)

新加坡国民登记身份证(NRIC)

斯洛文尼亚身份证 (EMSO)

南非身份证

西班牙税务识别号

瑞典身份证

英国身份证(NINO)

美国加州驾驶执照

美国印第安纳州驾驶执照

美国纽约州驾驶执照

美国德克萨斯州驾驶执照

美国社会安全号码(SSN)

敏感个人数据的类型

数据分类可以在文件中找到以下敏感个人信息(SPII)。

以下 SPII 目前仅能以英文识别:

  • 刑事诉讼参考:有关自然人的刑事定罪和犯罪的数据。

  • 种族参考:有关自然人的种族或民族血统的数据。

  • 健康参考:有关自然人健康的数据。

  • ICD-9-CM 医疗代码:医疗保健行业使用的代码。

  • ICD-10-CM 医疗代码:医疗保健行业使用的代码。

  • 哲学信仰参考:有关自然人的哲学信仰的数据。

  • 政治观点参考:有关自然人政治观点的数据。

  • 宗教信仰参考:有关自然人的宗教信仰的数据。

  • 性生活或性取向参考:有关自然人的性生活或性取向的数据。

类别类型

数据分类将您的数据分类如下。

大多数类别都可以用英语、德语和西班牙语识别。

类别 类型 英语 德语 西班牙语

金融

资产负债表

采购订单

发票

季度报告

人力资源

背景调查

薪酬计划

员工合同

员工评价

运行状况

简历

合法的

保密协议

供应商-客户合同

营销

活动

会议

操作

审计报告

销售额

销售订单

服务

射频干扰

征求建议书

母猪

培训

支持

投诉和票务

以下元数据也使用相同的受支持语言进行分类和识别:

  • 应用程序数据

  • 存档文件

  • 声音的

  • 数据分类业务应用数据中的面包屑

  • CAD 文件

  • 代码

  • 腐败

  • 数据库和索引文件

  • 设计文件

  • 电子邮件应用程序数据

  • 加密(具有高熵值的文件)

  • 可执行文件

  • 财务应用数据

  • 健康应用数据

  • 图片

  • 日志

  • 杂项文件

  • 杂项演示

  • 杂项电子表格

  • 杂项“未知”

  • 受密码保护的文件

  • 结构化数据

  • 视频

  • 零字节文件

文件类型

数据分类扫描所有文件的类别和元数据洞察,并在仪表板的文件类型部分显示所有文件类型。当数据分类检测个人身份信息 (PII) 或执行 DSAR 搜索时,仅支持以下文件格式:

.CSV, .DCM, .DOC, .DOCX, .JSON, .PDF, .PPTX, .RTF, .TXT, .XLS, .XLSX, Docs, Sheets, and Slides

所发现信息的准确性

NetApp无法保证数据分类识别的个人数据和敏感个人数据 100% 的准确性。您应该始终通过查看数据来验证信息。

根据我们的测试,下表显示了数据分类发现的信息的准确性。我们根据_精度_和_召回率_来细分它:

精确

数据分类发现的内容被正确识别的概率。例如,个人数据的准确率为 90%,意味着在被识别为包含个人信息的 10 个文件中,有 9 个实际上包含个人信息。 10 个文件中会有 1 个是误报。

记起

数据分类找到其应有内容的概率。例如,个人数据的召回率为 70%,意味着数据分类可以识别出组织中 10 个文件中实际包含个人信息的 7 个。数据分类会遗漏 30% 的数据,并且不会出现在仪表板中。

我们正在不断提高结果的准确性。这些改进将在未来的数据分类版本中自动提供。

类型 精确 记起

个人数据 - 一般

90%-95%

60%-80%

个人数据 - 国家标识符

30%-60%

40%-60%

敏感个人数据

80%-95%

20%-30%

类别

90%-97%

60%-80%