NetApp数据分类中的私有数据类别
NetApp数据分类可以在您的卷和数据库中识别多种类型的私有数据。
数据分类识别两种类型的个人数据:
-
个人身份信息(PII)
-
敏感个人信息(SPII)
|
如果您需要数据分类来识别其他私人数据类型,例如额外的国民身份证号码或医疗保健标识符,请联系您的客户经理。 |
个人数据的类型
文件中的个人数据或_个人身份信息_(PII)可以是一般个人数据或国家标识符。下表第三列标识数据分类是否使用"接近度验证"验证其对标识符的发现。
表中标明了可以识别这些项目的语言。
类型 | 标识符 | 接近度验证? | 英语 | 德语 | 西班牙语 | 法语 | 日语 |
---|---|---|---|---|---|---|---|
常规 |
信用卡号码 |
是 |
✓ |
✓ |
✓ |
✓ |
|
数据主体 |
否 |
✓ |
✓ |
✓ |
|||
电子邮件地址 |
否 |
✓ |
✓ |
✓ |
✓ |
||
IBAN 号码(国际银行账户号码) |
否 |
✓ |
✓ |
✓ |
✓ |
||
IP 地址 |
否 |
✓ |
✓ |
✓ |
✓ |
||
密码 |
是 |
✓ |
✓ |
✓ |
✓ |
||
国家标识符 |
澳大利亚 TFN(税号) |
是 |
✓ |
✓ |
✓ |
||
澳大利亚驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
澳大利亚医疗保险号码 |
是 |
✓ |
✓ |
✓ |
|||
澳大利亚护照号码 |
是 |
✓ |
✓ |
✓ |
|||
奥地利社会安全号码 |
是 |
✓ |
✓ |
✓ |
|||
比利时身份证(国民身份证) |
是 |
✓ |
✓ |
✓ |
|||
博茨瓦纳身份证(奥芒)号码 |
是 |
✓ |
✓ |
✓ |
|||
博茨瓦纳护照号码 |
是 |
✓ |
✓ |
✓ |
|||
巴西身份证 (CPF) |
是 |
✓ |
✓ |
✓ |
|||
英国护照 |
是 |
✓ |
✓ |
✓ |
|||
保加利亚身份证 (UCN) |
是 |
✓ |
✓ |
✓ |
|||
加拿大银行信息号码 - 账号 |
是 |
✓ |
|||||
加拿大银行信息号码 - 过境号码 |
是 |
✓ |
|||||
加拿大公民/永久居民号码 - PR 卡号码 (UCI) |
是 |
✓ |
|||||
加拿大驾驶执照 - 艾伯塔省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 不列颠哥伦比亚省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 曼尼托巴省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 新不伦瑞克省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 纽芬兰和拉布拉多 |
是 |
✓ |
|||||
加拿大驾驶执照 - 西北地区 |
是 |
✓ |
|||||
加拿大驾驶执照 - 新斯科舍省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 努纳武特地区 |
是 |
✓ |
|||||
加拿大驾照 - 安大略省 |
是 |
✓ |
|||||
加拿大驾驶执照 - 爱德华王子岛 |
是 |
✓ |
|||||
加拿大驾驶执照 - 魁北克 |
是 |
✓ |
|||||
加拿大驾驶执照 - 萨斯喀彻温省 |
是 |
✓ |
|||||
加拿大育空地区驾驶执照 |
是 |
✓ |
|||||
加拿大健康卡号码 - 艾伯塔省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 不列颠哥伦比亚省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 曼尼托巴省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 纽芬兰和拉布拉多省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 西北地区 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 新斯科舍省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 努纳武特地区 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 安大略省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 爱德华王子岛 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 魁北克 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 萨斯喀彻温省 PHIN |
是 |
✓ |
|||||
加拿大健康卡号码 - 育空地区 PHIN |
是 |
✓ |
|||||
加拿大护照号码 |
是 |
✓ |
|||||
加拿大社会保险号(SIN) |
是 |
✓ |
|||||
克罗地亚身份证 (OIB) |
是 |
✓ |
✓ |
✓ |
|||
塞浦路斯税务识别号(TIC) |
是 |
✓ |
✓ |
✓ |
|||
捷克/斯洛伐克身份证 |
是 |
✓ |
✓ |
✓ |
|||
丹麦身份证 (CPR) |
是 |
✓ |
✓ |
✓ |
|||
荷兰身份证 (BSN) |
是 |
✓ |
✓ |
✓ |
|||
爱沙尼亚身份证 |
是 |
✓ |
✓ |
✓ |
|||
芬兰身份证 (HETU) |
是 |
✓ |
✓ |
✓ |
|||
法国驾照 |
是 |
✓ |
✓ |
✓ |
✓ |
||
法国身份证 |
是 |
✓ |
✓ |
✓ |
✓ |
||
法国国家统计局 |
是 |
✓ |
✓ |
✓ |
✓ |
||
法国社会保障号码 |
是 |
✓ |
✓ |
✓ |
✓ |
||
法国税务识别号(SPI) |
是 |
✓ |
✓ |
✓ |
✓ |
||
德国身份证 (Personalausweisnummer) |
是 |
✓ |
✓ |
✓ |
|||
德国银行转账内部 ID |
是 |
✓ |
✓ |
✓ |
|||
德国社会保障号 (Sozialversicherungsnummer) |
是 |
✓ |
✓ |
✓ |
|||
德国纳税识别号 (Steuerliche Identifikationsnummer) |
是 |
✓ |
✓ |
✓ |
|||
希腊身份证 |
是 |
✓ |
✓ |
✓ |
|||
匈牙利税务识别号 |
是 |
✓ |
✓ |
✓ |
|||
爱尔兰身份证 (PPS) |
是 |
✓ |
✓ |
✓ |
|||
以色列身份证 |
是 |
✓ |
✓ |
✓ |
|||
意大利税务识别号 |
是 |
✓ |
✓ |
✓ |
|||
日本个人身份证号码(个人和公司) |
是 |
✓ |
✓ |
✓ |
✓ |
||
拉脱维亚身份证 |
是 |
✓ |
✓ |
✓ |
|||
立陶宛身份证 |
是 |
✓ |
✓ |
✓ |
|||
卢森堡身份证 |
是 |
✓ |
✓ |
✓ |
|||
马耳他身份证 |
是 |
✓ |
✓ |
✓ |
|||
国家医疗服务体系 (NHS) 号码 |
是 |
✓ |
✓ |
✓ |
|||
新西兰银行账户 |
是 |
✓ |
✓ |
✓ |
|||
新西兰驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
新西兰税务局 (IRD) 号码(税号) |
是 |
✓ |
✓ |
✓ |
|||
新西兰 NHI(国民健康指数)号码 |
是 |
✓ |
✓ |
✓ |
|||
新西兰护照号码 |
是 |
✓ |
✓ |
✓ |
|||
波兰身份证 (PESEL) |
是 |
✓ |
✓ |
✓ |
|||
葡萄牙税务识别号(NIF) |
是 |
✓ |
✓ |
✓ |
|||
罗马尼亚身份证 (CNP) |
是 |
✓ |
✓ |
✓ |
|||
新加坡国民登记身份证(NRIC) |
是 |
✓ |
✓ |
✓ |
|||
斯洛文尼亚身份证 (EMSO) |
是 |
✓ |
✓ |
✓ |
|||
南非身份证 |
是 |
✓ |
✓ |
✓ |
|||
西班牙税务识别号 |
是 |
✓ |
✓ |
✓ |
|||
瑞典身份证 |
是 |
✓ |
✓ |
✓ |
|||
英国身份证(NINO) |
是 |
✓ |
✓ |
✓ |
|||
美国加州驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
美国印第安纳州驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
美国纽约州驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
美国德克萨斯州驾驶执照 |
是 |
✓ |
✓ |
✓ |
|||
美国社会安全号码(SSN) |
是 |
✓ |
✓ |
✓ |
敏感个人数据的类型
数据分类可以在文件中找到以下敏感个人信息(SPII)。
以下 SPII 目前仅能以英文识别:
-
刑事诉讼参考:有关自然人的刑事定罪和犯罪的数据。
-
种族参考:有关自然人的种族或民族血统的数据。
-
健康参考:有关自然人健康的数据。
-
ICD-9-CM 医疗代码:医疗保健行业使用的代码。
-
ICD-10-CM 医疗代码:医疗保健行业使用的代码。
-
哲学信仰参考:有关自然人的哲学信仰的数据。
-
政治观点参考:有关自然人政治观点的数据。
-
宗教信仰参考:有关自然人的宗教信仰的数据。
-
性生活或性取向参考:有关自然人的性生活或性取向的数据。
类别类型
数据分类将您的数据分类如下。
大多数类别都可以用英语、德语和西班牙语识别。
类别 | 类型 | 英语 | 德语 | 西班牙语 |
---|---|---|---|---|
金融 |
资产负债表 |
✓ |
✓ |
✓ |
采购订单 |
✓ |
✓ |
✓ |
|
发票 |
✓ |
✓ |
✓ |
|
季度报告 |
✓ |
✓ |
✓ |
|
人力资源 |
背景调查 |
✓ |
✓ |
|
薪酬计划 |
✓ |
✓ |
✓ |
|
员工合同 |
✓ |
✓ |
||
员工评价 |
✓ |
✓ |
||
运行状况 |
✓ |
✓ |
||
简历 |
✓ |
✓ |
✓ |
|
合法的 |
保密协议 |
✓ |
✓ |
✓ |
供应商-客户合同 |
✓ |
✓ |
✓ |
|
营销 |
活动 |
✓ |
✓ |
✓ |
会议 |
✓ |
✓ |
✓ |
|
操作 |
审计报告 |
✓ |
✓ |
✓ |
销售额 |
销售订单 |
✓ |
✓ |
|
服务 |
射频干扰 |
✓ |
✓ |
|
征求建议书 |
✓ |
✓ |
||
母猪 |
✓ |
✓ |
✓ |
|
培训 |
✓ |
✓ |
✓ |
|
支持 |
投诉和票务 |
✓ |
✓ |
✓ |
以下元数据也使用相同的受支持语言进行分类和识别:
-
应用程序数据
-
存档文件
-
声音的
-
数据分类业务应用数据中的面包屑
-
CAD 文件
-
代码
-
腐败
-
数据库和索引文件
-
设计文件
-
电子邮件应用程序数据
-
加密(具有高熵值的文件)
-
可执行文件
-
财务应用数据
-
健康应用数据
-
图片
-
日志
-
杂项文件
-
杂项演示
-
杂项电子表格
-
杂项“未知”
-
受密码保护的文件
-
结构化数据
-
视频
-
零字节文件
文件类型
数据分类扫描所有文件的类别和元数据洞察,并在仪表板的文件类型部分显示所有文件类型。当数据分类检测个人身份信息 (PII) 或执行 DSAR 搜索时,仅支持以下文件格式:
.CSV, .DCM, .DOC, .DOCX, .JSON, .PDF, .PPTX, .RTF, .TXT, .XLS, .XLSX, Docs, Sheets, and Slides
所发现信息的准确性
NetApp无法保证数据分类识别的个人数据和敏感个人数据 100% 的准确性。您应该始终通过查看数据来验证信息。
根据我们的测试,下表显示了数据分类发现的信息的准确性。我们根据_精度_和_召回率_来细分它:
- 精确
-
数据分类发现的内容被正确识别的概率。例如,个人数据的准确率为 90%,意味着在被识别为包含个人信息的 10 个文件中,有 9 个实际上包含个人信息。 10 个文件中会有 1 个是误报。
- 记起
-
数据分类找到其应有内容的概率。例如,个人数据的召回率为 70%,意味着数据分类可以识别出组织中 10 个文件中实际包含个人信息的 7 个。数据分类会遗漏 30% 的数据,并且不会出现在仪表板中。
我们正在不断提高结果的准确性。这些改进将在未来的数据分类版本中自动提供。
类型 | 精确 | 记起 |
---|---|---|
个人数据 - 一般 |
90%-95% |
60%-80% |
个人数据 - 国家标识符 |
30%-60% |
40%-60% |
敏感个人数据 |
80%-95% |
20%-30% |
类别 |
90%-97% |
60%-80% |