Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

根据BlueXP  分类调查存储在您的组织中的数据

贡献者 amgrissino netapp-tonacki netapp-ahibbard

通过查看数据调查页面中的详细信息来调查您组织的数据。在查看监管信息板后、您可以在此处继续进行调查。在调查页面上、您可以使用多个筛选器之一筛选数据、以便仅显示您要查看的结果。您还可以查看文件元数据、文件和目录的权限、以及检查存储系统中是否存在重复文件。

您可以从BlueXP  分类UI的许多区域导航到此页面、包括监管和合规性信息板以及这些页面上已选择的筛选器。您可以将数据导出到CSV或JSON文件中、以供进一步分析或与他人共享。

备注 只有在选择对数据源执行完整分类扫描后,才可以使用本节所述的功能。已执行仅映射扫描的数据源不会显示文件级详细信息。

筛选"数据调查"页面中的数据

您可以筛选调查页面的内容,以便仅显示要查看的结果。

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在"数据调查"页面上、执行以下任一操作:

  3. 要在精炼后将页面内容下载为报告、请选择按钮。下载按钮

    在调查页面中细化结果时可用筛选器的屏幕截图。

  4. 要查看文件(非结构化数据)、目录(文件夹和文件共享)或数据库(结构化数据)中的数据、请选择顶部的选项卡之一。

  5. 要按数字或字母顺序对结果进行排序、请选择每列顶部的控件。

  6. 要进一步优化结果,请在“过滤器”窗格中选择一个过滤器。

备注 您只能在"数据调查"页面上查看一次扫描的前10、000个结果或500页。

按敏感度和内容过滤数据

使用以下筛选器查看数据中包含的敏感信息量。

筛选器 详细信息

类别

选择。"类别类型"

敏感度级别

选择敏感度级别:个人、敏感个人或非敏感。

标识符数量

选择每个文件检测到的敏感标识符范围。包括个人数据和敏感个人数据。在目录中筛选时、BlueXP分类汇总每个文件夹(和子文件夹)中所有文件的匹配项。注意:2023年12月(1.26.6版)版本删除了按目录计算个人身份信息(Personal可识别信息、Personal可识别信息)数据数量的选项。

个人数据

选择。"个人数据的类型"

敏感个人数据

选择。"敏感个人数据的类型"

数据主题

输入数据主体的全名或已知标识符。"单击此处了解有关数据主题的更多信息"(英文)

按用户所有者和用户权限过滤数据

使用以下筛选器查看文件所有者和访问数据的权限。

筛选器 详细信息

打开权限

选择数据以及文件夹/共享中的权限类型。

用户 / 组权限

选择一个或多个用户名和/或组名称、或者输入部分名称。

文件所有者

输入文件所有者名称。

具有访问权限的用户数

选择一个或多个类别范围、以显示哪些文件和文件夹对特定数量的用户开放。

按时间过滤数据

使用以下筛选器根据时间条件查看数据。

筛选器 详细信息

创建时间

选择创建文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

发现时间

选择BlueXP分类发现文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

上次修改时间

选择上次修改文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

上次访问

选择上次访问文件或目录(仅限CIFS或NFS)的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。对于BlueXP分类扫描的文件类型、这是BlueXP分类扫描文件的最后一次。

BlueXP分类不会从以下数据源中提取"上次访问时间":SharePoint Online、SharePoint内部部署(SharePoint Server)、OneDrive、Google Drive和Amazon S3。

按元数据筛选数据

使用以下筛选器可根据位置、大小以及目录或文件类型查看数据。

筛选器 详细信息

文件路径

最多输入20个要在查询中包含或排除的部分或完整路径。如果同时输入包含路径和排除路径、BlueXP分类会首先查找包含路径中的所有文件、然后从排除路径中删除文件、最后显示结果。请注意、在此筛选器中使用"*"不起作用、并且无法从扫描中排除特定文件夹-将扫描已配置共享下的所有目录和文件。

目录类型

选择目录类型:"共享"或"文件夹"。

文件类型

选择。"文件类型"

文件大小

选择文件大小范围。

文件哈希

输入文件的哈希以查找特定文件、即使名称不同也是如此。

按存储类型过滤数据

使用以下筛选器按存储类型查看数据。

筛选器 详细信息

工作环境类型

选择工作环境的类型。OneDrive、SharePoint和Google Drive归类为"应用程序"。

工作环境名称

选择特定的工作环境。

存储库

选择存储库、例如卷或模式。

按已保存搜索过滤数据

使用以下筛选器按保存的搜索查看数据。

筛选器 详细信息

已保存搜索

选择一个保存的搜索或多个。转到"已保存搜索选项卡"以查看现有已保存搜索的列表并创建新搜索。

按分析状态过滤数据

使用以下筛选器按BlueXP分类扫描状态查看数据。

筛选器 详细信息

分析状态

选择一个选项以显示"等待首次扫描"、"已完成扫描"、"等待重新扫描"或"无法扫描"的文件列表。

扫描分析事件

选择是要查看因BlueXP分类无法还原上次访问时间而未进行分类的文件、还是要查看即使BlueXP分类无法还原上次访问时间仍进行分类的文件。

"查看有关"上次访问时间"时间戳的详细信息"有关使用扫描分析事件进行筛选时调查页面中显示的项目的更多信息。

按重复项筛选数据

使用以下筛选器可查看存储中重复的文件。

筛选器 详细信息

重复

选择是否在存储库中复制文件。

查看文件元数据

除了向您显示文件所在的工作环境和卷之外、元数据还会显示更多信息、包括文件权限、文件所有者以及此文件是否存在重复项。如果您计划使用、此信息非常有用"创建保存的搜索"、因为您可以查看可用于筛选数据的所有信息。

信息的可用性取决于数据源。例如,数据库文件的卷名和权限不共享。

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在右侧的"数据调查"列表中、为任何单个文件选择右侧的脱机脱机脱字符注意、以查看文件元数据。

    显示数据调查页面中文件的元数据详细信息的屏幕截图。

查看用户对文件和目录的权限

要查看有权访问文件或目录的所有用户或组的列表及其权限类型,请选择*查看所有权限*。此按钮仅适用于CIFS共享中的数据。

请注意、如果您看到的是SID (安全标识符)、而不是用户名和组名、则应将Active Directory集成到BlueXP分类中。"了解如何执行此操作"(英文)

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在右侧的"数据调查"列表中、为任何单个文件选择右侧的脱机脱机脱字符注意、以查看文件元数据。

  3. 要查看有权访问文件或目录的所有用户或组的列表及其权限类型,请在打开权限字段中选择*查看所有权限*。

    备注 BlueXP  分类最多可在列表中显示100个用户。

    显示详细文件权限的屏幕截图。

  4. 选择任何组的下脱字符注意按钮以查看组中的用户列表。

    提示 您可以展开组的一级以查看组中的用户。
  5. 选择用户或组的名称以刷新"调查"页面、以便您可以查看该用户或组有权访问的所有文件和目录。

检查存储系统中是否存在重复文件

您可以检查存储系统中是否存在重复文件。如果您要确定可节省存储空间的区域,此功能非常有用。此外,还应确保某些具有特定权限或敏感信息的文件不会在存储系统中被不必要地重复。

系统会比较所有大小为1 MB或更大的文件(不包括数据库)、或者包含个人或敏感个人信息的文件、以查看是否存在重复文件。

BlueXP分类使用散列技术来确定重复文件。如果任何文件具有与另一个文件相同的哈希码,那么您可以 100% 确定这些文件是完全重复的 - 即使文件名不同。

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在左侧的调查页面筛选器窗格中、选择"文件大小"以及"重复项"("有重复项")、以查看特定大小范围的文件在您的环境中重复。

  3. (可选)下载重复文件列表并将其发送给存储管理员、以便他们可以决定哪些文件(如果有)可以删除。

  4. (可选)如果您确信不需要特定版本的文件、请自行选择"删除文件"

查看特定文件是否重复

您可以查看单个文件是否存在重复项。

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在数据调查列表中、选择右侧的注意任意单个文件以查看文件元数据。

    如果某个文件存在重复项、则此信息将显示在_D重复 项_字段旁边。

  3. 要查看重复文件的列表及其所在位置,请选择*View Details*。

  4. 在下一页中,选择*查看复制*以查看“调查”页面中的文件。

    显示如何查看重复文件所在位置的屏幕截图。

    提示 您可以随时使用此页面中提供的"文件哈希"值并直接在"调查"页面中输入此值来搜索特定的重复文件、也可以在保存的搜索中使用此值。

创建数据调查报告

"数据调查报告"是对"数据调查"页面中经过筛选的内容的下载。

该报告以 CSV 或 JSON 文件的形式提供,您可以保存到本地机器。

如果BlueXP分类为扫描文件(非结构化数据)、目录(文件夹和文件共享)和数据库(结构化数据)、则最多可下载三个报告文件。

这些文件将拆分为具有固定行数或记录数的文件:

  • JSON - 每份报告 100,000 条记录,生成大约需要 5 分钟

  • CSV - 每份报告 200,000 条记录,生成大约需要 4 分钟

    备注 您可以下载CSV文件的某个版本以在此浏览器中查看。此版本限制为10、000条记录。

数据调查报告中包含的内容

*非结构化文件数据报告*包含有关文件的以下信息:

  • 文件名

  • 位置类型

  • Working environment name

  • 存储库(例如,卷,存储分段,共享)

  • 存储库类型

  • 文件路径

  • 文件类型

  • 文件大小(MB)

  • 创建时间

  • 上次修改时间

  • 上次访问

  • 文件所有者

    • 配置 Active Directory 时,文件所有者数据包括帐户名称、SAM 帐户名称和电子邮件地址。

  • 类别

  • 个人信息

  • 敏感的个人信息

  • 打开权限

  • 扫描分析错误

  • 删除检测日期

    删除检测日期标识了文件被删除或移动的日期。这样,您就可以确定何时移动了敏感文件。已删除的文件不会计入仪表板或调查页面上显示的文件数量计数。这些文件仅显示在 CSV 报告中。

*非结构化目录数据报告*包含有关文件夹和文件共享的以下信息:

  • Working environment type

  • Working environment name

  • 目录名称

  • 存储库(例如、文件夹或文件共享)

  • 目录所有者

  • 创建时间

  • 发现时间

  • 上次修改时间

  • 上次访问

  • 打开权限

  • 目录类型

*结构化数据报告*包含有关数据库表的以下信息:

  • 数据库表名称

  • 位置类型

  • Working environment name

  • 存储库(例如模式)

  • 列计数

  • 行数

  • 个人信息

  • 敏感的个人信息

生成报告的步骤
  1. 在"Data Investigation (数据调查)"页面中、选择下载按钮页面右侧顶部的按钮。

  2. 选择报告类型:CSV或JSON。

  3. 输入报告名称

  4. 要下载完整的报告,请选择工作环境,然后从相应的下拉菜单中选择工作环境。提供目标文件夹路径

    要在浏览器中下载报告,请选择本地。注意:此选项将报告限制在前10,000行,并限制为CSW格式。如果选择本地,则不需要填写任何其他字段。

  5. 选择下载报告

    包含多个选项的Download调查报告页面的屏幕截图。

结果

此时将显示一条消息、指出正在下载报告。

根据选定筛选器创建保存的搜索

您可以在"数据调查"页面中为常用搜索筛选器创建保存的搜索、以便轻松复制这些搜索查询。

步骤
  1. 从BlueXP  分类菜单中,选择*Investigation *。

  2. 在数据调查页面上、选择要用于创建已保存搜索的筛选器。

  3. 在筛选器窗格底部,选择*从此搜索中创建保存的搜索*。

  4. 输入已保存搜索的名称和说明。

  5. 选择以下任一项:

  6. 选择*创建保存的搜索*。

提示 结果可能需要长达15分钟才能显示在"已保存搜索"页面上。