Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

调查存储在组织中的数据

贡献者

您可以通过在"数据调查"页面中查看详细信息来调查组织中的数据。您可以从BlueXP分类UI的许多区域导航到此页面、包括监管和合规性信息板。

备注 只有在选择对数据源执行完整分类扫描后,才可以使用本节所述的功能。已执行仅映射扫描的数据源不会显示文件级详细信息。

筛选"数据调查"页面中的数据

您可以筛选调查页面的内容,以便仅显示要查看的结果。这是一项功能非常强大的功能、因为在对数据进行细化后、您可以使用页面顶部的按钮栏执行各种操作、包括复制文件、移动文件、向文件添加标记或AIP标签等。

如果要在优化页面内容后将其作为报告下载、请单击 下载按钮 按钮。 有关数据调查报告的详细信息、请访问此处

在调查页面中细化结果时可用筛选器的屏幕截图。

  • 通过顶级选项卡、您可以查看文件(非结构化数据)、目录(文件夹和文件共享)或数据库(结构化数据)中的数据。

  • 通过每列顶部的控件、您可以按数字或字母顺序对结果进行排序。

  • 通过左窗格筛选器、您可以选择下一节所述的属性来细化结果。

按敏感度和内容筛选数据

使用以下筛选器查看数据中包含的敏感信息量。

筛选器 详细信息

类别

选择 "类别类型"

敏感度级别

选择敏感度级别:个人、敏感个人或非敏感。

标识符数量

选择每个文件检测到的敏感标识符范围。包括个人数据和敏感个人数据。在目录中筛选时、BlueXP分类汇总每个文件夹(和子文件夹)中所有文件的匹配项。

注意:2023年12月(1.26.6版)发布的版本暂时删除了按目录计算个人身份信息(Personal可识别信息、个人身份信息)数据数量的选项。

个人数据

选择 "个人数据的类型"

敏感个人数据

选择 "敏感个人数据的类型"

数据主题

输入数据主体的全名或已知标识符。 "单击此处了解有关数据主题的更多信息"

按用户所有者和用户权限筛选数据

使用以下筛选器查看文件所有者和访问数据的权限。

筛选器 详细信息

打开权限

选择数据以及文件夹/共享中的权限类型。

用户 / 组权限

选择一个或多个用户名和/或组名称、或者输入部分名称。

文件所有者

输入文件所有者名称。

具有访问权限的用户数

选择一个或多个类别范围、以显示哪些文件和文件夹对特定数量的用户开放。

按时间筛选数据

使用以下筛选器根据时间条件查看数据。

筛选器 详细信息

创建时间

选择创建文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

发现时间

选择BlueXP分类发现文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

上次修改时间

选择上次修改文件的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。

上次访问

选择上次访问文件或目录(仅限CIFS或NFS)的时间范围。您还可以指定自定义时间范围以进一步细化搜索结果。对于BlueXP分类扫描的文件类型、这是BlueXP分类扫描文件的最后一次。

请注意、BlueXP分类不会从以下数据源提取"上次访问时间":SharePoint Online、SharePoint内部部署(SharePoint Server)、OneDrive、Google Drive和Amazon S3。

按元数据筛选数据

使用以下筛选器可根据位置、大小以及目录或文件类型查看数据。

筛选器 详细信息

文件路径

最多输入20个要在查询中包含或排除的部分或完整路径。如果同时输入包含路径和排除路径、BlueXP分类会首先查找包含路径中的所有文件、然后从排除路径中删除文件、最后显示结果。请注意、在此筛选器中使用"*"不起作用、并且无法从扫描中排除特定文件夹-将扫描已配置共享下的所有目录和文件。

目录类型

选择目录类型:"共享"或"文件夹"。

文件类型

选择 "文件类型"

文件大小

选择文件大小范围。

文件哈希

输入文件的哈希以查找特定文件、即使名称不同也是如此。

按存储类型筛选数据

使用以下筛选器按存储类型查看数据。

筛选器 详细信息

工作环境类型

选择工作环境的类型。OneDrive、SharePoint和Google Drive归类为"应用程序"。

工作环境名称

选择特定的工作环境。

存储库

选择存储库、例如卷或模式。

按标记、标签、已分配用户和策略筛选数据

使用以下筛选器按AIP标签或标记查看数据。

筛选器 详细信息

策略

选择一个或多个策略。开始 "此处" 可查看现有策略列表并创建您自己的自定义策略。

Label

选择 …​ "AIP 标签" 分配给文件的。

Tags

选择 …​ "一个或多个标记" 分配给文件的。

已分配给

选择将文件分配到的人员的姓名。

按分析状态筛选数据

使用以下筛选器按BlueXP分类扫描状态查看数据。

筛选器 详细信息

分析状态

选择一个选项以显示"等待首次扫描"、"已完成扫描"、"等待重新扫描"或"无法扫描"的文件列表。

扫描分析事件

选择是要查看因BlueXP分类无法还原上次访问时间而未进行分类的文件、还是要查看即使BlueXP分类无法还原上次访问时间仍进行分类的文件。

"查看有关"上次访问时间"时间戳的详细信息" 有关使用扫描分析事件筛选时"调查"页面中显示的项目的详细信息。

按重复项筛选数据

使用以下筛选器可查看存储中重复的文件。

筛选器 详细信息

重复

选择是否在存储库中复制文件。

查看文件元数据

在数据调查结果窗格中,您可以单击 注意 用于查看文件元数据的任何单个文件。

显示数据调查页面中文件的元数据详细信息的屏幕截图。

除了向您显示文件所在的工作环境和卷之外,元数据还会显示更多信息,包括文件权限,文件所有者,此文件是否存在重复项以及分配的 AIP 标签(如果有) "BlueXP分类中的集成AIP")。如果您计划使用此信息,此信息将非常有用 "创建策略" 因为您可以看到可用于筛选数据的所有信息。

请注意,并非所有信息都可用于所有数据源—只是适合该数据源的信息。例如,卷名称,权限和 AIP 标签与数据库文件无关。

查看单个文件的详细信息时,可以对该文件执行以下操作:

查看文件和目录的权限

要查看有权访问文件或目录的所有用户或组的列表及其权限类型、请单击*查看所有权限*。此按钮仅适用于CIFS共享、SharePoint Online、SharePoint内部部署和OneDrive中的数据。

请注意、如果您看到的是SID (安全标识符)、而不是用户名和组名、则应将Active Directory集成到BlueXP分类中。 "了解如何执行此操作"

显示详细文件权限的屏幕截图。

您可以单击 注意 查看属于该组的用户列表。

此外、 您可以单击某个用户或组的名称、此时将显示调查页面、并在"用户/组权限"筛选器中填充该用户或组的名称、以便您可以查看该用户或组有权访问的所有文件和目录。

检查存储系统中是否存在重复文件

您可以查看存储系统中是否存储了重复的文件。如果您要确定可节省存储空间的区域,此功能非常有用。此外,确保具有特定权限或敏感信息的某些文件不会在存储系统中进行不必要的复制也会很有帮助。

系统会比较所有大小为1 MB或更大且包含个人或敏感个人信息的文件(不包括数据库)、以查看是否存在重复文件。您可以使用"调查"页面筛选"文件大小"和"重复项"、查看环境中具有特定大小范围的文件的重复项。

BlueXP分类使用散列技术来确定重复文件。如果任何文件与另一个文件具有相同的哈希代码,我们可以 100% 确保这些文件完全重复,即使文件名不同也是如此。

您可以下载重复文件列表并将其发送给存储管理员,以便他们确定可以删除哪些文件(如果有)。您也可以 "删除文件" 如果您确信不需要特定版本的文件,请自行选择。

查看所有复制的文件

如果您需要列出在工作环境中复制的所有文件以及正在扫描的数据源,则可以在 " 数据调查 " 页面中使用名为 * 重复项 > 具有重复项 * 的筛选器。

所有复制的文件都会显示在结果页面中。

查看特定文件是否重复

如果要查看单个文件是否存在重复项,可以在数据调查结果窗格中单击 注意 用于查看文件元数据的任何单个文件。如果某个文件存在重复项,则此信息将显示在 Duplicates 字段旁边。

要查看重复文件的列表及其所在位置,请单击 * 查看详细信息 * 。在下一页中,单击 * 查看重复项 * 以查看调查页面中的文件。

显示如何查看重复文件所在位置的屏幕截图。

提示 您可以随时使用此页面中提供的 " 文件哈希 " 值并直接在 " 调查 " 页面中输入此值以搜索特定的重复文件,也可以在策略中使用此值。

数据调查报告

"数据调查报告"是对"数据调查"页面中经过筛选的内容的下载。

报告有两种不同的格式:

  • 以.CSV文件格式保存到本地计算机。

    此报告最多可包含10、000行数据。

  • 导出到NFS共享的.jSON文件。

    如果数据行数超过250、000行、则会创建其他.JSON文件。

    导出到文件共享时、请确保BlueXP分类具有正确的导出访问权限。

如果BlueXP分类为扫描文件(非结构化数据)、目录(文件夹和文件共享)和数据库(结构化数据)、则最多可下载三个报告文件。

生成数据调查报告

步骤
  1. 在数据调查页面中、单击 下载按钮 按钮。

  2. 选择要下载.CSV报告还是.JSON数据报告、然后单击*下载报告*。

    选择.json报告时、请以`<host_name>:/<share_path>`格式输入要下载报告的NFS共享的名称。

    包含多个选项的Download调查报告页面的屏幕截图。

结果

此时将显示一条消息、指出正在下载报告。

您可以在中查看JSON报告生成的进度 "操作状态窗格"

每个数据调查报告中包含的内容

*非结构化文件数据报告*包含有关文件的以下信息:

  • 文件名

  • 位置类型

  • Working environment name

  • 存储库(例如,卷,存储分段,共享)

  • 存储库类型

  • 文件路径

  • 文件类型

  • 文件大小(MB)

  • 创建时间

  • 上次修改时间

  • 上次访问

  • 文件所有者

  • 类别

  • 个人信息

  • 敏感的个人信息

  • 打开权限

  • 扫描分析错误

  • 删除检测日期

    删除检测日期用于标识文件被删除或移动的日期。这样,您就可以确定何时移动了敏感文件。已删除的文件不属于信息板或 " 调查 " 页面上显示的文件编号。这些文件仅显示在 CSV 报告中。

*非结构化目录数据报告*包含有关文件夹和文件共享的以下信息:

  • Working environment type

  • Working environment name

  • 目录名称

  • 存储库(例如、文件夹或文件共享)

  • 目录所有者

  • 创建时间

  • 发现时间

  • 上次修改时间

  • 上次访问

  • 打开权限

  • 目录类型

*结构化数据报告*包含有关数据库表的以下信息:

  • 数据库表名称

  • 位置类型

  • Working environment name

  • 存储库(例如模式)

  • 列计数

  • 行数

  • 个人信息

  • 敏感的个人信息