Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

了解BlueXP分类

贡献者

BlueXP分类(Cloud Data Sense)是一项适用于BlueXP的数据监管服务、可扫描企业内部和云数据源、以便对数据进行映射和分类、并确定私有信息。这有助于降低安全性和合规性风险,降低存储成本,并有助于您的数据迁移项目。

重要说明

从2024年5月起、BlueXP版本1.31将作为BlueXP中的核心功能免费提供。不需要分类许可证或订阅。我们还将BlueXP分类功能重点放在NetApp存储系统上、因此、某些未使用或未充分利用的功能已弃用。

一直使用旧版1.3或更早版本的用户将继续使用该版本、直到其订阅到期为止。

功能

BlueXP分类使用人工智能(AI)、自然语言处理(NLL)和机器学习(ML)来了解它扫描的内容、以便提取实体并对内容进行相应的分类。这样、BlueXP分类就可以提供以下功能区域。

保持合规性

BlueXP分类提供了多种可帮助您实现合规性的工具。您可以使用BlueXP分类来:

  • 识别个人身份信息( PiII )。

  • 根据GDPR、CCPA、PCI和HIPAA隐私法规的要求、识别广泛的敏感个人信息。

  • 根据名称或电子邮件地址响应数据主体访问请求(Data Subject Access Requests、DSAar)。

增强安全性

BlueXP分类可以识别可能存在被用于犯罪目的访问风险的数据。您可以使用BlueXP分类来:

  • 确定具有打开权限的所有文件和目录(共享和文件夹)、这些文件和目录会公开给您的整个组织或公有。

  • 确定位于初始专用位置以外的敏感数据。

  • 遵守数据保留策略。

  • 使用_policies_自动检测新的安全问题、以便安全人员可以立即采取措施。

优化存储使用

BlueXP分类提供了有助于降低存储总拥有成本(TCO)的工具。您可以使用BlueXP分类来:

支持的工作环境和数据源

BlueXP分类可以扫描和分析来自以下类型的工作环境和数据源的结构化和非结构化数据:

工作环境

  • 适用于 ONTAP 的 Amazon FSX

  • Azure NetApp Files

  • Cloud Volumes ONTAP (部署在 AWS , Azure 或 GCP 中)

  • 内部 ONTAP 集群

  • StorageGRID

数据源

  • NetApp文件共享

  • 数据库:

    • Amazon Relational Database Service ( Amazon RDS )

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • SQL Server ( MSSQL )

BlueXP分类支持NFS 3.x、4.0和4.1以及CIFS 1.x、2.0、2.1和3.0。

成本

BlueXP分类现在可免费使用。不需要分类许可证或付费订阅。

基础架构成本

  • 在云中安装BlueXP分类需要部署云实例、这会导致从部署该实例的云提供商处收取费用。请参阅。 为每个云提供商部署的实例类型如果您在内部系统上安装BlueXP分类、则不需要任何费用。

  • BlueXP分类要求您已部署BlueXP Connector。在许多情况下、由于您在BlueXP中使用的其他存储和服务、您已经有了一个Connector。Connector 实例会从部署该实例的云提供商处收取费用。请参见 "为每个云提供商部署的实例类型"。如果在内部部署系统上安装 Connector ,则不需要任何成本。

数据传输成本

数据传输成本取决于您的设置。如果BlueXP分类实例和数据源位于同一可用性区域和区域、则不会产生数据传输成本。但是、如果数据源(例如Cloud Volumes ONTAP系统)位于_不同_可用性区域或区域、则云提供商将向您收取数据传输成本。有关详细信息,请参见以下链接:

BlueXP分类实例

在云中部署BlueXP  分类时、BlueXP  会将实例部署在与连接器相同的子网中。 "了解有关连接器的更多信息。"

显示在云提供商中运行的BlueXP实例和BlueXP分类实例的示意图。

请注意以下有关默认实例的信息:

  • 在AWS中、BlueXP  分类在具有500 GiB GP2磁盘的上运行 "m6i.4xlarge实例"。操作系统映像为 Amazon Linux 2 。在AWS中部署时、如果您要扫描少量数据、则可以选择较小的实例大小。

  • 在Azure中、BlueXP  分类在具有500 GiB磁盘的上运行"标准的 D16s_v3 VM"。操作系统映像为Ubuntu 22.04。

  • 在GCP中、BlueXP  分类在具有500 GiB标准永久性磁盘的上运行"n2-standard-16 虚拟机"。操作系统映像为Ubuntu 22.04。

  • 在默认实例不可用的区域中、BlueXP分类在备用实例上运行。"请参见备用实例类型"(英文)

  • 此实例名为 CloudCompliance ,并与生成的哈希( UUID )串联在一起。例如: CloudCompliance" — 16bb6564-38AD-4080-9a92 — 36f5fd2f71c7

  • 每个连接器仅部署一个BlueXP分类实例。

您还可以在内部的Linux主机上或首选云提供商的主机上部署BlueXP分类。无论您选择哪种安装方法,软件的工作方式都完全相同。只要该实例可以访问Internet、BlueXP分类软件的升级就会自动进行。

提示 实例应始终保持运行状态、因为BlueXP分类会持续扫描数据。

部署在不同的实例类型

您可以在CPU更少、RAM更少的系统上部署BlueXP  分类。

系统大小 规格 限制

超大

32个CPU、128 GB RAM、1 TiB SSD

最多可扫描5亿个文件。

大型(默认)

16个CPU、64 GB RAM、500 GiB SSD

最多可扫描2.5亿个文件。

在Azure或GCP中部署BlueXP  分类时、如果要使用较小的实例类型、请发送电子邮件至ng-contace-data-sSense@NetApp。com以获取帮助。

BlueXP分类的工作原理

从较高层面来看、BlueXP分类的工作原理如下:

  1. 您可以在BlueXP中部署BlueXP分类实例。

  2. 您可以对一个或多个数据源启用高级别映射或深度扫描。

  3. BlueXP分类使用AI学习流程扫描数据。

  4. 您可以使用提供的信息板和报告工具帮助您开展合规和监管工作。

扫描的工作原理

启用BlueXP分类并选择要扫描的存储库(即卷、数据库架构或其他用户数据)后、它会立即开始扫描数据以确定个人数据和敏感数据。在大多数情况下、您应重点扫描实时生产数据、而不是备份、镜像或灾难恢复站点。然后、BlueXP分类会映射您的组织数据、对每个文件进行分类、并在数据中标识和提取实体和预定义模式。扫描的结果是个人信息,敏感个人信息,数据类别和文件类型的索引。

BlueXP分类可通过挂载NFS和CIFS卷与任何其他客户端一样连接到数据。NFS 卷会自动以只读方式访问,而您需要提供 Active Directory 凭据来扫描 CIFS 卷。

显示在云提供商中运行的BlueXP实例和BlueXP分类实例的示意图。BlueXP分类实例连接到NFS和CIFS卷和数据库以扫描它们。

完成初始扫描后、BlueXP分类会以轮循方式持续扫描数据、以检测增量更改(这就是保持实例运行至关重要的原因)。

您可以在卷级别或数据库架构级别启用和禁用扫描。

映射扫描与分类扫描之间的区别是什么

您可以在BlueXP  分类中执行两种类型的扫描:

  • 仅映射扫描仅提供数据的概览,并对选定的数据源执行扫描。与map和分类扫描相比、仅映射扫描所需时间更短、因为不会访问文件来查看其中的数据。

  • 地图和分类扫描可对您的数据进行深度扫描。

通过仅映射扫描、您可以快速扫描数据并确定可能需要更多研究的数据源、然后可以对这些数据源执行地图和分类扫描。

下表显示了一些差异:

功能 对扫描进行映射和分类 仅映射扫描

扫描速度

快速

定价

免费

免费

容量

限制为500 TB

限制为500 TB

文件类型和已用容量的列表

文件数和已用容量

文件的期限和大小

能够运行"数据映射报告"

数据调查页面以查看文件详细信息

搜索文件中的名称

创建"策略"以提供自定义搜索结果

能够运行其他报告

能够从文件中查看元数据*

*映射扫描期间从文件中提取以下元数据:

  • Working environment

  • Working environment type

  • 存储库

  • 文件类型

  • Used capacity

  • 文件数

  • 文件大小

  • 文件创建

  • 文件上次访问

  • 文件上次修改时间

  • 文件发现时间

  • 权限提取

监管信息板差异:
功能 映射和分类 映射

陈旧数据

非业务数据

文件重复

预定义策略

自定义策略

DDA报告

映射报告

灵敏度级别检测

具有广泛权限的敏感数据

打开权限

数据存在期限

数据大小

类别

文件类型

合规性信息板差异:
功能 映射和分类 映射

个人信息

敏感的个人信息

隐私风险评估报告

HIPAA 报告

PCI DSS 报告

调查筛选差异:
功能 映射和分类 映射

策略

Working environment type

Working environment

存储库

文件类型

文件大小

创建时间

发现时间

上次修改时间

上次访问

打开权限

文件目录路径

类别

敏感度

标识符数量

个人数据

敏感的个人数据

数据主题

重复

分类状态

状态始终为"洞察力有限"

扫描分析事件

文件哈希

具有访问权限的用户数

用户/组权限

文件所有者

目录类型

BlueXP分类扫描数据的速度

扫描速度受网络延迟、磁盘延迟、网络带宽、环境大小和文件分发大小的影响。

  • 执行仅映射扫描时、BlueXP  分类每天可扫描100-150 Tib的数据。

  • 执行地图和分类扫描时、BlueXP  分类每天可扫描15-40 Tib的数据。

BlueXP  分类分类的信息

BlueXP分类可收集数据(文件)、编制索引并为其分配类别。BlueXP分类索引的数据包括以下内容:

网络概述

BlueXP部署BlueXP分类实例、其中包含一个安全组、用于从连接器实例建立入站HTTP连接。

在SaaS模式下使用BlueXP时、与BlueXP的连接通过HTTPS提供、浏览器和BlueXP分类实例之间发送的私有数据通过使用TLS 1.2的端到端加密进行保护、这意味着NetApp和第三方无法读取。

出站规则完全开放。要安装和升级BlueXP分类软件以及发送使用情况指标、需要访问Internet。

如果您有严格的网络要求,"了解BlueXP分类所联系的端点"

BlueXP  分类中的用户角色

为每个用户分配的角色在BlueXP  和BlueXP  分类中提供不同的功能。有关详细信息,请参阅以下内容: