Skip to main content
BlueXP classification
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

了解BlueXP分类

贡献者 netapp-tonacki amgrissino netapp-ahibbard netapp-bcammett

BlueXP分类(Cloud Data Sense)是一项适用于BlueXP的数据监管服务、可扫描企业内部和云数据源、以便对数据进行映射和分类、并确定私有信息。这有助于降低安全性和合规性风险,降低存储成本,并有助于您的数据迁移项目。

重要说明 从1.31版开始、BlueXP  分类作为BlueXP  的核心功能提供。无需额外付费。不需要分类许可证或订阅。+如果您使用的是旧版版本1.3或更早版本、则该版本将一直有效、直到您的订阅到期为止。"请参见已弃用功能的列表"(英文)

功能

BlueXP分类使用人工智能(AI)、自然语言处理(NLL)和机器学习(ML)来了解它扫描的内容、以便提取实体并对内容进行相应的分类。这样、BlueXP分类就可以提供以下功能区域。

保持合规性

BlueXP分类提供了多种可帮助您实现合规性的工具。您可以使用BlueXP分类来:

  • 识别个人身份信息( PiII )。

  • 根据GDPR、CCPA、PCI和HIPAA隐私法规的要求、识别广泛的敏感个人信息。

  • 根据名称或电子邮件地址响应数据主体访问请求(Data Subject Access Requests、DSAar)。

增强安全性

BlueXP分类可以识别可能存在被用于犯罪目的访问风险的数据。您可以使用BlueXP分类来:

  • 确定具有打开权限的所有文件和目录(共享和文件夹)、这些文件和目录会公开给您的整个组织或公有。

  • 确定位于初始专用位置以外的敏感数据。

  • 遵守数据保留策略。

  • 使用policies自动检测新的安全问题,以便安全人员可以立即采取行动。

优化存储使用

BlueXP分类提供了有助于降低存储总拥有成本(TCO)的工具。您可以使用BlueXP分类来:

支持的工作环境和数据源

BlueXP分类可以扫描和分析来自以下类型的工作环境和数据源的结构化和非结构化数据:

工作环境

  • 适用于 ONTAP 的 Amazon FSX

  • Azure NetApp Files

  • Cloud Volumes ONTAP (部署在 AWS , Azure 或 GCP 中)

  • 内部 ONTAP 集群

  • StorageGRID

数据源

  • NetApp文件共享

  • 数据库:

    • Amazon Relational Database Service ( Amazon RDS )

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • SQL Server ( MSSQL )

BlueXP分类支持NFS 3.x、4.0和4.1以及CIFS 1.x、2.0、2.1和3.0。

成本

BlueXP  分类可免费使用。不需要分类许可证或付费订阅。

基础架构成本

  • 在云中安装BlueXP分类需要部署云实例、这会导致从部署该实例的云提供商处收取费用。请参阅。 为每个云提供商部署的实例类型如果您在内部系统上安装BlueXP分类、则不需要任何费用。

  • BlueXP分类要求您已部署BlueXP Connector。在许多情况下、由于您在BlueXP中使用的其他存储和服务、您已经有了一个Connector。Connector 实例会从部署该实例的云提供商处收取费用。请参见 "为每个云提供商部署的实例类型"。如果在内部部署系统上安装 Connector ,则不需要任何成本。

数据传输成本

数据传输成本取决于您的设置。如果BlueXP分类实例和数据源位于同一可用性区域和区域、则不会产生数据传输成本。但是、如果数据源(例如Cloud Volumes ONTAP系统)位于_不同_可用性区域或区域、则云提供商将向您收取数据传输成本。有关详细信息,请参见以下链接:

BlueXP分类实例

在云中部署BlueXP  分类时、BlueXP  会将实例部署在与连接器相同的子网中。 "了解有关连接器的更多信息。"

显示在云提供商中运行的BlueXP实例和BlueXP分类实例的示意图。

请注意以下有关默认实例的信息:

  • 在AWS中、BlueXP  分类在具有500 GiB GP2磁盘的上运行 "m6i.4xlarge实例"。操作系统映像为 Amazon Linux 2 。在AWS中部署时、如果您要扫描少量数据、则可以选择较小的实例大小。

  • 在Azure中、BlueXP  分类在具有500 GiB磁盘的上运行"标准的 D16s_v3 VM"。操作系统映像为Ubuntu 22.04。

  • 在GCP中、BlueXP  分类在具有500 GiB标准永久性磁盘的上运行"n2-standard-16 虚拟机"。操作系统映像为Ubuntu 22.04。

  • 在默认实例不可用的区域中、BlueXP分类在备用实例上运行。"请参见备用实例类型"(英文)

  • 此实例名为 CloudCompliance ,并与生成的哈希( UUID )串联在一起。例如: CloudCompliance" — 16bb6564-38AD-4080-9a92 — 36f5fd2f71c7

  • 每个连接器仅部署一个BlueXP分类实例。

您还可以在内部的Linux主机上或首选云提供商的主机上部署BlueXP分类。无论您选择哪种安装方法,软件的工作方式都完全相同。只要实例可以访问互联网,BlueXP 分类软件的升级就会自动进行。

提示 实例应始终保持运行状态、因为BlueXP分类会持续扫描数据。

部署在不同的实例类型

查看实例类型的以下规范:

系统大小 规格 限制

超大

32个CPU、128 GB RAM、1 TiB SSD

最多可扫描5亿个文件。

大型(默认)

16个CPU、64 GB RAM、500 GiB SSD

最多可扫描2.5亿个文件。

在Azure或GCP中部署BlueXP  分类时、如果要使用较小的实例类型、请发送电子邮件至ng-contace-data-sSense@NetApp。com以获取帮助。

BlueXP  分类扫描的工作原理

概括地说、BlueXP  分类扫描的工作原理如下:

  1. 您可以在BlueXP中部署BlueXP分类实例。

  2. 您可以对一个或多个数据源启用高级别映射(称为_Mapping only_扫描)或深度扫描(称为_Map & Classic_扫描)。

  3. BlueXP分类使用AI学习流程扫描数据。

  4. 您可以使用提供的信息板和报告工具帮助您开展合规和监管工作。

启用BlueXP分类并选择要扫描的存储库(即卷、数据库架构或其他用户数据)后、它会立即开始扫描数据以确定个人数据和敏感数据。在大多数情况下、您应重点扫描实时生产数据、而不是备份、镜像或灾难恢复站点。然后、BlueXP分类会映射您的组织数据、对每个文件进行分类、并在数据中标识和提取实体和预定义模式。扫描的结果是个人信息,敏感个人信息,数据类别和文件类型的索引。

BlueXP分类可通过挂载NFS和CIFS卷与任何其他客户端一样连接到数据。NFS 卷会自动以只读方式访问,而您需要提供 Active Directory 凭据来扫描 CIFS 卷。

显示在云提供商中运行的BlueXP实例和BlueXP分类实例的示意图。BlueXP分类实例连接到NFS和CIFS卷和数据库以扫描它们。

完成初始扫描后、BlueXP  分类会以轮循方式持续扫描数据、以检测增量更改。这就是保持实例运行非常重要的原因。

您可以在卷级别或数据库模式级别启用和禁用扫描。

备注 BlueXP classification不会对其可以扫描的数据量施加限制。每个连接器支持扫描和显示 500 TiB 的数据。要扫描超过 500 TiB 的数据,"安装另一个连接器"然后"部署BlueXP classification的另一个实例"。 BlueXP UI 显示来自单个连接器的数据。有关查看来自多个连接器的数据的提示,请参阅"使用多个连接器"

映射扫描与分类扫描之间的区别是什么

您可以在BlueXP  分类中执行两种类型的扫描:

  • 仅映射扫描仅提供数据的概览,并对选定的数据源执行。仅映射扫描比映射和分类扫描花费的时间更少,因为它们不访问文件来查看其中的数据。您可能希望先确定研究领域、然后对这些领域执行地图和分类扫描。

  • 对扫描进行映射和分类提供对数据的深入扫描。

有关映射扫描和分类扫描之间差异的详细信息,请参见"映射扫描与分类扫描有何区别?"

BlueXP  分类分类的信息

BlueXP  分类可收集以下数据、为其编制索引并为其分配类别:

  • 关于文件的标准元数据:文件类型、大小、创建和修改日期等。

  • 个人数据:个人身份信息(Pi2),如电子邮件地址、身份号码或信用卡号码,BlueXP  分类使用文件中的特定字词、字符串和模式来识别这些信息。"了解有关个人数据的更多信息"(英文)

  • 敏感个人数据:《一般数据保护条例》(GDPR)和其他隐私法规定义的特殊类型的敏感个人信息(SPII)、例如健康数据、种族或政治观点。"了解有关敏感个人数据的更多信息"(英文)

  • 类别:BlueXP  分类将其扫描的数据划分为不同类型的类别。类别是基于 AI 对每个文件的内容和元数据的分析而得出的主题。"了解有关类别的更多信息"(英文)

  • Types:BlueXP  分类采用它扫描的数据并按文件类型进行细分。"了解有关类型的更多信息"(英文)

  • 名称实体识别:BlueXP  分类使用AI从文档中提取人们的自然名称。"了解如何响应数据主体访问请求"(英文)

网络概述

BlueXP分类可在云端或内部部署一个服务器或集群、无论您选择在何处。这些服务器通过标准协议连接到数据源、并为Elasticsearch集群中的结果编制索引、该集群也部署在相同的服务器上。这样便可支持多云、跨云、私有云和内部环境。

BlueXP部署BlueXP分类实例、其中包含一个安全组、用于从连接器实例建立入站HTTP连接。

当您在SaaS模式下使用BlueXP  时、将通过HTTPS提供与BlueXP  的连接、并且在您的浏览器和BlueXP  分类实例之间发送的私有数据将通过使用TLS 1.2的端到端加密得到保护、这意味着NetApp和第三方无法读取这些数据。

出站规则完全开放。要安装和升级BlueXP分类软件以及发送使用情况指标、需要访问Internet。

如果您有严格的网络要求,"了解BlueXP分类所联系的端点"