Skip to main content
BlueXP classification
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

瞭解 BlueXP 分類

貢獻者

BlueXP 分類是 BlueXP 的資料治理服務、可掃描企業內部部署和雲端資料來源、以對應和分類資料、並識別私有資訊。這有助於降低安全性與法規遵循風險、降低儲存成本、並協助您執行資料移轉專案。

功能

BlueXP 分類使用人工智慧( AI )、自然語言處理( NLP )和機器學習( ML )來瞭解它所掃描的內容、以便擷取實體並據此分類內容。這可讓 BlueXP 分類提供下列功能領域。

維持法規遵循

BlueXP 分類提供數種工具、可協助您達成法規遵循目標。您可以使用 BlueXP 分類來:

  • 識別個人識別資訊( PII )。

  • 根據GDPR、CCPA、PCI及HIPAA隱私權法規的要求、識別範圍廣泛的敏感個人資訊。

  • 根據名稱或電子郵件地址回應資料主旨存取要求(DSAR)。

  • 識別您資料庫中的唯一識別碼是否位於其他儲存庫中的檔案中、基本上是製作您自己的「個人資料」清單、以在 BlueXP 分類掃描中識別。

  • 當檔案包含特定PII時、透過電子郵件通知特定使用者(您使用定義此條件 "原則")以便決定行動計畫。

強化安全性

BlueXP 分類可識別出可能因犯罪目的而面臨存取風險的資料。您可以使用 BlueXP 分類來:

  • 識別所有具有開放權限的檔案和目錄(共享區和資料夾)、這些檔案和目錄都會公開給整個組織或大眾使用。

  • 識別位於初始專屬位置之外的敏感資料。

  • 遵守資料保留政策。

  • 使用_policies自動通知安全員工新的安全問題、以便他們立即採取行動。

  • 將自訂標記新增至檔案(例如「需要搬移」)、並指派一個BlueXP使用者、讓該人員擁有檔案的更新。

  • 檢視及修改 "Azure資訊保護(AIP)標籤" 在您的檔案中。

最佳化儲存使用量

BlueXP 分類提供的工具可協助您處理儲存設備的總體擁有成本( TCO )。您可以使用 BlueXP 分類來:

加速資料移轉

BlueXP 分類可用於掃描內部部署資料、然後再將其移轉至公有雲或私有雲。您可以使用 BlueXP 分類來:

  • 在移動資料之前、請先檢視資料大小、以及是否有任何資料包含敏感資訊。

  • 篩選來源資料(根據超過25種準則)、以便只將所需檔案移至目的地、不必要的資料不會移動。

  • 自動且持續地將所需的資料移動、複製或同步至雲端儲存庫。

支援的資料來源

BlueXP 分類可掃描及分析下列類型資料來源的結構化和非結構化資料:

  • NetApp:*

  • (部署於AWS、Azure或GCP)Cloud Volumes ONTAP

  • 內部部署 ONTAP 的叢集

  • StorageGRID

  • Azure NetApp Files

  • Amazon FSX for ONTAP Sf

  • 適用於 Google Cloud Cloud Volumes Service

非NetApp:

  • Dell EMC Isilon

  • Pure Storage

  • Nutanix

  • 任何其他儲存設備廠商

雲端:

  • Amazon S3

  • Google Cloud Storage

  • OneDrive

  • SharePoint Online

  • SharePoint內部部署(SharePoint Server)

  • Google雲端硬碟

資料庫:

  • Amazon關係資料庫服務(Amazon RDS)

  • MongoDB

  • MySQL

  • Oracle

  • PostgreSQL

  • SAP HANA

  • SQL Server ( MSSQL )

BlueXP 分類支援 NFS 3.x 、 4.0 和 4.1 版、以及 CIFS 1.x 、 2.0 、 2.1 和 3.0 版。

成本

  • 使用 BlueXP 分類的成本取決於您正在掃描的資料量。BlueXP 分類在 BlueXP 工作區中掃描的前 1 TB 資料可免費使用 30 天。這包括所有工作環境和資料來源的所有資料。必須訂閱AWS、Azure或GCP Marketplace、或NetApp的BYOL授權、才能在該點之後繼續掃描資料。請參閱 "定價" 以取得詳細資料。

  • 在雲端中安裝 BlueXP 分類需要部署雲端執行個體、這會導致部署雲端的雲端供應商收取費用。請參閱 為每個雲端供應商部署的執行個體類型。如果您在內部部署系統上安裝 BlueXP 分類、則不需支付任何費用。

  • BlueXP 分類要求您已部署 BlueXP Connector 。在許多情況下、由於您在BlueXP中使用的其他儲存設備和服務、您已經擁有Connector。連接器執行個體會從部署該執行個體的雲端供應商收取費用。請參閱 "為每個雲端供應商部署的執行個體類型"。如果您將連接器安裝在內部部署系統上、則無需支付任何費用。

資料傳輸成本

資料傳輸成本取決於您的設定。如果 BlueXP 分類執行個體和資料來源位於相同的可用性區域和區域、則不會產生資料傳輸成本。但是如果Cloud Volumes ONTAP 資料來源(例如、不支援的系統或S3時段)位於_不同_可用度區域或區域、則您的雲端供應商會向您收取資料傳輸成本。如需詳細資料、請參閱以下連結:

BlueXP 分類執行個體

當您在雲端部署 BlueXP 分類時、 BlueXP 會將執行個體部署在與 Connector 相同的子網路中。 "深入瞭解連接器。"

顯示在雲端供應商中執行的 BlueXP 執行個體和 BlueXP 分類執行個體的圖表。

請注意下列關於預設執行個體的資訊:

  • 在 AWS 中、 BlueXP 分類是在上執行 "m6i.4xlarge 執行個體" 搭配 500 GB GP2 磁碟。作業系統映像是Amazon Linux 2。在 AWS 中部署時、如果您要掃描少量資料、可以選擇較小的執行個體大小。

  • 在 Azure 中、 BlueXP 分類是在上執行 "Standard_D16s_v3 VM" 使用 500 GB 的 GiB 磁碟。作業系統映像是CentOS 7.9。

  • 在 GCP 中、 BlueXP 分類是在上執行 "n2-Standard-16 VM" 使用 500 GB 的 GiB Standard 持續性磁碟。作業系統映像是CentOS 7.9。

  • 在無法使用預設執行個體的地區、 BlueXP 分類會在替代執行個體上執行。 "請參閱替代執行個體類型"

  • 此執行個體的名稱為 CloudCompliance _ 、並以產生的雜湊( UUID )串聯在其中。例如: _CloudCompliance -16bb6564-38ad-4080-9a92-36f5fd2f71c7

  • 每個 Connector 只部署一個 BlueXP 分類執行個體。

您也可以在內部部署的 Linux 主機或偏好的雲端供應商的主機上部署 BlueXP 分類。無論您選擇哪種安裝方法、軟體的運作方式都完全相同。只要執行個體能夠存取網際網路、就會自動升級 BlueXP 分類軟體。

提示 由於 BlueXP 分類會持續掃描資料、因此執行個體應該隨時保持執行狀態。

使用較小的執行個體類型

您可以在 CPU 較少、 RAM 較少的系統上部署 BlueXP 分類、但使用這些功能較不強大的系統時會有一些限制。

系統大小 規格 限制

超大

32 個 CPU 、 128 GB RAM 、 1 個 TiB SSD

最多可掃描 5 億個檔案。

大型(預設)

16 個 CPU 、 64 GB RAM 、 500 GB GiB SSD

最多可掃描 2.5 億個檔案。

8 個 CPU 、 32 GB RAM 、 200 GB SSD

掃描速度較慢、最多只能掃描100萬個檔案。

8 個 CPU 、 16 GB RAM 、 100 GB SSD

與「中」相同的限制、加上識別能力 "資料主旨名稱" 內部檔案已停用。

在 AWS 上的雲端部署 BlueXP 分類時、您可以選擇大型 / 中型 / 小型執行個體。在 Azure 或 GCP 中部署 BlueXP 分類時、如果您想要使用其中一種替代系統、請寄送電子郵件至 ng-contact-data-sense@netapp.com 以取得協助。我們需要與您一起部署這些其他雲端組態。

在內部部署 BlueXP 分類時、只要使用具有替代規格的 Linux 主機即可。您不需要聯絡NetApp尋求協助。

BlueXP 分類的運作方式

在高層級的 BlueXP 分類中、其運作方式如下:

  1. 您可以在 BlueXP 中部署 BlueXP 分類執行個體。

  2. 您可以在一或多個資料來源上啟用高層對應或深度層級掃描。

  3. BlueXP 分類會使用 AI 學習程序掃描資料。

  4. 您可以使用所提供的儀表板和報告工具、協助您達成法規遵循與治理目標。

掃描的運作方式

啟用 BlueXP 分類並選取要掃描的儲存庫(這些是磁碟區、儲存區、資料庫架構、 OneDrive 或 SharePoint 使用者資料)之後、系統會立即開始掃描資料、以識別個人和敏感資料。您應該專注於在大多數情況下掃描線上即時資料、而非備份、鏡像或災難恢復站台。然後 BlueXP 分類會對應您的組織資料、對每個檔案進行分類、並識別及擷取資料中的實體和預先定義的模式。掃描結果是個人資訊、敏感個人資訊、資料類別和檔案類型的索引。

BlueXP 分類透過掛載 NFS 和 CIFS 磁碟區、與任何其他用戶端一樣連線至資料。NFS 磁碟區會自動以唯讀方式存取、而您需要提供 Active Directory 認證來掃描 CIFS 磁碟區。

顯示在雲端供應商中執行的 BlueXP 執行個體和 BlueXP 分類執行個體的圖表。BlueXP 分類執行個體會連線至 NFS 和 CIFS 磁碟區、 S3 貯體、 OneDrive 帳戶和資料庫、以進行掃描。

初始掃描之後、 BlueXP 分類會以循環方式持續掃描您的資料、以偵測遞增變更(這就是保持執行個體正常運作的重要原因)。

您可以在磁碟區層級、儲存庫層級、資料庫架構層級、OneDrive使用者層級和SharePoint網站層級啟用和停用掃描。

對應掃描與分類掃描之間有何差異

BlueXP 分類可讓您在選定的資料來源上執行一般的「對應」掃描。對應只提供資料的高層級總覽、而分類則提供資料的深度層級掃描。您可以很快在資料來源上完成對應、因為它不會存取檔案來查看內部資料。

許多使用者之所以喜歡這項功能、是因為他們想要快速掃描資料、找出需要更多研究的資料來源、然後只能針對需要的資料來源或磁碟區進行分類掃描。

下表顯示部分差異:

功能 分類 對應

掃描速度

快速

檔案類型和已用容量的清單

是的

是的

檔案數量和已用容量

是的

是的

檔案的存留時間和大小

是的

是的

執行的能力 "資料對應報告"

是的

是的

「資料調查」頁面可檢視檔案詳細資料

是的

在檔案中搜尋名稱

是的

建立 "原則" 提供自訂搜尋結果

是的

使用AIP標籤和狀態標籤來分類資料

是的

複製、刪除及移動來源檔案

是的

執行其他報告的能力

是的

BlueXP 分類掃描資料的速度

掃描速度會受到網路延遲、磁碟延遲、網路頻寬、環境大小和檔案發佈大小的影響。

  • 執行對應掃描時、 BlueXP 分類可在每天每個掃描器節點掃描 100 至 150 Tibs 的資料。

  • 執行分類掃描時、 BlueXP 分類可在每天每個掃描器節點掃描 15-40 Tibs 的資料。

BlueXP 分類索引的資訊

BlueXP 分類會收集、索引及指派類別給您的資料(檔案)。BlueXP 分類索引的資料包括:

標準中繼資料

BlueXP 分類會收集檔案的標準中繼資料:檔案類型、檔案大小、建立和修改日期等。

個人資料

個人識別資訊、例如電子郵件地址、識別號碼或信用卡號碼。 "深入瞭解個人資料"

敏感的個人資料

GDPR 及其他隱私權法規所定義的特殊敏感資訊類型、例如健康資料、族群來源或政治見解。 "深入瞭解敏感的個人資料"

類別

BlueXP 分類會將掃描的資料分成不同類型的類別。類別是以 AI 分析每個檔案的內容和中繼資料為基礎的主題。 "深入瞭解類別"

類型

BlueXP 分類會根據檔案類型來記錄掃描的資料、並加以細分。 "深入瞭解類型"

名稱實體辨識

BlueXP 分類使用 AI 從文件中擷取自然人姓名。 "瞭解如何回應資料主體存取要求"

網路總覽

BlueXP 會使用安全性群組來部署 BlueXP 分類執行個體、以便從 Connector 執行個體進行傳入 HTTP 連線。

在 SaaS 模式中使用 BlueXP 時、會透過 HTTPS 提供與 BlueXP 的連線、而在瀏覽器和 BlueXP 分類執行個體之間傳送的私有資料則會使用 TLS 1.2 來保護端點對端加密、這表示 NetApp 和協力廠商無法讀取。

傳出規則已完全開啟。安裝和升級 BlueXP 分類軟體、以及傳送使用量指標、都需要網際網路存取。

如果您有嚴格的網路需求、 "瞭解 BlueXP 分類所接觸的端點"

使用者存取法規遵循資訊

指派給每位使用者的角色在 BlueXP 和 BlueXP 分類中提供不同的功能:

  • *帳戶管理員*可管理所有工作環境的法規遵循設定及檢視法規遵循資訊。

  • *工作區管理*只能管理具有存取權限的系統的法規遵循設定及檢視法規遵循資訊。如果工作空間管理員無法存取 BlueXP 中的工作環境、則他們無法在 BlueXP 分類索引標籤中看到工作環境的任何法規遵循資訊。

  • 具有* Compliance Viewer*角色的使用者只能檢視法規遵循資訊、並針對擁有存取權限的系統產生報告。這些使用者無法啟用 / 停用掃描磁碟區、儲存區或資料庫架構。這些使用者也無法複製、移動或刪除檔案。