Skip to main content
BlueXP classification
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

瞭解 BlueXP 分類

貢獻者

BlueXP 分類( Cloud Data Sense )是 BlueXP 的資料治理服務、可掃描企業內部部署和雲端資料來源、以對應和分類資料、並識別私有資訊。這有助於降低安全性與法規遵循風險、降低儲存成本、並協助您執行資料移轉專案。

重要

從 2024 年 5 月開始、 BlueXP 分類為 BlueXP 的核心功能、無需額外付費。不需要分類授權或訂閱。我們也將 BlueXP 分類功能集中在 NetApp 儲存系統上、因此部分未使用或未充分使用的功能已被淘汰。

使用舊版 1.30 或更早版本的使用者將繼續使用該版本、直到其訂閱到期為止。

功能

BlueXP 分類使用人工智慧( AI )、自然語言處理( NLP )和機器學習( ML )來瞭解它所掃描的內容、以便擷取實體並據此分類內容。這可讓 BlueXP 分類提供下列功能領域。

維持法規遵循

BlueXP 分類提供數種工具、可協助您達成法規遵循目標。您可以使用 BlueXP 分類來:

  • 識別個人識別資訊( PII )。

  • 根據GDPR、CCPA、PCI及HIPAA隱私權法規的要求、識別範圍廣泛的敏感個人資訊。

  • 根據名稱或電子郵件地址回應資料主旨存取要求(DSAR)。

強化安全性

BlueXP 分類可識別出可能因犯罪目的而面臨存取風險的資料。您可以使用 BlueXP 分類來:

  • 識別所有具有開放權限的檔案和目錄(共享區和資料夾)、這些檔案和目錄都會公開給整個組織或大眾使用。

  • 識別位於初始專屬位置之外的敏感資料。

  • 遵守資料保留政策。

  • 使用 _policies _ 自動偵測新的安全性問題、讓安全人員可以立即採取行動。

最佳化儲存使用量

BlueXP 分類提供的工具可協助您處理儲存設備的總體擁有成本( TCO )。您可以使用 BlueXP 分類來:

支援的工作環境和資料來源

BlueXP 分類可以掃描及分析下列工作環境和資料來源類型的結構化和非結構化資料:

  • 工作環境 *

  • (部署於AWS、Azure或GCP)Cloud Volumes ONTAP

  • 內部部署 ONTAP 的叢集

  • Azure NetApp Files

  • Amazon FSX for ONTAP Sf

  • Google Cloud NetApp Volumes

  • 資料來源 *

  • NetApp 檔案共用

  • 資料庫:

    • Amazon關係資料庫服務(Amazon RDS)

    • MongoDB

    • MySQL

    • Oracle

    • PostgreSQL

    • SAP HANA

    • SQL Server ( MSSQL )

BlueXP 分類支援 NFS 3.x 版和 CIFS 1.x 、 2.0 、 2.1 和 3.0 版。

成本

BlueXP 分類現在可以免費使用。不需要分類授權或付費訂閱。

基礎架構成本

  • 在雲端中安裝 BlueXP 分類需要部署雲端執行個體、這會導致部署雲端的雲端供應商收取費用。請參閱 為每個雲端供應商部署的執行個體類型。如果您在內部部署系統上安裝 BlueXP 分類、則不需支付任何費用。

  • BlueXP 分類要求您已部署 BlueXP Connector 。在許多情況下、由於您在BlueXP中使用的其他儲存設備和服務、您已經擁有Connector。連接器執行個體會從部署該執行個體的雲端供應商收取費用。請參閱 "為每個雲端供應商部署的執行個體類型"。如果您將連接器安裝在內部部署系統上、則無需支付任何費用。

資料傳輸成本

資料傳輸成本取決於您的設定。如果 BlueXP 分類執行個體和資料來源位於相同的可用性區域和區域、則不會產生資料傳輸成本。但是、如果資料來源(例如 Cloud Volumes ONTAP 系統)位於 _ 不同 _ 的可用性區域或區域、則您的雲端供應商會向您收取資料傳輸成本。如需詳細資料、請參閱以下連結:

BlueXP 分類執行個體

當您在雲端部署 BlueXP 分類時、 BlueXP 會將執行個體部署在與 Connector 相同的子網路中。 "深入瞭解連接器。"

顯示在雲端供應商中執行的 BlueXP 執行個體和 BlueXP 分類執行個體的圖表。

請注意下列關於預設執行個體的資訊:

  • 在 AWS 中、 BlueXP 分類是在上執行 "m6i.4xlarge 執行個體" 搭配 500 GB GP2 磁碟。作業系統映像是Amazon Linux 2。在 AWS 中部署時、如果您要掃描少量資料、可以選擇較小的執行個體大小。

  • 在 Azure 中、 BlueXP 分類是在上執行 "Standard_D16s_v3 VM" 使用 500 GB 的 GiB 磁碟。作業系統映像是CentOS 7.9。

  • 在 GCP 中、 BlueXP 分類是在上執行 "n2-Standard-16 VM" 使用 500 GB 的 GiB Standard 持續性磁碟。作業系統映像是CentOS 7.9。

  • 在無法使用預設執行個體的地區、 BlueXP 分類會在替代執行個體上執行。 "請參閱替代執行個體類型"

  • 此執行個體的名稱為 CloudCompliance _ 、並以產生的雜湊( UUID )串聯在其中。例如: _CloudCompliance -16bb6564-38ad-4080-9a92-36f5fd2f71c7

  • 每個 Connector 只部署一個 BlueXP 分類執行個體。

您也可以在內部部署的 Linux 主機或偏好的雲端供應商的主機上部署 BlueXP 分類。無論您選擇哪種安裝方法、軟體的運作方式都完全相同。只要執行個體能夠存取網際網路、就會自動升級 BlueXP 分類軟體。

提示 由於 BlueXP 分類會持續掃描資料、因此執行個體應該隨時保持執行狀態。

在不同的執行個體類型上部署

您可以在 CPU 較少且 RAM 較少的系統上部署 BlueXP 分類。

系統大小 規格 限制

超大

32 個 CPU 、 128 GB RAM 、 1 個 TiB SSD

最多可掃描 5 億個檔案。

大型(預設)

16 個 CPU 、 64 GB RAM 、 500 GB GiB SSD

最多可掃描 2.5 億個檔案。

在 Azure 或 GCP 中部署 BlueXP 分類時、如果您想要使用較小的執行個體類型、請寄送電子郵件至 ng-contact-data-sense@netapp.com 以取得協助。

BlueXP 分類的運作方式

在高層級的 BlueXP 分類中、其運作方式如下:

  1. 您可以在 BlueXP 中部署 BlueXP 分類執行個體。

  2. 您可以在一或多個資料來源上啟用高層對應或深度層級掃描。

  3. BlueXP 分類會使用 AI 學習程序掃描資料。

  4. 您可以使用所提供的儀表板和報告工具、協助您達成法規遵循與治理目標。

掃描的運作方式

啟用 BlueXP 分類並選取要掃描的儲存庫(這些是磁碟區、資料庫架構或其他使用者資料)之後、系統會立即開始掃描資料、以識別個人和敏感資料。您應該專注於在大多數情況下掃描線上即時資料、而非備份、鏡像或災難恢復站台。然後 BlueXP 分類會對應您的組織資料、對每個檔案進行分類、並識別及擷取資料中的實體和預先定義的模式。掃描結果是個人資訊、敏感個人資訊、資料類別和檔案類型的索引。

BlueXP 分類透過掛載 NFS 和 CIFS 磁碟區、與任何其他用戶端一樣連線至資料。NFS 磁碟區會自動以唯讀方式存取、而您需要提供 Active Directory 認證來掃描 CIFS 磁碟區。

顯示在雲端供應商中執行的 BlueXP 執行個體和 BlueXP 分類執行個體的圖表。BlueXP 分類執行個體會連線至 NFS 和 CIFS 磁碟區和資料庫、以進行掃描。

初始掃描之後、 BlueXP 分類會以循環方式持續掃描您的資料、以偵測遞增變更(這就是保持執行個體正常運作的重要原因)。

您可以在磁碟區層級或資料庫架構層級啟用和停用掃描。

對應掃描與分類掃描之間有何差異

BlueXP 分類可讓您在選定的資料來源上執行一般的「對應」掃描。對應只提供資料的高層級總覽、而分類則提供資料的深度層級掃描。您可以很快在資料來源上完成對應、因為它不會存取檔案來查看內部資料。

許多使用者之所以喜歡這項功能、是因為他們想要快速掃描資料、找出需要更多研究的資料來源、然後只能針對需要的資料來源或磁碟區進行分類掃描。

下表顯示部分差異:

功能 分類 對應

掃描速度

快速

定價

免費

免費

容量

限 500 TB

限 500 TB

檔案類型和已用容量的清單

是的

是的

檔案數量和已用容量

是的

是的

檔案的存留時間和大小

是的

是的

執行的能力 "資料對應報告"

是的

是的

「資料調查」頁面可檢視檔案詳細資料

是的

在檔案中搜尋名稱

是的

建立 "原則" 提供自訂搜尋結果

是的

執行其他報告的能力

是的

能夠查看檔案中的中繼資料 *

是的

  • 下列中繼資料會在對應掃描期間從檔案中擷取:

  • 工作環境

  • 工作環境類型

  • 儲存儲存庫

  • 檔案類型

  • 已用容量

  • 檔案數量

  • 檔案大小

  • 檔案建立

  • 檔案上次存取

  • 上次修改的檔案

  • 檔案探索時間

  • 權限擷取

  • 治理儀表板差異 * :

功能 地圖與分類 地圖

過時資料

是的

是的

非商業資料

是的

是的

重複的檔案

是的

是的

預先定義的原則

是的

自訂原則

是的

是的

DDA 報告

是的

是的

對應報告

是的

是的

靈敏度等級偵測

是的

具有廣泛權限的機密資料

是的

開放式權限

是的

是的

資料存留期

是的

是的

資料大小

是的

是的

類別

是的

檔案類型

是的

是的

  • 法規遵循儀表板差異 * :

功能 地圖與分類 地圖

個人資訊

是的

敏感的個人資訊

是的

隱私風險評估報告

是的

HIPAA 報告

是的

PCI DSS 報告

是的

  • 調查篩選差異 * :

功能 地圖與分類 地圖

原則

是的

是的

工作環境類型

是的

是的

工作環境

是的

是的

儲存儲存庫

是的

是的

檔案類型

是的

是的

檔案大小

是的

是的

建立時間

是的

是的

探索到的時間

是的

是的

上次修改時間

是的

是的

上次存取

是的

是的

開放式權限

是的

是的

檔案目錄路徑

是的

是的

類別

是的

敏感度等級

是的

識別碼數目

是的

個人資料

是的

敏感的個人資料

是的

資料主旨

是的

重複項目

是的

是的

分類狀態

是的

狀態永遠是「有限見解」

掃描分析事件

是的

是的

檔案雜湊

是的

是的

擁有存取權的使用者人數

是的

是的

使用者 / 群組權限

是的

是的

檔案擁有者

是的

是的

目錄類型

是的

是的

BlueXP 分類掃描資料的速度

掃描速度會受到網路延遲、磁碟延遲、網路頻寬、環境大小和檔案發佈大小的影響。

  • 執行對應掃描時、 BlueXP 分類每天可掃描 100-150 Tibs 的資料。

  • 執行分類掃描時、 BlueXP 分類每天可掃描 15-40 Tibs 的資料。

BlueXP 分類索引的資訊

BlueXP 分類會收集、索引及指派類別給您的資料(檔案)。BlueXP 分類索引的資料包括:

  • * 標準中繼資料 * BlueXP 分類會收集檔案的標準中繼資料:檔案類型、檔案大小、建立和修改日期等。

  • * 個人資料 * :個人識別資訊( PII )、例如電子郵件地址、識別號碼或信用卡號碼。 "深入瞭解個人資料"

  • * 敏感個人資料 * : GDPR 定義的特殊類型敏感個人資訊( SPii )、例如健康資料、族裔來源或政治見解、以及其他隱私權法規。 "深入瞭解敏感的個人資料"

  • * 類別 * : BlueXP 分類會將掃描的資料分成不同類別。類別是以 AI 分析每個檔案的內容和中繼資料為基礎的主題。 "深入瞭解類別"

  • * 類型 * : BlueXP 分類會根據檔案類型來記錄掃描的資料、並將其分解。 "深入瞭解類型"

  • * 名稱實體辨識 * : BlueXP 分類使用 AI 從文件中擷取人員的自然名稱。 "瞭解如何回應資料主體存取要求"

網路總覽

BlueXP 會使用安全性群組來部署 BlueXP 分類執行個體、以便從 Connector 執行個體進行傳入 HTTP 連線。

在 SaaS 模式中使用 BlueXP 時、會透過 HTTPS 提供與 BlueXP 的連線、而在瀏覽器和 BlueXP 分類執行個體之間傳送的私有資料則會使用 TLS 1.2 來保護端點對端加密、這表示 NetApp 和協力廠商無法讀取。

傳出規則已完全開啟。安裝和升級 BlueXP 分類軟體、以及傳送使用量指標、都需要網際網路存取。

如果您有嚴格的網路需求、 "瞭解 BlueXP 分類所接觸的端點"

使用者存取法規遵循資訊

指派給每位使用者的角色在 BlueXP 和 BlueXP 分類中提供不同的功能:

  • *帳戶管理員*可管理所有工作環境的法規遵循設定及檢視法規遵循資訊。

  • *工作區管理*只能管理具有存取權限的系統的法規遵循設定及檢視法規遵循資訊。如果工作空間管理員無法存取 BlueXP 中的工作環境、則他們無法在 BlueXP 分類索引標籤中看到工作環境的任何法規遵循資訊。

  • 具有* Compliance Viewer*角色的使用者只能檢視法規遵循資訊、並針對擁有存取權限的系統產生報告。這些使用者無法啟用 / 停用掃描磁碟區、儲存區或資料庫架構。