瞭解 BlueXP 分類
BlueXP 分類( Cloud Data Sense )是 BlueXP 的資料治理服務、可掃描企業內部部署和雲端資料來源、以對應和分類資料、並識別私有資訊。這有助於降低安全性與法規遵循風險、降低儲存成本、並協助您執行資料移轉專案。
重要
從 2024 年 5 月開始、 BlueXP 分類為 BlueXP 的核心功能、無需額外付費。不需要分類授權或訂閱。我們也將 BlueXP 分類功能集中在 NetApp 儲存系統上、因此部分未使用或未充分使用的功能已被淘汰。
使用舊版 1.30 或更早版本的使用者將繼續使用該版本、直到其訂閱到期為止。
功能
BlueXP 分類使用人工智慧( AI )、自然語言處理( NLP )和機器學習( ML )來瞭解它所掃描的內容、以便擷取實體並據此分類內容。這可讓 BlueXP 分類提供下列功能領域。
BlueXP 分類提供數種工具、可協助您達成法規遵循目標。您可以使用 BlueXP 分類來:
-
識別個人識別資訊( PII )。
-
根據GDPR、CCPA、PCI及HIPAA隱私權法規的要求、識別範圍廣泛的敏感個人資訊。
-
根據名稱或電子郵件地址回應資料主旨存取要求(DSAR)。
BlueXP 分類可識別出可能因犯罪目的而面臨存取風險的資料。您可以使用 BlueXP 分類來:
-
識別所有具有開放權限的檔案和目錄(共享區和資料夾)、這些檔案和目錄都會公開給整個組織或大眾使用。
-
識別位於初始專屬位置之外的敏感資料。
-
遵守資料保留政策。
-
使用 _policies _ 自動偵測新的安全性問題、讓安全人員可以立即採取行動。
BlueXP 分類提供的工具可協助您處理儲存設備的總體擁有成本( TCO )。您可以使用 BlueXP 分類來:
-
識別重複或非業務相關的資料、以提高儲存效率。
-
識別非使用中的資料、將其分層儲存至成本較低的物件儲存設備、藉此節省儲存成本。 "深入瞭解Cloud Volumes ONTAP 從NetApp系統分層的相關資訊"。 "深入瞭解內部部署ONTAP 的資訊系統分層"。
支援的工作環境和資料來源
BlueXP 分類可以掃描及分析下列工作環境和資料來源類型的結構化和非結構化資料:
-
工作環境 *
-
(部署於AWS、Azure或GCP)Cloud Volumes ONTAP
-
內部部署 ONTAP 的叢集
-
StorageGRID
-
Azure NetApp Files
-
Amazon FSX for ONTAP Sf
-
Google Cloud NetApp Volumes
-
資料來源 *
-
NetApp 檔案共用
-
資料庫:
-
Amazon關係資料庫服務(Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server ( MSSQL )
-
BlueXP 分類支援 NFS 3.x 、 4.0 和 4.1 版、以及 CIFS 1.x 、 2.0 、 2.1 和 3.0 版。
成本
BlueXP 分類現在可以免費使用。不需要分類授權或付費訂閱。
基礎架構成本
-
在雲端中安裝 BlueXP 分類需要部署雲端執行個體、這會導致部署雲端的雲端供應商收取費用。請參閱 為每個雲端供應商部署的執行個體類型。如果您在內部部署系統上安裝 BlueXP 分類、則不需支付任何費用。
-
BlueXP 分類要求您已部署 BlueXP Connector 。在許多情況下、由於您在BlueXP中使用的其他儲存設備和服務、您已經擁有Connector。連接器執行個體會從部署該執行個體的雲端供應商收取費用。請參閱 "為每個雲端供應商部署的執行個體類型"。如果您將連接器安裝在內部部署系統上、則無需支付任何費用。
資料傳輸成本
資料傳輸成本取決於您的設定。如果 BlueXP 分類執行個體和資料來源位於相同的可用性區域和區域、則不會產生資料傳輸成本。但是、如果資料來源(例如 Cloud Volumes ONTAP 系統)位於 _ 不同 _ 的可用性區域或區域、則您的雲端供應商會向您收取資料傳輸成本。如需詳細資料、請參閱以下連結:
BlueXP 分類執行個體
當您在雲端部署 BlueXP 分類時、 BlueXP 會將執行個體部署在與 Connector 相同的子網路中。 "深入瞭解連接器。"
請注意下列關於預設執行個體的資訊:
-
在 AWS 中、 BlueXP 分類是在上執行 "m6i.4xlarge 執行個體" 搭配 500 GB GP2 磁碟。作業系統映像是Amazon Linux 2。在 AWS 中部署時、如果您要掃描少量資料、可以選擇較小的執行個體大小。
-
在 Azure 中、 BlueXP 分類是在具有 500 GB 磁碟的 A 上執行"Standard_D16s_v3 VM"。作業系統映像是 Ubuntu 22.04 。
-
在 GCP 中、 BlueXP 分類是在具有 500 GiB Standard 持續性磁碟的上執行"n2-Standard-16 VM"。作業系統映像是 Ubuntu 22.04 。
-
在無法使用預設執行個體的地區、 BlueXP 分類會在替代執行個體上執行。 "請參閱替代執行個體類型"。
-
此執行個體的名稱為 CloudCompliance _ 、並以產生的雜湊( UUID )串聯在其中。例如: _CloudCompliance -16bb6564-38ad-4080-9a92-36f5fd2f71c7
-
每個 Connector 只部署一個 BlueXP 分類執行個體。
您也可以在內部部署的 Linux 主機或偏好的雲端供應商的主機上部署 BlueXP 分類。無論您選擇哪種安裝方法、軟體的運作方式都完全相同。只要執行個體能夠存取網際網路、就會自動升級 BlueXP 分類軟體。
由於 BlueXP 分類會持續掃描資料、因此執行個體應該隨時保持執行狀態。 |
-
部署在不同的執行個體類型 *
您可以在 CPU 較少且 RAM 較少的系統上部署 BlueXP 分類。
系統大小 | 規格 | 限制 |
---|---|---|
超大 |
32 個 CPU 、 128 GB RAM 、 1 個 TiB SSD |
最多可掃描 5 億個檔案。 |
大型(預設) |
16 個 CPU 、 64 GB RAM 、 500 GB GiB SSD |
最多可掃描 2.5 億個檔案。 |
在 Azure 或 GCP 中部署 BlueXP 分類時、如果您想要使用較小的執行個體類型、請寄送電子郵件至 ng-contact-data-sense@netapp.com 以取得協助。
BlueXP 分類的運作方式
在高層級的 BlueXP 分類中、其運作方式如下:
-
您可以在 BlueXP 中部署 BlueXP 分類執行個體。
-
您可以在一或多個資料來源上啟用高層對應或深度層級掃描。
-
BlueXP 分類會使用 AI 學習程序掃描資料。
-
您可以使用所提供的儀表板和報告工具、協助您達成法規遵循與治理目標。
掃描的運作方式
啟用 BlueXP 分類並選取要掃描的儲存庫(這些是磁碟區、資料庫架構或其他使用者資料)之後、系統會立即開始掃描資料、以識別個人和敏感資料。您應該專注於在大多數情況下掃描線上即時資料、而非備份、鏡像或災難恢復站台。然後 BlueXP 分類會對應您的組織資料、對每個檔案進行分類、並識別及擷取資料中的實體和預先定義的模式。掃描結果是個人資訊、敏感個人資訊、資料類別和檔案類型的索引。
BlueXP 分類透過掛載 NFS 和 CIFS 磁碟區、與任何其他用戶端一樣連線至資料。NFS 磁碟區會自動以唯讀方式存取、而您需要提供 Active Directory 認證來掃描 CIFS 磁碟區。
初始掃描之後、 BlueXP 分類會以循環方式持續掃描您的資料、以偵測遞增變更(這就是保持執行個體正常運作的重要原因)。
您可以在磁碟區層級或資料庫架構層級啟用和停用掃描。
對應掃描與分類掃描之間有何差異
BlueXP 分類可讓您在選定的資料來源上執行一般的「對應」掃描。對應只提供資料的高層級總覽、而分類則提供資料的深度層級掃描。您可以很快在資料來源上完成對應、因為它不會存取檔案來查看內部資料。
許多使用者之所以喜歡這項功能、是因為他們想要快速掃描資料、找出需要更多研究的資料來源、然後只能針對需要的資料來源或磁碟區進行分類掃描。
下表顯示部分差異:
功能 | 分類 | 對應 |
---|---|---|
掃描速度 |
慢 |
快速 |
定價 |
免費 |
免費 |
容量 |
限 500 TB |
限 500 TB |
檔案類型和已用容量的清單 |
是的 |
是的 |
檔案數量和已用容量 |
是的 |
是的 |
檔案的存留時間和大小 |
是的 |
是的 |
執行的能力 "資料對應報告" |
是的 |
是的 |
「資料調查」頁面可檢視檔案詳細資料 |
是的 |
否 |
在檔案中搜尋名稱 |
是的 |
否 |
建立 "原則" 提供自訂搜尋結果 |
是的 |
否 |
執行其他報告的能力 |
是的 |
否 |
能夠查看檔案中的中繼資料 * |
否 |
是的 |
-
下列中繼資料會在對應掃描期間從檔案中擷取:
-
工作環境
-
工作環境類型
-
儲存儲存庫
-
檔案類型
-
已用容量
-
檔案數量
-
檔案大小
-
檔案建立
-
檔案上次存取
-
上次修改的檔案
-
檔案探索時間
-
權限擷取
治理儀表板差異:
功能 | 地圖與分類 | 地圖 |
---|---|---|
過時資料 |
是的 |
是的 |
非商業資料 |
是的 |
是的 |
重複的檔案 |
是的 |
是的 |
預先定義的原則 |
是的 |
否 |
自訂原則 |
是的 |
是的 |
DDA 報告 |
是的 |
是的 |
對應報告 |
是的 |
是的 |
靈敏度等級偵測 |
是的 |
否 |
具有廣泛權限的機密資料 |
是的 |
否 |
開放式權限 |
是的 |
是的 |
資料存留期 |
是的 |
是的 |
資料大小 |
是的 |
是的 |
類別 |
是的 |
否 |
檔案類型 |
是的 |
是的 |
法規遵循儀表板差異:
功能 | 地圖與分類 | 地圖 |
---|---|---|
個人資訊 |
是的 |
否 |
敏感的個人資訊 |
是的 |
否 |
隱私風險評估報告 |
是的 |
否 |
HIPAA 報告 |
是的 |
否 |
PCI DSS 報告 |
是的 |
否 |
調查篩選差異:
功能 | 地圖與分類 | 地圖 |
---|---|---|
原則 |
是的 |
是的 |
工作環境類型 |
是的 |
是的 |
工作環境 |
是的 |
是的 |
儲存儲存庫 |
是的 |
是的 |
檔案類型 |
是的 |
是的 |
檔案大小 |
是的 |
是的 |
建立時間 |
是的 |
是的 |
探索到的時間 |
是的 |
是的 |
上次修改時間 |
是的 |
是的 |
上次存取 |
是的 |
是的 |
開放式權限 |
是的 |
是的 |
檔案目錄路徑 |
是的 |
是的 |
類別 |
是的 |
否 |
敏感度等級 |
是的 |
否 |
識別碼數目 |
是的 |
否 |
個人資料 |
是的 |
否 |
敏感的個人資料 |
是的 |
否 |
資料主旨 |
是的 |
否 |
重複項目 |
是的 |
是的 |
分類狀態 |
是的 |
狀態永遠是「有限見解」 |
掃描分析事件 |
是的 |
是的 |
檔案雜湊 |
是的 |
是的 |
擁有存取權的使用者人數 |
是的 |
是的 |
使用者 / 群組權限 |
是的 |
是的 |
檔案擁有者 |
是的 |
是的 |
目錄類型 |
是的 |
是的 |
BlueXP 分類掃描資料的速度
掃描速度會受到網路延遲、磁碟延遲、網路頻寬、環境大小和檔案發佈大小的影響。
-
執行對應掃描時、 BlueXP 分類每天可掃描 100-150 Tibs 的資料。
-
執行分類掃描時、 BlueXP 分類每天可掃描 15-40 Tibs 的資料。
BlueXP 分類的資訊
BlueXP 分類會收集、索引及指派類別給您的資料(檔案)。BlueXP 分類索引的資料包括:
-
* 檔案的標準中繼資料 * :檔案類型、檔案大小、建立及修改日期等。
-
* 個人資料 * :個人識別資訊( PII )、例如電子郵件地址、識別號碼或信用卡號碼。 "深入瞭解個人資料"。
-
* 敏感個人資料 * : GDPR 定義的特殊類型敏感個人資訊( SPii )、例如健康資料、族裔來源或政治見解、以及其他隱私權法規。 "深入瞭解敏感的個人資料"。
-
* 類別 * : BlueXP 分類會將掃描的資料分成不同類別。類別是以 AI 分析每個檔案的內容和中繼資料為基礎的主題。 "深入瞭解類別"。
-
* 類型 * : BlueXP 分類會根據檔案類型來記錄掃描的資料、並將其分解。 "深入瞭解類型"。
-
* 名稱實體辨識 * : BlueXP 分類使用 AI 從文件中擷取人員的自然名稱。 "瞭解如何回應資料主體存取要求"。
網路總覽
BlueXP 會使用安全性群組來部署 BlueXP 分類執行個體、以便從 Connector 執行個體進行傳入 HTTP 連線。
在 SaaS 模式中使用 BlueXP 時、會透過 HTTPS 提供與 BlueXP 的連線、而在瀏覽器和 BlueXP 分類執行個體之間傳送的私有資料則會使用 TLS 1.2 來保護端點對端加密、這表示 NetApp 和協力廠商無法讀取。
傳出規則已完全開啟。安裝和升級 BlueXP 分類軟體、以及傳送使用量指標、都需要網際網路存取。
如果您有嚴格的網路需求、 "瞭解 BlueXP 分類所接觸的端點"。
BlueXP 分類中的使用者角色
指派給每位使用者的角色在 BlueXP 和 BlueXP 分類中提供不同的功能。如需詳細資料、請參閱下列內容:
-
"BlueXP IAM 角色"(在標準模式下使用 BlueXP 時)
-
"BlueXP 帳戶角色"(在受限模式或私人模式下使用 BlueXP 時)