瞭解 BlueXP 分類
BlueXP 分類是 BlueXP 的資料治理服務、可掃描企業內部部署和雲端資料來源、以對應和分類資料、並識別私有資訊。這有助於降低安全性與法規遵循風險、降低儲存成本、並協助您執行資料移轉專案。
功能
BlueXP 分類使用人工智慧( AI )、自然語言處理( NLP )和機器學習( ML )來瞭解它所掃描的內容、以便擷取實體並據此分類內容。這可讓 BlueXP 分類提供下列功能領域。
維持法規遵循
BlueXP 分類提供數種工具、可協助您達成法規遵循目標。您可以使用 BlueXP 分類來:
-
識別個人識別資訊( PII )。
-
根據GDPR、CCPA、PCI及HIPAA隱私權法規的要求、識別範圍廣泛的敏感個人資訊。
-
根據名稱或電子郵件地址回應資料主旨存取要求(DSAR)。
-
識別您資料庫中的唯一識別碼是否位於其他儲存庫中的檔案中、基本上是製作您自己的「個人資料」清單、以在 BlueXP 分類掃描中識別。
-
當檔案包含特定PII時、透過電子郵件通知特定使用者(您使用定義此條件 "原則")以便決定行動計畫。
強化安全性
BlueXP 分類可識別出可能因犯罪目的而面臨存取風險的資料。您可以使用 BlueXP 分類來:
-
識別所有具有開放權限的檔案和目錄(共享區和資料夾)、這些檔案和目錄都會公開給整個組織或大眾使用。
-
識別位於初始專屬位置之外的敏感資料。
-
遵守資料保留政策。
-
使用_policies自動通知安全員工新的安全問題、以便他們立即採取行動。
-
將自訂標記新增至檔案(例如「需要搬移」)、並指派一個BlueXP使用者、讓該人員擁有檔案的更新。
-
檢視及修改 "Azure資訊保護(AIP)標籤" 在您的檔案中。
最佳化儲存使用量
BlueXP 分類提供的工具可協助您處理儲存設備的總體擁有成本( TCO )。您可以使用 BlueXP 分類來:
-
識別重複或非業務相關的資料、以提高儲存效率。您可以使用此資訊來決定要移動或刪除特定檔案。
-
刪除看起來不安全或風險太高、無法留在儲存系統中、或是您已識別為重複的檔案。您可以使用_policies自動刪除符合特定條件的檔案。
-
識別非使用中的資料、將其分層儲存至成本較低的物件儲存設備、藉此節省儲存成本。 "深入瞭解Cloud Volumes ONTAP 從NetApp系統分層的相關資訊"。 "深入瞭解內部部署ONTAP 的資訊系統分層"。
加速資料移轉
BlueXP 分類可用於掃描內部部署資料、然後再將其移轉至公有雲或私有雲。您可以使用 BlueXP 分類來:
-
在移動資料之前、請先檢視資料大小、以及是否有任何資料包含敏感資訊。
-
篩選來源資料(根據超過25種準則)、以便只將所需檔案移至目的地、不必要的資料不會移動。
-
自動且持續地將所需的資料移動、複製或同步至雲端儲存庫。
支援的資料來源
BlueXP 分類可掃描及分析下列類型資料來源的結構化和非結構化資料:
-
NetApp:*
-
(部署於AWS、Azure或GCP)Cloud Volumes ONTAP
-
內部部署 ONTAP 的叢集
-
StorageGRID
-
Azure NetApp Files
-
Amazon FSX for ONTAP Sf
-
適用於 Google Cloud Cloud Volumes Service
非NetApp:
-
Dell EMC Isilon
-
Pure Storage
-
Nutanix
-
任何其他儲存設備廠商
雲端:
-
Amazon S3
-
Google Cloud Storage
-
OneDrive
-
SharePoint Online
-
SharePoint內部部署(SharePoint Server)
-
Google雲端硬碟
資料庫:
-
Amazon關係資料庫服務(Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server ( MSSQL )
BlueXP 分類支援 NFS 3.x 、 4.0 和 4.1 版、以及 CIFS 1.x 、 2.0 、 2.1 和 3.0 版。
成本
-
使用 BlueXP 分類的成本取決於您正在掃描的資料量。BlueXP 分類在 BlueXP 工作區中掃描的前 1 TB 資料可免費使用 30 天。這包括所有工作環境和資料來源的所有資料。必須訂閱AWS、Azure或GCP Marketplace、或NetApp的BYOL授權、才能在該點之後繼續掃描資料。請參閱 "定價" 以取得詳細資料。
-
在雲端中安裝 BlueXP 分類需要部署雲端執行個體、這會導致部署雲端的雲端供應商收取費用。請參閱 為每個雲端供應商部署的執行個體類型。如果您在內部部署系統上安裝 BlueXP 分類、則不需支付任何費用。
-
BlueXP 分類要求您已部署 BlueXP Connector 。在許多情況下、由於您在BlueXP中使用的其他儲存設備和服務、您已經擁有Connector。連接器執行個體會從部署該執行個體的雲端供應商收取費用。請參閱 "為每個雲端供應商部署的執行個體類型"。如果您將連接器安裝在內部部署系統上、則無需支付任何費用。
資料傳輸成本
資料傳輸成本取決於您的設定。如果 BlueXP 分類執行個體和資料來源位於相同的可用性區域和區域、則不會產生資料傳輸成本。但是如果Cloud Volumes ONTAP 資料來源(例如、不支援的系統或S3時段)位於_不同_可用度區域或區域、則您的雲端供應商會向您收取資料傳輸成本。如需詳細資料、請參閱以下連結:
BlueXP 分類執行個體
當您在雲端部署 BlueXP 分類時、 BlueXP 會將執行個體部署在與 Connector 相同的子網路中。 "深入瞭解連接器。"
請注意下列關於預設執行個體的資訊:
-
在 AWS 中、 BlueXP 分類是在上執行 "m6i.4xlarge 執行個體" 搭配 500 GB GP2 磁碟。作業系統映像是Amazon Linux 2。在 AWS 中部署時、如果您要掃描少量資料、可以選擇較小的執行個體大小。
-
在 Azure 中、 BlueXP 分類是在上執行 "Standard_D16s_v3 VM" 使用 500 GB 的 GiB 磁碟。作業系統映像是CentOS 7.9。
-
在 GCP 中、 BlueXP 分類是在上執行 "n2-Standard-16 VM" 使用 500 GB 的 GiB Standard 持續性磁碟。作業系統映像是CentOS 7.9。
-
在無法使用預設執行個體的地區、 BlueXP 分類會在替代執行個體上執行。 "請參閱替代執行個體類型"。
-
此執行個體的名稱為 CloudCompliance _ 、並以產生的雜湊( UUID )串聯在其中。例如: _CloudCompliance -16bb6564-38ad-4080-9a92-36f5fd2f71c7
-
每個 Connector 只部署一個 BlueXP 分類執行個體。
您也可以在內部部署的 Linux 主機或偏好的雲端供應商的主機上部署 BlueXP 分類。無論您選擇哪種安裝方法、軟體的運作方式都完全相同。只要執行個體能夠存取網際網路、就會自動升級 BlueXP 分類軟體。
由於 BlueXP 分類會持續掃描資料、因此執行個體應該隨時保持執行狀態。 |
使用較小的執行個體類型
您可以在 CPU 較少、 RAM 較少的系統上部署 BlueXP 分類、但使用這些功能較不強大的系統時會有一些限制。
系統大小 | 規格 | 限制 |
---|---|---|
超大 |
32 個 CPU 、 128 GB RAM 、 1 個 TiB SSD |
最多可掃描 5 億個檔案。 |
大型(預設) |
16 個 CPU 、 64 GB RAM 、 500 GB GiB SSD |
最多可掃描 2.5 億個檔案。 |
中 |
8 個 CPU 、 32 GB RAM 、 200 GB SSD |
掃描速度較慢、最多只能掃描100萬個檔案。 |
小 |
8 個 CPU 、 16 GB RAM 、 100 GB SSD |
與「中」相同的限制、加上識別能力 "資料主旨名稱" 內部檔案已停用。 |
在 AWS 上的雲端部署 BlueXP 分類時、您可以選擇大型 / 中型 / 小型執行個體。在 Azure 或 GCP 中部署 BlueXP 分類時、如果您想要使用其中一種替代系統、請寄送電子郵件至 ng-contact-data-sense@netapp.com 以取得協助。我們需要與您一起部署這些其他雲端組態。
在內部部署 BlueXP 分類時、只要使用具有替代規格的 Linux 主機即可。您不需要聯絡NetApp尋求協助。
BlueXP 分類的運作方式
在高層級的 BlueXP 分類中、其運作方式如下:
-
您可以在 BlueXP 中部署 BlueXP 分類執行個體。
-
您可以在一或多個資料來源上啟用高層對應或深度層級掃描。
-
BlueXP 分類會使用 AI 學習程序掃描資料。
-
您可以使用所提供的儀表板和報告工具、協助您達成法規遵循與治理目標。
掃描的運作方式
啟用 BlueXP 分類並選取要掃描的儲存庫(這些是磁碟區、儲存區、資料庫架構、 OneDrive 或 SharePoint 使用者資料)之後、系統會立即開始掃描資料、以識別個人和敏感資料。您應該專注於在大多數情況下掃描線上即時資料、而非備份、鏡像或災難恢復站台。然後 BlueXP 分類會對應您的組織資料、對每個檔案進行分類、並識別及擷取資料中的實體和預先定義的模式。掃描結果是個人資訊、敏感個人資訊、資料類別和檔案類型的索引。
BlueXP 分類透過掛載 NFS 和 CIFS 磁碟區、與任何其他用戶端一樣連線至資料。NFS 磁碟區會自動以唯讀方式存取、而您需要提供 Active Directory 認證來掃描 CIFS 磁碟區。
初始掃描之後、 BlueXP 分類會以循環方式持續掃描您的資料、以偵測遞增變更(這就是保持執行個體正常運作的重要原因)。
您可以在磁碟區層級、儲存庫層級、資料庫架構層級、OneDrive使用者層級和SharePoint網站層級啟用和停用掃描。
對應掃描與分類掃描之間有何差異
BlueXP 分類可讓您在選定的資料來源上執行一般的「對應」掃描。對應只提供資料的高層級總覽、而分類則提供資料的深度層級掃描。您可以很快在資料來源上完成對應、因為它不會存取檔案來查看內部資料。
許多使用者之所以喜歡這項功能、是因為他們想要快速掃描資料、找出需要更多研究的資料來源、然後只能針對需要的資料來源或磁碟區進行分類掃描。
下表顯示部分差異:
功能 | 分類 | 對應 |
---|---|---|
掃描速度 |
慢 |
快速 |
檔案類型和已用容量的清單 |
是的 |
是的 |
檔案數量和已用容量 |
是的 |
是的 |
檔案的存留時間和大小 |
是的 |
是的 |
執行的能力 "資料對應報告" |
是的 |
是的 |
「資料調查」頁面可檢視檔案詳細資料 |
是的 |
否 |
在檔案中搜尋名稱 |
是的 |
否 |
建立 "原則" 提供自訂搜尋結果 |
是的 |
否 |
使用AIP標籤和狀態標籤來分類資料 |
是的 |
否 |
複製、刪除及移動來源檔案 |
是的 |
否 |
執行其他報告的能力 |
是的 |
否 |
BlueXP 分類掃描資料的速度
掃描速度會受到網路延遲、磁碟延遲、網路頻寬、環境大小和檔案發佈大小的影響。
-
執行對應掃描時、 BlueXP 分類可在每天每個掃描器節點掃描 100 至 150 Tibs 的資料。
-
執行分類掃描時、 BlueXP 分類可在每天每個掃描器節點掃描 15-40 Tibs 的資料。
BlueXP 分類索引的資訊
BlueXP 分類會收集、索引及指派類別給您的資料(檔案)。BlueXP 分類索引的資料包括:
- 標準中繼資料
-
BlueXP 分類會收集檔案的標準中繼資料:檔案類型、檔案大小、建立和修改日期等。
- 個人資料
-
個人識別資訊、例如電子郵件地址、識別號碼或信用卡號碼。 "深入瞭解個人資料"。
- 敏感的個人資料
-
GDPR 及其他隱私權法規所定義的特殊敏感資訊類型、例如健康資料、族群來源或政治見解。 "深入瞭解敏感的個人資料"。
- 類別
-
BlueXP 分類會將掃描的資料分成不同類型的類別。類別是以 AI 分析每個檔案的內容和中繼資料為基礎的主題。 "深入瞭解類別"。
- 類型
-
BlueXP 分類會根據檔案類型來記錄掃描的資料、並加以細分。 "深入瞭解類型"。
- 名稱實體辨識
-
BlueXP 分類使用 AI 從文件中擷取自然人姓名。 "瞭解如何回應資料主體存取要求"。
網路總覽
BlueXP 會使用安全性群組來部署 BlueXP 分類執行個體、以便從 Connector 執行個體進行傳入 HTTP 連線。
在 SaaS 模式中使用 BlueXP 時、會透過 HTTPS 提供與 BlueXP 的連線、而在瀏覽器和 BlueXP 分類執行個體之間傳送的私有資料則會使用 TLS 1.2 來保護端點對端加密、這表示 NetApp 和協力廠商無法讀取。
傳出規則已完全開啟。安裝和升級 BlueXP 分類軟體、以及傳送使用量指標、都需要網際網路存取。
如果您有嚴格的網路需求、 "瞭解 BlueXP 分類所接觸的端點"。
使用者存取法規遵循資訊
指派給每位使用者的角色在 BlueXP 和 BlueXP 分類中提供不同的功能:
-
*帳戶管理員*可管理所有工作環境的法規遵循設定及檢視法規遵循資訊。
-
*工作區管理*只能管理具有存取權限的系統的法規遵循設定及檢視法規遵循資訊。如果工作空間管理員無法存取 BlueXP 中的工作環境、則他們無法在 BlueXP 分類索引標籤中看到工作環境的任何法規遵循資訊。
-
具有* Compliance Viewer*角色的使用者只能檢視法規遵循資訊、並針對擁有存取權限的系統產生報告。這些使用者無法啟用 / 停用掃描磁碟區、儲存區或資料庫架構。這些使用者也無法複製、移動或刪除檔案。
"深入瞭解BlueXP角色" 以及使用方法 "新增具有特定角色的使用者"。