瞭解 BlueXP 分類
BlueXP 分類( Cloud Data Sense )是 BlueXP 的資料治理服務、可掃描企業內部部署和雲端資料來源、以對應和分類資料、並識別私有資訊。這有助於降低安全性與法規遵循風險、降低儲存成本、並協助您執行資料移轉專案。
|
從 1.31 版開始, BlueXP 分類可作為 BlueXP 的核心功能。無需額外付費。不需要分類授權或訂閱。+ 如果您使用的是舊版 1.30 或更早版本,則該版本會在您的訂閱到期之前提供使用。"請參閱過時功能的清單"。 |
功能
BlueXP 分類使用人工智慧( AI )、自然語言處理( NLP )和機器學習( ML )來瞭解它所掃描的內容、以便擷取實體並據此分類內容。這可讓 BlueXP 分類提供下列功能領域。
BlueXP 分類提供數種工具、可協助您達成法規遵循目標。您可以使用 BlueXP 分類來:
-
識別個人識別資訊( PII )。
-
根據GDPR、CCPA、PCI及HIPAA隱私權法規的要求、識別範圍廣泛的敏感個人資訊。
-
根據名稱或電子郵件地址回應資料主旨存取要求(DSAR)。
BlueXP 分類可識別出可能因犯罪目的而面臨存取風險的資料。您可以使用 BlueXP 分類來:
-
識別所有具有開放權限的檔案和目錄(共享區和資料夾)、這些檔案和目錄都會公開給整個組織或大眾使用。
-
識別位於初始專屬位置之外的敏感資料。
-
遵守資料保留政策。
-
使用 policies 自動偵測新的安全性問題,讓資安人員可以立即採取行動。
BlueXP 分類提供的工具可協助您處理儲存設備的總體擁有成本( TCO )。您可以使用 BlueXP 分類來:
-
識別重複或非業務相關的資料、以提高儲存效率。
-
識別非使用中的資料,將其分層儲存至成本較低的物件儲存設備,進而節省儲存成本。 "深入瞭解Cloud Volumes ONTAP 從NetApp系統分層的相關資訊"。 "深入瞭解內部部署ONTAP 的資訊系統分層"。
支援的工作環境和資料來源
BlueXP 分類可以掃描及分析下列工作環境和資料來源類型的結構化和非結構化資料:
-
工作環境 *
-
Amazon FSX for ONTAP Sf
-
Azure NetApp Files
-
(部署於AWS、Azure或GCP)Cloud Volumes ONTAP
-
內部部署 ONTAP 的叢集
-
StorageGRID
-
資料來源 *
-
NetApp 檔案共用
-
資料庫:
-
Amazon關係資料庫服務(Amazon RDS)
-
MongoDB
-
MySQL
-
Oracle
-
PostgreSQL
-
SAP HANA
-
SQL Server ( MSSQL )
-
BlueXP 分類支援 NFS 3.x 、 4.0 和 4.1 版、以及 CIFS 1.x 、 2.0 、 2.1 和 3.0 版。
成本
BlueXP 分類是免費使用的。不需要分類授權或付費訂閱。
基礎架構成本
-
在雲端中安裝 BlueXP 分類需要部署雲端執行個體、這會導致部署雲端的雲端供應商收取費用。請參閱。 為每個雲端供應商部署的執行個體類型如果您在內部部署系統上安裝 BlueXP 分類、則不需支付任何費用。
-
BlueXP 分類要求您已部署 BlueXP Connector 。在許多情況下、由於您在BlueXP中使用的其他儲存設備和服務、您已經擁有Connector。連接器執行個體會從部署該執行個體的雲端供應商收取費用。請參閱 "為每個雲端供應商部署的執行個體類型"。如果您將連接器安裝在內部部署系統上、則無需支付任何費用。
資料傳輸成本
資料傳輸成本取決於您的設定。如果 BlueXP 分類執行個體和資料來源位於相同的可用性區域和區域、則不會產生資料傳輸成本。但是、如果資料來源(例如 Cloud Volumes ONTAP 系統)位於 _ 不同 _ 的可用性區域或區域、則您的雲端供應商會向您收取資料傳輸成本。如需詳細資料、請參閱以下連結:
BlueXP 分類執行個體
當您在雲端部署 BlueXP 分類時, BlueXP 會將執行個體部署在與 Connector 相同的子網路中。 "深入瞭解連接器。"
請注意下列關於預設執行個體的資訊:
-
在 AWS 中, BlueXP 分類是在具有 500 GB GP2 磁碟的上執行 "m6i.4xlarge 執行個體"。作業系統映像是Amazon Linux 2。在 AWS 中部署時、如果您要掃描少量資料、可以選擇較小的執行個體大小。
-
在 Azure 中、 BlueXP 分類是在具有 500 GB 磁碟的 A 上執行"Standard_D16s_v3 VM"。作業系統映像是 Ubuntu 22.04 。
-
在 GCP 中、 BlueXP 分類是在具有 500 GiB Standard 持續性磁碟的上執行"n2-Standard-16 VM"。作業系統映像是 Ubuntu 22.04 。
-
在無法使用預設執行個體的地區、 BlueXP 分類會在替代執行個體上執行。"請參閱替代執行個體類型"。
-
此執行個體的名稱為 CloudCompliance _ 、並以產生的雜湊( UUID )串聯在其中。例如: _CloudCompliance -16bb6564-38ad-4080-9a92-36f5fd2f71c7
-
每個 Connector 只部署一個 BlueXP 分類執行個體。
您也可以在內部部署的 Linux 主機或偏好的雲端供應商的主機上部署 BlueXP 分類。無論您選擇哪種安裝方法、軟體的運作方式都完全相同。只要實例可以存取互聯網,BlueXP 分類軟體的升級就會自動進行。
|
由於 BlueXP 分類會持續掃描資料、因此執行個體應該隨時保持執行狀態。 |
-
部署在不同的執行個體類型 *
查看實例類型的以下規範:
系統大小 | 規格 | 限制 |
---|---|---|
超大 |
32 個 CPU 、 128 GB RAM 、 1 個 TiB SSD |
最多可掃描 5 億個檔案。 |
大型(預設) |
16 個 CPU 、 64 GB RAM 、 500 GB GiB SSD |
最多可掃描 2.5 億個檔案。 |
在 Azure 或 GCP 中部署 BlueXP 分類時,如果您想要使用較小的執行個體類型,請寄送電子郵件至 ng-contact-data-Sense @ NetApp .com 以取得協助。
BlueXP 分類掃描的運作方式
在高層級的 BlueXP 分類掃描中,其運作方式如下:
-
您可以在 BlueXP 中部署 BlueXP 分類執行個體。
-
您可以在一或多個資料來源上啟用高階對應(稱為「僅對應」掃描)或深度層級掃描(稱為「地圖與分類」掃描)。
-
BlueXP 分類會使用 AI 學習程序掃描資料。
-
您可以使用所提供的儀表板和報告工具、協助您達成法規遵循與治理目標。
啟用 BlueXP 分類並選取要掃描的儲存庫(這些是磁碟區、資料庫架構或其他使用者資料)之後、系統會立即開始掃描資料、以識別個人和敏感資料。您應該專注於在大多數情況下掃描線上即時資料、而非備份、鏡像或災難恢復站台。然後 BlueXP 分類會對應您的組織資料、對每個檔案進行分類、並識別及擷取資料中的實體和預先定義的模式。掃描結果是個人資訊、敏感個人資訊、資料類別和檔案類型的索引。
BlueXP 分類透過掛載 NFS 和 CIFS 磁碟區、與任何其他用戶端一樣連線至資料。NFS 磁碟區會自動以唯讀方式存取、而您需要提供 Active Directory 認證來掃描 CIFS 磁碟區。
初始掃描之後, BlueXP 分類會以循環方式持續掃描您的資料,以偵測遞增變更。這就是保持執行個體持續運作的重要原因。
您可以在磁碟區層級或資料庫模式層級啟用和停用掃描。
|
BlueXP classification不會對其可掃描的資料量施加限制。每個連接器支援掃描和顯示 500 TiB 的資料。要掃描超過 500 TiB 的數據,"安裝另一個連接器"然後"部署BlueXP classification的另一個實例"。 BlueXP UI 顯示來自單一連接器的資料。有關查看來自多個連接器的資料的提示,請參閱"使用多個連接器"。 |
對應掃描與分類掃描之間有何差異
您可以在 BlueXP 分類中執行兩種類型的掃描:
-
僅對應掃描 僅提供資料的高層級總覽,並在選定的資料來源上執行。僅映射掃描比映射和分類掃描花費的時間更少,因為它們不存取文件來查看其中的資料。您可能會想要先找出研究領域,然後在這些領域上執行地圖和分類掃描。
-
地圖與分類掃描 提供深入層級的資料掃描功能。
如需對應掃描與分類掃描之間差異的詳細資訊"對應掃描和分類掃描有何不同?",請參閱。
BlueXP 分類的資訊
BlueXP 分類會收集,建立類別索引,並將類別指派給下列資料:
-
* 檔案的標準中繼資料 * :檔案類型、檔案大小、建立及修改日期等。
-
* 個人資料 * :個人識別資訊( PII ),例如電子郵件地址,識別號碼或信用卡號碼, BlueXP 分類會使用檔案中的特定字詞,字串和模式來識別這些資訊。"深入瞭解個人資料"。
-
* 敏感個人資料 * :根據一般資料保護規範( GDPR )及其他隱私權規範的定義,特殊類型的敏感個人資訊( SPII ),例如健康資料,族裔來源或政治見解。"深入瞭解敏感的個人資料"。
-
* 類別 * : BlueXP 分類會將掃描的資料分成不同類別。類別是以 AI 分析每個檔案的內容和中繼資料為基礎的主題。"深入瞭解類別"。
-
* 類型 * : BlueXP 分類會取得掃描的資料,並依檔案類型加以細分。"深入瞭解類型"。
-
* 名稱實體辨識 * : BlueXP 分類使用 AI 從文件中擷取人員的自然名稱。"瞭解如何回應資料主體存取要求"。
網路總覽
BlueXP 分類可在雲端或內部部署單一伺服器或叢集、無論您選擇哪一種。伺服器透過標準傳輸協定連線至資料來源、並在Elasticsearch叢集中建立結果索引、該叢集也部署在相同的伺服器上。這可支援多雲端,跨雲端,私有雲和內部部署環境。
BlueXP 會使用安全性群組來部署 BlueXP 分類執行個體、以便從 Connector 執行個體進行傳入 HTTP 連線。
當您在 SaaS 模式中使用 BlueXP 時,會透過 HTTPS 提供 BlueXP 連線,而在瀏覽器和 BlueXP 分類執行個體之間傳送的私有資料則會使用 TLS 1.2 來保護端點對端加密,這表示 NetApp 和第三方無法讀取。
傳出規則已完全開啟。安裝和升級 BlueXP 分類軟體、以及傳送使用量指標、都需要網際網路存取。
如果您有嚴格的網路需求,請參閱"瞭解 BlueXP 分類所接觸的端點"。