Skip to main content
BlueXP classification
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

在 BlueXP 分類掃描中新增個人資料識別碼

貢獻者

BlueXP 分類提供許多方法、讓您新增自訂的「個人資料」清單、 BlueXP 分類將在未來掃描中識別、讓您完整瞭解可能敏感資料位於組織檔案的位置。

  • 注意 * 此資訊僅適用於 BlueXP 分類舊版 1.30 及更早版本。

  • 您可以根據所掃描的資料庫中的特定欄位來新增唯一識別碼。

  • 您可以從文字檔新增自訂關鍵字、這些文字會在您的資料中識別。

  • 您可以使用規則運算式(regex)新增個人模式、將regex新增至現有的預先定義模式。

  • 您可以新增自訂類別、以識別資料中的特定資訊類別。

所有語言均支援所有這些新增自訂掃描準則的機制。

註 本節所述的功能僅在您選擇對資料來源執行完整分類掃描時可用。只有對應掃描的資料來源不會顯示檔案層級的詳細資料。

從資料庫新增自訂的個人資料識別碼

我們稱為「Data Fusion SURE__」的功能可讓您掃描貴組織的資料、找出資料庫中的唯一識別碼是否存在於任何其他資料來源。您可以在資料庫表格中選取特定欄或欄、以選擇 BlueXP 分類在其掃描中尋找的其他識別碼。例如、下圖顯示 Fusion 如何使用資料功能來掃描您的磁碟區、儲存庫和資料庫、找出 Oracle 資料庫中所有客戶 ID 的出現情形。

圖表顯示如何使用資料庫的內容做為來源、以識別包含相同資料的檔案。

如您所見、在兩個磁碟區和一個 S3 儲存區中找到兩個獨特的客戶 ID 。也會識別資料庫表格中的任何相符項目。

請注意、由於您正在掃描自己的資料庫、因此在未來的 BlueXP 分類掃描中、無論資料儲存在哪種語言、都會用來識別資料。

步驟

您必須擁有 "新增至少一個資料庫伺服器" 至 BlueXP 分類、然後再新增資料 Fusion 來源。

  1. 在「組態」頁面中、按一Fusion 下來源資料所在資料庫中的*管理Data S還原*。

    選取「管理資料 Fusion 」按鈕以新增來源欄的快照。

  2. 在下 Fusion 一頁按一下 * 「 Add Data Source" (新增資料來源) * 。

  3. 在 _ 新增資料 Fusion 來源 _ 頁面:

    1. 從下拉式功能表中選取資料庫架構。

    2. 在該架構中輸入表格名稱。

    3. 輸入含有您要使用之唯一識別碼的欄或欄。

      新增多個欄時、請在個別行中輸入每個欄名稱或表格檢視名稱。

    識別資料 Fusion 來源的架構、表格和欄的快照。

  4. 按一下「 * 新增資料 Fusion 來源 * 」。

    您已設定資料 Fusion 功能的所有資料來源參考資料的快照。

結果

下次掃描後、結果會將此新資訊納入「法規遵循儀表板」的「個人結果」區段、以及「個人資料」篩選器的「調查」頁面。例如、您用於分類器的名稱會出現在篩選器清單中 Customers.CustomerID

「Fusion 調查結果」窗格中顯示資料實例的快照。

刪除資料Fusion 來源

如果您在某個時候決定不使用特定的資料 Fusion 來源來掃描檔案、您可以從「資料 Fusion 」清單頁面中選取來源列、然後按一下「 * 刪除資料 Fusion 來源 * 」。

顯示如何移除資料 Fusion 的快照來源。

從字詞清單新增自訂關鍵字

您可以將自訂關鍵字新增至 BlueXP 分類、以便識別在資料中找到該資訊的位置。只要輸入您想要 BlueXP 分類辨識的每個字詞、即可新增關鍵字。關鍵字會新增至 BlueXP 分類已使用的現有預先定義關鍵字、結果會顯示在「個人模式」區段下方。

例如、您可能想要查看所有檔案中提及內部產品名稱的位置、以確保這些名稱在不安全的位置無法存取。

更新自訂關鍵字之後、 BlueXP 分類將重新開始掃描所有資料來源。掃描完成後、新結果將會顯示在 BlueXP 分類法規遵循儀表板的「個人結果」區段下方、以及「個人資料」篩選器的「調查」頁面中。

步驟
  1. 從「Classification settings」(_分類設定)索引標籤中、按一下「* Add New Classifier*」(新增分類器)以啟動「_Add Custom Classifier.

    顯示如何啟動「新增自訂類別器」精靈的快照。

  2. 在_選取類型_頁面中、輸入類別器的名稱、提供簡短說明、選取*個人識別符號*、然後按*下一步*。

    您輸入的名稱會顯示在 BlueXP 分類 UI 中、做為符合分類器需求的掃描檔案標題、並顯示為「調查」頁面中的篩選名稱。

    您也可以勾選「遮罩系統中偵測到的結果」方塊、使完整結果不會出現在UI中。例如、您可能想要隱藏完整的信用卡號碼或類似的個人資料(遮罩會出現在UI中、如下所示:「通過:[、通過:[、通過:[、*、3434)。

    顯示如何命名類別器並選取類別器類型的快照。

  3. 在「選取資料分析工具」頁面中、選取*自訂關鍵字*做為定義類別器的方法、然後按一下*下一步*。

    螢幕擷取畫面會顯示選擇自訂關鍵字做為 BlueXP 分類工具、用於建立模式。

  4. 在_建立邏輯_頁面中、輸入您要辨識的關鍵字-每個字位於一行、然後按一下*驗證*。

    以下螢幕快照顯示內部產品名稱(不同類型的貓頭鷹)。這些項目的 BlueXP 分類搜尋不區分大小寫。

    輸入自訂類別器關鍵字的螢幕擷取畫面。

  5. 按一下 * 完成 * 、 BlueXP 分類就會開始重新掃描您的資料。

結果

掃描完成後、結果會將此新資訊納入「法規遵循儀表板」的「個人結果」區段下方、以及「個人資料」篩選器的「調查」頁面。

在「調查結果」窗格中顯示自訂關鍵字範例的快照。

如您所見、分類器的名稱會用作「個人結果」面板中的名稱。如此一來、您就能啟動許多不同的關鍵字群組、並查看每個群組的結果。

使用regex新增自訂的個人資料識別碼

您可以使用自訂規則運算式(regex)新增個人模式、以識別資料中的特定資訊。這可讓您建立新的自訂regex、以識別系統中尚未存在的新個人資訊元素。regex 會新增至 BlueXP 分類已使用的現有預先定義模式、結果會顯示在「個人模式」區段下方。

例如、您可能想要查看所有檔案中提及內部產品ID的位置。例如、如果產品ID的結構清楚明確、12位數的編號從201開始、您可以使用自訂的regex功能在檔案中搜尋。此範例的規則運算式為*\b201\d{9}\b*。

新增 regex 之後、 BlueXP 分類將重新開始掃描所有資料來源。掃描完成後、新結果將會顯示在 BlueXP 分類法規遵循儀表板的「個人結果」區段下方、以及「個人資料」篩選器的「調查」頁面中。

如果您需要建置規則運算式的協助、請參閱 "規則運算式 101."。選擇 Python 以查看結果類型 BlueXP 分類將與規則運算式相符。。 "Python Regex 測試器頁面" 也可透過顯示圖樣的圖形表示方式來使用。

註 目前我們不允許在建立 regex 時使用模式旗標、這表示您不應該使用「 / 」。
步驟
  1. 從「Classification settings」(_分類設定)索引標籤中、按一下「* Add New Classifier*」(新增分類器)以啟動「_Add Custom Classifier.

    顯示如何啟動「新增自訂類別器」精靈的快照。

  2. 在_選取類型_頁面中、輸入類別器的名稱、提供簡短說明、選取*個人識別符號*、然後按*下一步*。

    您輸入的名稱會顯示在 BlueXP 分類 UI 中、做為符合分類器需求的掃描檔案標題、並顯示為「調查」頁面中的篩選名稱。您也可以勾選「遮罩系統中偵測到的結果」方塊、使完整結果不會出現在UI中。例如、您可能想要隱藏完整的信用卡號碼或類似的個人資料。

    顯示如何命名類別器並選取類別器類型的快照。

  3. 在「選取資料分析工具」頁面中、選取*自訂規則運算式*做為定義類別器的方法、然後按一下*下一步*。

    顯示「自訂規則運算式」選項的螢幕擷取畫面、以作為 BlueXP 分類用來建置模式的工具。

  4. 在_建立邏輯_頁面中、輸入規則運算式和任何鄰近字詞、然後按一下*完成*。

    1. 您可以輸入任何合法的規則運算式。按一下「 * 驗證 * 」按鈕、讓 BlueXP 分類驗證規則運算式是否有效、且其範圍不太廣、表示它會傳回太多結果。

    2. 您也可以輸入一些鄰近詞彙、以協助精簡結果的準確度。這些詞彙通常會在您要搜尋的模式300個字元內找到(在找到的模式之前或之後)。在單獨一行輸入每個字詞或片語。

      輸入自訂類別器的 regex 和鄰近字詞的螢幕擷取畫面。

結果

新增分類器、 BlueXP 分類開始重新掃描所有資料來源。您會回到「自訂類別器」頁面、在其中可以檢視符合新類別器的檔案數量。掃描所有資料來源所產生的結果、將會花費一些時間、視需要掃描的檔案數量而定。

快照顯示在掃描進行中新增至系統的新regex類別器結果。

新增自訂類別

BlueXP 分類會將它掃描的資料分成不同類型的類別。類別是以人工智慧分析每個檔案的內容和中繼資料為基礎的主題。 "請參閱預先定義類別清單"

類別可顯示您擁有的資訊類型、協助您瞭解資料的現況。例如、像是_恢復_或_員工合約_的類別可能包含敏感資料。調查結果時、您可能會發現員工合約儲存在不安全的位置。然後您就可以修正該問題。

您可以將自訂類別新增至 BlueXP 分類、以便識別資料資產中唯一的資訊類別。您可以建立「訓練」檔案來新增每個類別、其中包含您要識別的資料類別、然後讓 BlueXP 分類掃描這些檔案、透過 AI 「學習」、以便識別資料來源中的資料。這些類別會新增至 BlueXP 分類已識別的現有預先定義類別、結果會顯示在「類別」區段下方。

例如、您可能想要查看.gz格式的壓縮安裝檔案在檔案中的位置、以便視需要加以移除。

更新自訂類別之後、 BlueXP 分類將重新開始掃描所有資料來源。掃描完成後、新結果將會顯示在 BlueXP 分類規範儀表板的「類別」區段下方、以及「類別」篩選器的「調查」頁面中。 "瞭解如何依類別檢視檔案"

您需要的產品

您至少需要建立 25 個訓練檔案、其中包含您希望 BlueXP 分類識別的資料類別範例。支援下列檔案類型:

.CSV, .DOC, .DOCX, .GZ, .JSON, .PDF, .PPTX, .RTF, .TXT, .XLS, .XLSX, Docs, Sheets, and Slides

檔案必須至少為 100 位元組、而且必須位於 BlueXP 分類可存取的資料夾中。

步驟
  1. 從「Classification settings」(_分類設定)索引標籤中、按一下「* Add New Classifier*」(新增分類器)以啟動「_Add Custom Classifier.

    顯示如何啟動「新增自訂類別器」精靈的快照。

  2. 在_選取類型_頁面中、輸入類別器的名稱、提供簡短說明、選取*類別*、然後按*下一步*。

    您輸入的名稱會顯示在 BlueXP 分類 UI 中、做為符合您定義之資料類別的掃描檔案標題、以及「調查」頁面中的篩選名稱。

    顯示如何命名類別器並選取類別器類型的快照。

  3. 在_建立邏輯_頁面中、確定您已準備好學習檔案、然後按一下*選取檔案*。

    「建立邏輯」頁面的螢幕擷取畫面、您可以在其中新增包含您想要 BlueXP 分類學習之資料的檔案。

  4. 輸入磁碟區的IP位址、以及訓練檔案所在的路徑、然後按一下*「Add*(新增*)」。

    顯示如何輸入訓練檔案位置的快照。

  5. 驗證 BlueXP 分類是否能識別訓練檔案。按一下* x*以移除任何不符合要求的訓練檔案。然後按一下「完成」。

    顯示 BlueXP 分類將用作定義新類別的訓練檔案的檔案擷取畫面。

結果

新類別是根據訓練檔案所定義、並新增至 BlueXP 分類。然後 BlueXP 分類會開始重新掃描所有資料來源、以識別符合此新類別的檔案。您會返回「自訂分類器」頁面、在其中可以檢視符合新類別的檔案數量。掃描所有資料來源所產生的結果、將會花費一些時間、視需要掃描的檔案數量而定。

檢視自訂分類器的結果

您可以在"規範儀表板"和"調查"頁面中檢視任何自訂類別器的結果。例如、此螢幕擷取畫面會在「個人結果」區段的「法規遵循儀表板」中顯示相符的資訊。

在「調查結果」窗格中顯示自訂regex結果範例的快照。

按一下 使用箭頭畫圓 按鈕、可在「調查」頁面中查看詳細結果。

此外、您的所有自訂類別器結果都會顯示在「自訂類別器」索引標籤中、前6個自訂類別器結果則會顯示在「符合性儀表板」中、如下所示。

根據傳回的結果顯示前3大自訂分類器的快照。

管理自訂分類器

您可以使用*編輯分類器*按鈕來變更您所建立的任何自訂分類器。

提示 您目前無法編輯 Data Fusion 分類器。

如果您稍後決定不需要 BlueXP 分類來識別您新增的自訂模式、您可以使用 * 刪除分類器 * 按鈕來移除每個項目。

「自訂類別器」頁面的快照、其中包含用於編輯和刪除類別器的按鈕。