使用NetApp Data Classification調查組織中儲存的數據
資料調查儀表板顯示文件和目錄層級的資料洞察,使您能夠對結果進行排序和過濾。數據調查頁面提供有關文件和目錄元數據和權限的見解以及識別重複文件。透過文件、目錄和資料庫層級的洞察,您可以採取措施來提高組織的合規性並節省儲存空間。資料調查頁面還支援移動、複製和刪除檔案。
|
|
要從調查頁面獲得見解,您必須對資料來源執行完整的分類掃描。僅進行過映射掃描的資料來源不會顯示檔案層級的詳細資訊。 |
資料調查結構
數據調查頁面將數據分類到三個選項卡:
-
非結構化資料:文件數據
-
目錄:資料夾和檔案共享
-
結構化:資料庫
數據過濾器
資料調查頁面提供了許多過濾器來對您的資料進行分類,以便您可以找到所需的資料。您可以同時使用多個過濾器。
若要新增過濾器,請選擇新增過濾器按鈕。

過濾敏感度和內容
使用以下過濾器查看您的資料包含多少敏感資訊。
| 篩選 | 細節 |
|---|---|
類別 |
選擇"類別類型"。 |
敏感度等級 |
選擇敏感度等級:個人、敏感個人或非敏感。 |
識別符數量 |
選擇每個檔案偵測到的敏感標識符的範圍。包括個人資料和敏感個人資料。在目錄中過濾時,資料分類會將每個資料夾(和子資料夾)中所有檔案的匹配結果匯總。注意:2023 年 12 月(版本 1.26.6)版本刪除了按目錄計算個人識別資訊 (PII) 資料數量的選項。 |
個人資料 |
選擇"個人資料的類型"。 |
敏感個人資訊 |
選擇"敏感個人資料的類型"。 |
資料主體 |
輸入資料主體的全名或已知標識符。"在此處了解有關數據主體的更多信息" 。 |
過濾使用者擁有者和使用者權限
使用下列過濾器查看文件擁有者和存取資料的權限。
| 篩選 | 細節 |
|---|---|
開放權限 |
選擇資料和資料夾/共享內的權限類型。 |
使用者/群組權限 |
選擇一個或多個使用者名稱和/或群組名,或輸入部分名稱。 |
文件所有者 |
輸入檔案所有者名稱。 |
有存取權限的使用者數 |
選擇一個或多個類別範圍以顯示哪些檔案和資料夾對一定數量的使用者開放。 |
按時間順序過濾
使用以下過濾器根據時間標準查看資料。
| 篩選 | 細節 |
|---|---|
創建時間 |
選擇文件建立的時間範圍。您也可以指定自訂時間範圍來進一步最佳化搜尋結果。 |
發現時間 |
選擇資料分類發現檔案的時間範圍。您也可以指定自訂時間範圍來進一步最佳化搜尋結果。 |
上次修改 |
選擇檔案最後修改的時間範圍。您也可以指定自訂時間範圍來進一步最佳化搜尋結果。 |
上次訪問 |
選擇檔案或目錄*上次被存取的時間範圍。您也可以指定自訂時間範圍來進一步最佳化搜尋結果。對於資料分類掃描的檔案類型,這是資料分類最後一次掃描該檔案的時間。 |
{星號} 目錄的上次存取時間僅適用於 NFS 或 CIFS 共用。
過濾元資料
使用下列篩選器根據位置、大小和目錄或檔案類型檢視資料。
| 篩選 | 細節 |
|---|---|
文件路徑 |
輸入最多 20 個要在查詢中包含或排除的部分或完整路徑。如果同時輸入包含路徑和排除路徑,資料分類會先在包含路徑中找到所有文件,然後從排除路徑中刪除文件,然後顯示結果。請注意,在此過濾器中使用“*”沒有任何效果,並且您無法從掃描中排除特定資料夾 - 配置共用下的所有目錄和檔案都將被掃描。 |
目錄類型 |
選擇目錄類型;“共享”或“資料夾”。 |
文件類型 |
選擇"文件類型"。 |
文件大小 |
選擇檔案大小範圍。 |
文件哈希 |
輸入文件的雜湊值即可找到特定文件,即使名稱不同。 |
過濾器儲存類型
使用以下過濾器按儲存類型查看資料。
| 篩選 | 細節 |
|---|---|
系統類型 |
選擇系統類型。 |
系統環境名稱 |
選擇特定係統。 |
儲存庫 |
選擇儲存庫,例如磁碟區或模式。 |
過濾查詢
使用下列篩選器按已儲存的查詢查看資料。
| 篩選 | 細節 |
|---|---|
已儲存的查詢 |
選擇一個或多個已儲存的查詢。前往"已儲存的查詢選項卡"查看現有已儲存查詢的清單並建立新查詢。 |
標籤 |
選擇"一個或多個標籤"分配給您的文件。 |
過濾分析狀態
使用以下過濾器按資料分類掃描狀態查看資料。
| 篩選 | 細節 |
|---|---|
分析狀態 |
選擇一個選項來顯示「等待首次掃描」、「已完成掃描」、「等待重新掃描」或「掃描失敗」的檔案清單。 |
掃描分析事件 |
選擇是否要查看由於資料分類無法恢復上次存取時間而未分類的文件,或即使資料分類無法恢復上次存取時間但已分類的文件。 |
"查看有關“上次訪問時間”時間戳的詳細信息"有關使用掃描分析事件進行過濾時調查頁面中出現的項目的詳細資訊。
按重複項過濾資料
使用以下過濾器查看儲存中重複的檔案。
| 篩選 | 細節 |
|---|---|
重複項 |
選擇檔案是否在儲存庫中重複。 |
查看檔案元數據
除了顯示文件所在的系統和磁碟區之外,元資料還顯示更多信息,包括文件權限、文件擁有者以及該文件是否有重複。如果您打算"建立已儲存的查詢"因為您可以看到可用於過濾資料的所有資訊。
資訊的可用性取決於資料來源。例如,資料庫檔案的磁碟區名稱和權限不共用。
-
從資料分類選單中,選擇*調查*。
-
在右側的資料調查清單中,選擇向下插入符號
在任意單一文件的右側查看文件元資料。
-
或者,您可以使用*建立標籤*按鈕為檔案建立或新增標籤。從下拉式選單中選擇一個現有標籤或使用 + 新增 按鈕新增一個新標籤。標籤可用於過濾資料。
查看檔案和目錄的使用者權限
若要查看有權存取檔案或目錄的所有使用者或群組的清單以及他們擁有的權限類型,請選擇「查看所有權限」。此選項僅適用於 CIFS 共享中的資料。
如果您使用安全性識別碼 (SID) 而不是使用者名稱和群組名,則應該將 Active Directory 整合到資料分類中。有關更多信息,請參閱"將 Active Directory 新增至資料分類" 。
-
從資料分類選單中,選擇*調查*。
-
在右側的資料調查清單中,選擇向下插入符號
在任意單一文件的右側查看文件元資料。 -
若要查看有權存取檔案或目錄的所有使用者或群組的清單以及他們擁有的權限類型,請在「開啟權限」欄位中選擇「查看所有權限」。
資料分類在清單中顯示最多 100 個使用者。 -
選擇向下插入符號
任何群組的按鈕即可查看屬於該群組的使用者清單。您可以展開該群組的某個層級來查看屬於該群組的使用者。 -
選擇使用者或群組的名稱以重新整理調查頁面,以便您可以看到該使用者或群組有權存取的所有檔案和目錄。
檢查儲存系統中的重複文件
您可以檢查儲存系統中是否儲存了重複的檔案。如果您想確定可以節省儲存空間的區域,這將非常有用。確保具有特定權限或敏感資訊的某些檔案不會在儲存系統中不必要地重複也是很好的。
您的所有文件(不包括資料庫)如果大小為 1 MB 或更大,或包含個人或敏感個人信息,都會被進行比較,以查看是否有重複。
資料分類使用雜湊技術來確定重複檔案。如果任何檔案與另一個檔案具有相同的雜湊碼,那麼您可以 100% 確定這些檔案是完全重複的 - 即使檔案名稱不同。
-
從資料分類選單中,選擇*調查*。
-
在「篩選器」窗格中,選擇「檔案大小」以及「重複」(「有重複」)以查看您的環境中哪些特定大小範圍的檔案是重複的。
-
或者,下載重複檔案的清單並將其發送給儲存管理員,以便他們可以決定可以刪除哪些檔案(如果有)。
-
您可以選擇刪除、標記或移動重複的檔案。選擇您想要執行操作的文件,然後選擇適當的操作。
查看特定檔案是否重複
您可以查看單一文件是否有重複。
-
從資料分類選單中,選擇*調查*。
-
在資料調查清單中,選擇
在任意單一文件的右側查看文件元資料。如果檔案存在重複,則此資訊將顯示在「Duplicates」欄位旁邊。
-
若要查看重複檔案的清單及其位置,請選擇「查看詳細資料」*。
-
在下一頁中選擇「查看重複項」以查看調查頁面中的文件。
-
您可以選擇刪除、標記或移動重複的檔案。選擇您想要執行操作的文件,然後選擇適當的操作。
|
|
您可以使用此頁面提供的「檔案雜湊」值並將其直接輸入到調查頁面中,以便隨時搜尋特定的重複檔案 - 或者您可以在已儲存的查詢中使用它。 |
下載您的報告
您可以以 CSV 或 JSON 格式下載過濾結果。
如果資料分類正在掃描檔案(非結構化資料)、目錄(資料夾和檔案共用)和資料庫(結構化資料),則最多可以下載三個報表檔案。
檔案被分割成具有固定行數或記錄數的檔案:
-
JSON:每份報告 100,000 筆記錄,產生大約需要 5 分鐘
-
CSV:每份報告 200,000 筆記錄,產生大約需要 4 分鐘
|
|
您可以下載 CSV 檔案的版本以在此瀏覽器中查看。此版本限制為 10,000 筆記錄。 |
可下載報告所包含的內容
*非結構化文件資料報告*包含有關您的文件的以下資訊:
-
檔案名稱
-
位置類型
-
系統名稱
-
儲存庫(例如,磁碟區、儲存桶、共用)
-
儲存庫類型
-
文件路徑
-
文件類型
-
文件大小(單位:MB)
-
創建時間
-
上次修改時間
-
上次訪問
-
文件所有者
-
設定 Active Directory 時,檔案擁有者資料包含帳戶名稱、SAM 帳戶名稱和電子郵件地址。
-
-
類別
-
個人資訊
-
敏感個人資訊
-
開放權限
-
掃描分析錯誤
-
刪除檢測日期
刪除檢測日期標識檔案被刪除或移動的日期。這使您能夠識別敏感文件何時被移動。已刪除的文件不會計入儀表板或調查頁面上顯示的文件數量。這些文件僅出現在 CSV 報告中。
*非結構化目錄資料報告*包括有關您的資料夾和檔案共享的以下資訊:
-
系統類型
-
系統名稱
-
目錄名稱
-
儲存庫(例如資料夾或檔案共用)
-
目錄所有者
-
創建時間
-
發現時間
-
上次修改時間
-
上次訪問
-
開放權限
-
目錄類型
*結構化資料報告*包含有關資料庫表的以下資訊:
-
資料庫表名稱
-
位置類型
-
系統名稱
-
儲存庫(例如,架構)
-
列數
-
行數
-
個人資訊
-
敏感個人資訊
-
從資料調查頁面中,選擇
頁面右上方的按鈕。 -
選擇報告類型:CSV 或 JSON。
-
輸入報告名稱。
-
若要下載完整的報告,請選擇系統,然後從對應的下拉式選單中選擇系統和磁碟區。提供目標資料夾路徑。
若要在瀏覽器中下載報告,請選擇本機。請注意,此選項將報表限制為前 10,000 行,並且僅限於 CSV 格式。如果您選擇本機,則無需填寫任何其他欄位。
-
選擇下載報告。

對話方塊中將顯示一則訊息,提示正在下載報告。
根據選定的篩選器建立已儲存的查詢
-
在調查標籤中,透過選擇要使用的篩選器來定義搜尋。看"在調查頁面中過濾數據"了解詳情。
-
一旦您根據自己的喜好設定了所有過濾器特性,請選擇*儲存查詢*。

-
為已儲存的查詢命名並新增描述。該名稱必須是唯一的。
-
您可以選擇將查詢儲存為策略:
-
若要將查詢儲存為策略,請切換*作為策略執行*開關。
-
選擇*永久刪除*或*發送電子郵件更新*。如果您選擇電子郵件更新,您可以每天、每週或每月透過電子郵件將查詢結果傳送給所有控制台使用者。或者,您可以以相同的頻率將通知傳送到特定的電子郵件地址。
-
-
選擇*儲存*。

建立搜尋或策略後,您可以在已儲存的查詢標籤中查看它。
|
|
結果可能需要最多 15 分鐘才會顯示在「已儲存的查詢」頁面上。 |