Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

BlueXP 분류에 대해 알아보십시오

기여자

BlueXP 분류는 회사의 온프레미스 및 클라우드 데이터 소스를 검사하여 데이터를 매핑 및 분류하고 개인 정보를 식별하는 BlueXP용 데이터 거버넌스 서비스입니다. 따라서 보안 및 규정 준수 위험을 줄이고 스토리지 비용을 절감하며 데이터 마이그레이션 프로젝트를 지원할 수 있습니다.

피처

BlueXP 분류에서는 인공 지능(AI), 자연어 처리(NLP) 및 머신 러닝(ML)을 사용하여 엔터티를 추출하고 그에 따라 콘텐츠를 범주화하기 위해 검색하는 콘텐츠를 파악합니다. 이를 통해 BlueXP 분류는 다음과 같은 기능 영역을 제공할 수 있습니다.

규정 준수 유지

BlueXP 분류는 규정 준수 노력에 도움이 되는 여러 가지 도구를 제공합니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

  • 개인 식별 정보(PII)를 식별합니다.

  • GDPR, CCPA, PCI 및 HIPAA 개인 정보 보호 규정에서 요구하는 광범위한 민감한 개인 정보를 식별합니다.

  • 이름 또는 이메일 주소를 기반으로 Data Subject Access Request(SAR)에 응답합니다.

  • 데이터베이스의 고유 식별자가 다른 저장소의 파일에 있는지 확인합니다. 기본적으로 BlueXP 분류 검사에서 식별된 "개인 데이터" 목록을 만듭니다.

  • 파일에 특정 PII가 포함된 경우 이메일을 통해 특정 사용자에게 알립니다(을 사용하여 이 기준을 정의합니다 "정책") 따라서 실천 계획을 결정할 수 있습니다.

보안 강화

BlueXP 분류는 범죄 목적으로 액세스할 위험이 있는 데이터를 식별할 수 있습니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

  • 전체 조직 또는 공용 에 노출된 공개 권한으로 모든 파일 및 디렉터리(공유 및 폴더)를 식별합니다.

  • 초기 전용 위치 외부에 상주하는 중요한 데이터를 식별합니다.

  • 데이터 보존 정책 준수

  • 정책 _ 을(를) 사용하여 보안 직원에게 새 보안 문제를 자동으로 통지하여 즉시 조치를 취할 수 있습니다.

  • 파일에 사용자 지정 태그(예: "이동해야 함")를 추가하고 BlueXP 사용자를 할당하여 사용자가 파일 업데이트를 소유할 수 있도록 합니다.

  • 보고 수정합니다 "AIP(Azure Information Protection) 레이블" 파일을 선택합니다.

스토리지 사용을 최적화합니다

BlueXP 분류는 스토리지 TCO(총 소유 비용)에 도움이 되는 도구를 제공합니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

데이터 마이그레이션을 가속화

BlueXP 분류는 퍼블릭 또는 프라이빗 클라우드로 마이그레이션하기 전에 사내 데이터를 검사하는 데 사용할 수 있습니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

  • 데이터를 이동하기 전에 데이터의 크기와 데이터에 중요한 정보가 포함되어 있는지 여부를 확인합니다.

  • 필요한 파일만 대상으로 이동할 수 있도록 소스 데이터(25가지 이상의 조건 유형 기준)를 필터링합니다. 불필요한 데이터는 이동하지 않습니다.

  • 필요한 데이터만 클라우드 저장소로 자동, 복사 또는 동기화합니다.

지원되는 데이터 소스

BlueXP 분류는 다음과 같은 유형의 데이터 소스에서 정형 데이터와 비정형 데이터를 스캔 및 분석할 수 있습니다.

  • NetApp: *

  • Cloud Volumes ONTAP(AWS, Azure 또는 GCP에 구축)

  • 온프레미스 ONTAP 클러스터

  • StorageGRID

  • Azure NetApp Files

  • ONTAP용 Amazon FSx

  • Google Cloud용 Cloud Volumes Service

  • 비 NetApp: *

  • Dell EMC Isilon

  • Pure Storage 비교

  • 말씀해 주십시오

  • 기타 스토리지 공급업체

  • 클라우드: *

  • Amazon S3

  • Google 클라우드 스토리지

  • OneDrive 를 클릭합니다

  • SharePoint Online을 클릭합니다

  • SharePoint 사내(SharePoint Server)

  • Google 드라이브

  • 데이터베이스: *

  • Amazon Relational Database Service(Amazon RDS)

  • MongoDB

  • MySQL

  • 오라클

  • PostgreSQL

  • SAP HANA를 참조하십시오

  • SQL Server(MSSQL)

BlueXP 분류는 NFS 버전 3.x, 4.0, 4.1 및 CIFS 버전 1.x, 2.0, 2.1 및 3.0을 지원합니다.

비용

  • BlueXP 분류 사용 비용은 스캔 중인 데이터의 양에 따라 달라집니다. BlueXP 작업 공간에서 BlueXP 분류 검사를 수행하는 첫 1TB의 데이터는 30일간 무료로 제공됩니다. 여기에는 모든 작업 환경 및 데이터 소스의 모든 데이터가 포함됩니다. AWS, Azure 또는 GCP Marketplace에 대한 가입 또는 NetApp의 BYOL 라이센스를 구입해야 하며, 이후 계속해서 데이터를 스캔할 수 있습니다. 을 참조하십시오 "가격" 를 참조하십시오.

  • 클라우드에 BlueXP 분류를 설치하려면 클라우드 인스턴스를 배포해야 하므로 클라우드 인스턴스가 배포된 클라우드 공급자가 비용을 부담합니다. 을 참조하십시오 각 클라우드 공급자에 대해 구축된 인스턴스 유형입니다. BlueXP 분류를 사내 시스템에 설치하면 비용이 들지 않습니다.

  • BlueXP 분류에서는 BlueXP 커넥터를 배포해야 합니다. BlueXP에서 사용 중인 다른 스토리지 및 서비스로 인해 이미 커넥터가 있는 경우가 많습니다. Connector 인스턴스를 사용하면 배포된 클라우드 공급자가 비용을 청구합니다. 를 참조하십시오 "각 클라우드 공급자에 대해 구축된 인스턴스 유형입니다". 커넥터를 온프레미스 시스템에 설치하는 경우 비용이 들지 않습니다.

데이터 전송 비용

데이터 전송 비용은 설정에 따라 다릅니다. BlueXP 분류 인스턴스 및 데이터 소스가 동일한 가용성 영역 및 지역에 있는 경우 데이터 전송 비용이 발생하지 않습니다. 하지만 Cloud Volumes ONTAP 시스템 또는 S3 버킷과 같은 데이터 소스가 _different_Availability Zone 또는 지역에 있는 경우 클라우드 공급자가 데이터 전송 비용을 청구합니다. 자세한 내용은 다음 링크를 참조하십시오.

BlueXP 분류 인스턴스입니다

BlueXP 분류를 클라우드에 배포하면 BlueXP는 Connector와 동일한 서브넷에 인스턴스를 배포합니다. "커넥터에 대해 자세히 알아보십시오."

클라우드 공급자에서 실행되는 BlueXP 인스턴스 및 BlueXP 분류 인스턴스를 보여 주는 다이어그램입니다.

기본 인스턴스에 대한 다음 사항에 유의하십시오.

  • AWS에서 BlueXP 분류는 에서 실행됩니다 "m6i.4xLarge 인스턴스" 500GiB GP2 디스크 사용. 운영 체제 이미지는 Amazon Linux 2입니다. AWS에 구축할 경우 소량의 데이터를 스캔할 경우 더 작은 인스턴스 크기를 선택할 수 있습니다.

  • Azure에서 BlueXP 분류는 에서 실행됩니다 "standard_d16s_v3 vm" 500GiB 디스크 사용 운영 체제 이미지는 CentOS 7.9입니다.

  • GCP에서 BlueXP 분류는 에서 실행됩니다 "N2-표준-16 VM" 500GiB 표준 영구 디스크 사용 운영 체제 이미지는 CentOS 7.9입니다.

  • 기본 인스턴스를 사용할 수 없는 지역에서는 대체 인스턴스에서 BlueXP 분류가 실행됩니다. "대체 인스턴스 유형을 참조하십시오".

  • 인스턴스의 이름은 CloudCompliance_이며 생성된 해시(UUID)와 연결됩니다. 예: _CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7

  • Connector당 하나의 BlueXP 분류 인스턴스만 배포됩니다.

BlueXP 분류를 사내 Linux 호스트 또는 선호하는 클라우드 공급업체의 호스트에 배포할 수도 있습니다. 선택한 설치 방법에 관계없이 소프트웨어가 정확히 같은 방식으로 작동합니다. 인스턴스에 인터넷 액세스가 가능한 한 BlueXP 분류 소프트웨어의 업그레이드는 자동으로 수행됩니다.

팁 BlueXP 분류는 지속적으로 데이터를 검사하기 때문에 인스턴스가 항상 실행 상태를 유지해야 합니다.

더 작은 인스턴스 유형 사용

CPU가 적고 RAM이 적은 시스템에 BlueXP 분류를 배포할 수 있지만 이러한 덜 강력한 시스템을 사용할 때는 몇 가지 제약이 있습니다.

시스템 크기 사양 제한 사항

매우 크게

32개의 CPU, 128GB RAM, 1TiB SSD

최대 5억 개의 파일을 스캔할 수 있습니다.

크게(기본값)

CPU 16개, 64GB RAM, 500GiB SSD

최대 2억 5천만 개의 파일을 스캔할 수 있습니다.

중간

CPU 8개, 32GB RAM, 200GiB SSD

스캔 속도가 느리며 최대 100만 개의 파일만 스캔할 수 있습니다.

작은 크기

CPU 8개, 16GB RAM, 100GiB SSD

"중간"과 동일한 제한 사항과 식별 기능을 제공합니다 "데이터 주체 이름" 내부 파일이 비활성화되었습니다.

AWS의 클라우드에 BlueXP 분류를 배포할 때 대규모/중간/소규모 인스턴스를 선택할 수 있습니다. Azure 또는 GCP에서 BlueXP 분류를 구축할 때 이러한 대체 시스템 중 하나를 사용하려면 ng-contact-data-sense@netapp.com 으로 이메일을 보내 지원을 요청하십시오. 이러한 다른 클라우드 구성을 배포하려면 고객과 협력해야 합니다.

BlueXP 분류를 온프레미스에 구축할 경우 대체 사양이 있는 Linux 호스트를 사용하면 됩니다. NetApp에 지원을 요청할 필요가 없습니다.

BlueXP 분류의 작동 방식

BlueXP 분류는 다음과 같이 작동합니다.

  1. BlueXP에서 BlueXP 분류 인스턴스를 배포합니다.

  2. 하나 이상의 데이터 소스에서 고급 매핑 또는 심층 스캔을 활성화할 수 있습니다.

  3. BlueXP 분류는 AI 학습 프로세스를 사용하여 데이터를 스캔합니다.

  4. 제공된 대시보드 및 보고 도구를 사용하여 규정 준수 및 거버넌스 작업에 도움을 줄 수 있습니다.

스캔 작동 방식

BlueXP 분류를 활성화하고 스캔할 저장소(볼륨, 버킷, 데이터베이스 스키마 또는 OneDrive 또는 SharePoint 사용자 데이터)를 선택하면 즉시 데이터 스캔이 시작되어 개인 및 중요 데이터를 식별합니다. 대부분의 경우 백업, 미러 또는 DR 사이트 대신 라이브 운영 데이터를 검사하는 데 집중해야 합니다. 그런 다음 BlueXP 분류를 통해 조직 데이터를 매핑하고, 각 파일을 분류하고, 데이터에서 엔터티와 미리 정의된 패턴을 식별하고 추출합니다. 검사 결과는 개인 정보, 민감한 개인 정보, 데이터 범주 및 파일 형식의 인덱스입니다.

BlueXP 분류는 NFS 및 CIFS 볼륨을 마운트하여 다른 클라이언트와 마찬가지로 데이터에 연결됩니다. CIFS 볼륨을 스캔하려면 Active Directory 자격 증명을 제공해야 하지만 NFS 볼륨은 읽기 전용으로 자동 액세스됩니다.

클라우드 공급자에서 실행되는 BlueXP 인스턴스 및 BlueXP 분류 인스턴스를 보여 주는 다이어그램입니다. BlueXP 분류 인스턴스는 NFS 및 CIFS 볼륨, S3 버킷, OneDrive 계정 및 데이터베이스에 연결하여 검색합니다.

초기 검사 후 BlueXP 분류는 라운드 로빈 방식으로 데이터를 지속적으로 스캔하여 증분 변경을 감지합니다. 이렇게 했다면 인스턴스를 계속 실행하는 것이 중요합니다.

볼륨 수준, 버킷 수준, 데이터베이스 스키마 수준, OneDrive 사용자 수준 및 SharePoint 사이트 수준에서 스캔을 활성화 및 비활성화할 수 있습니다.

매핑 스캔과 분류 스캔의 차이점은 무엇입니까

BlueXP 분류를 통해 선택한 데이터 소스에서 일반적인 "매핑" 스캔을 실행할 수 있습니다. 매핑은 데이터에 대한 상위 수준의 개요만 제공하는 반면 분류는 데이터에 대한 세부 수준의 스캐닝을 제공합니다. 내부 데이터를 보기 위해 파일에 액세스하지 않기 때문에 데이터 소스에서 매핑을 매우 빠르게 수행할 수 있습니다.

많은 사용자가 데이터를 신속하게 스캔하여 더 많은 연구가 필요한 데이터 소스를 식별하려고 하므로 이 기능을 좋아하고, 그런 다음 필요한 데이터 소스 또는 볼륨에서만 분류 검사를 활성화할 수 있습니다.

아래 표에는 몇 가지 차이점이 나와 있습니다.

피처 분류 매핑

스캔 속도

느림

빠릅니다

파일 유형 및 사용된 용량 목록입니다

파일 수 및 사용된 용량입니다

파일의 수명 및 크기

을 실행하는 기능 "데이터 매핑 보고서"

파일 세부 정보를 보려면 데이터 조사 페이지 를 참조하십시오

아니요

파일 내에서 이름을 검색합니다

아니요

생성 "정책" 맞춤형 검색 결과를 제공합니다

아니요

AIP 레이블 및 상태 태그를 사용하여 데이터를 분류합니다

아니요

원본 파일을 복사, 삭제 및 이동합니다

아니요

다른 보고서를 실행할 수 있습니다

아니요

BlueXP 분류 스캔 데이터의 속도

스캔 속도는 네트워크 지연 시간, 디스크 지연 시간, 네트워크 대역폭, 환경 크기 및 파일 배포 크기의 영향을 받습니다.

  • 매핑 스캔을 수행할 때 BlueXP 분류는 스캐너 노드당 하루에 100-150GB의 데이터를 스캔할 수 있습니다.

  • 분류 스캔을 수행할 때 BlueXP 분류는 스캐너 노드당 하루에 15-40개의 BB 데이터를 스캔할 수 있습니다.

BlueXP 분류 색인에 대한 정보

BlueXP 분류는 데이터(파일)에 범주를 수집, 색인 및 할당합니다. BlueXP 분류 인덱스의 데이터는 다음과 같습니다.

표준 메타데이터

BlueXP 분류는 파일 유형, 크기, 생성 및 수정 날짜 등의 파일에 대한 표준 메타데이터를 수집합니다.

개인 데이터

이메일 주소, 식별 번호 또는 신용 카드 번호와 같은 개인 식별 정보 "개인 데이터에 대해 자세히 알아보십시오".

민감한 개인 데이터

GDPR 및 기타 개인 정보 보호 규정에 정의된 의료 데이터, 인종 또는 정치적 의견과 같은 민감한 정보의 특별한 유형. "중요한 개인 데이터에 대해 자세히 알아보십시오".

범주

BlueXP 분류는 스캔한 데이터를 다른 유형의 범주로 나눕니다. 범주는 각 파일의 콘텐츠 및 메타데이터에 대한 AI 분석을 기반으로 하는 주제입니다. "범주에 대해 자세히 알아보십시오".

유형

BlueXP 분류는 스캔한 데이터를 파일 유형별로 분류하여 표시합니다. "유형에 대해 자세히 알아보십시오".

이름 요소 인식

BlueXP 분류에서는 AI를 사용하여 문서에서 자연인의 이름을 추출합니다. "데이터 주체 액세스 요청에 응답하는 방법에 대해 알아봅니다".

네트워킹 개요

BlueXP는 Connector 인스턴스의 인바운드 HTTP 연결을 활성화하는 보안 그룹과 함께 BlueXP 분류 인스턴스를 배포합니다.

SaaS 모드에서 BlueXP에 연결할 때 HTTPS를 통해 BlueXP에 연결되며 브라우저와 BlueXP 분류 인스턴스 간에 전송되는 프라이빗 데이터는 TLS 1.2를 사용하는 엔드 투 엔드 암호화로 보안이 유지됩니다. 즉, NetApp과 타사가 이 데이터를 읽을 수 없습니다.

아웃바운드 규칙은 완전히 열립니다. BlueXP 분류 소프트웨어를 설치 및 업그레이드하고 사용 지표를 전송하려면 인터넷 액세스가 필요합니다.

규정 준수 정보에 대한 사용자 액세스

각 사용자에게 할당된 역할은 BlueXP와 BlueXP 분류 내에서 서로 다른 기능을 제공합니다.

  • 계정 관리자 * 는 규정 준수 설정을 관리하고 모든 작업 환경에 대한 규정 준수 정보를 볼 수 있습니다.

  • Workspace Admin * 은 액세스 권한이 있는 시스템에 대해서만 준수 설정을 관리하고 준수 정보를 볼 수 있습니다. 작업 영역 관리자가 BlueXP의 작업 환경에 액세스할 수 없는 경우 BlueXP 분류 탭에서 작업 환경에 대한 규정 준수 정보를 볼 수 없습니다.

  • Compliance Viewer * 역할의 사용자는 규정 준수 정보를 보고 액세스 권한이 있는 시스템에 대한 보고서만 생성할 수 있습니다. 이러한 사용자는 볼륨, 버킷 또는 데이터베이스 스키마 스캔을 활성화/비활성화할 수 없습니다. 이러한 사용자는 파일을 복사, 이동 또는 삭제할 수 없습니다.