Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

BlueXP 분류에 대해 알아보십시오

기여자

BlueXP 분류(Cloud Data Sense)는 기업의 온프레미스 및 클라우드 데이터 소스를 검사하여 데이터를 매핑 및 분류하고 프라이빗 정보를 식별하는 BlueXP용 데이터 거버넌스 서비스입니다. 따라서 보안 및 규정 준수 위험을 줄이고 스토리지 비용을 절감하며 데이터 마이그레이션 프로젝트를 지원할 수 있습니다.

중요

2024년 5월 버전 1.31부터 BlueXP 분류를 추가 비용 없이 BlueXP 내에서 핵심 기능으로 사용할 수 있습니다. 분류 라이선스 또는 가입이 필요하지 않습니다. NetApp 스토리지 시스템에서의 BlueXP 분류 기능도 중점적으로 다루므로 사용되지 않거나 활용도가 낮은 일부 기능은 더 이상 사용되지 않습니다.

1.30 이전 버전을 사용한 사용자는 구독이 만료될 때까지 해당 버전을 계속 사용할 수 있습니다.

피처

BlueXP 분류에서는 인공 지능(AI), 자연어 처리(NLP) 및 머신 러닝(ML)을 사용하여 엔터티를 추출하고 그에 따라 콘텐츠를 범주화하기 위해 검색하는 콘텐츠를 파악합니다. 이를 통해 BlueXP 분류는 다음과 같은 기능 영역을 제공할 수 있습니다.

규정 준수 유지

BlueXP 분류는 규정 준수 노력에 도움이 되는 여러 가지 도구를 제공합니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

  • 개인 식별 정보(PII)를 식별합니다.

  • GDPR, CCPA, PCI 및 HIPAA 개인 정보 보호 규정에서 요구하는 광범위한 민감한 개인 정보를 식별합니다.

  • 이름 또는 이메일 주소를 기반으로 Data Subject Access Request(SAR)에 응답합니다.

보안 강화

BlueXP 분류는 범죄 목적으로 액세스할 위험이 있는 데이터를 식별할 수 있습니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

  • 전체 조직 또는 공용 에 노출된 공개 권한으로 모든 파일 및 디렉터리(공유 및 폴더)를 식별합니다.

  • 초기 전용 위치 외부에 상주하는 중요한 데이터를 식별합니다.

  • 데이터 보존 정책 준수

  • 보안 담당자가 즉시 조치를 취할 수 있도록 새 보안 문제를 자동으로 감지하려면 _Policies_를 사용하십시오.

스토리지 사용을 최적화합니다

BlueXP 분류는 스토리지 TCO(총 소유 비용)에 도움이 되는 도구를 제공합니다. BlueXP 분류를 사용하여 다음을 수행할 수 있습니다.

지원되는 작업 환경 및 데이터 소스

BlueXP 분류를 통해 다음과 같은 유형의 작업 환경 및 데이터 소스에서 정형 및 비정형 데이터를 스캔하고 분석할 수 있습니다.

  • 작업 환경 *

  • Cloud Volumes ONTAP(AWS, Azure 또는 GCP에 구축)

  • 온프레미스 ONTAP 클러스터

  • Azure NetApp Files

  • ONTAP용 Amazon FSx

  • Google Cloud NetApp 볼륨

  • 데이터 소스 *

  • NetApp 파일 공유

  • 데이터베이스:

    • Amazon Relational Database Service(Amazon RDS)

    • MongoDB

    • MySQL

    • 오라클

    • PostgreSQL

    • SAP HANA를 참조하십시오

    • SQL Server(MSSQL)

BlueXP 분류는 NFS 버전 3.x와 CIFS 버전 1.x, 2.0, 2.1 및 3.0을 지원합니다.

비용

BlueXP 분류를 무료로 사용할 수 있습니다. 분류 라이선스 또는 유료 가입이 필요하지 않습니다.

비용

  • 클라우드에 BlueXP 분류를 설치하려면 클라우드 인스턴스를 배포해야 하므로 클라우드 인스턴스가 배포된 클라우드 공급자가 비용을 부담합니다. 을 참조하십시오 각 클라우드 공급자에 대해 구축된 인스턴스 유형입니다. BlueXP 분류를 사내 시스템에 설치하면 비용이 들지 않습니다.

  • BlueXP 분류에서는 BlueXP 커넥터를 배포해야 합니다. BlueXP에서 사용 중인 다른 스토리지 및 서비스로 인해 이미 커넥터가 있는 경우가 많습니다. Connector 인스턴스를 사용하면 배포된 클라우드 공급자가 비용을 청구합니다. 를 참조하십시오 "각 클라우드 공급자에 대해 구축된 인스턴스 유형입니다". 커넥터를 온프레미스 시스템에 설치하는 경우 비용이 들지 않습니다.

데이터 전송 비용

데이터 전송 비용은 설정에 따라 다릅니다. BlueXP 분류 인스턴스 및 데이터 소스가 동일한 가용성 영역 및 지역에 있는 경우 데이터 전송 비용이 발생하지 않습니다. 그러나 Cloud Volumes ONTAP 시스템과 같은 데이터 원본이 _different_Availability Zone 또는 지역에 있는 경우에는 클라우드 공급자가 데이터 전송 비용을 청구합니다. 자세한 내용은 다음 링크를 참조하십시오.

BlueXP 분류 인스턴스입니다

BlueXP 분류를 클라우드에 배포하면 BlueXP는 Connector와 동일한 서브넷에 인스턴스를 배포합니다. "커넥터에 대해 자세히 알아보십시오."

클라우드 공급자에서 실행되는 BlueXP 인스턴스 및 BlueXP 분류 인스턴스를 보여 주는 다이어그램입니다.

기본 인스턴스에 대한 다음 사항에 유의하십시오.

  • AWS에서 BlueXP 분류는 에서 실행됩니다 "m6i.4xLarge 인스턴스" 500GiB GP2 디스크 사용. 운영 체제 이미지는 Amazon Linux 2입니다. AWS에 구축할 경우 소량의 데이터를 스캔할 경우 더 작은 인스턴스 크기를 선택할 수 있습니다.

  • Azure에서 BlueXP 분류는 에서 실행됩니다 "standard_d16s_v3 vm" 500GiB 디스크 사용 운영 체제 이미지는 CentOS 7.9입니다.

  • GCP에서 BlueXP 분류는 에서 실행됩니다 "N2-표준-16 VM" 500GiB 표준 영구 디스크 사용 운영 체제 이미지는 CentOS 7.9입니다.

  • 기본 인스턴스를 사용할 수 없는 지역에서는 대체 인스턴스에서 BlueXP 분류가 실행됩니다. "대체 인스턴스 유형을 참조하십시오".

  • 인스턴스의 이름은 CloudCompliance_이며 생성된 해시(UUID)와 연결됩니다. 예: _CloudCompliance-16b6564-38ad-4080-9a92-36f5fd2f71c7

  • Connector당 하나의 BlueXP 분류 인스턴스만 배포됩니다.

BlueXP 분류를 사내 Linux 호스트 또는 선호하는 클라우드 공급업체의 호스트에 배포할 수도 있습니다. 선택한 설치 방법에 관계없이 소프트웨어가 정확히 같은 방식으로 작동합니다. 인스턴스에 인터넷 액세스가 가능한 한 BlueXP 분류 소프트웨어의 업그레이드는 자동으로 수행됩니다.

팁 BlueXP 분류는 지속적으로 데이터를 검사하기 때문에 인스턴스가 항상 실행 상태를 유지해야 합니다.

더 작은 인스턴스 유형 사용

CPU가 적고 RAM이 적은 시스템에 BlueXP 분류를 배포할 수 있지만 이러한 덜 강력한 시스템을 사용할 때는 몇 가지 제약이 있습니다.

시스템 크기 사양 제한 사항

매우 크게

32개의 CPU, 128GB RAM, 1TiB SSD

최대 5억 개의 파일을 스캔할 수 있습니다.

크게(기본값)

CPU 16개, 64GB RAM, 500GiB SSD

최대 2억 5천만 개의 파일을 스캔할 수 있습니다.

중간

CPU 8개, 32GB RAM, 200GiB SSD

스캔 속도가 느리며 최대 100만 개의 파일만 스캔할 수 있습니다.

작은 크기

CPU 8개, 16GB RAM, 100GiB SSD

"중간"과 동일한 제한 사항과 식별 기능을 제공합니다 "데이터 주체 이름" 내부 파일이 비활성화되었습니다.

AWS의 클라우드에 BlueXP 분류를 배포할 때 대규모/중간/소규모 인스턴스를 선택할 수 있습니다. Azure 또는 GCP에서 BlueXP 분류를 구축할 때 이러한 대체 시스템 중 하나를 사용하려면 ng-contact-data-sense@netapp.com 으로 이메일을 보내 지원을 요청하십시오. 이러한 다른 클라우드 구성을 배포하려면 고객과 협력해야 합니다.

BlueXP 분류를 온프레미스에 구축할 경우 대체 사양이 있는 Linux 호스트를 사용하면 됩니다. NetApp에 지원을 요청할 필요가 없습니다.

BlueXP 분류의 작동 방식

BlueXP 분류는 다음과 같이 작동합니다.

  1. BlueXP에서 BlueXP 분류 인스턴스를 배포합니다.

  2. 하나 이상의 데이터 소스에서 고급 매핑 또는 심층 스캔을 활성화할 수 있습니다.

  3. BlueXP 분류는 AI 학습 프로세스를 사용하여 데이터를 스캔합니다.

  4. 제공된 대시보드 및 보고 도구를 사용하여 규정 준수 및 거버넌스 작업에 도움을 줄 수 있습니다.

스캔 작동 방식

BlueXP 분류를 활성화하고 스캔할 저장소(볼륨, 데이터베이스 스키마 또는 기타 사용자 데이터)를 선택하면 즉시 데이터 스캔이 시작되어 개인 및 중요 데이터를 식별합니다. 대부분의 경우 백업, 미러 또는 DR 사이트 대신 라이브 운영 데이터를 검사하는 데 집중해야 합니다. 그런 다음 BlueXP 분류를 통해 조직 데이터를 매핑하고, 각 파일을 분류하고, 데이터에서 엔터티와 미리 정의된 패턴을 식별하고 추출합니다. 검사 결과는 개인 정보, 민감한 개인 정보, 데이터 범주 및 파일 형식의 인덱스입니다.

BlueXP 분류는 NFS 및 CIFS 볼륨을 마운트하여 다른 클라이언트와 마찬가지로 데이터에 연결됩니다. CIFS 볼륨을 스캔하려면 Active Directory 자격 증명을 제공해야 하지만 NFS 볼륨은 읽기 전용으로 자동 액세스됩니다.

클라우드 공급자에서 실행되는 BlueXP 인스턴스 및 BlueXP 분류 인스턴스를 보여 주는 다이어그램입니다. BlueXP 분류 인스턴스는 NFS 및 CIFS 볼륨과 데이터베이스에 연결하여 검사합니다.

초기 검사 후 BlueXP 분류는 라운드 로빈 방식으로 데이터를 지속적으로 스캔하여 증분 변경을 감지합니다. 이렇게 했다면 인스턴스를 계속 실행하는 것이 중요합니다.

볼륨 수준 또는 데이터베이스 스키마 수준에서 스캔을 활성화 또는 비활성화할 수 있습니다.

매핑 스캔과 분류 스캔의 차이점은 무엇입니까

BlueXP 분류를 통해 선택한 데이터 소스에서 일반적인 "매핑" 스캔을 실행할 수 있습니다. 매핑은 데이터에 대한 상위 수준의 개요만 제공하는 반면 분류는 데이터에 대한 세부 수준의 스캐닝을 제공합니다. 내부 데이터를 보기 위해 파일에 액세스하지 않기 때문에 데이터 소스에서 매핑을 매우 빠르게 수행할 수 있습니다.

많은 사용자가 데이터를 신속하게 스캔하여 더 많은 연구가 필요한 데이터 소스를 식별하려고 하므로 이 기능을 좋아하고, 그런 다음 필요한 데이터 소스 또는 볼륨에서만 분류 검사를 활성화할 수 있습니다.

아래 표에는 몇 가지 차이점이 나와 있습니다.

피처 분류 매핑

스캔 속도

느림

빠릅니다

가격

무료

무료

용량

500TB로 제한됩니다

500TB로 제한됩니다

파일 유형 및 사용된 용량 목록입니다

파일 수 및 사용된 용량입니다

파일의 수명 및 크기

을 실행하는 기능 "데이터 매핑 보고서"

파일 세부 정보를 보려면 데이터 조사 페이지 를 참조하십시오

아니요

파일 내에서 이름을 검색합니다

아니요

생성 "정책" 맞춤형 검색 결과를 제공합니다

아니요

다른 보고서를 실행할 수 있습니다

아니요

파일에서 메타데이터를 볼 수 있는 기능 *

아니요

  • 매핑 스캔 중에 파일에서 다음 메타데이터가 추출됩니다.

  • 작업 환경

  • 작업 환경 유형입니다

  • 저장소 저장소

  • 파일 형식

  • 사용된 용량입니다

  • 파일 수입니다

  • 파일 크기

  • 파일 생성

  • 파일 마지막 액세스

  • 파일이 마지막으로 수정되었습니다

  • 파일 검색 시간

  • 권한 추출

  • 거버넌스 대시보드 차이점 *:

피처 매핑 및 분류 지도

오래된 데이터입니다

비즈니스 데이터가 아닌 데이터

중복된 파일

미리 정의된 정책

아니요

사용자 지정 정책

DDA 보고서

매핑 보고서

감도 수준 감지

아니요

권한이 넓은 중요한 데이터

아니요

권한을 엽니다

데이터 사용 기간

데이터의 크기입니다

범주

아니요

파일 형식

  • 규정 준수 대시보드의 차이점 *:

피처 매핑 및 분류 지도

개인 정보

아니요

민감한 개인 정보

아니요

개인정보 보호 위험 평가 보고서

아니요

HIPAA 보고서

아니요

PCI DSS 보고서

아니요

  • 조사 필터 차이 *:

피처 매핑 및 분류 지도

정책

작업 환경 유형입니다

작업 환경

저장소 저장소

파일 형식

파일 크기

만든 시간

검색된 시간

마지막 수정

마지막 액세스

권한을 엽니다

파일 디렉토리 경로입니다

범주

아니요

감도 수준

아니요

식별자 수입니다

아니요

개인 데이터

아니요

민감한 개인 데이터

아니요

데이터 제목

아니요

중복

분류 상태입니다

상태는 항상 "제한된 통찰력"입니다.

스캔 분석 이벤트

파일 해시

액세스 권한이 있는 사용자 수입니다

사용자/그룹 권한

파일 소유자

디렉터리 유형입니다

BlueXP 분류 스캔 데이터의 속도

스캔 속도는 네트워크 지연 시간, 디스크 지연 시간, 네트워크 대역폭, 환경 크기 및 파일 배포 크기의 영향을 받습니다.

  • 매핑 스캔을 수행할 때 BlueXP 분류는 일일 데이터 100~150개의 TiB를 스캔할 수 있습니다.

  • 분류 스캔을 수행할 때 BlueXP 분류는 하루에 15-40개의 TiB 데이터를 스캔할 수 있습니다.

BlueXP 분류 색인에 대한 정보

BlueXP 분류는 데이터(파일)에 범주를 수집, 색인 및 할당합니다. BlueXP 분류 인덱스의 데이터는 다음과 같습니다.

표준 메타데이터

BlueXP 분류는 파일 유형, 크기, 생성 및 수정 날짜 등의 파일에 대한 표준 메타데이터를 수집합니다.

개인 데이터

이메일 주소, 식별 번호 또는 신용 카드 번호와 같은 개인 식별 정보 "개인 데이터에 대해 자세히 알아보십시오".

민감한 개인 데이터

GDPR 및 기타 개인 정보 보호 규정에 정의된 의료 데이터, 인종 또는 정치적 의견과 같은 민감한 정보의 특별한 유형. "중요한 개인 데이터에 대해 자세히 알아보십시오".

범주

BlueXP 분류는 스캔한 데이터를 다른 유형의 범주로 나눕니다. 범주는 각 파일의 콘텐츠 및 메타데이터에 대한 AI 분석을 기반으로 하는 주제입니다. "범주에 대해 자세히 알아보십시오".

유형

BlueXP 분류는 스캔한 데이터를 파일 유형별로 분류하여 표시합니다. "유형에 대해 자세히 알아보십시오".

이름 요소 인식

BlueXP 분류에서는 AI를 사용하여 문서에서 사람들의 자연어 이름을 추출합니다. "데이터 주체 액세스 요청에 응답하는 방법에 대해 알아봅니다".

네트워킹 개요

BlueXP는 Connector 인스턴스의 인바운드 HTTP 연결을 활성화하는 보안 그룹과 함께 BlueXP 분류 인스턴스를 배포합니다.

SaaS 모드에서 BlueXP에 연결할 때 HTTPS를 통해 BlueXP에 연결되며 브라우저와 BlueXP 분류 인스턴스 간에 전송되는 프라이빗 데이터는 TLS 1.2를 사용하는 엔드 투 엔드 암호화로 보안이 유지됩니다. 즉, NetApp과 타사가 이 데이터를 읽을 수 없습니다.

아웃바운드 규칙은 완전히 열립니다. BlueXP 분류 소프트웨어를 설치 및 업그레이드하고 사용 지표를 전송하려면 인터넷 액세스가 필요합니다.

규정 준수 정보에 대한 사용자 액세스

각 사용자에게 할당된 역할은 BlueXP와 BlueXP 분류 내에서 서로 다른 기능을 제공합니다.

  • 계정 관리자 * 는 규정 준수 설정을 관리하고 모든 작업 환경에 대한 규정 준수 정보를 볼 수 있습니다.

  • Workspace Admin * 은 액세스 권한이 있는 시스템에 대해서만 준수 설정을 관리하고 준수 정보를 볼 수 있습니다. 작업 영역 관리자가 BlueXP의 작업 환경에 액세스할 수 없는 경우 BlueXP 분류 탭에서 작업 환경에 대한 규정 준수 정보를 볼 수 없습니다.

  • Compliance Viewer * 역할의 사용자는 규정 준수 정보를 보고 액세스 권한이 있는 시스템에 대한 보고서만 생성할 수 있습니다. 이러한 사용자는 볼륨, 버킷 또는 데이터베이스 스키마 스캔을 활성화/비활성화할 수 없습니다.