Skip to main content
NetApp artificial intelligence solutions
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

빅데이터 아키텍처를 위한 NetApp 기반 데이터 패브릭

기여자 kevin-hoke

NetApp 이 지원하는 데이터 패브릭은 클라우드와 온프레미스 환경 전반의 데이터 관리를 간소화하고 통합하여 디지털 혁신을 가속화합니다.

NetApp 이 지원하는 데이터 패브릭은 아래 그림에서 볼 수 있듯이 데이터 가시성 및 통찰력, 데이터 액세스 및 제어, 데이터 보호 및 보안을 위한 일관되고 통합된 데이터 관리 서비스와 애플리케이션(빌딩 블록)을 제공합니다.

입력/출력 대화 상자 또는 서면 내용을 나타내는 그림

검증된 데이터 패브릭 고객 사용 사례

NetApp 이 제공하는 데이터 패브릭은 고객에게 다음과 같은 9가지 검증된 사용 사례를 제공합니다.

  • 분석 워크로드 가속화

  • DevOps 혁신 가속화

  • 클라우드 호스팅 인프라 구축

  • 클라우드 데이터 서비스 통합

  • 데이터 보호 및 보안

  • 비정형 데이터 최적화

  • 데이터 센터 효율성 확보

  • 데이터 통찰력과 제어 제공

  • 단순화하고 자동화하세요

이 문서에서는 9가지 사용 사례 중 2가지와 해당 솔루션을 다룹니다.

  • 분석 워크로드 가속화

  • 데이터 보호 및 보안

NetApp NFS 직접 액세스

NetApp NFS를 사용하면 고객은 데이터를 이동하거나 복사하지 않고도 기존 또는 새로운 NFSv3 또는 NFSv4 데이터에 대한 빅데이터 분석 작업을 실행할 수 있습니다. 이를 통해 여러 개의 데이터 사본이 생성되는 것을 방지하고 소스와 데이터를 동기화할 필요성이 없어집니다. 예를 들어, 금융 부문에서 데이터를 한 장소에서 다른 장소로 이동하려면 법적 의무를 충족해야 하는데, 이는 쉬운 일이 아닙니다. 이 시나리오에서 NetApp NFS 직접 액세스는 원래 위치에서 재무 데이터를 분석합니다. 또 다른 주요 이점은 NetApp NFS 직접 액세스를 사용하면 기본 Hadoop 명령을 사용하여 Hadoop 데이터를 보호하는 작업이 간소화되고 NetApp의 풍부한 데이터 관리 포트폴리오를 활용한 데이터 보호 워크플로가 가능해진다는 것입니다.

입력/출력 대화 상자 또는 서면 내용을 나타내는 그림

NetApp NFS 직접 액세스는 Hadoop/Spark 클러스터에 대해 두 가지 종류의 배포 옵션을 제공합니다.

  • 기본적으로 Hadoop/Spark 클러스터는 데이터 저장을 위해 Hadoop 분산 파일 시스템(HDFS)과 기본 파일 시스템을 사용합니다. NetApp NFS 직접 액세스를 통해 기본 HDFS를 NFS 스토리지로 대체하여 기본 파일 시스템으로 사용할 수 있으며, 이를 통해 NFS 데이터에 대한 직접 분석 작업이 가능합니다.

  • 또 다른 배포 옵션에서 NetApp NFS 직접 액세스는 단일 Hadoop/Spark 클러스터에서 HDFS와 함께 추가 스토리지로 NFS를 구성하는 것을 지원합니다. 이 경우, 고객은 NFS 내보내기를 통해 데이터를 공유하고 HDFS 데이터와 함께 동일한 클러스터에서 해당 데이터에 액세스할 수 있습니다.

NetApp NFS 직접 액세스를 사용하면 다음과 같은 주요 이점이 있습니다.

  • 현재 위치에서 데이터를 분석하므로 HDFS와 같은 Hadoop 인프라로 분석 데이터를 이동하는 데 드는 시간과 성능이 많이 소요되는 작업을 방지할 수 있습니다.

  • 복제본의 개수를 3개에서 1개로 줄입니다.

  • 사용자가 컴퓨팅과 스토리지를 분리하여 독립적으로 확장할 수 있습니다.

  • ONTAP 의 풍부한 데이터 관리 기능을 활용하여 엔터프라이즈 데이터 보호를 제공합니다.

  • Hortonworks 데이터 플랫폼에 대한 인증을 받았습니다.

  • 하이브리드 데이터 분석 배포를 지원합니다.

  • 동적 멀티스레드 기능을 활용하여 백업 시간을 줄입니다.

빅데이터를 위한 빌딩 블록

NetApp 이 제공하는 데이터 패브릭은 아래 그림에서 볼 수 있듯이 데이터 액세스, 제어, 보호 및 보안을 위한 데이터 관리 서비스와 애플리케이션(빌딩 블록)을 통합합니다.

입력/출력 대화 상자 또는 서면 내용을 나타내는 그림

위 그림의 구성 요소는 다음과 같습니다.

  • * NetApp NFS 직접 액세스.* 추가 소프트웨어나 드라이버가 필요하지 않고 최신 Hadoop 및 Spark 클러스터에서 NetApp NFS 볼륨에 직접 액세스할 수 있습니다.

  • * NetApp Cloud Volumes ONTAP 및 Google Cloud NetApp Volumes.* Amazon Web Services(AWS)에서 실행되는 ONTAP 또는 Microsoft Azure 클라우드 서비스의 Azure NetApp Files (ANF) 기반의 소프트웨어 정의 연결 스토리지입니다.

  • * NetApp SnapMirror 기술*. 온프레미스와 ONTAP Cloud 또는 NPS 인스턴스 간의 데이터 보호 기능을 제공합니다.

  • 클라우드 서비스 제공자. 이러한 공급업체로는 AWS, Microsoft Azure, Google Cloud, IBM Cloud가 있습니다.

  • PaaS. AWS의 Amazon Elastic MapReduce(EMR) 및 Databricks, Microsoft Azure HDInsight 및 Azure Databricks와 같은 클라우드 기반 분석 서비스입니다.