데이터 레이크에서 ONTAP NFS로
이 사용 사례는 우리가 수행한 가장 큰 규모의 금융 고객 개념 증명(CPOC)을 기반으로 합니다. 과거에는 NetApp In-Place Analytics Module(NIPAM)을 사용하여 분석 데이터를 NetApp ONTAP AI로 이동했습니다. 하지만 최근 NetApp XCP의 향상된 성능과 고유한 NetApp 데이터 무버 솔루션 접근 방식 덕분에 NetApp XCP를 사용하여 데이터 마이그레이션을 다시 실행했습니다.
고객의 과제와 요구 사항
주목할 만한 고객 과제와 요구 사항은 다음과 같습니다.
-
고객은 구조화된 데이터, 구조화되지 않은 데이터, 반구조화된 데이터, 로그, 데이터 레이크의 머신 간 데이터를 포함하여 다양한 유형의 데이터를 보유하고 있습니다. AI 시스템은 예측 작업을 위해 이러한 모든 유형의 데이터를 처리해야 합니다. 데이터가 데이터 레이크 기반 파일 시스템에 있는 경우 처리하기 어렵습니다.
-
고객의 AI 아키텍처는 Hadoop 분산 파일 시스템(HDFS) 및 Hadoop 호환 파일 시스템(HCFS)의 데이터에 액세스할 수 없으므로 AI 작업에 해당 데이터를 사용할 수 없습니다. AI에는 NFS와 같은 이해하기 쉬운 파일 시스템 형식의 데이터가 필요합니다.
-
데이터 양이 방대하고 처리량이 높기 때문에 데이터 레이크에서 데이터를 이동하려면 몇 가지 특별한 프로세스가 필요하며, 데이터를 AI 시스템으로 이동하려면 비용 효율적인 방법이 필요합니다.
데이터 무버 솔루션
이 솔루션에서는 MapR 파일 시스템(MapR-FS)이 MapR 클러스터의 로컬 디스크에서 생성됩니다. MapR NFS 게이트웨이는 각 데이터 노드에 가상 IP로 구성됩니다. 파일 서버 서비스는 MapR-FS 데이터를 저장하고 관리합니다. NFS 게이트웨이는 가상 IP를 통해 NFS 클라이언트에서 Map-FS 데이터에 액세스할 수 있도록 합니다. 각 MapR 데이터 노드에서 XCP 인스턴스가 실행되어 Map NFS Gateway에서 NetApp ONTAP NFS로 데이터를 전송합니다. 각 XCP 인스턴스는 특정 소스 폴더 세트를 대상 위치로 전송합니다.
다음 그림은 XCP를 사용한 MapR 클러스터용 NetApp 데이터 이동 솔루션을 보여줍니다.
자세한 고객 사용 사례, 녹화된 데모 및 테스트 결과는 다음을 참조하세요."XCP를 사용하여 데이터 레이크 및 고성능 컴퓨팅에서 ONTAP NFS로 데이터 이동" 블로그.
NetApp XCP를 사용하여 ONTAP NFS로 MapR-FS 데이터를 이동하는 방법에 대한 자세한 단계는 부록 B를 참조하세요."TR-4732: 빅데이터 분석 데이터를 인공지능으로" .