Skip to main content
AI Data Engine
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

NetApp AI Data Engine FAQ

기여자 netapp-dbagwell

이 FAQ에서는 NetApp AI Data Engine(AIDE)의 아키텍처, 배포, 사용자 유형, 기술 기능, 통합 및 라이선스를 포함하여 AIDE에 대한 일반적인 질문을 다룹니다.

AIDE 기본 사항

NetApp AI Data Engine(AIDE)이란 무엇입니까?

NetApp AI Data Engine(AIDE)은 스토리지가 통합된 AI 데이터 서비스로, 원시 데이터를 검색하고 준비하는 것부터 생성형 AI(GenAI), 검색 증강 생성(RAG), 에이전트형 AI 및 AI 팩토리를 지원하는 검색 엔드포인트 제공에 이르기까지 전체 AI 라이프사이클을 포괄합니다. AIDE는 동기화 및 변경 감지를 자동화하여 데이터 검색 및 큐레이션을 위해 선택한 데이터에 대한 통합되고 최신 상태의 보기를 제공합니다.

AIDE는 어떻게 작동하나요?

AIDE는 NetApp ONTAP 스토리지 시스템과 직접 통합되어 자동화된 변경 감지 및 동기화를 통해 전체 NetApp 데이터 환경에 대한 글로벌하고 구조화된 뷰를 생성합니다. AIDE는 압축 및 중복 제거를 통한 실시간 벡터화, 정책 기반 가드레일, AI 도구와의 통합을 제공합니다.

사용자 및 역할

AI Data Engine을 사용하는 사람은 누구입니까?

AIDE의 주요 사용자는 다음과 같습니다.

  1. ONTAP 스토리지 관리자: 인프라, AI 관련 스토리지 요구 사항, 보안 및 규정 준수를 관리합니다.

  2. 데이터 엔지니어: 다양한 환경에 걸쳐 데이터 이동, 준비 및 통합을 관리합니다.

  3. 데이터 과학자: AI가 활용할 수 있도록 관련 데이터를 준비하고 변환합니다.

요구 사항 및 배포

어떤 하드웨어가 필요합니까?

AIDE를 배포하려면 AFX 시스템(AFX 컨트롤러, 디스크 쉘프 및 네트워크 스위치 포함)이 필요하지만, SnapMirror 및 클러스터 피어링을 사용하여 ONTAP 9를 실행하는 클러스터의 클러스터 데이터를 사용할 수 있습니다. 고가용성과 성능을 보장하기 위해 AIDE 배포에는 최소 4개의 AFX 컨트롤러 노드가 필요합니다.

AIDE는 NetApp 데이터 컴퓨팅 노드(DCN)에서 실행됩니다. 세 개의 DCN이 필요합니다. DCN은 Metadata Engine, 데이터 동기화, Data Curator 및 Data Guardrails를 포함하는 AIDE 소프트웨어를 호스팅합니다.

제가 보유한 DCN을 사용할 수 있습니까?

아니요. DCN은 NetApp에서 제공하는 데이터 컴퓨팅 하드웨어 노드이며 AI Data Engine의 유일한 배포 메커니즘입니다.

최소 필요한 DCN 수는 몇 개입니까?

정확히 3개의 DCN이 필요합니다.

DCN에서 실행되는 OS는 무엇입니까?

DCN은 AIDE가 포함된 NetApp 제공 소프트웨어 스택을 실행합니다.

AFX 없이 AIDE를 배포할 수 있습니까?

아니요. AIDE 배포를 위해 AFX가 필요합니다. AIDE는 Trident를 사용하여 AFX 볼륨을 내부 스토리지(영구 볼륨)로 사용합니다. AIDE에 스토리지를 제공하는 AFX 클러스터는 ONTAP 9 시스템 또는 클러스터와 피어링될 수 있습니다. 클러스터 피어링과 SnapMirror를 사용하여 원격 ONTAP 클러스터에서 AFX 시스템으로 데이터를 동기화합니다.

관리 및 인터페이스

AIDE Console은 NetApp Console의 일부인가요, 아니면 별도의 인터페이스인가요?

AIDE Console은 DCN에서 실행되는 별도의 관리 인터페이스입니다. AIDE Console을 사용하여 Data Guardrails 및 Data Curator와 같은 AIDE 서비스를 관리합니다. 또한 ONTAP System Manager를 사용하여 AIDE 클러스터를 모니터링할 수 있습니다.

기능 및 성능

AIDE의 주요 기능은 무엇입니까?

AIDE의 네 가지 주요 기능은 다음과 같습니다.

Metadata Engine
  • 데이터의 구조화되고 최신 상태의 대화형 보기를 자동으로 생성합니다.

  • ONTAP에 저장된 데이터와 함께 작동합니다.

  • 데이터 전문가가 스토리지 관리자와 협업하여 데이터를 찾고 이해할 수 있도록 지원합니다.

  • API는 메타데이터를 쿼리하여 기능을 제공하는 동시에 스토리지 시스템의 NFS 트래픽 부하를 줄입니다.

  • 메타데이터 추출 및 카탈로그화 기능은 AIDE를 위해 특별히 구축되었으며 지속적으로 작동하고 스냅샷과 같은 ONTAP 기능을 활용합니다.

데이터 동기화
  • 원본 데이터가 변경될 때 수동 개입 없이 자동으로 데이터의 최신성을 유지합니다.

  • 관리자는 데이터 업데이트 간격을 일 또는 시간 단위로 정의합니다.

  • 데이터 전반에 걸쳐 점진적인 데이터 이동성과 동기화를 제공하여 AI 데이터의 중복 복사본을 제거합니다.

Data Guardrails
  • AI 라이프사이클 전반에 걸쳐 민감한 데이터를 자동으로 식별하고 보호합니다. AI Data Engine Console을 통해 액세스할 수 있습니다.

  • 데이터를 지속적으로 스캔하고 분류하며 범주화합니다.

  • 민감한 데이터(예: PII) 및 위험 요소를 식별합니다.

  • 회사 및 규제 기준에 맞춰 민감한 데이터의 자동 처리 정책 수립을 용이하게 합니다.

  • 데이터 보호를 위해 민감한 정보를 자동으로 삭제하는 기능을 제공합니다.

  • 필요에 따라 민감한 파일에 대한 액세스를 제한합니다.

Data Curator
  • 데이터 과학자가 스토리지 전체에서 관련 데이터를 검색할 수 있습니다.

  • AFX 볼륨에 있는 데이터를 사용하여 선별된 데이터 컬렉션을 생성합니다.

  • 데이터 용량 증가를 줄이고 성능을 향상시키기 위해 스토리지 계층에서 벡터 임베딩을 생성합니다.

  • 벡터 의미 검색 및 재순위 지정을 통해 AI 애플리케이션을 위한 검색 엔드포인트를 제공합니다.

통합 및 상호 운용성

AIDE는 여러 ONTAP 클러스터에 걸쳐 연합 메타데이터를 지원합니까?

AIDE는 SnapMirror 및 클러스터 피어링을 사용하여 여러 ONTAP 클러스터에 연결하여 중앙 집중식 메타데이터 가시성을 확보할 수 있습니다.

메타데이터는 어디에 저장되나요?

AIDE는 AFX에서 제공하는 영구 볼륨을 사용하여 연결된 AFX 클러스터에 메타데이터를 저장합니다. DCN은 내부 작업을 위해 로컬 스토리지를 사용합니다.

AIDE Metadata Engine이 데이터를 분류합니까?

아니요. Metadata Engine은 파일 시스템 메타데이터를 카탈로그화하고 이 카탈로그화된 메타데이터를 쿼리할 수 있는 API를 제공합니다.

어떤 데이터 소스가 지원되나요?

AIDE는 데이터 소스로 ONTAP 볼륨(로컬 또는 원격)을 지원합니다. 원격 ONTAP 클러스터는 ONTAP 9를 실행해야 하며 클러스터 피어링 및 SnapMirror를 통해 연결되어야 합니다.

AIDE 9.18.1에서는 ONTAP S3 버킷 및 StorageGRID 객체를 데이터 소스로 지원하지 않습니다.

AIDE는 분류, 벡터화 및 의미 검색을 위해 어떤 유형의 파일을 처리할 수 있습니까?

AIDE는 OCR 기능을 갖춘 PDF, DOCX, PPTX, TXT 및 이미지 파일을 비롯한 다양한 파일 형식을 지원합니다.

AIDE는 비영어권 데이터의 분류를 지원합니까?

AIDE는 영어 데이터만 지원합니다.

AIDE는 어떤 통합을 지원하나요?

AIDE는 직접 API 호출 또는 Model Context Protocol(MCP) 서버를 통해 액세스할 수 있는 RAG API 엔드포인트를 제공합니다. 이를 통해 에이전트 기반 AI 프레임워크 및 도구와의 통합이 지원됩니다.

배포 및 라이센싱

배포 옵션은 무엇인가요?

AIDE는 DCN을 사용하는 AFX 인프라에 온프레미스로 배포됩니다. NetApp ONTAP AFX 설치와 직접 통합됩니다.

AIDE는 어떻게 라이센스가 부여되나요?

AIDE를 실행하려면 Data Guardrails 및 Data Curator를 실행하기 위한 소프트웨어 라이센스가 필요합니다.

Metadata Engine만 필요한 경우, 모든 AFX 시스템에 포함된 ONTAP One 라이센스를 통해 Metadata Engine 전용 기능에 대한 사용 권한을 얻을 수 있습니다.