Skip to main content
AI Data Engine
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

NetApp AI Data Engine FAQ

기여자 netapp-dbagwell

이 FAQ에서는 NetApp AI Data Engine(AIDE)의 아키텍처, 배포, 사용자 유형, 기술 기능, 통합 및 라이선스를 포함하여 AIDE에 대한 일반적인 질문을 다룹니다.

AIDE 기본 사항

NetApp AI Data Engine이란 무엇입니까?

NetApp AI Data Engine(AIDE)은 스토리지가 통합된 AI 데이터 서비스로, 원시 데이터를 검색하고 준비하는 것부터 생성형 AI(GenAI), 검색 증강 생성(RAG), 에이전트형 AI 및 AI 팩토리를 지원하는 검색 엔드포인트 제공에 이르기까지 전체 AI 라이프사이클을 포괄합니다. AIDE는 동기화 및 변경 감지를 자동화하여 데이터 검색 및 큐레이션을 위해 선택한 데이터에 대한 통합되고 최신 상태의 보기를 제공합니다.

AIDE는 어떻게 작동하나요?

AIDE는 NetApp ONTAP 스토리지 시스템과 직접 통합되어 자동화된 변경 감지 및 동기화를 통해 전체 NetApp 데이터 환경에 대한 글로벌하고 구조화된 뷰를 생성합니다. AIDE는 압축 및 중복 제거를 통한 실시간 벡터화, 정책 기반 가드레일, AI 도구와의 통합을 제공합니다.

사용자 및 역할

AI Data Engine을 사용하는 사람은 누구입니까?

AIDE의 주요 사용자는 다음과 같습니다.

  1. ONTAP 스토리지 관리자: 인프라, AI 관련 스토리지 요구 사항, 보안 및 규정 준수를 관리합니다.

  2. 데이터 엔지니어: 다양한 환경에 걸쳐 데이터 이동, 준비 및 통합을 관리합니다.

  3. 데이터 과학자: AI가 활용할 수 있도록 관련 데이터를 준비하고 변환합니다.

요구 사항 및 배포

AIDE에 사용할 수 있는 배포 옵션은 무엇입니까?

AIDE는 두 가지 배포 옵션을 제공합니다.

  • NetApp DCN(데이터 컴퓨팅 노드) 배포: AIDE는 통합 GPU 리소스를 갖춘 NetApp 제공 데이터 컴퓨팅 노드에서 실행되어 메타데이터, 벡터화 및 RAG 엔드포인트를 포함한 모든 AIDE 기능을 제공합니다.

  • 타사 서버의 AIDE 소프트웨어: AIDE 소프트웨어는 지원되는 타사 하드웨어를 사용하여 고객이 제공하는 RHEL 9.7 서버에서 실행됩니다. Metadata Engine 기본 배포는 메타데이터 카탈로그 및 검색 기능을 제공하지만 GPU 종속 기능은 포함하지 않습니다.

NetApp DCN 구축에 필요한 하드웨어는 무엇입니까?

NetApp DCN 구축에는 AFX 시스템(AFX 컨트롤러, 디스크 쉘프 및 네트워크 스위치 포함)과 3개의 NetApp 데이터 컴퓨팅 노드가 필요합니다. 고가용성과 성능을 보장하려면 최소 4개의 AFX 컨트롤러 노드가 필요합니다.

타사 서버에 Metadata Engine 기본 기능을 사용하는 AIDE 소프트웨어를 배포하려면 어떤 하드웨어가 필요합니까?

AIDE 소프트웨어의 Metadata Engine 기본 기능을 타사 서버에 배포하려면 다음이 필요합니다.

  • 지원되는 공급업체에서 고객이 구매한 서버 3대

  • 모든 서버에 RHEL 9.7 LTS가 설치되어 있습니다.

  • 영구 스토리지용 ONTAP 9.18.1 이상을 실행하는 AFX 스토리지 시스템

GPU 기능을 포함한 전체 AIDE에 자체 서버를 사용할 수 있습니까?

AIDE 1.0.0 릴리스는 고객이 구매한 하드웨어의 타사 서버에서 기본 Metadata Engine을 지원합니다. GPU 기능을 포함한 AIDE의 모든 기능을 사용하려면 NetApp DCN 하드웨어가 필요합니다.

NetApp DCN에 필요한 최소 개수는 몇 개입니까?

정확히 3개의 NetApp DCN이 필요합니다.

AIDE 노드에서 실행되는 OS는 무엇입니까?

운영 체제는 배포 유형에 따라 다릅니다.

  • NetApp DCN: NetApp에서 제공하고 관리하는 소프트웨어 스택

  • 타사 서버에서 Metadata Engine 기본 기능을 갖춘 AIDE 소프트웨어: 고객이 설치 및 관리하는 Red Hat Enterprise Linux(RHEL) 9.7 LTS

AFX 없이 AIDE를 배포할 수 있습니까?

아니요. AIDE 배포를 위해 AFX가 필요합니다. AIDE는 "Trident"를 사용하여 내부 스토리지(영구 볼륨)로 AFX 볼륨을 사용합니다. AIDE용 스토리지를 제공하는 AFX 클러스터는 ONTAP 9 시스템 또는 클러스터와 피어링될 수 있습니다. 클러스터 피어링과 SnapMirror를 사용하여 원격 ONTAP 클러스터에서 AFX 시스템으로 데이터를 동기화합니다.

관리 및 인터페이스

AIDE Console은 NetApp Console의 일부인가요, 아니면 별도의 인터페이스인가요?

AIDE Console은 NetApp DCN에서 실행되는 별도의 관리 인터페이스입니다. AIDE Console을 사용하여 Data Guardrails 및 Data Curator와 같은 AIDE 서비스를 관리합니다. 또한 ONTAP System Manager를 사용하여 AIDE 클러스터를 모니터링할 수 있습니다.

기능 및 성능

AIDE의 주요 기능은 무엇입니까?

AIDE는 배포 유형에 따라 가용성이 달라지는 네 가지 주요 기능을 제공합니다.

Metadata Engine(모든 배포에서 사용 가능)
  • 데이터의 구조화되고 최신 상태의 대화형 보기를 자동으로 생성합니다.

  • ONTAP에 저장된 데이터와 함께 작동합니다.

  • 데이터 전문가가 스토리지 관리자와 협업하여 데이터를 찾고 이해할 수 있도록 지원합니다.

  • API는 메타데이터를 쿼리하여 기능을 제공하는 동시에 스토리지 시스템의 NFS 트래픽 부하를 줄입니다.

  • 메타데이터 추출 및 카탈로그화 기능은 AIDE를 위해 특별히 구축되었으며 지속적으로 작동하고 스냅샷과 같은 ONTAP 기능을 활용합니다.

Data Sync(모든 배포 환경에서 사용 가능)
  • 원본 데이터가 변경될 때 수동 개입 없이 자동으로 데이터의 최신성을 유지합니다.

  • 관리자는 데이터 업데이트 간격을 일 또는 시간 단위로 정의합니다.

  • 데이터 전반에 걸쳐 점진적인 데이터 이동성과 동기화를 제공하여 AI 데이터의 중복 복사본을 제거합니다.

Data Guardrails(NetApp DCN 필수 라이선스가 있는 경우에만)
  • AI 라이프사이클 전반에 걸쳐 민감한 데이터를 자동으로 식별하고 보호합니다. AI Data Engine Console을 통해 액세스할 수 있습니다.

  • 데이터를 지속적으로 스캔하고 분류하며 범주화합니다.

  • 민감한 데이터(예: PII) 및 위험 요소를 식별합니다.

  • 회사 및 규제 기준에 맞춰 민감한 데이터의 자동 처리 정책 수립을 용이하게 합니다.

  • 완전한 정책 시행(자동 정보 삭제 및 접근 제한)을 위해서는 NetApp DCN 배포 환경에서만 사용 가능한 벡터화 기능이 필요합니다.

  • 타사 서버에서 Metadata Engine 기본 기능을 사용하는 AIDE 소프트웨어는 분류자 기반 메타데이터 태깅을 지원하지만 가드레일 적용은 지원하지 않습니다.

Data Curator(NetApp DCN 필수 라이센스가 있는 경우에만)
  • 데이터 과학자가 스토리지 전체에서 관련 데이터를 검색할 수 있습니다.

  • AFX 볼륨에 있는 데이터를 사용하여 선별된 데이터 컬렉션을 생성합니다.

  • 데이터 용량 증가를 줄이고 성능을 향상시키기 위해 스토리지 계층에서 벡터 임베딩을 생성합니다.

  • 벡터 의미 검색 및 재순위 지정을 통해 AI 애플리케이션을 위한 검색 엔드포인트를 제공합니다.

참고 타사 서버에서 Metadata Engine 기본 기능을 사용하는 AIDE 소프트웨어에는 Metadata Engine 및 Data Sync 기능이 포함됩니다. Data Guardrails 및 Data Curator를 사용하려면 NetApp DCN 배포에서 사용 가능한 GPU 리소스가 필요합니다.
타사 서버의 AIDE 소프트웨어와 NetApp DCN을 비교할 때 어떤 기능을 사용할 수 있습니까?

타사 서버의 AIDE 소프트웨어는 메타데이터 중심 기능을 제공합니다.

타사 서버에서 Metadata Engine 기본 기능을 갖춘 AIDE 소프트웨어와 함께 사용 가능:

  • 워크스페이스 생성 및 관리

  • 자동화된 메타데이터 추출 및 카탈로그 작성

  • REST API를 통한 메타데이터 검색 및 필터링

  • 자동화된 데이터 통화를 위한 Data Sync

  • 메타데이터 내보내기 기능

타사 서버에서 Metadata Engine 기본 기능을 사용하는 AIDE 소프트웨어에서는 사용할 수 없습니다:

  • GPU 의존 서비스(벡터화, OCR, 데이터 보강)

  • 데이터 수집 및 벡터 임베딩

  • 의미 검색을 위한 RAG 엔드포인트

  • 검색 시 Guardrail 정책 시행

통합 및 상호 운용성

AIDE는 여러 ONTAP 클러스터에 걸쳐 연합 메타데이터를 지원합니까?

AIDE는 SnapMirror 및 클러스터 피어링을 사용하여 여러 ONTAP 클러스터에 연결하여 중앙 집중식 메타데이터 가시성을 확보할 수 있습니다.

메타데이터는 어디에 저장되나요?

AIDE는 AFX에서 제공하는 영구 볼륨을 사용하여 연결된 AFX 클러스터에 메타데이터를 저장합니다. 데이터 컴퓨팅 노드는 내부 작업을 위해 로컬 스토리지를 사용합니다.

AIDE Metadata Engine이 데이터를 분류합니까?

아니요. AIDE Metadata Engine은 파일 시스템 메타데이터를 카탈로그화하고 이 카탈로그화된 메타데이터를 쿼리하기 위한 API를 제공합니다.

어떤 데이터 소스가 지원되나요?

AIDE는 데이터 소스로 ONTAP 볼륨(로컬 또는 원격)을 지원합니다. 원격 ONTAP 클러스터는 ONTAP 9를 실행해야 하며 클러스터 피어링 및 SnapMirror를 통해 연결되어야 합니다.

AIDE 9.18.1에서는 ONTAP S3 버킷 및 StorageGRID 객체를 데이터 소스로 지원하지 않습니다.

AIDE는 분류, 벡터화 및 의미 검색을 위해 어떤 유형의 파일을 처리할 수 있습니까?

AIDE는 OCR 기능을 갖춘 PDF, DOCX, PPTX, TXT 및 이미지 파일을 비롯한 다양한 파일 형식을 지원합니다.

AIDE는 비영어권 데이터의 분류를 지원합니까?

AIDE는 영어 데이터만 지원합니다.

AIDE는 어떤 통합을 지원하나요?

AIDE는 직접 API 호출 또는 Model Context Protocol(MCP) 서버를 통해 액세스할 수 있는 RAG API 엔드포인트를 제공합니다. 이를 통해 에이전트 기반 AI 프레임워크 및 도구와의 통합이 지원됩니다.

라이센싱

AIDE는 어떻게 라이센스가 부여되나요?

AIDE 라이선스는 배포 유형 및 필요한 기능에 따라 다릅니다.

NetApp DCN 구축:

  • Data Guardrails 및 Data Curator를 사용하려면 AIDE 프리미엄 서비스 라이센스가 필요합니다

  • Metadata Engine 및 데이터 동기화 기능은 ONTAP One 라이선스(모든 AFX 시스템에 포함됨)에 포함되어 있습니다.

타사 서버의 Metadata Engine 기본 기능을 갖춘 AIDE software:

  • ONTAP One 라이센스는 Metadata Engine 및 데이터 동기화 기능에 대한 사용 권한을 제공합니다

  • 타사 서버에 Metadata Engine 기본 기능을 배포할 경우 Data Guardrails 및 Data Curator를 사용할 수 없습니다.