AI Data Engine의 새로운 기능
AI Data Engine(AIDE) 9.18.1은 AI 데이터 관리를 위한 NetApp의 플랫폼의 초기 릴리스입니다. 이 릴리스에서는 조직이 AI 워크로드에 필요한 비정형 데이터를 카탈로그화하고 구성할 수 있도록 지원하는 메타데이터 엔진과 관리 워크플로가 도입되어 고급 거버넌스 및 벡터화 기능을 위한 기반을 제공합니다. 고급 거버넌스(가드레일) 및 벡터화 기능은 적절한 AI Data Engine 라이선스를 보유한 고객에게 제공됩니다.
AIDE 9.18.1 초기 릴리스의 새로운 기능
AIDE 9.18.1에서는 다음과 같은 기본 기능을 소개합니다.
초기 릴리스에는 ONTAP 클러스터 전체의 파일과 객체를 카탈로그화하는 Metadata Engine이 포함되어 있습니다.
주요 기능은 다음과 같습니다:
-
피어링된 클러스터의 로컬 및 원격 ONTAP 볼륨에서 메타데이터(핵심 및 확장 속성, 객체 태그)를 자동으로 추출합니다.
-
기업 데이터에 대한 전체적인 시각을 필요로 하는 애플리케이션을 위한 중앙 집중식 쿼리 및 필터링 REST API.
-
확장 가능한 메타데이터 스토리지.
-
워크스페이스 생성 중에 메타데이터 자동 추출이 실행됩니다.
워크스페이스는 AI 프로젝트를 위한 데이터 소스(볼륨)의 논리적 그룹화를 제공합니다.
초기 릴리스는 다음을 지원합니다:
-
로컬 및 원격 ONTAP 볼륨에 걸쳐 워크스페이스를 생성합니다(클러스터 피어링 사용).
-
다중 사용자 및 다중 테넌트 환경을 지원하는 작업 영역에 대한 액세스 제어 할당.
-
워크스페이스 생성 시 메타데이터 자동 추출 및 카탈로그 채우기.
Data Sync는 수동 개입 없이 소스 데이터가 변경될 때 메타데이터 카탈로그와 데이터 수집을 최신 상태로 유지합니다.
주요 기능은 다음과 같습니다:
-
정책 기반 SnapMirror 복제를 사용하여 원격 또는 로컬 ONTAP 클러스터의 데이터를 자동으로 동기화합니다.
-
수정된 데이터만 전파하는 증분 업데이트로 오버헤드를 줄입니다.
-
워크스페이스별로 구성 가능한 새로 고침 간격.
-
작업 공간 수준의 동기화 상태 및 활동 모니터링.
초기 릴리스에는 다음과 같은 워크플로가 포함됩니다.
-
클러스터 설정 중 데이터 컴퓨팅 노드(DCN)의 검색 및 추가.
-
Metadata Engine을 위한 전용 메타데이터 스토리지 VM 생성.
-
클러스터 전체 메타데이터 액세스를 위한 Data Engine 서비스 인터페이스 구성.
-
다른 ONTAP 클러스터와 피어링하여 데이터 환경 전체에 걸쳐 메타데이터 카탈로그 기능을 확장합니다.
-
Microsoft Entra ID 및 Active Directory Federation Services(ADFS)를 사용하여 ONTAP System Manager 및 Data Engine Console에 안전하게 액세스하기 위한 OIDC/OAuth 기반 인증입니다.
-
워크스페이스 및 메타데이터 관리를 위한 역할 기반 액세스 제어.
적절한 AI Data Engine 라이센스를 보유한 고객은 다음 기능을 사용할 수 있습니다.
-
벡터화 및 RAG: AIDE 워크스페이스의 메타데이터를 사용하여 AI Data Engine Console에서 데이터 컬렉션, 임베딩 및 검색 엔드포인트를 생성합니다.
-
가드레일 기반 거버넌스: AI Data Engine Console에서 가드레일 정책을 정의하고 해당 정책을 ONTAP System Manager의 워크스페이스와 연결합니다.
지원되는 hardware 및 플랫폼
AI Data Engine 9.18.1은 다음을 결합한 ONTAP AI 데이터 플랫폼 클러스터에서 실행됩니다.
-
AFX 1K 스토리지 노드
-
NetApp 데이터 컴퓨팅 노드