Skip to main content
AI Data Engine
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

AI Data Engine에서 작업 공간 생성

기여자 netapp-dbagwell

클러스터를 설정한 후에는 워크스페이스를 생성할 수 있습니다. 워크스페이스를 사용하면 클러스터의 데이터를 분할하고, 개별 사용자의 데이터 액세스를 제어하고, AI Data Engine(AIDE)에서 액세스해서는 안 되는 데이터를 제외할 수 있습니다.

스토리지를 관리하는 경우 ONTAP System Manager를 사용하여 작업 영역을 생성하고 관리합니다.

조직은 팀, 프로젝트, 데이터 민감도 수준 또는 기타 관련 기준에 따라 작업 공간을 생성합니다. 예를 들어 의료 분야에서 근무하는 경우 임상 데이터를 작업 공간으로 분류하지만 IT, 법률 또는 기타 부서와 관련된 데이터는 제외할 수 있습니다.

이 작업 정보

시스템 처리 용량 제한은 워크스페이스 생성에 영향을 미칩니다(일반적으로 클러스터당 하루 최대 15GB). 여러 워크스페이스를 병렬로 또는 빠르게 연속적으로 생성하는 경우 각 워크스페이스 처리 시간이 길어져 상당한 지연이 발생할 수 있습니다.

워크스페이스 인벤토리 페이지에서 워크스페이스 생성 상태를 모니터링하세요. 최상의 결과를 얻으려면 이러한 기능에 즉시 액세스해야 하는 경우 한 번에 많은 워크스페이스를 생성하지 않는 것이 좋습니다.

시작하기 전에
  • 워크스페이스를 생성하고 데이터 수집을 연결하려면 스토리지 관리자 권한이 필요합니다.

  • 워크스페이스 및 AI Data Engine과 함께 사용하려는 원격(피어링된) 및 로컬 데이터 소스를 결정했습니다.

  • "데이터 컨테이너를 하나 이상 생성했습니다" 워크스페이스에서 사용할 수 있는 볼륨(예: 로컬 볼륨 또는 피어링된 클러스터의 볼륨)이 있습니다.

    중요함 워크스페이스에 볼륨을 추가할 때는 해당 워크스페이스의 예상 수명 기간 동안 삭제하지 않을 볼륨을 선택하십시오. 워크스페이스에 볼륨을 추가한 후 삭제하면 워크스페이스가 실패 상태로 전환됩니다. 워크스페이스를 설정하기 전에 볼륨의 장기적인 안정성을 확인하십시오.
  • 볼륨에서 NFS가 활성화되어 있는지 확인하되 CIFS는 비활성화되어 있는지 확인하십시오. 워크스페이스는 NFS가 활성화된 볼륨만 지원합니다. CIFS(SMB)가 활성화된 볼륨은 지원되지 않습니다.

워크스페이스 만들기

작업 공간을 생성하고 AI Data Engine에서 사용할 데이터가 포함된 데이터 컨테이너를 연결합니다.

단계
  1. ONTAP System Manager에서 *Data Engine > Workspaces*로 이동합니다.

  2. *추가*를 선택합니다.

  3. 워크스페이스 추가 대화 상자에서 워크스페이스와 연결할 수 있는 데이터 컨테이너를 하나 이상 선택합니다.

  4. "피어링된 클러스터"를 구성하여 해당 클러스터의 데이터에 워크스페이스 내에서 액세스할 수 있도록 하십시오.

  5. 워크스페이스에 대한 사용자 액세스 권한을 구성하려면 지금 구성하거나 "워크스페이스가 생성될 때까지 기다리십시오".

  6. 워크스페이스가 연결된 데이터 컨테이너와 동기화되어 새롭거나 업데이트된 데이터를 캡처하는 빈도에 대한 업데이트 간격을 구성합니다(예: 6시간).

    팁 데이터 최신성과 시스템 성능의 균형을 맞추는 간격을 선택하십시오. 여러 작업 공간에 데이터 컨테이너를 추가하면 시스템에서 자동으로 가장 적극적인(가장 짧은) 간격을 사용합니다. 자세한 내용은 워크스페이스 업데이트 및 버전 관리에 대한 문서를 참조하십시오.
  7. *계속*을 선택합니다.

  8. 작업 영역 확정 대화 상자에서 작업 영역 이름과 설명을 입력합니다.

  9. *추가*를 선택하여 워크스페이스를 생성합니다.

결과

작업 공간 생성 프로세스는 관련 데이터 세트, 파일 수, 파일 크기 및 기타 요인에 따라 완료하는 데 몇 분에서 몇 시간이 걸립니다.

이 시스템은 모든 데이터 소스의 메타데이터를 자동으로 추출하여 사용자가 프로젝트에 필요한 파일을 찾을 수 있도록 메타데이터 카탈로그에 저장합니다. 작업 공간에 사용자를 할당하면 데이터 엔지니어 사용자는 AI Data Engine Console에서 작업 공간과 연결된 구성 요소를 설정하고 상호 작용할 수 있습니다.

새 워크스페이스는 프로세스가 완료될 때까지 Workspaces 페이지에 Creating 상태로 표시되며, 완료되면 상태가 `ready`로 변경됩니다.

작업 공간 세부 정보 검토

워크스페이스 생성 후 워크스페이스 세부 정보를 검토하세요.

단계
  1. 전체 크기, 사용된 클러스터 용량의 백분율, 가장 최근 작업 공간 업데이트 날짜 등 작업 공간 세부 정보를 검토하십시오.

  2. 작업 공간 이름을 선택하여 세부 정보 페이지를 엽니다.

  3. 개요 탭에서 연결된 데이터 컨테이너, 사용자 및 활동을 포함한 작업 공간 세부 정보를 확인합니다.

워크스페이스 업데이트 및 버전 관리

워크스페이스를 새로 고칠 때마다 워크스페이스 내 모든 파일과 객체의 현재 상태를 캡처하는 변경 불가능한 버전이 생성됩니다. 버전에는 전체 메타데이터, 추출 중에 사용된 스냅샷에 대한 참조, 추적성을 위한 작업 ID가 포함됩니다. 이를 통해 데이터 계보, 재현성 및 감사 기능을 지원합니다.

새로 고침은 사용자가 구성한 일정(예: 6시간마다)에 따라 또는 수동으로 트리거할 때 발생합니다. 지원되는 최소 업데이트 간격은 1시간이고 최대는 1년입니다. 데이터 컨테이너가 여러 워크스페이스에 포함된 경우 시스템은 메타데이터 추출 일정을 잡을 때 가장 빈번하고 기간이 가장 짧은 업데이트 간격을 사용합니다.

기본적으로 시스템은 이전 버전, 현재 버전 및 다음 버전(진행 중)을 보관합니다. 시스템은 조직의 정책에 따라 이전 버전을 보관하며 필요에 따라 삭제할 수 있습니다.

워크스페이스의 모든 버전을 나열하고 버전 간의 차이점을 확인하여 어떤 파일이나 개체가 추가, 수정 또는 삭제되었는지 파악할 수 있습니다. 이를 통해 시간 경과에 따른 변경 사항을 추적하고 워크스페이스 데이터의 진화를 이해할 수 있습니다.