Skip to main content
AI Data Engine
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

데이터 자산에 대한 AI Data Engine의 Data Guardrails 정책을 정의하십시오

기여자 netapp-dbagwell

데이터 또는 플랫폼 소유자는 AI Data Engine Console을 사용하여 AI 적용 범위에 포함되는 데이터, 항상 사용이 금지되는 데이터, 그리고 해당 데이터가 분류 및 검색 증강 생성(RAG)에 사용될 때 적용되는 안전 규칙을 정의할 수 있습니다.

이러한 절차를 사용하여 AI Data Engine Console에서 해당 정책을 정의하면 ONTAP System Manager가 작업 공간의 모든 데이터에 해당 정책을 적용할 수 있습니다.

시작하기 전에
  • AI Data Engine Console (`\https://<cluster_management_ip>/console`에서 전역 정책을 생성하고 관리하려면 스토리지 관리자 권한이 필요합니다.

  • 배포되고 정상 상태인 데이터 컴퓨팅 노드가 있는 AIDE 클러스터가 있습니다.

  • "OpenID Connect(OIDC)"가 구성되어 있으며 IdP 역할이 데이터 정책 관리를 허용하는 AIDE 관리자 역할에 매핑되어 있습니다.

  • AI Data Engine software 라이센스가 설치되어 Data Guardrails 및 추론 기능이 활성화됩니다.

  • 워크스페이스가 하나 이상 존재하거나, 관리자와 협의하여 워크스페이스에서 사용할 데이터 소스(볼륨)를 파악했습니다.

정책 유형 이해

AI Data Engine Console은 데이터 환경을 구성하는 다음과 같은 정책 유형을 보여줍니다.

  • 분류기: 모든 작업 공간에서 PII, 보안 문제 또는 기타 패턴을 감지하도록 분류기를 활성화합니다.

  • 분류기 범주: 조직 및 관리를 위해 규정 준수 범주로 분류기를 그룹화합니다.

  • Data Guardrails 정책: 정보 검색 또는 추론 시 적용되는 안전 및 삭제 규칙.

ONTAP System Manager를 사용하여 이러한 Data Guardrails 정책을 생성하거나 관리할 수 없습니다. 스토리지 관리자가 워크스페이스에 정책을 적용할 때 해당 정책을 읽고 적용하는 기능만 수행합니다. 모든 정책 정의 및 유지 관리는 AI Data Engine Console에서 이루어집니다.

분류기 활성화

분류기는 메타데이터와 콘텐츠를 모두 분석하여 파일과 객체에 주석을 추가합니다(예: 개인 식별 정보 또는 민감한 범주 감지). 워크스페이스 데이터에서 분류기를 실행하려면 AIDE Console에서 분류기를 활성화해야 합니다.

이 작업 정보

분류기 동작은 AI Data Engine Console에서 전역적으로 제어됩니다. 활성화된 모든 분류기는 모든 작업 공간에서 실행됩니다. 전역적으로 적용되므로 개별 작업 공간에 대해서는 활성화 또는 비활성화할 수 없습니다. 전역적으로만 활성화 또는 비활성화가 가능합니다.

단계
  1. AIDE Console에서 *Data Guardrails > Classifiers*로 이동합니다.

  2. 분류기 범주를 선택하면 해당 범주에 포함된 분류기가 표시됩니다.

  3. 활성화할 분류기의 확인란을 선택하거나 모든 행을 선택하여 분류기를 일괄적으로 활성화합니다.

  4. *Enable*을 선택합니다.

    팁 일괄 선택 옵션을 사용하여 여러 분류기를 한 번에 활성화할 수 있습니다. 분류기를 활성화할 때마다 모든 워크스페이스가 새로 고쳐집니다. 불필요한 새로 고침을 최소화하려면 분류기를 하나씩 활성화하는 대신 여러 분류기를 한 번에 활성화하세요.
결과

새로 생성된 워크스페이스와 기존 워크스페이스 모두 메타데이터 처리 중에 활성화된 분류기를 실행합니다.

분류 태그는 메타데이터 카탈로그에 기록되며 데이터 엔지니어가 데이터 수집을 생성할 때 필터링에 사용할 수 있게 됩니다.

분류기 범주 관리

분류자는 "PII" 또는 "Financial data"와 같은 범주로 구성됩니다. 범주를 사용하면 관련 분류자를 그룹화하여 관리 및 규정 준수 현황을 더 쉽게 파악할 수 있습니다. AIDE가 제공하는 기본 범주를 사용하거나 규정 준수 요구 사항에 맞춰 사용자 지정 범주를 생성할 수 있습니다.

단계
  1. AIDE Console에서 *Data Guardrails > Classifiers*로 이동합니다.

  2. 기존 분류기 범주를 확인하세요. 분류에는 크게 두 가지 범주가 있습니다.

    • 콘텐츠 또는 데이터: 파일 내의 특정 유형의 데이터를 감지합니다.

    • 문서: 콘텐츠를 기반으로 문서 유형을 분류합니다.

  3. 기본 분류기 하위 범주가 충분한지 또는 사용자 지정 하위 범주를 만들지 여부를 결정합니다.

    • 기본 분류자 하위 범주(예: General Privacy)를 사용하는 경우:

      1. 분류기 범주에서 범주 이름을 선택하면 해당 분류기가 표시됩니다.

      2. 분류기 목록을 살펴보세요.

      3. *추가*를 선택하여 사용 가능한 분류기의 전체 목록에서 목록에 없는 분류기를 찾아 추가합니다.

    • 사용자 지정 카테고리를 만들려면 파란색 더하기 기호 뒤에 Add라는 단어가 있습니다을(를) 선택합니다.

      1. 고유한 이름과 설명을 추가하고 사용 가능한 분류자를 범주에 할당하세요.

      2. 추가 를 선택합니다

  4. 범주 내 분류자를 비활성화하려면 분류자에 대해 파란색 가로 점 3개를 선택하고 *비활성화*를 선택하세요. 모든 행을 선택하여 일괄적으로 상태를 변경할 수도 있습니다.

결과

범주는 규정 준수 여부를 파악하기 위한 분류기를 구성합니다. 데이터 엔지니어는 데이터 수집을 필터링하고 생성할 때 분류 태그를 사용할 수 있습니다.

Data Guardrails 정책을 생성하고 관리합니다.

Data Guardrails 정책은 분류기가 민감한 콘텐츠를 감지하거나 프롬프트 및 검색 결과가 콘텐츠 규칙을 위반할 때 AIDE가 어떻게 대응하는지를 결정합니다.

일반적인 Guardrail 동작은 다음과 같습니다.

  • 검색된 스니펫에서 PII를 마스킹하거나 삭제합니다.

  • 규정 준수 규칙을 위반하는 답변 차단.

  • 감사를 위해 위반 사항을 기록하거나 태그 지정합니다.

이 작업 정보

가드레일 정책은 AI Data Engine Console에서만 생성하고 관리할 수 있습니다.

ONTAP System Manager에서는 한 번에 하나의 guardrail 정책에만 작업 영역을 연결할 수 있습니다.

단계
  1. AIDE Console에서 Data Guardrails > *Guardrail policies*로 이동합니다.

  2. *추가*를 선택합니다.

  3. 범위를 명확하게 설명하는 이름과 설명을 입력합니다(예: Customer PII redaction for support KB).

  4. 가드레일 활성화에 필요한 데이터 분류기 기반 조건을 구성합니다.

    1. 가드레일 활성화 조건을 정의합니다.

      1. 각 조건에 대해 분류기 범주 또는 분류기 유형을 선택하십시오.

      2. 필요에 따라 추가 조건을 추가하고 정의하십시오.

      3. *Search*에서 구체적인 검색 조건을 정의한 다음 *Accept*를 선택하세요.

    2. 가드레일 정책에 대한 작업을 정의합니다(예: 콘텐츠 익명화 또는 데이터 수집에서 파일 차단 및 제거).

  5. Data Guardrails를 적용할 작업 공간을 선택하십시오.

  6. 정책 상태를 설정합니다.

    • Enabled: 정책을 즉시 활성화합니다.

    • 테스트 모드: 정책을 활성화하기 전에 정책의 영향을 검증할 수 있습니다.

    • 비활성화됨: Data Guardrails를 적용하지 않고 저장합니다.

  7. 정책을 저장하고 작업 공간에 적용하려면 추가 를 선택하십시오.

    팁 엄격한 적용을 활성화하기 전에 파일럿 작업 공간과 비프로덕션 데이터 수집을 통해 *테스트 모드*를 사용하여 얼마나 많은 응답이 영향을 받을지 파악하십시오.
결과

새로운 Data Guardrails 정책이 활성화되었으며 선택된 작업 공간에 적용됩니다.

정책이 작업 영역과 상호 작용하는 방식

정책이 정의된 후:

  • 스토리지 관리자는 ONTAP System Manager를 사용하여 워크스페이스를 생성하고, 데이터 컨테이너를 선택하고, 가드레일 정책을 연결합니다.

  • 분류자는 사용자가 활성화한 내용을 기반으로 작업 영역 콘텐츠에서 자동으로 실행됩니다.

  • 작업 영역에 연결된 Data Guardrails는 검색 엔드포인트의 동작 방식에 영향을 미칩니다.

데이터 엔지니어 및 데이터 과학자:

  • 표시되는 데이터 자산(작업 영역 및 데이터 컬렉션)은 이미 역할 할당별로 필터링되어 있습니다.

  • 사용자가 조회하는 메타데이터(예: PII 태그)는 활성화된 분류자에 따라 결정됩니다.

  • RAG 파이프라인이 수신하는 응답은 워크스페이스 수준에서 구성된 Data Guardrails에 의해 제한됩니다.