Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

GenAI 인프라를 구축합니다

기여자

조직을 위해 FSx for ONTAP 지식 베이스, 커넥터 및 애플리케이션을 구축하기 전에 환경에 RAG 프레임워크용 GenAI 인프라를 구축해야 합니다. 기본 인프라 구성요소는 Amazon Bedrock 서비스, NetApp GenAI 엔진의 가상 머신 인스턴스 및 FSx for ONTAP 파일 시스템입니다.

구축된 인프라는 여러 지식 베이스, 챗봇, 커넥터를 지원할 수 있으므로 일반적으로 이 작업은 한 번만 수행하면 됩니다.

인프라 세부 정보

GenAI 배포는 Amazon Bedrock이 지원되는 AWS 지역에 있어야 합니다. "지원되는 지역 목록을 봅니다"

인프라는 다음과 같은 구성 요소로 이루어집니다.

아마존 Bedrock 서비스

Amazon Bedrock은 단일 API를 통해 선도적인 AI 회사의 기반 모델(FMS)을 사용할 수 있는 완전 관리형 서비스입니다. 또한 안전한 생성 AI 애플리케이션을 구축하는 데 필요한 기능을 제공합니다.

아마존 Q 비즈니스

Amazon Q는 Amazon Bedrock을 기반으로 구축되어 질문에 답하고 데이터 소스의 정보를 기반으로 콘텐츠를 생성하는 데 사용할 수 있는 완전 관리형 생성 AI 도우미를 제공합니다.

NetApp GenAI 엔진용 가상 머신입니다

이 프로세스 중에 NetApp GenAI 엔진이 배포됩니다. 데이터 소스에서 데이터를 수집한 다음 해당 데이터를 벡터 데이터베이스에 쓸 수 있는 처리 능력을 제공합니다.

FSx for ONTAP 파일 시스템

FSx for ONTAP 파일 시스템은 GenAI 시스템을 위한 스토리지를 제공합니다.

데이터 소스를 기반으로 기본 모델에 의해 생성된 데이터를 저장하는 벡터 데이터베이스를 포함하는 단일 볼륨이 배포됩니다.

기술 자료에 통합할 데이터 소스는 동일한 FSx for ONTAP 파일 시스템 또는 다른 시스템에 상주할 수 있습니다.

NetApp GenAI 엔진은 이 두 볼륨을 모두 모니터링하고 상호 작용합니다.

다음 이미지는 GenAI 인프라를 보여 줍니다. 이 절차를 수행하는 동안 번호가 1, 2, 3인 구성 요소가 전개됩니다. 배포를 시작하기 전에 다른 요소가 있어야 합니다.

GenAI 인프라 구성 요소의 다이어그램

GenAI 인프라를 구축합니다

AWS 자격 증명을 입력하고 FSx for ONTAP 파일 시스템을 선택하여 검색 증강 생성(RAG) 인프라를 배포해야 합니다.

시작하기 전에

이 절차를 시작하기 전에 사용자의 환경이 지식 베이스 또는 커넥터의 요구 사항을 충족하는지 확인하십시오.

단계
  1. 중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.

  2. AI 워크로드 타일에서 * 배포 및 관리 * 를 선택합니다.

  3. 인프라 다이어그램을 검토하고 * Next * 를 선택합니다.

  4. AWS 설정 * 섹션의 항목을 완료합니다.

    1. * AWS 자격 증명 *: AWS 리소스 배포 권한을 제공하는 AWS 자격 증명을 선택하거나 추가합니다.

    2. * 위치 *: AWS 지역, VPC 및 서브넷을 선택합니다.

      GenAI 배포는 Amazon Bedrock이 활성화된 AWS 지역에 있어야 합니다. "지원되는 지역 목록을 봅니다"

  5. 인프라 설정 * 섹션의 항목을 완료합니다.

    1. * 태그 * : 이 배포의 일부인 모든 AWS 리소스에 적용할 태그 키/값 쌍을 입력하십시오. 이러한 태그는 AWS 관리 콘솔 및 워크로드 공장 내의 인프라 정보 영역에 표시되며 워크로드 공장 리소스를 추적하는 데 도움이 됩니다.

  6. Connectivity * 섹션을 완료합니다.

    1. * 키 쌍 * : NetApp GenAI 엔진 인스턴스에 안전하게 연결할 수 있는 키 쌍을 선택하십시오.

  7. AI 엔진 * 섹션을 완료하십시오.

    1. * 인스턴스 이름 *: 필요에 따라 * 인스턴스 이름 정의 * 를 선택하고 AI 엔진 인스턴스의 사용자 정의 이름을 입력합니다. 인스턴스 이름은 AWS 관리 콘솔 및 워크로드 공장 내의 인프라 정보 영역에 표시되며, 작업 부하 공장 리소스를 추적하는 데 도움이 됩니다.

  8. 배포 * 를 선택하여 배포를 시작합니다.

    참고 자격 증명 오류로 인해 배포가 실패하는 경우 오류 메시지 내에서 하이퍼링크를 선택하여 오류 세부 정보를 확인할 수 있습니다. 누락 또는 차단된 권한 목록과 GenAI 워크로드를 배포하기 위해 필요한 권한 목록을 확인할 수 있습니다.
결과

워크로드 팩토리가 챗봇 인프라 구축을 시작합니다. 이 프로세스는 최대 10분 정도 소요될 수 있습니다.

배포 프로세스 중에 다음 항목이 설정됩니다.

  • 네트워크는 전용 끝점과 함께 설정됩니다.

  • IAM 역할, 인스턴스 프로필 및 보안 그룹이 생성됩니다.

  • GenAI 엔진의 가상 머신 인스턴스가 배포됩니다.

  • Amazon Bedrock은 접두사가 있는 로그 그룹을 사용하여 Amazon CloudWatch 로그에 로그를 보내도록 구성되어 `/aws/bedrock/`있습니다.

  • GenAI 엔진은 이름이 지정된 로그 그룹을 사용하여 Amazon CloudWatch 로그에 로그를 전송하도록 구성되어 /netapp/wlmai/<tenancyAccountId>/randomId`있습니다. 여기서 는 현재 사용자에 대한 입니다. `<tenancyAccountID> "BlueXP 계정 ID입니다"