Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

GenAI 문제 해결

기여자 netapp-mwallis

발생할 수 있는 몇 가지 일반적인 문제를 해결하는 방법에 대해 알아봅니다.

일반적인 문제 및 해결 방법

이러한 문제 중 하나가 있는 경우 해결 방법 열에 있는 단계를 사용하여 문제를 해결할 수 있습니다.

영역 문제 원인 해결 방법

구축

볼륨이 이미 있기 때문에 배포가 실패합니다.

GenAI용 BlueXP  워크로드 팩토리에는 구축 프로세스 중에 새 볼륨을 생성해야 하지만, 지정한 이름을 사용하는 볼륨이 이미 존재합니다.

새 볼륨에 사용할 고유한 이름을 지정하고 다시 배포하십시오.

구축

GenAI용 BlueXP  워크로드 팩토리에서 볼륨을 마운트할 수 없기 때문에 구축이 실패합니다.

FSx for NetApp ONTAP에 필요한 하나 이상의 인바운드 포트가 닫히거나 필터링되었습니다.

다음 인바운드 포트를 엽니다.

| 프로토콜 | 포트 | 목적

| 모든 ICMP | 모두 | 인스턴스에 Ping을 수행 중입니다

| HTTPS | 443 | Connector에서 fsxadmin 관리 LIF로 액세스하여 FSx로 API 호출을 전송합니다

| SSH를 클릭합니다 | 22 | 클러스터 관리 LIF 또는 노드 관리 LIF의 IP 주소에 SSH를 액세스할 수 있습니다

| TCP | 111 | NFS에 대한 원격 프로시저 호출

| TCP | 139 | CIFS에 대한 NetBIOS 서비스 세션입니다

| TCP | 161-162 을 참조하십시오 | 단순한 네트워크 관리 프로토콜

| TCP | 445 | Microsoft SMB/CIFS over TCP 및 NetBIOS 프레임

| TCP | 635 | NFS 마운트

| TCP | 749 | Kerberos

| TCP | 2049 | NFS 서버 데몬

| TCP | 3260 | iSCSI 데이터 LIF를 통한 iSCSI 액세스

| TCP | 4045 | NFS 잠금 데몬

| TCP | 4046 | NFS에 대한 네트워크 상태 모니터

| TCP | 10000 | NDMP를 사용한 백업

| TCP | 11104 | SnapMirror에 대한 인터클러스터 통신 세션의 관리

| TCP | 11105 | 인터클러스터 LIF를 사용하여 SnapMirror 데이터 전송

| UDP입니다 | 111 | NFS에 대한 원격 프로시저 호출

| UDP입니다 | 161-162 을 참조하십시오 | 단순한 네트워크 관리 프로토콜

| UDP입니다 | 635 | NFS 마운트

| UDP입니다 | 2049 | NFS 서버 데몬

| UDP입니다 | 4045 | NFS 잠금 데몬

| UDP입니다 | 4046 | NFS에 대한 네트워크 상태 모니터

| UDP입니다 | 4049 | NFS rquotad 프로토콜

유지 관리

AI 엔진을 시작하지 못하고 * Knowledge Base * 페이지에 "AI engine instance error" 오류가 표시됩니다.

AI 엔진 인스턴스가 손상되었거나 존재하지 않습니다.

Rebuild * 버튼을 선택합니다. GenAI를 위한 BlueXP  워크로드 공장은 인프라를 리빌드하고 리빌드 진행률을 표시합니다. 완료되면 지식 베이스가 재구축된 인프라에 다시 연결되고 지식 베이스 목록이 표시됩니다.

유지 관리

AI 엔진이 시작되지 않고 * Knowledge Base * 페이지에 "GenAI 엔진 인스턴스가 중지되었습니다" 오류가 표시됩니다.

AI 엔진 인스턴스가 실행되고 있지 않습니다.

AWS Management Console 또는 AWS CLI를 사용하여 AI 엔진 인스턴스를 시작합니다.

유지 관리

AI 엔진이 시작되지 않고 * Knowledge Base * 페이지에 "GenAI 엔진 서버가 응답하지 않습니다"라는 오류가 표시됩니다.

AI 엔진 인스턴스가 응답하지 않습니다.

다음 복구 단계를 사용합니다.

단계
  1. GenAI 엔진 인스턴스에 대한 SSH 액세스를 사용하도록 GenAI 엔진 인스턴스 보안 그룹을 수정합니다.

  2. SSH를 사용하여 인스턴스에 로그인합니다.

  3. 다음 명령을 실행합니다.

    docker-compose up

유지 관리

BlueXP  워크로드 팩터에서 GenAI를 사용하는 백엔드 Docker 인스턴스를 시작하지 못했습니다.

볼륨이 삭제되고 EC2 인스턴스가 다시 시작되었습니다.

다음 복구 단계를 사용합니다.

단계
  1. FSx for NetApp ONTAP에서 새 볼륨을 생성합니다. 예를 들어, 볼륨 이름은 netapp_ai 이고 볼륨 경로는 일 수 /netapp_ai 있습니다.

  2. Amazon EC2 인스턴스에 대한 SSH.

  3. 볼륨 나열:

    docker volume list
  4. 이전 볼륨 제거:

    docker volume rm ec2-user_persistent_folder
  5. `docker-compose.yml`텍스트 편집기를 사용하여 파일을 엽니다.

  6. `volumes`섹션에서 디바이스 경로를 새 볼륨 경로로 변경합니다. 예를 들면 다음과 같습니다.

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

유지 관리

BlueXP  워크로드 팩터에서 GenAI를 사용하는 백엔드 Docker 인스턴스를 시작하지 못했습니다.

루트 볼륨이 삭제되었습니다.

이름과 경로를 사용하여 볼륨을 생성한 다음 Amazon EC2에서 백엔드 Docker 인스턴스를 다시 시작합니다.

유지 관리

BlueXP  워크로드 팩터에서 GenAI를 사용하는 백엔드 Docker 인스턴스를 시작하지 못했습니다.

루트 볼륨이 삭제되었습니다.

이름과 경로를 사용하여 볼륨을 생성한 다음 Amazon EC2에서 백엔드 Docker 인스턴스를 다시 시작합니다.