Skip to main content
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Solução de problemas do GenAI

Colaboradores netapp-mwallis

Aprenda a contornar alguns problemas comuns que você pode encontrar.

Problemas e soluções comuns

Se você tiver um desses problemas, use as etapas na coluna solução alternativa para tentar resolvê-lo.

Área Problema Causa Solução alternativa

Implantação

A implantação falha porque o volume já existe.

O NetApp Workload Factory for GenAI precisa criar um novo volume durante o processo de implantação, mas já existe um volume usando o nome que você especificou.

Especifique um nome exclusivo a ser usado para o novo volume e tente implantar novamente.

Implantação

A implantação falha porque o NetApp Workload Factory para GenAI não consegue montar o volume.

Uma ou mais portas de entrada necessárias para o FSX for NetApp ONTAP são fechadas ou filtradas.

Abra as seguintes portas de entrada:

| Protocolo | Porta | Finalidade

| Todo o ICMP | Tudo | Fazer ping na instância

| HTTPS | 443 | Acesso do conetor ao LIF de gerenciamento fsxadmin para enviar chamadas de API para o FSX

| SSH | 22 | Acesso SSH ao endereço IP do LIF de gerenciamento de cluster ou um LIF de gerenciamento de nó

| TCP | 111 | Chamada de procedimento remoto para NFS

| TCP | 139 | Sessão de serviço NetBIOS para CIFS

| TCP | 161-162 | Protocolo de gerenciamento de rede simples

| TCP | 445 | Microsoft SMB/CIFS sobre TCP com enquadramento NetBIOS

| TCP | 635 | Montagem em NFS

| TCP | 749 | Kerberos

| TCP | 2049 | Daemon do servidor NFS

| TCP | 3260 | Acesso iSCSI através do iSCSI data LIF

| TCP | 4045 | Daemon de bloqueio NFS

| TCP | 4046 | Monitor de status da rede para NFS

| TCP | 10000 | Backup usando NDMP

| TCP | 11104 | Gestão de sessões de comunicação entre clusters para SnapMirror

| TCP | 11105 | Transferência de dados SnapMirror usando LIFs entre clusters

| UDP | 111 | Chamada de procedimento remoto para NFS

| UDP | 161-162 | Protocolo de gerenciamento de rede simples

| UDP | 635 | Montagem em NFS

| UDP | 2049 | Daemon do servidor NFS

| UDP | 4045 | Daemon de bloqueio NFS

| UDP | 4046 | Monitor de status da rede para NFS

| UDP | 4049 | Protocolo rquotad NFS

Manutenção

O mecanismo de IA falha ao iniciar e você vê o erro "erro de instância do mecanismo de IA" na página bases de conhecimento.

A instância do mecanismo de IA foi corrompida ou não existe.

Selecione o botão Reconstruir. O NetApp Workload Factory para GenAI reconstrói a infraestrutura e exibe o progresso da reconstrução. Quando concluído, suas bases de conhecimento serão reconectadas à infraestrutura reconstruída e a lista de bases de conhecimento será exibida.

Manutenção

O mecanismo de IA falha ao iniciar, e você vê o erro "a instância do mecanismo GenAI está parada" na página bases de conhecimento.

A instância do mecanismo de IA não está em execução.

Use o Console de Gerenciamento da AWS ou a CLI da AWS para iniciar a instância do mecanismo de IA.

Manutenção

O mecanismo de IA não arranca e vê o erro "o servidor do motor GenAI não está a responder" na página bases de dados de conhecimento.

A instância do mecanismo de IA não está respondendo.

Use as seguintes etapas de recuperação:

Passos
  1. Modifique o grupo de segurança da instância do mecanismo GenAI para habilitar o acesso SSH à instância do mecanismo GenAI.

  2. Faça login na instância usando SSH.

  3. Execute o seguinte comando:

    docker-compose up

Manutenção

A instância do Docker de backend usada pelo NetApp Workload Factory para GenAI falhou ao iniciar.

O volume foi excluído e a instância EC2 foi reiniciada.

Use as seguintes etapas de recuperação:

Passos
  1. Crie um novo volume no FSX for NetApp ONTAP. Por exemplo, o nome do volume pode ser netapp_ai e o caminho do volume pode ser /netapp_ai.

  2. SSH para a instância do Amazon EC2.

  3. Listar os volumes:

    docker volume list
  4. Retire o volume antigo:

    docker volume rm ec2-user_persistent_folder
  5. Abra o docker-compose.yml arquivo usando um editor de texto.

  6. `volumes`Na secção , altere o caminho do dispositivo para o novo caminho do volume. Por exemplo:

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

Manutenção

A instância do Docker de backend usada pelo NetApp Workload Factory para GenAI falhou ao iniciar.

O volume raiz foi excluído.

Crie um volume com um nome e um caminho e reinicie a instância do Docker de back-end do Amazon EC2.

Manutenção

A instância do Docker de backend usada pelo NetApp Workload Factory para GenAI falhou ao iniciar.

O volume raiz foi excluído.

Crie um volume com um nome e um caminho e reinicie a instância do Docker de back-end do Amazon EC2.