Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Dépannage GenAI

Contributeurs netapp-mwallis

Apprenez à contourner certains problèmes courants que vous pourriez rencontrer.

Problèmes courants et solutions

Si vous rencontrez l'un de ces problèmes, vous pouvez suivre les étapes de la colonne solution de contournement pour essayer de le résoudre.

De service Problème Cause Solution de contournement

Déploiement

Le déploiement échoue, car le volume existe déjà.

NetApp Workload Factory for GenAI doit créer un nouveau volume pendant le processus de déploiement, mais un volume existe déjà avec le nom que vous avez spécifié.

Spécifiez un nom unique à utiliser pour le nouveau volume et essayez à nouveau de déployer.

Déploiement

Le déploiement échoue car NetApp Workload Factory pour GenAI ne parvient pas à monter le volume.

Un ou plusieurs des ports entrants requis pour FSX pour NetApp ONTAP sont fermés ou filtrés.

Ouvrez les ports entrants suivants :

| Protocole | Port | Objectif

| Tous les protocoles ICMP | Tout | Envoi d'une requête ping à l'instance

| HTTPS | 443 | Accès depuis le connecteur à la LIF de gestion fsxadmin pour envoyer des appels API à FSX

| SSH | 22 | Accès SSH à l'adresse IP du LIF de gestion de cluster ou d'un LIF de gestion de nœud

| TCP | 111 | Appel de procédure à distance pour NFS

| TCP | 139 | Session de service NetBIOS pour CIFS

| TCP | 161-162 | Protocole de gestion de réseau simple

| TCP | 445 | Microsoft SMB/CIFS sur TCP avec encadrement NetBIOS

| TCP | 635 | Montage NFS

| TCP | 749 | Kerberos

| TCP | 2049 | Démon du serveur NFS

| TCP | 3260 | Accès iSCSI via le LIF de données iSCSI

| TCP | 4045 | Démon de verrouillage NFS

| TCP | 4046 | Surveillance de l'état du réseau pour NFS

| TCP | 10000 | Sauvegarde avec NDMP

| TCP | 11104 | Gestion des sessions de communication intercluster pour SnapMirror

| TCP | 11105 | Transfert de données SnapMirror à l'aide de LIF intercluster

| UDP | 111 | Appel de procédure à distance pour NFS

| UDP | 161-162 | Protocole de gestion de réseau simple

| UDP | 635 | Montage NFS

| UDP | 2049 | Démon du serveur NFS

| UDP | 4045 | Démon de verrouillage NFS

| UDP | 4046 | Surveillance de l'état du réseau pour NFS

| UDP | 4049 | Protocole NFS rquotad

Maintenance

Le moteur ai ne démarre pas et vous voyez l'erreur "erreur d'instance de moteur ai" sur la page bases de connaissances.

L'instance du moteur ai a été corrompue ou n'existe pas.

Sélectionnez le bouton Reconstruire. NetApp Workload Factory pour GenAI reconstruit l'infrastructure et affiche la progression de la reconstruction. Une fois terminé, vos bases de connaissances sont reconnectées à l'infrastructure reconstruite et la liste des bases de connaissances s'affiche.

Maintenance

Le moteur ai ne démarre pas et vous voyez l'erreur "l'instance du moteur GenAI est arrêtée" sur la page bases de connaissances.

L'instance du moteur ai n'est pas en cours d'exécution.

Utilisez la console de gestion AWS ou l'interface de ligne de commande AWS pour démarrer l'instance du moteur ai.

Maintenance

Le moteur ai ne démarre pas et vous voyez l'erreur "le serveur du moteur GenAI ne répond pas" sur la page bases de connaissances.

L'instance du moteur ai ne répond pas.

Procédez comme suit pour la restauration :

Étapes
  1. Modifiez le groupe de sécurité de l'instance du moteur GenAI pour activer l'accès SSH à l'instance du moteur GenAI.

  2. Connectez-vous à l'instance à l'aide de SSH.

  3. Exécutez la commande suivante :

    docker-compose up

Maintenance

L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer.

Le volume a été supprimé et l'instance EC2 a été redémarrée.

Procédez comme suit pour la restauration :

Étapes
  1. Créez un volume sur FSX pour NetApp ONTAP. Par exemple, le nom du volume peut être netapp_ai et le chemin du volume peut être /netapp_ai.

  2. SSH vers l'instance Amazon EC2.

  3. Lister les volumes :

    docker volume list
  4. Supprimez l'ancien volume :

    docker volume rm ec2-user_persistent_folder
  5. Ouvrez le docker-compose.yml fichier à l'aide d'un éditeur de texte.

  6. Dans la volumes section, modifiez le chemin d'accès du périphérique sur le nouveau chemin d'accès du volume. Par exemple :

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

Maintenance

L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer.

Le volume root a été supprimé.

Créez un volume avec un nom et un chemin, puis redémarrez l'instance Docker back-end à partir d'Amazon EC2.

Maintenance

L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer.

Le volume root a été supprimé.

Créez un volume avec un nom et un chemin, puis redémarrez l'instance Docker back-end à partir d'Amazon EC2.