Dépannage GenAI
Apprenez à contourner certains problèmes courants que vous pourriez rencontrer.
Problèmes courants et solutions
Si vous rencontrez l'un de ces problèmes, vous pouvez suivre les étapes de la colonne solution de contournement pour essayer de le résoudre.
| De service | Problème | Cause | Solution de contournement |
|---|---|---|---|
Déploiement |
Le déploiement échoue, car le volume existe déjà. |
NetApp Workload Factory for GenAI doit créer un nouveau volume pendant le processus de déploiement, mais un volume existe déjà avec le nom que vous avez spécifié. |
Spécifiez un nom unique à utiliser pour le nouveau volume et essayez à nouveau de déployer. |
Déploiement |
Le déploiement échoue car NetApp Workload Factory pour GenAI ne parvient pas à monter le volume. |
Un ou plusieurs des ports entrants requis pour FSX pour NetApp ONTAP sont fermés ou filtrés. |
Ouvrez les ports entrants suivants : |
| Protocole | Port | Objectif
| Tous les protocoles ICMP | Tout | Envoi d'une requête ping à l'instance
| HTTPS | 443 | Accès depuis le connecteur à la LIF de gestion fsxadmin pour envoyer des appels API à FSX
| SSH | 22 | Accès SSH à l'adresse IP du LIF de gestion de cluster ou d'un LIF de gestion de nœud
| TCP | 111 | Appel de procédure à distance pour NFS
| TCP | 139 | Session de service NetBIOS pour CIFS
| TCP | 161-162 | Protocole de gestion de réseau simple
| TCP | 445 | Microsoft SMB/CIFS sur TCP avec encadrement NetBIOS
| TCP | 635 | Montage NFS
| TCP | 749 | Kerberos
| TCP | 2049 | Démon du serveur NFS
| TCP | 3260 | Accès iSCSI via le LIF de données iSCSI
| TCP | 4045 | Démon de verrouillage NFS
| TCP | 4046 | Surveillance de l'état du réseau pour NFS
| TCP | 10000 | Sauvegarde avec NDMP
| TCP | 11104 | Gestion des sessions de communication intercluster pour SnapMirror
| TCP | 11105 | Transfert de données SnapMirror à l'aide de LIF intercluster
| UDP | 111 | Appel de procédure à distance pour NFS
| UDP | 161-162 | Protocole de gestion de réseau simple
| UDP | 635 | Montage NFS
| UDP | 2049 | Démon du serveur NFS
| UDP | 4045 | Démon de verrouillage NFS
| UDP | 4046 | Surveillance de l'état du réseau pour NFS
| UDP | 4049 | Protocole NFS rquotad
Maintenance |
Le moteur ai ne démarre pas et vous voyez l'erreur "erreur d'instance de moteur ai" sur la page bases de connaissances. |
L'instance du moteur ai a été corrompue ou n'existe pas. |
Sélectionnez le bouton Reconstruire. NetApp Workload Factory pour GenAI reconstruit l'infrastructure et affiche la progression de la reconstruction. Une fois terminé, vos bases de connaissances sont reconnectées à l'infrastructure reconstruite et la liste des bases de connaissances s'affiche. |
Maintenance |
Le moteur ai ne démarre pas et vous voyez l'erreur "l'instance du moteur GenAI est arrêtée" sur la page bases de connaissances. |
L'instance du moteur ai n'est pas en cours d'exécution. |
Utilisez la console de gestion AWS ou l'interface de ligne de commande AWS pour démarrer l'instance du moteur ai. |
Maintenance |
Le moteur ai ne démarre pas et vous voyez l'erreur "le serveur du moteur GenAI ne répond pas" sur la page bases de connaissances. |
L'instance du moteur ai ne répond pas. |
Procédez comme suit pour la restauration : Étapes
|
Maintenance |
L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer. |
Le volume a été supprimé et l'instance EC2 a été redémarrée. |
Procédez comme suit pour la restauration : Étapes
|
Maintenance |
L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer. |
Le volume root a été supprimé. |
Créez un volume avec un nom et un chemin, puis redémarrez l'instance Docker back-end à partir d'Amazon EC2. |
Maintenance |
L'instance Docker backend utilisée par NetApp Workload Factory pour GenAI n'a pas pu démarrer. |
Le volume root a été supprimé. |
Créez un volume avec un nom et un chemin, puis redémarrez l'instance Docker back-end à partir d'Amazon EC2. |