生成AIのトラブルシューティング
発生する可能性のある一般的な問題を回避する方法について説明します。
一般的な問題と解決策
これらのいずれかの問題がある場合は、[Workaround]列の手順を使用して解決できます。
面積 | 問題 | 原因 | 回避策 |
---|---|---|---|
導入 |
ボリュームがすでに存在するため導入に失敗します。 |
生成AI用のBlueXP ワークロードファクトリでは導入プロセスで新しいボリュームを作成する必要がありますが、指定した名前のボリュームがすでに存在します。 |
新しいボリュームに使用する一意の名前を指定してから、導入を再試行してください。 |
導入 |
生成AI用のBlueXP ワークロードファクトリでボリュームをマウントできないため、導入が失敗します。 |
FSx for NetApp ONTAPに必要な1つ以上のインバウンドポートが閉じているか、フィルタリングされています。 |
次のインバウンドポートを開きます。 |
| プロトコル | ポート | 目的
| すべての ICMP | すべて | インスタンスの ping を実行します
| HTTPS | 443 | fsxadmin管理LIFへのコネクタからアクセスし、API呼び出しをFSXに送信します
| SSH | 22 | クラスタ管理 LIF またはノード管理 LIF の IP アドレスへの SSH アクセス
| TCP | 111 | NFS のリモートプロシージャコール
| TCP | 139 | CIFS の NetBIOS サービスセッション
| TCP | 161-162 | 簡易ネットワーク管理プロトコル
| TCP | 445 | NetBIOS フレーム同期を使用した Microsoft SMB over TCP
| TCP | 635 | NFSマウント
| TCP | 749 | Kerberos
| TCP | 2049 | NFSサーバデーモン
| TCP | 3260 | iSCSI データ LIF を介した iSCSI アクセス
| TCP | 4045 | NFSロックデーモン
| TCP | 4046 | NFS のネットワークステータスモニタ
| TCP | 10000 | NDMP を使用したバックアップ
| TCP | 11104 | SnapMirror のクラスタ間通信セッションの管理
| TCP | 11105 | クラスタ間 LIF を使用した SnapMirror データ転送
| UDP | 111 | NFS のリモートプロシージャコール
| UDP | 161-162 | 簡易ネットワーク管理プロトコル
| UDP | 635 | NFSマウント
| UDP | 2049 | NFSサーバデーモン
| UDP | 4045 | NFSロックデーモン
| UDP | 4046 | NFS のネットワークステータスモニタ
| UDP | 4049 | NFS rquotadプロトコル
メンテナンス |
AIエンジンが起動せず、*ナレッジベース*ページに「AIエンジンインスタンスエラー」というエラーが表示されます。 |
AIエンジンインスタンスが破損しているか、存在しません。 |
[再構築(Rebuild)]ボタンを選択します。BlueXP Workload Factory for生成AIでインフラがリビルドされ、リビルドの進捗状況が表示されます。完了すると、ナレッジベースが再構築されたインフラストラクチャに再接続され、ナレッジベースのリストが表示されます。 |
メンテナンス |
AIエンジンが起動せず、*ナレッジベース*ページに「The生成AI engine instance is stopped」というエラーが表示されます。 |
AIエンジンインスタンスが実行されていません。 |
AWS Management ConsoleまたはAWS CLIを使用して、AIエンジンインスタンスを起動します。 |
メンテナンス |
AIエンジンが起動せず、*ナレッジベース*ページに「The生成AI engine server is not responding」というエラーが表示されます。 |
AIエンジンインスタンスが応答していません。 |
次のリカバリ手順を実行します。 手順
|
メンテナンス |
BlueXP ワークロードファクトリで 生成AI用に使用されるバックエンドDockerインスタンスを起動できませんでした。 |
ボリュームが削除され、EC2インスタンスが再起動されました。 |
次のリカバリ手順を実行します。 手順
|
メンテナンス |
BlueXP ワークロードファクトリで 生成AI用に使用されるバックエンドDockerインスタンスを起動できませんでした。 |
ルートボリュームが削除されました。 |
名前とパスを指定してボリュームを作成し、Amazon EC2からバックエンドDockerインスタンスを再起動します。 |
メンテナンス |
BlueXP ワークロードファクトリで 生成AI用に使用されるバックエンドDockerインスタンスを起動できませんでした。 |
ルートボリュームが削除されました。 |
名前とパスを指定してボリュームを作成し、Amazon EC2からバックエンドDockerインスタンスを再起動します。 |