Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

GenAI 疑難排解

貢獻者 netapp-mwallis

瞭解如何解決您可能遇到的一些常見問題。

常見問題與解決方案

如果您有上述其中一個問題、可以使用「因應措施」欄中的步驟來嘗試解決。

區域 問題 原因 因應措施

部署

部署失敗、因為磁碟區已經存在。

GenAI 的 BlueXP  工作負載工廠需要在部署過程中建立新的 Volume ,但已使用您指定的名稱存在一個 Volume 。

指定新磁碟區使用的唯一名稱、然後再次嘗試部署。

部署

由於 GenAI 的 BlueXP  工作負載工廠無法裝載磁碟區,因此部署失敗。

NetApp ONTAP 的 FSX 所需的一或多個輸入連接埠會關閉或篩選。

開啟下列輸入連接埠:

| 傳輸協定 | 連接埠 | 目的

| 所有 ICMP | 全部 | Ping 執行個體

| HTTPS | 443 | 從Connector存取fsxadmin管理LIF、將API呼叫傳送至FSX

| SSH | 22 | SSH 存取叢集管理 LIF 的 IP 位址或節點管理 LIF

| TCP | 111 | 遠端程序需要 NFS

| TCP | 139 | CIFS 的 NetBios 服務工作階段

| TCP | 161-162 | 簡單的網路管理傳輸協定

| TCP | 445 | Microsoft SMB/CIFS over TCP 搭配 NetBios 架構

| TCP | 635 | NFS 掛載

| TCP | 749 | Kerberos

| TCP | 2049 | NFS 伺服器精靈

| TCP | 3260 | 透過 iSCSI 資料 LIF 存取 iSCSI

| TCP | 4045 | NFS 鎖定精靈

| TCP | 4046 | NFS 的網路狀態監控

| TCP | 10000 | 使用 NDMP 備份

| TCP | 11104 | 管理 SnapMirror 的叢集間通訊工作階段

| TCP | 11105 | 使用叢集間生命體進行 SnapMirror 資料傳輸

| UDP | 111 | 遠端程序需要 NFS

| UDP | 161-162 | 簡單的網路管理傳輸協定

| UDP | 635 | NFS 掛載

| UDP | 2049 | NFS 伺服器精靈

| UDP | 4045 | NFS 鎖定精靈

| UDP | 4046 | NFS 的網路狀態監控

| UDP | 4049 | NFS rquotad 傳輸協定

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到「 AI engine instance error 」( AI 引擎執行個體錯誤)錯誤。

AI 引擎執行個體毀損或不存在。

選擇 * 重建 * 按鈕。GenAI 的 BlueXP  工作負載工廠會重建基礎架構,並顯示重建進度。完成後,您的知識庫會重新連線至重建的基礎架構,並顯示知識庫清單。

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到錯誤「 GenAI 引擎執行個體已停止」。

AI 引擎執行個體未執行。

使用 AWS 管理主控台或 AWS CLI 啟動 AI 引擎執行個體。

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到錯誤「 GenAI 引擎伺服器沒有回應」。

AI 引擎執行個體沒有回應。

請使用下列還原步驟:

步驟
  1. 修改 GenAI 引擎執行個體安全性群組,以啟用對 GenAI 引擎執行個體的 SSH 存取。

  2. 使用 SSH 登入執行個體。

  3. 執行下列命令:

    docker-compose up

維護

GenAI 的 BlueXP  工作負載工廠所使用的後端 Docker 執行個體無法啟動。

磁碟區已刪除、 EC2 執行個體已重新啟動。

請使用下列還原步驟:

步驟
  1. 在適用於 NetApp ONTAP 的 FSX 上建立新的 Volume 。例如、 Volume 名稱可以是 netapp_ai /netapp_ai、而 Volume 路徑可以是。

  2. SSH 至 Amazon EC2 執行個體。

  3. 列出磁碟區:

    docker volume list
  4. 移除舊 Volume :

    docker volume rm ec2-user_persistent_folder
  5. `docker-compose.yml`使用文字編輯器開啟檔案。

  6. 在 `volumes`區段中、將裝置路徑變更為新的 Volume 路徑。例如:

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

維護

GenAI 的 BlueXP  工作負載工廠所使用的後端 Docker 執行個體無法啟動。

根磁碟區已刪除。

使用名稱和路徑建立 Volume 、然後從 Amazon EC2 重新啟動後端 Docker 執行個體。

維護

GenAI 的 BlueXP  工作負載工廠所使用的後端 Docker 執行個體無法啟動。

根磁碟區已刪除。

使用名稱和路徑建立 Volume 、然後從 Amazon EC2 重新啟動後端 Docker 執行個體。