Skip to main content
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

GenAI 疑難排解

貢獻者 netapp-mwallis

瞭解如何解決您可能遇到的一些常見問題。

常見問題與解決方案

如果您有上述其中一個問題、可以使用「因應措施」欄中的步驟來嘗試解決。

區域 問題 原因 因應措施

部署

部署失敗、因為磁碟區已經存在。

NetApp Workload Factory for GenAI 需要在部署過程中建立新磁碟區,但使用您指定的名稱的磁碟區已經存在。

指定新磁碟區使用的唯一名稱、然後再次嘗試部署。

部署

部署失敗,因為NetApp Workload Factory for GenAI 無法掛載該磁碟區。

NetApp ONTAP 的 FSX 所需的一或多個輸入連接埠會關閉或篩選。

開啟下列輸入連接埠:

| 傳輸協定 | 連接埠 | 目的

| 所有 ICMP | 全部 | Ping 執行個體

| HTTPS | 443 | 從Connector存取fsxadmin管理LIF、將API呼叫傳送至FSX

| SSH | 22 | SSH 存取叢集管理 LIF 的 IP 位址或節點管理 LIF

| TCP | 111 | 遠端程序需要 NFS

| TCP | 139 | CIFS 的 NetBios 服務工作階段

| TCP | 161-162 | 簡單的網路管理傳輸協定

| TCP | 445 | Microsoft SMB/CIFS over TCP 搭配 NetBios 架構

| TCP | 635 | NFS 掛載

| TCP | 749 | Kerberos

| TCP | 2049 | NFS 伺服器精靈

| TCP | 3260 | 透過 iSCSI 資料 LIF 存取 iSCSI

| TCP | 4045 | NFS 鎖定精靈

| TCP | 4046 | NFS 的網路狀態監控

| TCP | 10000 | 使用 NDMP 備份

| TCP | 11104 | 管理 SnapMirror 的叢集間通訊工作階段

| TCP | 11105 | 使用叢集間生命體進行 SnapMirror 資料傳輸

| UDP | 111 | 遠端程序需要 NFS

| UDP | 161-162 | 簡單的網路管理傳輸協定

| UDP | 635 | NFS 掛載

| UDP | 2049 | NFS 伺服器精靈

| UDP | 4045 | NFS 鎖定精靈

| UDP | 4046 | NFS 的網路狀態監控

| UDP | 4049 | NFS rquotad 傳輸協定

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到「 AI engine instance error 」( AI 引擎執行個體錯誤)錯誤。

AI 引擎執行個體毀損或不存在。

選擇*重建*按鈕。 NetApp Workload Factory for GenAI 重建基礎架構並顯示重建進度。完成後,您的知識庫將重新連接到重建的基礎設施,並顯示知識庫清單。

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到錯誤「 GenAI 引擎執行個體已停止」。

AI 引擎執行個體未執行。

使用 AWS 管理主控台或 AWS CLI 啟動 AI 引擎執行個體。

維護

AI 引擎無法啟動,您會在 * 知識庫 * 頁面上看到錯誤「 GenAI 引擎伺服器沒有回應」。

AI 引擎執行個體沒有回應。

請使用下列還原步驟:

步驟
  1. 修改 GenAI 引擎執行個體安全性群組,以啟用對 GenAI 引擎執行個體的 SSH 存取。

  2. 使用 SSH 登入執行個體。

  3. 執行下列命令:

    docker-compose up

維護

NetApp Workload Factory for GenAI 使用的後端 Docker 實例無法啟動。

磁碟區已刪除、 EC2 執行個體已重新啟動。

請使用下列還原步驟:

步驟
  1. 在適用於 NetApp ONTAP 的 FSX 上建立新的 Volume 。例如、 Volume 名稱可以是 netapp_ai /netapp_ai、而 Volume 路徑可以是。

  2. SSH 至 Amazon EC2 執行個體。

  3. 列出磁碟區:

    docker volume list
  4. 移除舊 Volume :

    docker volume rm ec2-user_persistent_folder
  5. `docker-compose.yml`使用文字編輯器開啟檔案。

  6. 在 `volumes`區段中、將裝置路徑變更為新的 Volume 路徑。例如:

    volumes:
      persistent_folder:
        driver_opts:
          type: 'nfs'
          o: "addr=svm-0df66b96a890d8a72.\
          fs-0d673008aaca12bc3.\
          fsx.us-east-1.amazonaws.com,nolock,soft,rw"
          device: ':/netapp_ai' # Path to new volume

維護

NetApp Workload Factory for GenAI 使用的後端 Docker 實例無法啟動。

根磁碟區已刪除。

使用名稱和路徑建立 Volume 、然後從 Amazon EC2 重新啟動後端 Docker 執行個體。

維護

NetApp Workload Factory for GenAI 使用的後端 Docker 實例無法啟動。

根磁碟區已刪除。

使用名稱和路徑建立 Volume 、然後從 Amazon EC2 重新啟動後端 Docker 執行個體。