Skip to main content
AI Data Engine
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

將資料運算節點新增至您的 AI Data Engine 叢集

貢獻者 netapp-dbagwell dmp-netapp

您可以在建立新的 AI Data Engine(AIDE)叢集或擴展現有叢集時新增資料運算節點。工作流程包括使用 ONTAP System Manager 探索和設定節點。

準備新增節點

新增資料運算節點時,請考慮以下事項。

資料運算節點數量下限

新的 AIDE 叢集需要正好三個可用的資料運算節點。

硬體安裝與定址能力

請確保滿足以下先決條件:

  • 新資料運算硬體已安裝到位、通電並連接到叢集交換器。

  • 您有一個 IP 位址空間範圍可用於資料運算節點到 ONTAP 後端子網路。

  • ONTAP 叢集已初始化,可從叢集管理 LIF 存取。

System Manager 憑證

您需要 storage administrator 權限才能執行 AIDE 叢集建立或擴充任務。

軟體相容性

請查看以下文件,以確認您的資料運算硬體和軟體版本與您的 ONTAP 叢集相容:

在新增節點作業期間、System Manager 將確認新節點執行的軟體版本與下列項目相容:

  • 如果這是第一個新增的資料運算節點,則為 ONTAP 叢集的有效版本。

  • 如果資料運算節點已存在,則為現有資料運算叢集版本。

如果節點不相容:

  • 在「新增」對話方塊中,受影響的資料運算節點旁邊會顯示錯誤訊息。

  • 您必須先將資料運算節點軟體 (或 ONTAP,視情況而定) 更新至相容版本。

新增資料計算節點

在建立新的 AIDE 叢集或擴展現有叢集時,新增資料運算節點。

步驟
  1. 在 System Manager 中,選擇導覽窗格中的 Dashboard ,然後選擇 Health 卡片。

  2. 確認有節點需要新增,然後選取 View details 以顯示清單。

    此清單包含已發現但尚未成為 AIDE 叢集一部分的節點。

  3. 或者、您可以選擇 ClusterOverview 以及 Data compute 標籤來查看清單。

  4. 在資料運算頁面的底部,選擇節點清單上方的 Add

  5. 在「新增節點」對話方塊中,選擇要新增的資料運算節點。

  6. 如果這是您第一次新增節點且後端子網路不存在,請選取 Add subnet 並提供:

    • 子網路名稱(供內部使用)

    • 子網路位址和遮罩

    • 後端網路上資料運算節點和 ONTAP 節點的 IP 位址範圍

      System Manager 驗證該範圍是否包含足夠的可用 IP 位址,以滿足所有要新增的資料運算節點、叢集中的所有 ONTAP 節點以及用於資料運算節點與 ONTAP 通訊的附加叢集級浮動 IP 位址的需求。

  7. 無論您是新增後端子網路或其已存在,請執行以下操作:

    1. 查看可用的 IP 位址。

    2. 如有需要,請選擇 Edit subnet 並擴充 IP 位址範圍。

      • 您只能擴大範圍。不支援縮小或變更子網路。

      • 變更子網路或 IP 範圍可能需要在資料運算節點上重新建立基礎 Kubernetes 叢集,這可能需要幾分鐘的時間。

  8. (可選)透過提供以下資訊來設定 Data Engine 服務介面:

    • 服務 IP 位址

    • 網路遮罩

    • 閘道(如果您的環境需要)

      單一 IP 位址將在資料運算節點之間進行負載平衡,並用作 AIDE Console 和相關 API 的前端位址。

  9. 檢查所選節點、後端子網路和 Data Engine 服務介面設定。

  10. 選擇 Add 並等待操作完成。System Manager 將執行以下操作:

    • 將選定的節點新增至資料運算叢集

    • 配置後端網路並將節點加入基於 Kubernetes 的資料運算叢集

    • 更新 Data Compute 節點探索的內部中繼資料

  11. 完成後,選擇 ClusterOverview 並確認:

    • Data compute 下,新的資料運算節點作為叢集的一部分在線上顯示

    • 所有節點均為 Healthy

    • 每個節點的 AIDE 版本均正確顯示

    • 確認儀錶板 Health 卡片顯示已更新的節點計數

  12. (選用)所有節點加入叢集後,請驗證所有服務是否正確啟動。

    1. 驗證 Kubernetes Pod 狀態:

      kubectl get pods -n aide-system
    2. 確認所有 Pod 都顯示為 RunningCompleted 狀態。