向 AIDE 叢集新增資料計算節點
您可以在建立新的 AI Data Engine(AIDE)叢集或擴展現有叢集時新增資料計算節點(DCN)。工作流程包括使用 ONTAP System Manager 發現和配置節點。
準備新增節點
新增 DCN 節點時有幾個考量事項。
新建一個 AIDE 叢集正好需要三個 DCN 節點。
請確保滿足以下先決條件:
-
新的 DCN 硬體已安裝到位、通電並連接到叢集交換器。
-
您有可用於 DCN 到 ONTAP 後端子網路的 IP 位址空間範圍。
-
ONTAP 叢集已初始化,可從叢集管理 LIF 存取。
您需要 storage administrator 權限才能執行 AIDE 叢集建立或擴充任務。
請查看以下文件,以確認您的 DCN 硬體和軟體版本與您的 ONTAP 叢集相容:
在新增節點作業期間、System Manager 將確認新節點執行的軟體版本與下列項目相容:
-
如果這是首次 DCN 加入,則為 ONTAP 叢集有效版本(ECV)。
-
如果已存在 DCN,則顯示現有 DCN 叢集版本。
如果節點不相容:
-
在「新增」對話方塊中,受影響的 DCN 旁邊會顯示錯誤訊息。
-
您必須先將 DCN 軟體(或 ONTAP,視情況而定)更新至相容版本。
新增資料計算節點
您可以在建立新的 AIDE 叢集或擴展現有叢集時新增 DCN 節點。
-
在 System Manager 中,選擇導覽窗格中的 Dashboard ,然後選擇 Health 卡片。
-
確認有節點需要新增,然後選取 View details 以顯示清單。
此清單包含已發現但尚未加入 AIDE 叢集的節點。
-
或者、您可以選擇 Cluster 和 Overview 以及 Data compute 標籤來查看清單。
-
在資料計算頁面的底部,選擇節點清單上方的 Add 。
-
在「新增資料計算節點」對話方塊中,選取您要新增的 DCN 節點。
您可以在新增節點之前選擇重新命名個別節點。
-
如果這是您第一次新增節點且後端子網路不存在,請選取 Add subnet 並提供:
-
子網路名稱(供內部使用)
-
子網路位址和遮罩
-
此後端網路上 DCN 和 ONTAP 節點的 IP 位址範圍
System Manager 驗證該範圍包含足夠的可用 IP 位址,以滿足所有要新增的 DCN 和叢集中的所有 ONTAP 節點的需求,以及用於 DCN 與 ONTAP 通訊的附加叢集級浮動 IP 位址。
-
-
無論您是新增後端子網路還是已存在:
-
查看可用的 IP 位址。
-
如有需要,請選擇 Edit subnet 並擴充 IP 位址範圍。
-
您只能擴大範圍。不支援縮小或變更子網路。
-
更改子網路或 IP 範圍可能需要在 DCN 上重新建立底層 Kubernetes 叢集,這可能需要幾分鐘。
-
-
-
(可選)透過提供以下資訊來設定 Data Engine 服務介面:
-
服務 IP 位址
-
網路遮罩
-
閘道(如果您的環境需要)
單一 IP 將在 DCN 之間進行負載平衡,並用作 AI Data Engine Console 和相關 API 的前端位址。
-
-
檢查所選節點、後端子網路和 Data Engine 服務介面設定。
-
選擇 Add 並等待操作完成。System Manager 將執行以下操作:
-
將選定的節點新增至 DCN 叢集
-
配置後端網路並將節點加入基於 Kubernetes 的 DCN 叢集
-
更新 DCN 發現的內部中繼資料
-
-
完成後,選擇 Cluster 和 Overview 並確認:
-
在 Data compute 下,新的 DCN 會作為叢集的一部分出現
-
所有節點均為 Healthy
-
確認儀錶板 Health 卡片顯示已更新的節點計數
-