替換 AIDE 叢集中的節點
如果您的 AI Data Engine (AIDE) 叢集中的資料計算節點 (DCN) 停止運行,或者由於硬體故障、升級或維護需要更換,則需要將其替換。這可以確保 AI Data Engine 叢集保持健康並正常運作。此過程不會中斷正在進行的服務。
準備更換節點
在更換 AIDE 叢集中的節點之前,需要考慮以下幾個方面。
您需要 storage administrator 權限才能執行 AIDE 叢集節點取代任務。
限制
在 AIDE 叢集中替換節點時,您應該注意以下限制:
-
僅支援使用 CLI 和選用的 REST API 進行節點替換。
-
您無法使用 System Manager 執行節點替換。
-
新節點應與叢集的軟體版本相符;ONTAP 將在需要時進行更新。
-
為避免 IP 位址衝突,故障節點在連接至叢集網路時不得開機。
需求
您需要以下項目:
-
新替換節點的序號
替換 AIDE 叢集中的 DCN 節點
您可以使用下列步驟取代 AIDE 叢集中的 DCN 節點。
-
實體移除故障節點
關閉節點電源並將其與叢集網路中斷連線。確保在更換過程中節點未在網路上啟動。
-
使用以下命令從叢集中刪除故障節點:
dcn cluster node delete -name <node_name> -force true提供 <node_name> 值的實際名稱。
-
將新節點實際連接到叢集
確保節點已連接電纜、已通電且可被發現。
-
檢視可探索且未設定的節點,以驗證新節點是否上線:
dcn cluster node show -membership available -
使用以下命令將節點新增至叢集:
dcn cluster node create -serial-number <new_node_serial>ONTAP 將為新節點指派一個 IP 位址。如果該節點的軟體版本與叢集不匹配,ONTAP 將自動更新該節點。
-
使用下列任一命令驗證叢集健全狀況和節點整合:
dcn cluster node showdcn cluster node show -instance