Skip to main content
AI Data Engine
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

替換 AIDE 叢集中的節點

貢獻者 dmp-netapp netapp-dbagwell

如果您的 AI Data Engine (AIDE) 叢集中的資料計算節點 (DCN) 停止運行,或者由於硬體故障、升級或維護需要更換,則需要將其替換。這可以確保 AI Data Engine 叢集保持健康並正常運作。此過程不會中斷正在進行的服務。

準備更換節點

在更換 AIDE 叢集中的節點之前,需要考慮以下幾個方面。

System Manager 憑證

您需要 storage administrator 權限才能執行 AIDE 叢集節點取代任務。

限制

在 AIDE 叢集中替換節點時,您應該注意以下限制:

  • 僅支援使用 CLI 和選用的 REST API 進行節點替換。

  • 您無法使用 System Manager 執行節點替換。

  • 新節點應與叢集的軟體版本相符;ONTAP 將在需要時進行更新。

  • 為避免 IP 位址衝突,故障節點在連接至叢集網路時不得開機。

需求

您需要以下項目:

  • 新替換節點的序號

替換 AIDE 叢集中的 DCN 節點

您可以使用下列步驟取代 AIDE 叢集中的 DCN 節點。

步驟
  1. 實體移除故障節點

    關閉節點電源並將其與叢集網路中斷連線。確保在更換過程中節點未在網路上啟動。

  2. 使用以下命令從叢集中刪除故障節點:

    dcn cluster node delete -name <node_name> -force true

    提供 <node_name> 值的實際名稱。

  3. 將新節點實際連接到叢集

    確保節點已連接電纜、已通電且可被發現。

  4. 檢視可探索且未設定的節點,以驗證新節點是否上線:

    dcn cluster node show -membership available

  5. 使用以下命令將節點新增至叢集:

    dcn cluster node create -serial-number <new_node_serial>

    ONTAP 將為新節點指派一個 IP 位址。如果該節點的軟體版本與叢集不匹配,ONTAP 將自動更新該節點。

  6. 使用下列任一命令驗證叢集健全狀況和節點整合:

    dcn cluster node show

    dcn cluster node show -instance