Skip to main content
AI Data Engine
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

在第三方伺服器上安裝 AI Data Engine software

貢獻者 netapp-dbagwell

在執行 Red Hat Enterprise Linux (RHEL) 9.7 的第三方伺服器上安裝 AI Data Engine (AIDE) 軟體。此部署選項可讓您在基礎架構上執行 AIDE,同時 ONTAP 繼續協調 AIDE 軟體堆疊。

第三方伺服器上的 AI Data Engine software 可提供與 NetApp 提供的資料運算節點應用裝置型 AIDE 部署相同的 Metadata Engine 功能。此部署選項目前尚不支援 GPU 和 AI 推理工作負載。

在您完成"安裝第三方伺服器"之後且在您"在 ONTAP 中建立運算叢集"之前,請完成此程序。

準備安裝

在第三方伺服器上安裝 AI Data Engine(AIDE)之前、請確保以下事項。

瞭解網路分離建議

AIDE 部署使用兩個用途不同的獨立網路:

  • 資料網路:提供外部連線能力,用於主機管理存取、AIDE API 存取、下載、DNS、NTP 和其他路由通訊。

  • 叢集網路:提供 ONTAP 和運算節點之間的內部通訊路徑。此網路不可路由,且必須與資料網路保持隔離。

嚴格隔離這些網路路徑,以避免路由衝突以及內部叢集流量和外部資料流量之間的意外存取。

您需要連接到網際網路或正確的伺服器才能取得作業系統更新、修補程式和 AIDE 軟體更新。如果資料網路配置為無法存取伺服器或網際網路以進行這些操作,您可能需要第三個管理網路來進行這些管理伺服器和 AIDE 操作。

符合環境先決條件
  • ONTAP 9.18.1 或更新版本正在您的 ONTAP AFX 叢集上執行

  • 剛好有三台伺服器符合最低硬體需求(CPU、記憶體、NIC、儲存設備)正在運作

  • 每台伺服器上都安裝了 Red Hat Enterprise Linux(RHEL)9.7

  • /var 分割區中至少有 70GB 的可用空間可用於磁碟子系統分割

網路計畫已確定
  • 外部(非叢集)主機網路是使用 NetworkManager 設定

  • 外部維護介面具有靜態 IP 位址、預設閘道路由,以及 "已設定靜態主機名稱"

  • "已為外部維護介面設定 DNS 和 NTP 時間同步"

  • 您已選擇 AIDE 要使用的伺服器介面

  • 您已確定哪些選定的介面面向叢集,哪些面向資料。

  • 面向叢集的介面連接到 AFX 叢集交換器

  • 面向資料的介面連接到資料網路交換器

  • 叢集交換器上已設定 VLAN-40 的網路存取,以便進行節點探索

  • 叢集網路與資料網路隔離,不會路由至資料網路

  • 不支援其他網路連線

  • 管理存取和 AIDE API 存取都使用外部網路連線

存取和軟體可用
  • 您擁有 NetApp 支援網站 (NSS) 存取

  • 您有可用於該 `aide-setup`指令的 DNS 名稱伺服器位址。

註 對於僅包含 Metadata Engine 的基本部署,不需要 GPU 驅動程式。
註 在第三方伺服器部署中,您需全權負責作業系統安全性、修補、防火牆組態、SELinux 強制執行以及 SSH 強化。NetApp 不提供作業系統的安全性修補程式。

步驟 1:在每個節點上下載安裝套件

從每個第三方伺服器上的 NetApp 支援網站(NSS)直接下載 AIDE 軟體 RPM 和容器映像 tar 檔案,或使用可存取 NetApp 支援網站的跳轉主機進行下載。

步驟
  1. 請造訪 NetApp 支援網站 "mysupport.netapp.com"

  2. 瀏覽至 Downloads

  3. 搜尋「AI Data Engine」。

  4. 輸入 NetApp 代表提供給您的第三方伺服器上的 Metadata Engine 版本名稱。

  5. 使用 `wget`或您首選的下載方式將這些檔案下載到各個伺服器:

    • netapp-aide.rpm

    • netapp-aide-images.tar

步驟 2:驗證每個節點上的套裝組合完整性

下載完成後,請在每個第三方伺服器上驗證軟體包校驗和。

步驟
  1. 使用提供的檢查碼驗證兩個檔案的套裝組合完整性:

    sha256sum netapp-aide.rpm
    sha256sum netapp-aide-images.tar
  2. 將輸出結果與下載頁面上提供的校驗和檔案進行比較。

重要 安裝前,請先驗證每個節點上兩個檔案的 SHA-256 校驗和。

步驟 3:在每個節點上安裝 RPM 並執行 aide-setup

提取容器映像、安裝 AIDE RPM 套件,並在每台協力廠商伺服器上執行 aide-setup。安裝程式會執行自動化的預檢驗證、主機組態設定和 AIDE 軟體部署。

步驟
  1. 以特權使用者身分登入第一個第三方伺服器。

  2. 建立容器映像所需的目錄:

    mkdir -p /var/lib/rancher/rke2/agent/images/
  3. 將容器映像 tar 檔案解壓縮到目錄:

    tar -xf netapp-aide-images.tar -C /var/lib/rancher/rke2/agent/images/
    警告 請確保 /var/lib/rancher/rke2/agent/images/ 目錄中除了解壓後的檔案外、沒有其他檔案。
  4. 安裝 netapp-aide RPM 套件:

    sudo dnf install netapp-aide.rpm
  5. 安裝 dnsmasq 套件:

    sudo dnf install dnsmasq
  6. 識別您的內部和外部網路介面:

    ip address show
    • 對於外部介面,請僅使用已設定對應 IP 位址的連接埠

    • 內部介面連接埠不得進行設定

  7. 識別您的 DNS 名稱伺服器 IP 位址,以便在 `aide-setup`命令中使用。

  8. 執行 `aide-setup`以設定叢集和外部介面:

    sudo /usr/sbin/aide-setup --internal_interface_primary_port <iface1> --internal_interface_secondary_port <iface2> --external_interface <external-iface> --dns_nameserver <dns-ip-1> --dns_nameserver <dns-ip-2> --overwrite_config
    • 使用面向叢集的介面進行 `--internal_interface_primary_port`和 `--internal_interface_secondary_port`連線。將這些介面連接到 AFX 叢集交換器。

    • 使用主機維護介面進行 --external_interface。此介面必須具有已設定的 IP 位址。

    • 使用 --dns_nameserver 選項提供一個或多個 DNS 名稱伺服器 IP 位址。

      警告 在面向叢集的介面上保持同等的安全控制,以保護從 ONTAP 取得的資料。將叢集網路路徑與外部維護網路路徑隔離,以防止資料在這些通道之間傳輸,從而避免存取違規。
  9. 檢閱飛行前輸出。在繼續之前,請確保未報告任何硬體組態法規遵循錯誤。

    成功完成後、您應該會看到以下訊息: AIDE is successfully configured for this node.

  10. 驗證節點是否可從 ONTAP 中發現。從 ONTAP CLI 執行:

    dcn cluster node show -membership available
  11. 在其餘兩台第三方伺服器上重複這些步驟。

註 每個節點在 aide-setup 完成後都會向 ONTAP 通告其序號、UUID 和連結本地位址。
接下來呢?

在第三方伺服器上安裝 AIDE 軟體後、登入 ONTAP System Manager 並遵循"使用 AFX 叢集設定 AIDE"工作流程來建立運算叢集、指派 IP 位址並啟用連線。