サードパーティのサーバーにAI Data Engine softwareをインストールする
Red Hat Enterprise Linux(RHEL)9.7を実行しているサードパーティ製サーバーにAI Data Engine(AIDE)ソフトウェアをインストールします。このデプロイメントオプションを使用すると、ONTAPがAIDEソフトウェアスタックのオーケストレーションを継続しながら、お客様のインフラストラクチャ上でAIDEを実行できます。
サードパーティサーバー上のAI Data Engine softwareは、NetApp提供のデータコンピュートノードアプライアンスベースのAIDEデプロイメントと同等のMetadata Engine機能を提供します。このデプロイメントオプションでは、GPUおよびAI推論ワークロードはまだサポートされていません。
"サードパーティサーバーのインストール"を完了してから"ONTAP でコンピューティングクラスタを作成します"を実行する前に、この手順を完了してください。
設置を準備
サードパーティサーバーにAI Data Engine(AIDE)をインストールする前に、以下の点を確認してください。
AIDE展開では、異なる目的を果たす2つの独立したネットワークを使用します。
-
データネットワーク:ホスト管理アクセス、AIDE APIアクセス、ダウンロード、DNS、NTP、およびその他のルーティングされた通信のための外部接続を提供します。
-
クラスタネットワーク:ONTAP と計算ノードの間の内部通信パスを提供します。このネットワークはルーティング不可能であり、データネットワークから隔離された状態を維持する必要があります。
ルーティングの競合や、内部クラスタトラフィックと外部データトラフィック間の意図しないアクセスを回避するため、これらのネットワークパスを厳密に分離してください。
OS アップデート、パッチ、および AIDE ソフトウェアアップデートを取得するには、インターネットまたは正しいサーバーに接続する方法が必要です。データネットワークがこれらの操作のためにサーバーまたはインターネットに到達しないように構成されている場合、これらの管理サーバーおよび AIDE 操作用に 3 番目の管理ネットワークが必要になる場合があります。
-
ONTAP 9.18.1以降がONTAP AFXクラスタで実行されている
-
最小ハードウェア要件(CPU、メモリ、NIC、ストレージ)を満たすサーバがちょうど3台稼働している
-
各サーバーにRed Hat Enterprise Linux(RHEL)9.7がインストールされています。
-
ディスク サブシステムのパーティショニング用に `/var`パーティションで少なくとも 70GB の空き容量が利用可能
-
外部(非クラスタ)ホストのネットワークはNetworkManagerを使用して構成されます
-
外部メンテナンスインターフェイスには静的IPアドレス、デフォルトゲートウェイルート、および "静的ホスト名が設定されています"
-
AIDE が使用するサーバーインターフェイスを選択しました
-
選択したインターフェイスのうち、クラスタ側とデータ側がどれであるかを特定しました
-
クラスタ対向インターフェイスはAFXクラスタスイッチに接続されています
-
データ接続インターフェイスはデータネットワークスイッチに接続されています。
-
ノード検出のため、クラスタスイッチでVLAN-40へのネットワークアクセスが設定されています
-
クラスタネットワークはデータネットワークから分離されており、データネットワークへのルーティングは行わない
-
追加のネットワーク接続はサポートされていません
-
管理アクセスと AIDE API アクセスはどちらも外部ネットワーク接続を使用します
-
NetApp Support Site(NSS)へのアクセス権がある
-
`aide-setup`コマンドで使用できるDNSネームサーバーアドレスがあります
|
|
基本的な Metadata Engine のみの導入では、GPU ドライバは必要ありません。 |
|
|
サードパーティ製サーバーを導入する場合、オペレーティングシステムのセキュリティ、パッチ適用、ファイアウォールの設定、SELinuxの適用、およびSSHの強化については、すべてお客様の責任となります。NetAppは、お使いのオペレーティングシステムに対するセキュリティパッチは提供していません。 |
ステップ1:各ノードにインストールバンドルをダウンロードする
NetApp Support Site(NSS)から AIDE ソフトウェア RPM とコンテナイメージ tar ファイルを各サードパーティサーバーに直接ダウンロードするか、NetApp Support Site にアクセスできるジャンプホストを使用してダウンロードします。
-
NetApp Support Siteにアクセスします "mysupport.netapp.com"。
-
Downloads に移動します。
-
"AI Data Engine"を検索します。
-
NetAppの担当者から提供されたサードパーティサーバー上のMetadata Engineのリリース名を入力します。
-
`wget`またはお好みのダウンロード方法を使用して、これらのファイルを各サーバーにダウンロードします:
-
netapp-aide.rpm -
netapp-aide-images.tar
-
ステップ2:各ノードでバンドルの整合性を確認する
ダウンロード後、各サードパーティサーバーでバンドルチェックサムを検証します。
-
提供されたチェックサムを使用して、両方のファイルのバンドルの整合性を検証します:
sha256sum netapp-aide.rpm sha256sum netapp-aide-images.tar -
ダウンロードページに記載されているチェックサムファイルと出力を比較します。
|
|
インストール前に、各ノード上の両方のファイルについてSHA-256チェックサムを検証します。 |
ステップ3:各ノードでRPMをインストールし、aide-setupを実行します
コンテナイメージを抽出し、AIDE RPMパッケージをインストールして、各サードパーティサーバーで `aide-setup`を実行します。インストーラは、自動化された事前検証、ホスト構成、およびAIDEソフトウェアの導入を実行します。
-
特権ユーザーとして最初のサードパーティサーバーにログインします。
-
コンテナイメージに必要なディレクトリを作成します:
mkdir -p /var/lib/rancher/rke2/agent/images/ -
コンテナイメージのtarファイルを以下のディレクトリに展開します:
tar -xf netapp-aide-images.tar -C /var/lib/rancher/rke2/agent/images/抽出されたファイル以外のファイルが `/var/lib/rancher/rke2/agent/images/`ディレクトリに配置されていないことを確認してください。 -
netapp-aideRPMをインストールします。sudo dnf install netapp-aide.rpm -
`dnsmasq`パッケージをインストールします:
sudo dnf install dnsmasq -
内部ネットワークインターフェースと外部ネットワークインターフェースを特定してください:
ip address show-
外部インターフェイスには、対応する IP アドレスが設定されているポートのみを使用してください。
-
内部インターフェースポートを設定しては いけません
-
-
`aide-setup`コマンドで使用する DNS ネームサーバーの IP アドレスを特定します。
-
`aide-setup`を実行して、クラスタと外部インターフェイスを設定します:
sudo /usr/sbin/aide-setup --internal_interface_primary_port <iface1> --internal_interface_secondary_port <iface2> --external_interface <external-iface> --dns_nameserver <dns-ip-1> --dns_nameserver <dns-ip-2> --overwrite_config-
クラスターに面したインターフェースを使用する
--internal_interface_primary_port`および `--internal_interface_secondary_port。それらのインターフェースをAFXクラスタスイッチに接続してください。 -
ホストメンテナンスインターフェースを `--external_interface`に使用します。このインターフェースには、設定済みのIPアドレスが必要です。
-
`--dns_nameserver`オプションを使用して、1つ以上のDNSネームサーバーのIPアドレスを指定します。
ONTAP から消費されるデータを保護するために、クラスタに面するインターフェースで同等のセキュリティ制御を維持します。クラスタネットワークパスを外部メンテナンスネットワークパスから分離し、データがアクセス違反を引き起こすような形でこれらのチャネル間を通過できないようにします。
-
-
プリフライト出力を確認します。続行する前に、ハードウェア構成のコンプライアンスエラーが報告されていないことを確認してください。
正常に完了すると、次のメッセージが表示されます:
AIDE is successfully configured for this node. -
ノードが ONTAP から検出可能であることを確認します。ONTAP CLI で次のコマンドを実行します:
dcn cluster node show -membership available -
残りの2つのサードパーティ製サーバーについても、これらの手順を繰り返してください。
|
|
各ノードは、 `aide-setup`の完了後、シリアル番号、UUID、およびリンクローカルアドレスをONTAPにアドバタイズします。 |
サードパーティサーバーにAIDEソフトウェアをインストールした後、ONTAPシステムマネージャーにサインインし、"AFX クラスターを使用した AIDE のセットアップ"ワークフローに従ってコンピューティングクラスタを作成し、IPアドレスを割り当て、接続を有効にします。