NVA-1173 NVIDIA DGXシステム搭載NetApp AIPod -ソフトウェアコンポーネント
このセクションでは、NVIDIA DGXシステムを搭載したNetApp AIPodのソフトウェアコンポーネントに焦点を当てます。
NVIDIAソフトウェア
NVIDIA Baseコマンド
NVIDIA Base Command ™はすべてのDGX BasePODを強化し、NVIDIAソフトウェアイノベーションのメリットを最大限に活用できるようにします。エンタープライズクラスのオーケストレーションとクラスタ管理、コンピューティング、ストレージ、ネットワークのインフラを高速化するライブラリ、AIワークロード向けに最適化されたオペレーティングシステム(OS)など、実績のあるプラットフォームにより、投資のポテンシャルを最大限に引き出すことができます。
NVIDIAベースコマンド解決策
NVIDIA GPU Cloud ( NGC )
NVIDIA NGC™は、AIに関するさまざまな専門知識を持つデータサイエンティスト、開発者、研究者のニーズを満たすソフトウェアを提供します。NGCでホストされるソフトウェアは、一般的な脆弱性とエクスポージャー(CVE)、暗号鍵、秘密鍵の集合をスキャンします。複数のGPU、多くの場合はマルチノードに拡張できるようにテストおよび設計されているため、DGXシステムへの投資を最大限に活用できます。
_ NVIDIA GPUクラウド_
NVIDIA AIエンタープライズ
NVIDIA AI Enterpriseは、すべての企業にジェネレーティブAIを提供するエンドツーエンドのソフトウェアプラットフォームです。NVIDIA DGXプラットフォーム上で実行するように最適化されたジェネレーティブAI基盤モデルに対して、最速かつ最も効率的なランタイムを提供します。本番環境レベルのセキュリティ、安定性、管理性を備えているため、生成型AIソリューションの開発が合理化されます。NVIDIA AI EnterpriseはDGX BasePODに含まれており、エンタープライズ開発者は事前トレーニング済みモデル、最適化されたフレームワーク、マイクロサービス、高速化されたライブラリ、エンタープライズサポートにアクセスできます。
NetAppソフトウェア
NetApp ONTAP
ネットアップが提供する最新世代のストレージ管理ソフトウェアONTAP 9を使用すれば、インフラを最新化し、クラウド対応のデータセンターに移行できます。ONTAP は、業界をリードするデータ管理機能を活用して、データの格納場所に関係なく、単一のツールセットでデータの管理と保護を実現します。エッジ、コア、クラウドなど、必要な場所に自由にデータを移動することもできます。ONTAP 9には、データ管理の簡易化、重要なデータの高速化と保護、ハイブリッドクラウドアーキテクチャ全体で次世代インフラ機能を実現する多数の機能が搭載されています。
データの高速化と保護
ONTAP は、卓越したパフォーマンスとデータ保護を実現し、以下の方法でこれらの機能を拡張します。
-
パフォーマンスとレイテンシの低下:ONTAPは、NFS over RDMA、Parallel NFS(pNFS)、NFSセッショントランキングを使用したNVIDIA GPUDirect Storage(GDS)のサポートなど、可能な限り低いレイテンシで最高のスループットを提供します。
-
データ保護ONTAPは、組み込みのデータ保護機能と、すべてのプラットフォームを共通で管理できる業界最高レベルのランサムウェア対策保証を提供します。
-
NetApp Volume Encryption(NVE):ONTAP は、オンボードと外部キー管理の両方をサポートし、ボリュームレベルでのネイティブな暗号化を実現します。
-
ストレージのマルチテナンシーと多要素認証:ONTAP を使用すると、最高レベルのセキュリティでインフラリソースを共有できます。
データ管理を簡易化
データ管理は、AIアプリケーションの運用やAI / MLデータセットのトレーニングに適切なリソースを使用できるように、エンタープライズIT運用とデータサイエンティストにとって非常に重要です。以下に記載するネットアップテクノロジに関する追加情報 は、この検証の対象外ですが、導入環境によっては関連性がある場合もあります。
ONTAP データ管理ソフトウェアには、運用を合理化および簡易化し、総運用コストを削減するための次の機能が含まれています。
-
スナップショットとクローンは、ML / DLワークフローのコラボレーション、並行した実験、強化されたデータガバナンスを可能にします。
-
SnapMirrorは、ハイブリッドクラウド環境やマルチサイト環境でのシームレスなデータ移動を可能にし、必要なときに必要な場所でデータを提供します。
-
インラインデータコンパクション、強化された重複排除:データコンパクションはストレージブロック内の無駄なスペースを削減し、重複排除は実効容量を大幅に増やします。この環境データはローカルに格納され、データはクラウドに階層化されます。
-
最小、最大、アダプティブのQuality of Service(AQoS)。きめ細かいサービス品質(QoS)管理機能により、高度に共有された環境で重要なアプリケーションのパフォーマンスレベルを維持できます。
-
NetApp FlexGroupを使用すると、ストレージクラスタ内のすべてのノードにデータを分散できるため、非常に大規模なデータセットに対して大容量とパフォーマンスが向上します。
-
NetApp FabricPool の略。Amazon Web Services(AWS)、Azure、NetApp StorageGRID ストレージ解決策 など、パブリッククラウドとプライベートクラウドのストレージオプションへコールドデータを自動的に階層化します。FabricPool の詳細については、を参照してください "TR-4598:『FabricPool best bests』"。
-
NetApp FlexCacheの略。リモートボリュームキャッシング機能を提供し、ファイル配信を簡易化し、WANレイテンシを低減し、WAN帯域幅コストを削減します。FlexCacheを使用すると、複数のサイトに分散した製品開発が可能になるだけでなく、リモートサイトから企業のデータセットにすばやくアクセスできるようになります。
将来のニーズにも対応できるインフラ
ONTAP は、次の機能を備えており、要件が厳しく、絶えず変化するビジネスニーズに対応できます。
-
シームレスな拡張とノンストップオペレーションONTAPでは、既存のコントローラとスケールアウトクラスタにオンラインで容量を追加できます。NVMe や 32Gb FC などの最新テクノロジへのアップグレードも、コストのかかるデータ移行やシステム停止を行わずに実行できます。
-
クラウドへの接続:ONTAPは、ほとんどのクラウドに対応したストレージ管理ソフトウェアで、すべてのパブリッククラウドでSoftware-Defined Storage(ONTAP Select)とクラウドネイティブインスタンス(Google Cloud NetApp Volumes)のオプションを選択できます。
-
新しいアプリケーションとの統合:ONTAP は、既存のエンタープライズアプリケーションをサポートするインフラを使用して、自律走行車、スマートシティ、インダストリー4.0などの次世代プラットフォームやアプリケーション向けにエンタープライズクラスのデータサービスを提供します。
NetApp DataOps ツールキット
NetApp DataOpsツールキットは、高性能なスケールアウトネットアップストレージを基盤とする開発/トレーニング用ワークスペースと推論サーバの管理を簡易化するPythonベースのツールです。DataOps Toolkitはスタンドアロンのユーティリティとして動作し、NetApp Tridentを活用してストレージの運用を自動化するKubernetes環境でさらに効果的です。主な機能は次のとおりです。
-
ハイパフォーマンスでスケールアウト可能なネットアップストレージを基盤とする、大容量のJupyterLabワークスペースを迅速にプロビジョニングできます。
-
エンタープライズクラスのネットアップストレージを基盤とする新しいNVIDIA Triton Inference Serverインスタンスを迅速にプロビジョニング
-
実験や迅速なイテレーションを可能にするために、大容量のJupyterLabワークスペースのクローンをほぼ瞬時に作成できます。
-
バックアップ/トレーサビリティ/ベースライン化のための大容量JupyterLabワークスペースのほぼ瞬時のスナップショット。
-
大容量でハイパフォーマンスなデータボリュームのプロビジョニング、クローニング、スナップショットをほぼ瞬時に実行できます。
NetApp Trident
Tridentは、Anthosを含むコンテナとKubernetesディストリビューション向けの、完全サポートされたオープンソースストレージオーケストレーションツールです。Tridentは、NetApp ONTAPを含むNetAppストレージポートフォリオ全体と連携し、NFS、NVMe/TCP、iSCSI接続にも対応しています。Trident を使用すると、ストレージ管理者の手を煩わせることなく、エンドユーザがネットアップストレージシステムからストレージをプロビジョニングして管理できるため、 DevOps ワークフローが高速化されます。