NVA-1173 NVIDIA DGXシステム搭載NetApp AIPod -ハードウェアコンポーネント
このセクションでは、NVIDIA DGXシステムを搭載したNetApp AIPodのハードウェアコンポーネントに焦点を当てます。
NetApp AFFストレージシステム
NetApp AFFの最先端のストレージシステムを使用すると、IT部門は、業界をリードするパフォーマンス、卓越した柔軟性、クラウド統合、業界最高のデータ管理機能によって、エンタープライズストレージの要件を満たすことができます。フラッシュに特化して設計されたAFF システムは、ビジネスクリティカルなデータの高速化、管理、保護に役立ちます。
AFF A90ストレージシステム
NetApp ONTAPデータ管理ソフトウェアを基盤とするNetApp AFF A90は、組み込みのデータ保護機能、オプションのランサムウェア対策機能、最も重要なビジネスワークロードのサポートに必要なハイパフォーマンスと耐障害性を提供します。ミッションクリティカルな運用の中断を解消し、パフォーマンスの調整を最小限に抑え、ランサムウェアの攻撃からデータを保護します。以下を実現します。•業界をリードするパフォーマンス•妥協のないデータセキュリティ•シンプルな無停止アップグレード
NetApp AFF A90ストレージシステム_
業界トップクラスのパフォーマンス
AFF A90は、ディープラーニング、AI、高速分析などの次世代ワークロードや、Oracle、SAP HANA、Microsoft SQL Server、仮想アプリケーションなどの従来型エンタープライズデータベースを容易に管理できます。ビジネスクリティカルなアプリケーションを、HAペアあたり最大240万IOPS、100 µ sの低レイテンシで最高速度で実行し、従来のNetAppモデルに比べてパフォーマンスを最大50%向上させます。NFS over RDMA、pNFS、セッショントランキングを使用すると、既存のデータセンターネットワークインフラを使用して、次世代アプリケーションに必要な高レベルのネットワークパフォーマンスを実現できます。また、SAN、NAS、オブジェクトストレージをユニファイドマルチプロトコルでサポートしているため、拡張も拡張も可能です。また、単一の統合ONTAPデータ管理ソフトウェアで、オンプレミスでもクラウドでも、最大限の柔軟性を実現できます。さらに、Active IQとCloud Insightsが提供するAIベースの予測分析でシステムの健全性を最適化できます。
妥協のないデータセキュリティ
AFF A90システムには、アプリケーションと整合性のあるNetApp統合データプロテクションソフトウェアがすべて含まれています。組み込みのデータ保護機能と最先端のランサムウェア対策ソリューションを提供し、事前の保護と攻撃後のリカバリを実現します。悪意のあるファイルがディスクに書き込まれるのを防ぎ、ストレージの異常を簡単に監視して分析情報を得ることができます。
シンプルな無停止アップグレード
AFF A90は、A800の既存のお客様に、システム停止を伴わないシャーシ内アップグレードを提供します。NetAppでは、高度な信頼性、可用性、保守性、管理性(RASM)機能を使用して、簡単に更新し、ミッションクリティカルな運用の中断を排除できます。さらに、NetApp ONTAPソフトウェアはすべてのシステムコンポーネントのファームウェアアップデートを自動的に適用するため、運用効率がさらに向上し、ITチームの日常業務が簡素化されます。
大規模な環境では、AFF A1Kシステムが最高レベルのパフォーマンスと容量のオプションを提供し、AFF A70やAFF C800などの他のNetAppストレージシステムは、低コストで小規模な環境向けのオプションを提供します。
NVIDIA DGX BasePOD
NVIDIA DGX BasePODは、NVIDIAのハードウェアおよびソフトウェアコンポーネント、MLOpsソリューション、サードパーティ製ストレージで構成される統合解決策です。NVIDIA製品と検証済みパートナーソリューションを使用したスケールアウトシステム設計のベストプラクティスを活用することで、お客様はAI開発のための効率的で管理しやすいプラットフォームを実装できます。図1は、NVIDIA DGX BasePODのさまざまなコンポーネントを示しています。
NVIDIA DGXベースPOD解決策
NVIDIA DGX H100システム
NVIDIA DGX H100™システムは、NVIDIA H100 Tensor Core GPUの画期的なパフォーマンスによって加速されるAIの大国です。
NVIDIA DGX H100システム_
DGX H100システムの主な仕様は次のとおりです。•8基のNVIDIA H100 GPU。•GPUあたり80 GBのGPUメモリ、合計640 GB。•NVIDIA NVSwitch™チップ4個。•PCIe 5.0に対応したデュアル56コアインテル®Xeon®Platinum 8480プロセッサー。•2 TBのDDR5システムメモリ。•8つのシングルポートNVIDIA ConnectX®-7(InfiniBand /イーサネット)アダプタと2つのデュアルポートNVIDIA ConnectX-7(InfiniBand /イーサネット)アダプタを提供するOSFPポート×4•DGX OS用の1.92TB M.2 NVMeドライブ×2、ストレージ/キャッシュ用の3.84TB U.2 NVMeドライブ×8•最大出力10.2 kW。DGX H100 CPUトレイの背面ポートを次に示します。OSFPポートのうち4つは、InfiniBandコンピューティングファブリック用に8つのConnectX-7アダプタを提供します。デュアルポートConnectX-7アダプタの各ペアは、ストレージファブリックと管理ファブリックへのパラレルパスを提供します。アウトオブバンドポートはBMCアクセスに使用されます。
NVIDIA DGX H100の背面パネル
NVIDIAネットワーク
NVIDIA Quantum-2 QM9700スイッチ
NVIDIA Quantum-2 QM9700 InfiniBandスイッチ
400Gb/秒InfiniBand接続を備えたNVIDIA Quantum-2 QM9700スイッチは、NVIDIA Quantum-2 InfiniBand BasePOD構成のコンピューティングファブリックを強化します。ConnectX-7シングルポートアダプタは、InfiniBandコンピューティングファブリックに使用されます。各NVIDIA DGXシステムは、各QM9700スイッチにデュアル接続されており、システム間に広帯域で低レイテンシの複数のパスを提供します。
NVIDIA Spectrum-3 SN4600スイッチ
NVIDIA Spectrum-3 SN4600スイッチ
NVIDIA Spectrum™-3 SN4600スイッチは合計128個のポート(スイッチあたり64個)を提供し、DGX BasePODのインバンド管理用に冗長接続を提供します。NVIDIA SN4600スイッチは、1GbEから200GbEまでの速度を提供できます。イーサネット経由で接続されたストレージアプライアンスには、NVIDIA SN4600スイッチも使用されます。NVIDIA DGXデュアルポートConnectX-7アダプタのポートは、インバンド管理とストレージ接続の両方に使用されます。
NVIDIA Spectrum SN2201スイッチ
NVIDIA Spectrum SN2201スイッチ
NVIDIA Spectrum SN2201スイッチは、アウトオブバンド管理用の接続を提供する48ポートを備えています。アウトオブバンド管理は、DGX BasePODのすべてのコンポーネントの統合管理接続を提供します。
NVIDIA ConnectX-7アダプタ
NVIDIA ConnectX-7アダプタ
NVIDIA ConnectX-7アダプタは、25/50/100/200/400Gのスループットを提供できます。NVIDIA DGXシステムは、シングルポートとデュアルポートのConnectX-7アダプタの両方を使用して、400Gb/秒InfiniBandおよびイーサネットを使用するDGX BasePOD環境に柔軟性を提供します。