テクノロジの概要
このセクションでは、この解決策 の主なコンポーネントについて詳しく説明します。
NetApp AFF システム
NetApp AFF ストレージシステムは、業界をリードするパフォーマンス、卓越した柔軟性、クラウド統合、業界最高のデータ管理機能を備えており、エンタープライズストレージの要件を満たすことができます。フラッシュに特化して設計されたAFF システムは、ビジネスクリティカルなデータの高速化、管理、保護に役立ちます。
NetApp AFF A400は、次の機能を搭載したミッドレンジのNVMeフラッシュストレージシステムです。
-
最大実効容量:約20PB
-
最大スケールアウト:2~24ノード(HAペア×12)
-
25GbEおよび16Gb FCホストがサポートされます
-
NVMe拡張ストレージシェルフへの100GbE RDMA over Converged Ethernet(RoCE)接続
-
NVMeシェルフが接続されていない場合は、100GbE RoCEポートをホストネットワークの接続に使用できます
-
拡張ストレージシェルフに12Gbps SAS接続を提供します
-
次の2つの構成があります。
-
イーサネット:25Gbイーサネット(SFP28)ポート×4
-
ファイバチャネル:16Gb FC(SFP+)ポート×4
-
-
100% 8KBのランダムリード、レイテンシは0.4ミリ秒、400k IOPS
エントリレベルのAI / ML環境向けのNetApp AFF A250には、次のような機能があります。
-
最大実効容量:35PB
-
最大スケールアウト:2~24ノード(HAペア×12)
-
440 万 IOPS のランダムリード: 1 ミリ秒
-
最新のNetApp ONTAP リリースONTAP 9.8以降を基盤としています
-
HAおよびクラスタインターコネクト用に25GBのイーサネットポートを2つ
ネットアップは、AFF A800やAFF A700など、大規模なAI / ML環境に優れたパフォーマンスと拡張性を提供するストレージシステムも提供しています。
NetApp ONTAP
ネットアップが提供する最新世代のストレージ管理ソフトウェアONTAP 9を使用すれば、インフラを最新化し、クラウド対応のデータセンターに移行できます。ONTAP は、業界をリードするデータ管理機能を活用して、データの格納場所に関係なく、単一のツールセットでデータの管理と保護を実現します。データは、エッジ、コア、クラウドなど、必要な場所に自由に移動することもできます。ONTAP 9には、データ管理を簡易化し、重要なデータの高速化と保護を実現するさまざまな機能が搭載されており、ハイブリッドクラウドアーキテクチャ全体で将来のニーズに対応できるインフラを実現できます。
データ管理を簡易化
データ管理は、アプリケーションやデータセットに適切なリソースを使用できるようにするために、エンタープライズ IT 運用にとって非常に重要です。ONTAP には、運用を合理化および簡易化し、総運用コストを削減するための次の機能が含まれています。
-
* インラインデータコンパクションと重複排除の強化。 * データコンパクションはストレージブロック内の無駄なスペースを削減し、重複排除は実効容量を大幅に増やします。この環境データはローカルに格納され、データはクラウドに階層化されます。
-
* 最小、最大、アダプティブの Quality of Service ( QoS ;サービス品質)。 * きめ細かい QoS 管理機能により、高度に共有された環境で重要なアプリケーションのパフォーマンスレベルを維持できます。
-
* ONTAP FabricPool 。*この機能は、Amazon Web Services(AWS)、Azure、NetApp StorageGRID オブジェクトストレージなどのパブリックおよびプライベートクラウドストレージオプションに、コールドデータを自動的に階層化します。
データの高速化と保護
ONTAP は、卓越したパフォーマンスとデータ保護を実現し、以下の方法でこれらの機能を拡張します。
-
* パフォーマンスと低レイテンシ。 * ONTAP は、可能な限り低いレイテンシで最高のスループットを提供します。
-
* データ保護。 * ONTAP は、組み込みのデータ保護機能を提供し、すべてのプラットフォームで共通の管理を実現します。
-
* NetApp Volume Encryption* ONTAP は、オンボードと外部の両方のキー管理をサポートし、ボリュームレベルのネイティブ暗号化を実現します。
将来のニーズにも対応できるインフラ
ONTAP 9は、要求の厳しい絶えず変化するビジネスニーズに対応するのに役立ちます。
-
シームレスな拡張とノンストップオペレーション。 ONTAP は、既存のコントローラやスケールアウトクラスタに無停止で容量を追加できます。NVMe や 32Gb FC などの最新テクノロジへのアップグレードも、コストのかかるデータ移行やシステム停止を行わずに実行できます。
-
*クラウド接続*ONTAPは、ほとんどのクラウドに対応したストレージ管理ソフトウェアで、すべてのパブリッククラウドでSoftware-Defined Storage(ONTAP Select)とクラウドネイティブインスタンス(Google Cloud NetApp Volumes)のオプションを選択できます。
-
新しいアプリケーションとの統合。 ONTAP は、既存のエンタープライズアプリケーションをサポートする同じインフラを使用して、OpenStack、Hadoop、MongoDBなどの次世代プラットフォームやアプリケーションにエンタープライズクラスのデータサービスを提供します。
NetApp FlexGroup ボリューム
一般に、トレーニングデータセットは数十億個のファイルからなる可能性があります。ファイルには、テキスト、オーディオ、ビデオなどの形式の非構造化データを含めることができます。これらのデータは、並行して読み込まれるように保存して処理する必要があります。ストレージシステムは、多数の小さなファイルを格納し、シーケンシャルI/OとランダムI/Oの両方で、それらのファイルを並列に読み取る必要があります
FlexGroup ボリューム(次の図)は、複数のコンスティチュエントメンバーボリュームで構成された単一のネームスペースで、ストレージ管理者はNetApp FlexVol と同様に使用および管理することができます。FlexGroup ボリューム内のファイルは、個々のメンバーボリュームに割り当てられ、複数のボリュームやノードにまたがってストライプされることはありません。次の機能が有効になります。
-
メタデータ比率の高いワークロード向けに、最大20ペタバイトの容量と予測可能な低レイテンシを実現します
-
同じネームスペースに最大4、000億個のファイルを格納できます
-
CPU、ノード、アグリゲート、コンスティチュエントFlexVol ボリューム全体でNASワークロードの並行処理をサポート
Lenovo ThinkSystemポートフォリオ
Lenovo ThinkSystem サーバは、革新的なハードウェア、ソフトウェア、サービスを搭載しており、お客様の現在の課題を解決し、将来の課題に対処するための、進化した、用途に合わせたモジュラー設計アプローチを提供します。これらのサーバは、クラス最高の業界標準テクノロジーと、差別化された Lenovo の革新技術を組み合わせて、 x86 サーバで可能な限り高い柔軟性を提供します。
Lenovo ThinkSystemサーバを導入する主なメリットは次のとおりです。
-
ビジネスとともに成長する拡張性に優れたモジュラ設計
-
業界をリードする耐障害性により、計画外停止にかかるコストを時間単位で削減します
-
高速フラッシュテクノロジにより、レイテンシを低減し、応答時間を短縮し、リアルタイムでのデータ管理をスマートに実現します
Lenovo は、 AI 分野において、企業がワークロードに ML と AI のメリットを理解し、採用できるようにするための実践的なアプローチをとっています。Lenovo のお客様は、 Lenovo AI Innovation Center で Lenovo AI 製品を調査および評価し、特定のユースケースの価値を十分に理解することができます。価値実現までの時間を短縮するために、このお客様中心のアプローチでは、AI向けに最適化され、すぐに使用できる解決策 開発プラットフォームのコンセプトの実証が可能です。
Lenovo SR670 V2
Lenovo ThinkSystem SR670 V2ラックサーバは、AIの高速化とハイパフォーマンスコンピューティング(HPC)に最適なパフォーマンスを提供します。SR670 V2は、最大8基のGPUをサポートし、機械学習、DL、推論の負荷が高いワークロード要件に対応します。
ハイエンドGPU(NVIDIA A100 80GB PCIe 8x GPUを含む)をサポートする最新の拡張性に優れたIntel Xeon CPUを搭載したThinkSystem SR670 V2は、AIおよびHPCワークロード向けに最適化された高速なパフォーマンスを提供します。
アクセラレータのパフォーマンスを使用するワークロードが増えるにつれて、GPU密度の需要も増加しています。小売、金融サービス、エネルギー、医療などの業界では、GPUを使用して分析情報を引き出し、ML、DL、推論の手法でイノベーションを推進しています。
ThinkSystem SR670 V2は、高速化されたHPCおよびAIワークロードを本番環境に導入するためのエンタープライズクラスの最適化された解決策 で、次世代プラットフォームを使用したスーパーコンピューティングクラスタのデータセンター密度を維持しながら、システムパフォーマンスを最大限に高めます。
その他の機能は次のとおりです。
-
GPUに高速ネットワークアダプタを直接接続し、I/Oパフォーマンスを最大化するGPU直接RDMA I/Oのサポート。
-
NVMeドライブをGPUに直接接続してストレージのパフォーマンスを最大限に高める、GPU直接ストレージのサポート。
MLPerf
MLPerf は、 AI のパフォーマンスを評価するための業界をリードするベンチマークスイートです。この検証では、最も人気の高いAIフレームワークの1つであるMXNetで画像分類ベンチマークを使用しました。MXNet_benchmarksトレーニングスクリプトは、AIトレーニングの促進に使用されました。このスクリプトには、複数の一般的な従来型モデルの実装が含まれており、できる限り高速になるように設計されています。単一のマシンで実行することも、複数のホスト間で分散モードで実行することもできます。