Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

テクノロジの概要

共同作成者

このセクションでは、この解決策 の主なコンポーネントについて詳しく説明します。

NetApp AFF システム

NetApp AFF ストレージシステムは、業界をリードするパフォーマンス、卓越した柔軟性、クラウド統合、業界最高のデータ管理機能を備えており、エンタープライズストレージの要件を満たすことができます。フラッシュに特化して設計されたAFF システムは、ビジネスクリティカルなデータの高速化、管理、保護に役立ちます。

この図は、NetApp AFF A400ストレージコントローラの前面を示しています。

この図は、NetApp AFF A400ストレージコントローラの背面を示しています。

NetApp AFF A400は、次の機能を搭載したミッドレンジのNVMeフラッシュストレージシステムです。

  • 最大実効容量:約20PB

  • 最大スケールアウト:2~24ノード(HAペア×12)

  • 25GbEおよび16Gb FCホストがサポートされます

  • NVMe拡張ストレージシェルフへの100GbE RDMA over Converged Ethernet(RoCE)接続

  • NVMeシェルフが接続されていない場合は、100GbE RoCEポートをホストネットワークの接続に使用できます

  • 拡張ストレージシェルフに12Gbps SAS接続を提供します

  • 次の2つの構成があります。

    • イーサネット:25Gbイーサネット(SFP28)ポート×4

    • ファイバチャネル:16Gb FC(SFP+)ポート×4

  • 100% 8KBのランダムリード、レイテンシは0.4ミリ秒、400k IOPS

エントリレベルのAI / ML環境向けのNetApp AFF A250には、次のような機能があります。

  • 最大実効容量:35PB

  • 最大スケールアウト:2~24ノード(HAペア×12)

  • 440 万 IOPS のランダムリード: 1 ミリ秒

  • 最新のNetApp ONTAP リリースONTAP 9.8以降を基盤としています

  • HAおよびクラスタインターコネクト用に25GBのイーサネットポートを2つ

ネットアップは、AFF A800やAFF A700など、大規模なAI / ML環境に優れたパフォーマンスと拡張性を提供するストレージシステムも提供しています。

NetApp ONTAP

ネットアップが提供する最新世代のストレージ管理ソフトウェアONTAP 9を使用すれば、インフラを最新化し、クラウド対応のデータセンターに移行できます。ONTAP は、業界をリードするデータ管理機能を活用して、データの格納場所に関係なく、単一のツールセットでデータの管理と保護を実現します。データは、エッジ、コア、クラウドなど、必要な場所に自由に移動することもできます。ONTAP 9には、データ管理を簡易化し、重要なデータの高速化と保護を実現するさまざまな機能が搭載されており、ハイブリッドクラウドアーキテクチャ全体で将来のニーズに対応できるインフラを実現できます。

データ管理を簡易化

データ管理は、アプリケーションやデータセットに適切なリソースを使用できるようにするために、エンタープライズ IT 運用にとって非常に重要です。ONTAP には、運用を合理化および簡易化し、総運用コストを削減するための次の機能が含まれています。

  • * インラインデータコンパクションと重複排除の強化。 * データコンパクションはストレージブロック内の無駄なスペースを削減し、重複排除は実効容量を大幅に増やします。この環境データはローカルに格納され、データはクラウドに階層化されます。

  • * 最小、最大、アダプティブの Quality of Service ( QoS ;サービス品質)。 * きめ細かい QoS 管理機能により、高度に共有された環境で重要なアプリケーションのパフォーマンスレベルを維持できます。

  • * ONTAP FabricPool 。*この機能は、Amazon Web Services(AWS)、Azure、NetApp StorageGRID オブジェクトストレージなどのパブリックおよびプライベートクラウドストレージオプションに、コールドデータを自動的に階層化します。

データの高速化と保護

ONTAP は、卓越したパフォーマンスとデータ保護を実現し、以下の方法でこれらの機能を拡張します。

  • * パフォーマンスと低レイテンシ。 * ONTAP は、可能な限り低いレイテンシで最高のスループットを提供します。

  • * データ保護。 * ONTAP は、組み込みのデータ保護機能を提供し、すべてのプラットフォームで共通の管理を実現します。

  • * NetApp Volume Encryption* ONTAP は、オンボードと外部の両方のキー管理をサポートし、ボリュームレベルのネイティブ暗号化を実現します。

将来のニーズにも対応できるインフラ

ONTAP 9は、要求の厳しい絶えず変化するビジネスニーズに対応するのに役立ちます。

  • シームレスな拡張とノンストップオペレーション。 ONTAP は、既存のコントローラやスケールアウトクラスタに無停止で容量を追加できます。NVMe や 32Gb FC などの最新テクノロジへのアップグレードも、コストのかかるデータ移行やシステム停止を行わずに実行できます。

  • *クラウド接続*ONTAPは、ほとんどのクラウドに対応したストレージ管理ソフトウェアで、すべてのパブリッククラウドでSoftware-Defined Storage(ONTAP Select)とクラウドネイティブインスタンス(Google Cloud NetApp Volumes)のオプションを選択できます。

  • 新しいアプリケーションとの統合。 ONTAP は、既存のエンタープライズアプリケーションをサポートする同じインフラを使用して、OpenStack、Hadoop、MongoDBなどの次世代プラットフォームやアプリケーションにエンタープライズクラスのデータサービスを提供します。

NetApp FlexGroup ボリューム

一般に、トレーニングデータセットは数十億個のファイルからなる可能性があります。ファイルには、テキスト、オーディオ、ビデオなどの形式の非構造化データを含めることができます。これらのデータは、並行して読み込まれるように保存して処理する必要があります。ストレージシステムは、多数の小さなファイルを格納し、シーケンシャルI/OとランダムI/Oの両方で、それらのファイルを並列に読み取る必要があります

FlexGroup ボリューム(次の図)は、複数のコンスティチュエントメンバーボリュームで構成された単一のネームスペースで、ストレージ管理者はNetApp FlexVol と同様に使用および管理することができます。FlexGroup ボリューム内のファイルは、個々のメンバーボリュームに割り当てられ、複数のボリュームやノードにまたがってストライプされることはありません。次の機能が有効になります。

  • メタデータ比率の高いワークロード向けに、最大20ペタバイトの容量と予測可能な低レイテンシを実現します

  • 同じネームスペースに最大4、000億個のファイルを格納できます

  • CPU、ノード、アグリゲート、コンスティチュエントFlexVol ボリューム全体でNASワークロードの並行処理をサポート

この図は、FlexGroup内にメインファイルが格納された多数のボリュームを含むストレージコントローラのHAペアを示しています。

Lenovo ThinkSystemポートフォリオ

Lenovo ThinkSystem サーバは、革新的なハードウェア、ソフトウェア、サービスを搭載しており、お客様の現在の課題を解決し、将来の課題に対処するための、進化した、用途に合わせたモジュラー設計アプローチを提供します。これらのサーバは、クラス最高の業界標準テクノロジーと、差別化された Lenovo の革新技術を組み合わせて、 x86 サーバで可能な限り高い柔軟性を提供します。

Lenovo ThinkSystemサーバを導入する主なメリットは次のとおりです。

  • ビジネスとともに成長する拡張性に優れたモジュラ設計

  • 業界をリードする耐障害性により、計画外停止にかかるコストを時間単位で削減します

  • 高速フラッシュテクノロジにより、レイテンシを低減し、応答時間を短縮し、リアルタイムでのデータ管理をスマートに実現します

Lenovo は、 AI 分野において、企業がワークロードに ML と AI のメリットを理解し、採用できるようにするための実践的なアプローチをとっています。Lenovo のお客様は、 Lenovo AI Innovation Center で Lenovo AI 製品を調査および評価し、特定のユースケースの価値を十分に理解することができます。価値実現までの時間を短縮するために、このお客様中心のアプローチでは、AI向けに最適化され、すぐに使用できる解決策 開発プラットフォームのコンセプトの実証が可能です。

Lenovo SR670 V2

Lenovo ThinkSystem SR670 V2ラックサーバは、AIの高速化とハイパフォーマンスコンピューティング(HPC)に最適なパフォーマンスを提供します。SR670 V2は、最大8基のGPUをサポートし、機械学習、DL、推論の負荷が高いワークロード要件に対応します。

この図は、3つのSR670構成を示しています。1つ目は、2.5インチHSドライブ8基とPCIe I/Oスロット2基を搭載したSXM GPU 4基です。2つ目は、ダブルワイドまたはシングルワイドのGPUスロットを4つ、および2.5インチまたは3.5インチのHSドライブを8台搭載したPCIe I/Oスロットを2つ示しています。3つ目の図は、8つのダブルワイドGPUスロットと6つのEDSFF HSドライブ、2つのPCIe I/Oスロットを示しています。

ハイエンドGPU(NVIDIA A100 80GB PCIe 8x GPUを含む)をサポートする最新の拡張性に優れたIntel Xeon CPUを搭載したThinkSystem SR670 V2は、AIおよびHPCワークロード向けに最適化された高速なパフォーマンスを提供します。

アクセラレータのパフォーマンスを使用するワークロードが増えるにつれて、GPU密度の需要も増加しています。小売、金融サービス、エネルギー、医療などの業界では、GPUを使用して分析情報を引き出し、ML、DL、推論の手法でイノベーションを推進しています。

ThinkSystem SR670 V2は、高速化されたHPCおよびAIワークロードを本番環境に導入するためのエンタープライズクラスの最適化された解決策 で、次世代プラットフォームを使用したスーパーコンピューティングクラスタのデータセンター密度を維持しながら、システムパフォーマンスを最大限に高めます。

その他の機能は次のとおりです。

  • GPUに高速ネットワークアダプタを直接接続し、I/Oパフォーマンスを最大化するGPU直接RDMA I/Oのサポート。

  • NVMeドライブをGPUに直接接続してストレージのパフォーマンスを最大限に高める、GPU直接ストレージのサポート。

MLPerf

MLPerf は、 AI のパフォーマンスを評価するための業界をリードするベンチマークスイートです。この検証では、最も人気の高いAIフレームワークの1つであるMXNetで画像分類ベンチマークを使用しました。MXNet_benchmarksトレーニングスクリプトは、AIトレーニングの促進に使用されました。このスクリプトには、複数の一般的な従来型モデルの実装が含まれており、できる限り高速になるように設計されています。単一のマシンで実行することも、複数のホスト間で分散モードで実行することもできます。