Skip to main content
NetApp artificial intelligence solutions
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

技術概要

共同作成者 kevin-hoke

このセクションでは、このソリューションの主要コンポーネントについて詳しく説明します。

NetApp AFFシステム

NetApp AFFストレージ システムにより、企業は業界をリードするパフォーマンス、優れた柔軟性、クラウド統合、クラス最高のデータ管理により、エンタープライズ ストレージの要件を満たすことができます。フラッシュ専用に設計されたAFFシステムは、ビジネスクリティカルなデータの高速化、管理、保護に役立ちます。

この図は、 NetApp AFF A400ストレージ コントローラの前面を示しています。

この図は、 NetApp AFF A400ストレージ コントローラの背面を示しています。

NetApp AFF A400は、次の機能を備えたミッドレンジ NVMe フラッシュ ストレージ システムです。

  • 最大有効容量: 約20PB

  • 最大スケールアウト: 2~24ノード (12 HAペア)

  • 25GbEおよび16Gb FCホストのサポート

  • NVMe拡張ストレージシェルフへの100GbE RDMA over Converged Ethernet(RoCE)接続

  • NVMeシェルフが接続されていない場合、100GbE RoCEポートをホストネットワーク接続に使用できます。

  • フル12Gbps SAS接続拡張ストレージシェルフ

  • 2 つの構成で利用可能:

    • イーサネット: 4x 25Gb イーサネット (SFP28) ポート

    • ファイバーチャネル: 4x 16Gb FC (SFP+) ポート

  • 100% 8KB ランダム読み取り @.4 ms 400k IOPS

エントリー レベルの AI/ML 導入向けのNetApp AFF A250 の機能は次のとおりです。

  • 最大有効容量:35PB

  • 最大スケールアウト: 2~24ノード (12 HAペア)

  • 440k IOPS ランダム読み取り @1ms

  • 最新のNetApp ONTAPリリースONTAP 9.8 以降をベースに構築

  • HAおよびクラスタ相互接続用の2つの25Gbイーサネットポート

NetApp は、大規模な AI/ML 導入向けに高いパフォーマンスと拡張性を提供するAFF A800やAFF A700などの他のストレージ システムも提供しています。

NetApp ONTAP

NetAppの最新世代のストレージ管理ソフトウェアであるONTAP 9 により、企業はインフラストラクチャを最新化し、クラウド対応のデータセンターに移行できるようになります。 ONTAP は業界をリードするデータ管理機能を活用し、データの保存場所に関係なく、単一のツール セットでデータの管理と保護を可能にします。データは、エッジ、コア、クラウドなど、必要な場所に自由に移動することもできます。 ONTAP 9 には、データ管理を簡素化し、重要なデータを高速化および保護し、ハイブリッド クラウド アーキテクチャ全体にわたって将来を見据えたインフラストラクチャを実現する多数の機能が含まれています。

データ管理を簡素化

データ管理は、アプリケーションとデータセットに適切なリソースが使用されるようにするための、企業の IT 運用にとって非常に重要です。 ONTAP には、運用を合理化および簡素化し、総運用コストを削減するための次の機能が含まれています。

  • *インライン データ圧縮と拡張重複排除。*データ圧縮によりストレージ ブロック内の無駄なスペースが削減され、重複排除により実効容量が大幅に増加します。これは、ローカルに保存されたデータとクラウドに階層化されたデータに適用されます。

  • *最小、最大、および適応型のサービス品質 (QoS)。*きめ細かな QoS 制御により、高度に共有された環境における重要なアプリケーションのパフォーマンス レベルを維持できます。

  • * ONTAPFabricPool。*この機能は、Amazon Web Services (AWS)、Azure、 NetApp StorageGRIDオブジェクト ストレージなどのパブリックおよびプライベート クラウド ストレージ オプションにコールド データを自動的に階層化します。

データの高速化と保護

ONTAP は優れたレベルのパフォーマンスとデータ保護を提供し、これらの機能を次のように拡張します。

  • パフォーマンスと低レイテンシー。 ONTAP は、可能な限り低いレイテンシで最高のスループットを提供します。

  • データ保護 ONTAP は、すべてのプラットフォームにわたる共通管理を備えた組み込みのデータ保護機能を提供します。

  • * NetAppボリューム暗号化。* ONTAP は、オンボードと外部の両方のキー管理サポートを備えたネイティブのボリューム レベルの暗号化を提供します。

将来を見据えたインフラ

ONTAP 9 は、要求が厳しく、常に変化するビジネス ニーズへの対応に役立ちます。

  • シームレスなスケーリングと中断のない運用。 ONTAP は、既存のコントローラおよびスケールアウト クラスタへの無停止の容量追加をサポートします。お客様は、コストのかかるデータ移行や停止なしで、NVMe や 32Gb FC などの最新テクノロジーにアップグレードできます。

  • クラウド接続。 ONTAP は、すべてのパブリック クラウドでソフトウェア定義ストレージ (ONTAP Select) とクラウド ネイティブ インスタンス (Google Cloud NetApp Volumes) のオプションを備えた、最もクラウドに接続されたストレージ管理ソフトウェアです。

  • 新興アプリケーションとの統合。 ONTAP は、既存のエンタープライズ アプリケーションをサポートするのと同じインフラストラクチャを使用して、OpenStack、Hadoop、MongoDB などの次世代プラットフォームとアプリケーションにエンタープライズ グレードのデータ サービスを提供します。

NetApp FlexGroupボリューム

トレーニング データセットは通常、数十億に及ぶ可能性のあるファイルのコレクションです。ファイルには、並列に読み取るために保存および処理する必要があるテキスト、オーディオ、ビデオ、およびその他の形式の非構造化データが含まれる場合があります。ストレージ システムは多数の小さなファイルを保存し、順次およびランダム I/O でそれらのファイルを並列に読み取る必要があります。

FlexGroupボリューム (次の図) は、複数の構成メンバー ボリュームで構成された単一のネームスペースであり、ストレージ管理者に対してNetApp FlexVol volumeのように管理され、機能します。 FlexGroupボリューム内のファイルは個々のメンバー ボリュームに割り当てられ、ボリュームまたはノード間でストライプ化されません。これらにより、次の機能が有効になります。

  • 最大 20 ペタバイトの容量と、高メタデータ ワークロード向けの予測可能な低レイテンシ

  • 同じ名前空間に最大4000億個のファイル

  • CPU、ノード、アグリゲート、および構成FlexVolボリュームにわたるNASワークロードの並列処理

この画像は、 FlexGroup内にメイン ファイルを含む多数のボリュームを含むストレージ コントローラの HA ペアを示しています。

Lenovo ThinkSystemポートフォリオ

Lenovo ThinkSystem サーバーは、今日の顧客の課題を解決し、将来の課題にも対応できる進化型で目的に合ったモジュール型設計アプローチを提供する革新的なハードウェア、ソフトウェア、サービスを備えています。これらのサーバーは、クラス最高の業界標準テクノロジーと Lenovo の差別化されたイノベーションを組み合わせることで、x86 サーバーに最大限の柔軟性を提供します。

Lenovo ThinkSystem サーバーを導入する主な利点は次のとおりです。

  • ビジネスの成長に合わせて拡張可能なモジュール設計

  • 業界をリードする回復力により、コストのかかる予定外のダウンタイムを何時間も節約

  • 低レイテンシ、高速応答、リアルタイムのスマートなデータ管理を実現する高速フラッシュテクノロジー

AI 分野では、Lenovo は企業が ML と AI の利点を理解し、ワークロードに導入できるよう支援する実践的なアプローチを採用しています。 Lenovo のお客様は、Lenovo AI イノベーション センターで Lenovo AI 製品を探索および評価し、特定のユース ケースの価値を十分に理解することができます。価値実現までの時間を短縮するために、この顧客中心のアプローチでは、すぐに使用でき、AI 向けに最適化されたソリューション開発プラットフォームの概念実証を顧客に提供します。

レノボ SR670 V2

Lenovo ThinkSystem SR670 V2 ラック サーバーは、高速 AI と高性能コンピューティング (HPC) に最適なパフォーマンスを提供します。 SR670 V2 は最大 8 個の GPU をサポートし、ML、DL、推論の計算集約型のワークロード要件に適しています。

この画像は 3 つの SR670 構成を示しています。最初は、8 つの 2.5 インチ HS ドライブと 2 つの PCIe I/O スロットを備えた 4 つの SXM GPU を示しています。  2 番目は、4 つのダブルワイドまたは 8 つのシングルワイド GPU スロットと、8 つの 2.5 インチまたは 4 つの 3.5 インチ HS ドライブを備えた 2 つの PCIe I/O スロットを示しています。  3 番目は、6 つの EDSFF HS ドライブと 2 つの PCIe I/O スロットを備えた 8 つのダブルワイド GPU スロットを示しています。

ThinkSystem SR670 V2 は、ハイエンド GPU ( NVIDIA A100 80GB PCIe 8x GPU を含む) をサポートする最新のスケーラブルな Intel Xeon CPU を搭載し、AI および HPC ワークロード向けに最適化され、高速化されたパフォーマンスを提供します。

アクセラレータのパフォーマンスを利用するワークロードが増えるため、GPU 密度に対する需要が高まっています。小売、金融サービス、エネルギー、ヘルスケアなどの業界では、GPU を使用して、ML、DL、推論技術によってより深い洞察を抽出し、イノベーションを推進しています。

ThinkSystem SR670 V2 は、高速化された HPC および AI ワークロードを本番環境に導入し、次世代プラットフォームによるスーパーコンピューティング クラスターのデータセンター密度を維持しながらシステム パフォーマンスを最大化するために最適化されたエンタープライズ グレードのソリューションです。

その他の機能は次のとおりです:

  • 高速ネットワーク アダプターを GPU に直接接続して I/O パフォーマンスを最大化する GPU ダイレクト RDMA I/O のサポート。

  • NVMe ドライブを GPU に直接接続してストレージ パフォーマンスを最大化する GPU ダイレクト ストレージのサポート。

MLPerf

MLPerf は、AI パフォーマンスを評価するための業界をリードするベンチマーク スイートです。この検証では、最も人気のある AI フレームワークの 1 つである MXNet を使用した画像分類ベンチマークを使用しました。 AI トレーニングを実行するために、MXNet_benchmarks トレーニング スクリプトが使用されました。このスクリプトには、いくつかの一般的な従来モデルの実装が含まれており、可能な限り高速になるように設計されています。単一のマシン上で実行することも、複数のホスト間で分散モードで実行することもできます。