技術概要
このセクションでは、このソリューションを完了するために必要なさまざまな技術コンポーネントの概要を説明します。
プロトピア
Protopia AI は、今日の市場において、目立たない、機密推論のためのソフトウェアのみのソリューションを提供しています。 Protopia ソリューションは、機密情報の漏洩を最小限に抑えることで、推論サービスに比類のない保護を提供します。 AI には、手元のタスクを実行するために本当に必要なデータ レコードの情報のみが与えられ、それ以上の情報は与えられません。ほとんどの推論タスクでは、すべてのデータ レコードに存在するすべての情報が使用されるわけではありません。 AI が画像、音声、ビデオ、あるいは構造化された表形式のデータを使用するかどうかに関係なく、Protopia は推論サービスに必要なものだけを提供します。特許取得済みのコアテクノロジーは、数学的にキュレーションされたノイズを使用してデータを確率的に変換し、特定の ML サービスに必要のない情報を改ざんします。このソリューションはデータをマスクするのではなく、厳選されたランダムノイズを使用してデータ表現を変更します。
Protopia ソリューションは、モデルの機能に関する入力特徴空間内の関連情報を保持しながら、表現を変更する問題を勾配ベースの摂動最大化法として定式化します。この検出プロセスは、ML モデルのトレーニングの最後に微調整パスとして実行されます。パスによって確率分布のセットが自動的に生成された後、低オーバーヘッドのデータ変換によってこれらの分布からのノイズ サンプルがデータに適用され、推論のためにモデルに渡される前に難読化されます。
NetApp ONTAP AI
DGX A100 システムとNetAppクラウド接続ストレージ システムを搭載したNetApp ONTAP AI リファレンス アーキテクチャは、 NetAppとNVIDIAによって開発および検証されました。これにより、IT 組織に次の利点をもたらすアーキテクチャが提供されます。
-
設計の複雑さを排除
-
コンピューティングとストレージの独立したスケーリングが可能
-
顧客が小規模から始めてシームレスに拡張できるようにする
-
さまざまなパフォーマンスとコストポイントに応じた幅広いストレージオプションを提供
ONTAP AI は、DGX A100 システムとNetApp AFF A800ストレージ システムを最先端のネットワークと緊密に統合します。 ONTAP AI は、設計の複雑さと推測を排除することで AI の導入を簡素化します。お客様は、エッジからコア、クラウドに至るまでデータをインテリジェントに管理しながら、小規模から始めて中断なく拡張することができます。
次の図は、DGX A100 システムを使用したONTAP AI ファミリ ソリューションのいくつかのバリエーションを示しています。 AFF A800システムのパフォーマンスは、最大 8 台の DGX A100 システムで検証されます。 ONTAPクラスタにストレージ コントローラ ペアを追加することで、アーキテクチャを複数のラックに拡張し、多数の DGX A100 システムとペタバイト単位のストレージ容量を線形パフォーマンスでサポートできるようになります。このアプローチは、使用される DL モデルのサイズと必要なパフォーマンス メトリックに基づいて、コンピューティングとストレージの比率を個別に変更できる柔軟性を提供します。
ONTAP AIの詳細については、以下を参照してください。 "NVA-1153: NVIDIA DGX A100 システムと Mellanox Spectrum Ethernet スイッチを搭載したNetApp ONTAP AI。"
NetApp ONTAP
NetAppの最新世代のストレージ管理ソフトウェアであるONTAP 9.11 により、企業はインフラストラクチャを最新化し、クラウド対応のデータセンターに移行できるようになります。 ONTAP は業界をリードするデータ管理機能を活用し、データの保存場所に関係なく、単一のツール セットでデータの管理と保護を可能にします。また、エッジ、コア、クラウドなど、必要な場所にデータを自由に移動することもできます。 ONTAP 9.11 には、データ管理を簡素化し、重要なデータを高速化および保護し、ハイブリッド クラウド アーキテクチャ全体で次世代のインフラストラクチャ機能を有効にする多数の機能が含まれています。
NetApp DataOps ツールキット
NetApp DataOps Toolkit は、開発者、データ サイエンティスト、DevOps エンジニア、データ エンジニアが、新しいデータ ボリュームまたは JupyterLab ワークスペースのほぼ瞬時のプロビジョニング、データ ボリュームまたは JupyterLab ワークスペースのほぼ瞬時のクローン作成、追跡可能性やベースライン設定のためのデータ ボリュームまたは JupyterLab ワークスペースのほぼ瞬時のスナップショット作成など、さまざまなデータ管理タスクを簡単に実行できるようにする Python ライブラリです。この Python ライブラリは、コマンドライン ユーティリティとして、または任意の Python プログラムや Jupyter ノートブックにインポートできる関数のライブラリとして機能します。
NVIDIA Triton 推論サーバー
NVIDIA Triton Inference Server は、モデルの展開と実行を標準化し、実稼働環境で高速かつスケーラブルな AI を実現するのに役立つオープンソースの推論サービス ソフトウェアです。 Triton Inference Server は、チームが GPU または CPU ベースのインフラストラクチャ上の任意のフレームワークからトレーニング済みの AI モデルを展開、実行、拡張できるようにすることで、AI 推論を効率化します。 Triton Inference Server は、TensorFlow、 NVIDIA TensorRT、PyTorch、MXNet、OpenVINO など、すべての主要なフレームワークをサポートしています。 Triton は Kubernetes と統合されており、主要なパブリック クラウド AI および Kubernetes プラットフォームで使用できるオーケストレーションとスケーリングを実現します。また、多くの MLOps ソフトウェア ソリューションとも統合されています。
パイトーチ
"パイトーチ"オープンソースの ML フレームワークです。 GPU と CPU を使用するディープラーニング向けに最適化されたテンソル ライブラリです。 PyTorch パッケージには、他の便利なユーティリティの中でも、テンソルを効率的にシリアル化するための多くのユーティリティを提供する多次元テンソルのデータ構造が含まれています。また、コンピューティング機能を備えたNVIDIA GPU でテンソル計算を実行できるようにする CUDA 対応機能も備えています。この検証では、OpenCV-Python (cv2) ライブラリを使用して、Python の最も直感的なコンピューター ビジョンの概念を活用しながらモデルを検証します。
データ管理を簡素化
データ管理は、AI アプリケーションと AI/ML データセットのトレーニングに適切なリソースが使用されるように、企業の IT 運用とデータ サイエンティストにとって非常に重要です。 NetAppテクノロジーに関する次の追加情報は、この検証の範囲外ですが、導入によっては関連する可能性があります。
ONTAPデータ管理ソフトウェアには、運用を合理化および簡素化し、総運用コストを削減するための次の機能が含まれています。
-
インライン データ圧縮と拡張重複排除。データ圧縮によりストレージ ブロック内の無駄なスペースが削減され、重複排除により実効容量が大幅に増加します。これは、ローカルに保存されたデータとクラウドに階層化されたデータに適用されます。
-
最小、最大、および適応型サービス品質 (AQoS)。きめ細かなサービス品質 (QoS) 制御により、高度に共有された環境における重要なアプリケーションのパフォーマンス レベルを維持できます。
-
NetAppFabricPool。 Amazon Web Services (AWS)、Azure、 NetApp StorageGRIDストレージ ソリューションなどのパブリックおよびプライベート クラウド ストレージ オプションへのコールド データの自動階層化を提供します。 FabricPoolの詳細については、以下を参照してください。 "TR-4598: FabricPool のベストプラクティス" 。
データの高速化と保護
ONTAP は優れたレベルのパフォーマンスとデータ保護を提供し、これらの機能を次のように拡張します。
-
パフォーマンスと低レイテンシ。 ONTAP は、可能な限り低いレイテンシで最高のスループットを提供します。
-
データ保護:ONTAP は、すべてのプラットフォームにわたる共通管理を備えた組み込みのデータ保護機能を提供します。
-
NetAppボリューム暗号化 (NVE)。 ONTAP は、オンボードと外部キー管理の両方をサポートするネイティブのボリューム レベルの暗号化を提供します。
-
マルチテナントと多要素認証。 ONTAP は、最高レベルのセキュリティでインフラストラクチャ リソースを共有できるようにします。
将来を見据えたインフラ
ONTAP は、次の機能により、要求が厳しく常に変化するビジネス ニーズへの対応に役立ちます。
-
シームレスなスケーリングと中断のない運用。 ONTAP は、既存のコントローラおよびスケールアウト クラスタへの無停止の容量追加をサポートします。お客様は、コストのかかるデータ移行や停止なしで、NVMe や 32Gb FC などの最新テクノロジーにアップグレードできます。
-
クラウド接続。 ONTAP は、すべてのパブリック クラウドでソフトウェア定義ストレージ (ONTAP Select) とクラウド ネイティブ インスタンス (Google Cloud NetApp Volumes) のオプションを備えた、最もクラウドに接続されたストレージ管理ソフトウェアです。
-
新しいアプリケーションとの統合。 ONTAP は、既存のエンタープライズ アプリケーションをサポートするのと同じインフラストラクチャを使用して、自律走行車、スマート シティ、インダストリー 4.0 などの次世代プラットフォームとアプリケーション向けにエンタープライズ グレードのデータ サービスを提供します。
NetApp Astraコントロール
NetApp Astra製品ファミリーは、 NetAppのストレージおよびデータ管理テクノロジーを活用し、オンプレミスおよびパブリック クラウドの Kubernetes アプリケーション向けのストレージおよびアプリケーション対応のデータ管理サービスを提供します。これにより、Kubernetes アプリケーションを簡単にバックアップし、データを別のクラスターに移行し、実用的なアプリケーションのクローンを即座に作成できるようになります。パブリッククラウドで実行されるKubernetesアプリケーションを管理する必要がある場合は、 "Astraコントロールサービス" 。 Astra Control Service は、Google Kubernetes Engine (GKE) および Azure Kubernetes Service (AKS) 内の Kubernetes クラスターのアプリケーション対応データ管理を提供する、 NetAppが管理するサービスです。
NetAppTrident
Astra "Trident"NetAppの は、永続ストレージの作成、管理、および使用を簡素化する、Docker および Kubernetes 向けのオープンソースの動的ストレージ オーケストレーターです。 Kubernetes ネイティブ アプリケーションであるTridentは、Kubernetes クラスター内で直接実行されます。 Trident を使用すると、顧客は DL コンテナ イメージをNetAppストレージにシームレスに導入でき、AI コンテナの導入にエンタープライズ グレードのエクスペリエンスを提供できます。 Kubernetes ユーザー (ML 開発者、データ サイエンティストなど) は、オーケストレーションとクローンを作成、管理、自動化して、 NetAppテクノロジーを活用した高度なデータ管理機能を活用できます。
NetApp BlueXPコピーと同期
"BlueXPコピーと同期"高速かつ安全なデータ同期を実現するNetAppサービスです。オンプレミスの NFS または SMB ファイル共有、 NetApp StorageGRID、 NetApp ONTAP S3、 Google Cloud NetApp Volumes、 Azure NetApp Files、Amazon Simple Storage Service (Amazon S3)、Amazon Elastic File System (Amazon EFS)、Azure Blob、Google Cloud Storage、または IBM Cloud Object Storage の間でファイルを転送する必要がある場合でも、 BlueXP Copy and Sync を使用すると、必要な場所にファイルを迅速かつ安全に移動します。データが転送されると、ソースとターゲットの両方で完全に使用できるようになります。 BlueXP Copy and Syncc は、事前に定義されたスケジュールに基づいてデータを継続的に同期し、差分のみを移動するため、データ複製にかかる時間とコストが最小限に抑えられます。 BlueXP Copy and Sync は、セットアップと使用が非常に簡単なソフトウェア アズ ア サービス (SaaS) ツールです。 BlueXP Copy and Sync によってトリガーされるデータ転送は、データ ブローカーによって実行されます。 BlueXPコピーおよび同期データブローカーは、AWS、Azure、Google Cloud Platform、またはオンプレミスにデプロイできます。
NetApp BlueXP分類
強力なAIアルゴリズムによって駆動され、 "NetApp BlueXP分類"データ資産全体にわたって自動制御とデータ ガバナンスを提供します。コスト削減箇所を簡単に特定し、コンプライアンスとプライバシーに関する懸念を特定し、最適化の機会を見つけることができます。 BlueXP分類ダッシュボードを使用すると、重複データを識別して冗長性を排除し、個人データ、非個人データ、機密データをマッピングし、機密データと異常に関するアラートをオンにするための洞察が得られます。