NetApp AI Data Engineに関するFAQ
このFAQでは、NetApp AI Data Engine(AIDE)に関するよくある質問について、アーキテクチャ、展開、ユーザー タイプ、技術的機能、統合、ライセンスなどを含めて説明します。
AIDEの基本
NetApp AI Data Engine(AIDE)は、生データの検出と準備から、生成AI(GenAI)、Retrieval-Augmented Generation(RAG)、エージェントAI、AIファクトリーを強化するための検索エンドポイントの提供まで、AIライフサイクル全体にわたるストレージ統合型AIデータサービスです。AIDEは同期と変更の検出を自動化し、データの検出とキュレーションのために、選択したデータの統合された最新のビューを提供します。
AIDEはNetApp ONTAPストレージシステムと直接統合し、自動化された変更検出と同期を備えたNetAppデータ資産全体のグローバルで構造化されたビューを作成します。AIDEは、圧縮と重複排除を使用したリアルタイムベクトル化、ポリシーベースのガードレール、AIツールとの統合を提供します。
ユーザーとロール
AIDE の主なユーザーには次のものが含まれます:
-
ONTAP ストレージ管理者:インフラストラクチャ、AI 固有のストレージのニーズ、セキュリティ、コンプライアンスを管理します。
-
データ エンジニア:環境間でのデータの移動、準備、統合を管理します。
-
データ サイエンティスト:AI での使用のために関連データを準備し、変換します。
要件と導入
AIDEには2つの導入オプションがあります:
-
NetApp データ コンピューティング ノード(DCN)の導入:AIDE は、統合 GPU リソースを備えた NetApp 提供のデータ コンピューティング ノードで実行され、メタデータ、ベクトル化、RAG エンドポイントを含む完全な AIDE 機能を提供します。
-
サードパーティサーバー上のAIDEソフトウェア:AIDEソフトウェアは、サポートされているサードパーティ製ハードウェアを使用して、お客様が提供するRHEL 9.7サーバー上で動作します。Metadata Engineの基本導入では、メタデータのカタログ化および検出機能が提供されますが、GPUに依存する機能は含まれていません。
NetApp DCN の導入には、AFX システム(AFX コントローラ、ディスク シェルフ、ネットワーク スイッチを含む)と 3 つの NetApp データ コンピュート ノードが必要です。高可用性とパフォーマンスを確保するには、少なくとも 4 つの AFX コントローラ ノードが必要です。
Metadata Engineの基本機能を備えたAIDEソフトウェアをサードパーティ製サーバーに導入するには、以下が必要です:
-
サポート対象ベンダーから顧客が調達したサーバー3台
-
すべてのサーバーにRHEL 9.7 LTSがインストールされています
-
永続ストレージ用にONTAP 9.18.1以降を実行しているAFXストレージシステム
AIDE 1.0.0リリースは、顧客が調達したハードウェア上のサードパーティ製サーバーで基本的なMetadata Engineをサポートしています。GPU機能を備えた完全なAIDE機能には、NetApp DCNハードウェアが必要です。
ちょうど3つのNetApp DCNが必要です。
オペレーティング システムは、導入タイプによって異なります:
-
NetApp DCN:NetAppが提供および管理するソフトウェアスタック
-
サードパーティ製サーバー上のMetadata Engine基本機能を備えたAIDEソフトウェア:Red Hat Enterprise Linux(RHEL)9.7 LTS、お客様によるインストールおよび管理
いいえ。AIDE の導入には AFX が必要です。AIDE は "Trident"を使用して、AFX ボリュームを内部ストレージ(永続ボリューム)として使用します。AIDE にストレージを提供する AFX クラスターは、ONTAP 9 システムまたはクラスターとピアリングできます。クラスター ピアリングとSnapMirrorを使用して、リモート ONTAP クラスターから AFX システムにデータを同期します。
管理とインターフェイス
AIDE Consoleは、NetApp DCN上で実行される独立した管理インターフェイスです。AIDE Consoleを使用して、Data GuardrailsやData CuratorなどのAIDEサービスを管理します。また、ONTAP System Managerを使用してAIDEクラスタを監視することもできます。
機能
AIDEは、導入タイプによって利用可能性が異なる4つの主要機能を提供します:
-
構造化された最新のインタラクティブなデータ ビューを自動的に生成します。
-
ONTAP に保存されているデータで動作します。
-
データ専門家がストレージ管理者と連携してデータを検索し、理解できるようにします。
-
API はメタデータをクエリして機能を提供し、ストレージ システムの NFS トラフィック負荷を軽減します。
-
メタデータ抽出とカタログ作成機能は、AIDE専用に構築されており、継続的に動作し、スナップショットなどのONTAP機能を活用します。
-
ソース データが変更されても、手動による介入なしにデータの最新性が自動的に維持されます。
-
管理者は、データの更新間隔を日数または時間数で定義します。
-
データ全体の増分データモビリティと同期を提供し、AIデータの冗長コピーを排除します。
-
AIライフサイクル全体を通して、機密データを自動的に識別し保護します。AIDE Consoleからアクセスできます。
-
データを継続的にスキャン、分類、カテゴリ化します。
-
機密データ(PII など)とリスクを識別します。
-
企業および規制基準に沿って機密データを自動的に処理するためのポリシーの作成を容易にします。
-
完全なポリシー適用(自動編集とアクセス制限)には、NetApp DCN デプロイメントでのみ利用可能なベクトル化機能が必要です。
-
サードパーティ製サーバー上のMetadata Engine基本機能を備えたAIDEソフトウェアは、分類子ベースのメタデータタグ付けをサポートしていますが、ガードレールの適用はサポートしていません。
-
データ サイエンティストがストレージ全体で関連データを検索できるようにします。
-
AFX ボリューム上に存在するデータを使用して、キュレーションされたデータ コレクションを作成します。
-
ストレージ レイヤでベクトル埋め込みを生成し、データの肥大化を抑え、パフォーマンスを向上させます。
-
ベクトル セマンティック検索と再ランク付けを備えた AI アプリケーションの検索エンドポイントを提供します。
|
|
サードパーティ サーバー上のMetadata Engine基本機能を備えたAI Data Engineソフトウェアには、Metadata Engineとデータ同期機能が含まれています。Data GuardrailsとData Curatorには、NetApp DCN導入環境で利用可能なGPUリソースが必要です。 |
サードパーティ製サーバー上のAIDEソフトウェアは、メタデータに特化した機能を提供します:
サードパーティサーバー上のMetadata Engine基本機能を備えたAIDEソフトウェアで利用可能:
-
ワークスペースの作成と管理
-
メタデータの自動抽出とカタログ化
-
REST API を介したメタデータの検索とフィルタリング
-
自動データ更新のための Data Sync
-
メタデータのエクスポート機能
サードパーティ サーバー上のMetadata Engine基本機能を備えたAIDEソフトウェアではご利用いただけません:
-
GPU依存型サービス(ベクトル化、OCR、エンリッチメント)
-
データ コレクションとベクトル埋め込み
-
セマンティック検索のためのRAGエンドポイント
-
取得時のガードレール ポリシーの適用
統合と相互運用性
AIDEは、SnapMirrorとクラスタ ピアリングを使用して複数のONTAPクラスタに接続でき、メタデータの可視性を一元化できます。
AIDEは、AFXが提供する永続ボリュームを使用して、接続されたAFXクラスタ上にメタデータを保存します。データ処理ノードは、内部処理にローカルストレージを使用します。
いいえ。AIDE Metadata Engineはファイルシステムのメタデータをカタログ化し、カタログ化されたメタデータを照会するためのAPIを提供します。
AIDEは、ONTAPボリューム(ローカルまたはリモート)をデータ ソースとしてサポートします。リモートONTAPクラスタは、ONTAP 9を実行し、クラスタ ピアリングとSnapMirrorを介して接続されている必要があります。
ONTAP S3バケットとStorageGRIDオブジェクトは、AIDE 9.18.1ではデータ ソースとしてサポートされていません。
AI Data Engine は、PDF、DOCX、PPTX、TXT、OCR 機能付き画像ファイルなど、幅広いファイル タイプをサポートします。
AIDEは英語のデータのみをサポートします。
AIDEは、直接API呼び出しまたはModel Context Protocol(MCP)サーバーを通じてアクセスできるRAG APIエンドポイントを提供します。これにより、エージェントAIフレームワークおよびツールとの統合がサポートされます。
ライセンス
AIDEライセンスは、導入形態と必要な機能によって異なります:
NetApp DCNデプロイメント:
-
Data GuardrailsとData CuratorにはAIDEプレミアムサービスライセンスが必要です
-
Metadata EngineとData Sync機能はONTAP Oneライセンスに含まれています(すべてのAFXシステムに付属)
サードパーティサーバー上のMetadata Engine基本機能を備えたAIDEソフトウェア:
-
ONTAP Oneライセンスは、Metadata EngineとData Sync機能の使用権を提供します
-
Data GuardrailsとData Curatorは、サードパーティサーバー上のMetadata Engine基本機能の導入では利用できません