NetApp AI Data Engineに関するFAQ
このFAQでは、NetApp AI Data Engine(AIDE)に関するよくある質問について、アーキテクチャ、展開、ユーザー タイプ、技術的機能、統合、ライセンスなどを含めて説明します。
AIDEの基本
NetApp AI Data Engine(AIDE)は、生データの検出と準備から、生成AI(GenAI)、Retrieval-Augmented Generation(RAG)、エージェントAI、AIファクトリーを強化するための検索エンドポイントの提供まで、AIライフサイクル全体にわたるストレージ統合型AIデータサービスです。AIDEは同期と変更の検出を自動化し、データの検出とキュレーションのために、選択したデータの統合された最新のビューを提供します。
AIDEはNetApp ONTAPストレージシステムと直接統合し、自動化された変更検出と同期を備えたNetAppデータ資産全体のグローバルで構造化されたビューを作成します。AIDEは、圧縮と重複排除を使用したリアルタイムベクトル化、ポリシーベースのガードレール、AIツールとの統合を提供します。
ユーザーとロール
AIDE の主なユーザーには次のものが含まれます:
-
ONTAP ストレージ管理者:インフラストラクチャ、AI 固有のストレージのニーズ、セキュリティ、コンプライアンスを管理します。
-
データ エンジニア:環境間でのデータの移動、準備、統合を管理します。
-
データ サイエンティスト:AI での使用のために関連データを準備し、変換します。
要件と導入
AIDE導入にはAFXシステム(AFXコントローラー、ディスク シェルフ、ネットワーク スイッチを含む)が必要ですが、SnapMirrorとクラスタピアリングを使用してONTAP 9を実行しているクラスターのクラスターデータを使用できます。高可用性とパフォーマンスを確保するために、AIDE導入には少なくとも4つのAFXコントローラーノードが必要です。
AIDEはNetAppデータ コンピューティング ノード(DCN)で実行されます。3つのDCNが必要です。DCNは、Metadata Engine、Data Sync、Data Curator、Data Guardrailsを含むAIDEソフトウェアをホストします。
いいえ。DCNはNetAppが提供するデータコンピューティングハードウェアノードであり、AIDEの唯一の導入メカニズムです。
正確に 3 つの DCN が必要です。
DCNは、NetAppが提供するソフトウェアスタックとAIDEを実行します。
いいえ。AIDE の導入には AFX が必要です。AIDE は Trident を使用して、AFX ボリュームを内部ストレージ(永続ボリューム)として消費します。AIDE にストレージを提供する AFX クラスタは、ONTAP 9 システムまたはクラスタとピアリングできます。クラスタ ピアリングと SnapMirror を使用して、リモート ONTAP クラスタから AFX システムにデータを同期します。
管理とインターフェイス
AIDE Consoleは、DCN上で動作する別の管理インターフェイスです。AIDE Consoleを使用して、Data GuardrailsやData CuratorなどのAIDEサービスを管理します。ONTAP System Managerを使用してAIDEクラスタを監視することもできます。
機能
AIDEには4つの主な機能があります:
-
構造化された最新のインタラクティブなデータ ビューを自動的に生成します。
-
ONTAP に保存されているデータで動作します。
-
データ専門家がストレージ管理者と連携してデータを検索し、理解できるようにします。
-
API はメタデータをクエリして機能を提供し、ストレージ システムの NFS トラフィック負荷を軽減します。
-
メタデータ抽出とカタログ作成機能は、AIDE専用に構築されており、継続的に動作し、スナップショットなどのONTAP機能を活用します。
-
ソース データが変更されても、手動による介入なしにデータの最新性が自動的に維持されます。
-
管理者は、データの更新間隔を日数または時間数で定義します。
-
データ全体の増分データモビリティと同期を提供し、AIデータの冗長コピーを排除します。
-
AIライフサイクル全体を通して、機密データを自動的に識別し保護します。AIDE Consoleからアクセスできます。
-
データを継続的にスキャン、分類、カテゴリ化します。
-
機密データ(PII など)とリスクを識別します。
-
企業および規制基準に沿って機密データを自動的に処理するためのポリシーの作成を容易にします。
-
データ保護のために機密情報の自動編集を提供します。
-
必要に応じて機密ファイルへのアクセスを制限します。
-
データ サイエンティストがストレージ全体で関連データを検索できるようにします。
-
AFX ボリューム上に存在するデータを使用して、キュレーションされたデータ コレクションを作成します。
-
ストレージ レイヤでベクトル埋め込みを生成し、データの肥大化を抑え、パフォーマンスを向上させます。
-
ベクトル セマンティック検索と再ランク付けを備えた AI アプリケーションの検索エンドポイントを提供します。
統合と相互運用性
AIDEは、SnapMirrorとクラスタ ピアリングを使用して複数のONTAPクラスタに接続でき、メタデータの可視性を一元化できます。
AIDE は、AFX が提供する永続ボリュームを使用して、接続された AFX クラスタにメタデータを保存します。DCN は内部操作にローカル ストレージを使用します。
いいえ。AIDE Metadata Engineはファイルシステムのメタデータをカタログ化し、カタログ化されたメタデータを照会するためのAPIを提供します。
AIDEは、ONTAPボリューム(ローカルまたはリモート)をデータ ソースとしてサポートします。リモートONTAPクラスタは、ONTAP 9を実行し、クラスタ ピアリングとSnapMirrorを介して接続されている必要があります。
ONTAP S3バケットとStorageGRIDオブジェクトは、AIDE 9.18.1ではデータ ソースとしてサポートされていません。
AI Data Engine は、PDF、DOCX、PPTX、TXT、OCR 機能付き画像ファイルなど、幅広いファイル タイプをサポートします。
AIDEは英語のデータのみをサポートします。
AIDEは、直接API呼び出しまたはModel Context Protocol(MCP)サーバーを通じてアクセスできるRAG APIエンドポイントを提供します。これにより、エージェントAIフレームワークおよびツールとの統合がサポートされます。
導入とライセンス
AIDEは、DCNを使用したAFXインフラストラクチャ上のオンプレミスに展開されます。NetApp ONTAP AFXインストールと直接統合します。
AIDEでData GuardrailsとData Curatorを実行するには、ソフトウェアライセンスが必要です。
Metadata Engineのみが必要な場合は、すべてのAFXシステムに含まれるONTAP Oneライセンスで、Metadata Engineのみの機能の使用権限が提供されます。