AI Data Engineでデータコレクションを表示
データエンジニアやデータサイエンティストがワークスペースからデータコレクションを作成して公開した後、そのステータス、サイズ、およびAI Data Engine(AIDE)クラスタへの影響を可視化する必要があります。
ストレージ管理者、データエンジニア、データサイエンティストであれば、ONTAP System ManagerとAI Data Engine Consoleでデータコレクションを表示できます。
-
データ コレクションを表示するには、ONTAP System Managerの_ストレージ管理者_権限、またはAIDE Console(`\https://<cluster_management_ip>/console`の_データ エンジニア_または_データ サイエンティスト_権限が必要です。
-
メタデータが正常に抽出されたワークスペースが少なくとも 1 つ存在します。
-
データ エンジニアまたはデータ サイエンティストが、AIDE Consoleから少なくとも1つのデータ コレクションを作成して公開している。
-
AIDEソフトウェアライセンスがインストールされ、推論機能が有効になっているため、ベクトル化エンドポイントと検索エンドポイントがアクティブになっています。
クラスター全体のデータ コレクションを表示する
ストレージ管理者にとって、ONTAP System Manager は、データ コレクションとそのフットプリントのクラスター全体のビューを提供しますが、管理者がそれらを作成または変更することはできません。
-
System Managerで、*Data Engine > Data collections*に移動します。
-
ページ上部の在庫概要を確認します:
-
ステータス別のデータ収集の総数
-
すべてのコレクションにわたるベクターデータベースで消費される合計容量
-
クラスター全体の容量に対するベクトル空間の割合
-
-
個々のデータ コレクションを選択して確認します:
-
コレクション名と説明
-
UUID
-
関連付けられたワークスペース
-
ステータス
-
コレクションのサイズ
-
作成者
-
最終更新時間
-
これで、クラスター内のすべてのデータ コレクションとそのストレージへの影響の概要が表示されます。このビューを使用して、大きい、古い、または準備完了状態になっていないコレクションを識別します。
また、個々のデータ コレクションがアクティブに更新されているかどうか、および何らかの障害によって RAG の使用がブロックされているかどうかも確認できます。
コレクション関連のジョブとイベントを監視する
ストレージ管理者は、クラスター全体の Activity ページとワークスペースの詳細から、コレクションを構築および更新するジョブを監視できます。
-
System Manager で、Data Engine > アクティビティ に移動します。
-
*イベント*タブ:
-
タイプ(ワークスペース、データ収集など)または重大度でフィルタリングします。
-
データ収集に関連するイベント(「データ収集の公開に失敗しました」など)を展開して詳細を表示します。
-
-
*ジョブ*タブで:
-
データ収集のインデックス作成と公開ジョブに焦点を絞るためのフィルタ。
-
各ジョブについて、ピークビューを開いて次の内容を確認します:
-
進捗率。
-
開始時間と終了時間。
-
報告されたエラー メッセージまたは警告。
-
-
-
必要に応じて、影響を受けるワークスペース(Data Engine > ワークスペース)に戻り、その アクティビティ タブを開いて、そのワークスペースのみにスコープされたイベントとジョブを表示します。
データ収集のライフサイクルを追跡し、停止または失敗したジョブを特定し、コンテキスト情報を収集してデータ エンジニア、データ サイエンティスト、またはサポートに渡すことができます。
|
|
データ収集が `Publishing`状態のまま長時間続く場合は、障害と判断する前に、アクティビティ ページで対応する長時間実行ジョブを確認してください。 |
AIDE Console からデータ コレクションを表示
データエンジニアやデータサイエンティストは通常、データコレクションの作成と公開が行われるAIDE Consoleから直接監視します。
-
データ エンジニアまたはデータ サイエンティストとして AIDE Console にログインします。
-
Data Collections に移動し、目的のデータ コレクションを選択します。
-
各コレクションについて:
-
状態を確認する(
Draft、Publishing、Ready、またはFailed)。 -
データ収集名を選択して、定義の詳細(フィルター、含まれるファイルの種類、分類子のオプション、埋め込み設定)を確認します。
-
最後の公開または更新のタイムスタンプを検査します。
-
-
必要に応じて、ジョブの詳細またはログ(利用可能な場合)を開いて、失敗または不完全な実行を確認します。
データ エンジニアとデータ サイエンティストは、ストレージ管理者を介さずに、ステータスと健全性を監視しながらコレクション定義を反復処理し、再度公開できます。