Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Data-to-RAG-Schnellstart für AI Data Engine

04/30/2026 Beitragende

PDFs

Gehen Sie mit diesem Workflow von einem neu bereitgestellten AI Data Engine (AIDE) System zu einem funktionsfähigen Retrieval-Augmented Generation (RAG) Endpunkt. Verstehen Sie, wie Speicheradministratoren, Dateningenieure und Data Scientists mithilfe von ONTAP System Manager und AIDE Console zusammenarbeiten.

Die folgenden Anweisungen setzen eine NetApp DCN-basierte AIDE-Bereitstellung voraus.

Bevor Sie beginnen

Sie haben NetApp DCNs installiert und dem ONTAP Cluster hinzugefügt.
Sie haben AIDE installiert und die AIDE Premium-Servicelizenz für Vektorisierungs- und Leitplankenfunktionen aktiviert.
Sie haben "OpenID Connect (OIDC)" konfiguriert und Rollen für Administratoren, Dateningenieure und Datenwissenschaftler zugeordnet.

Datenumfang und Governance definieren

Als Speicheradministrator oder Sicherheitsadministrator möchten Sie die Umgebung in AIDE Console und ONTAP System Manager vorbereiten:

"Erstellen Sie einen oder mehrere Arbeitsbereiche" from lokalen und entfernten Datenquellen.
"Klassifikatoren und Guardrail-Richtlinien konfigurieren" in der AIDE Console.
"Weisen Sie Dateningenieuren und Datenwissenschaftlern Zugriff auf die Workspaces zu".

Arbeitsbereichsmetadaten erkunden

Als Data Engineer oder Data Scientist möchten Sie die Metadaten des Arbeitsbereichs mithilfe der AIDE Console untersuchen:

"Arbeitsbereichsmetadaten erkunden" um die verfügbaren Inhalte zu verstehen.
Definieren Sie eine oder mehrere logische Teilmengen von Daten, die RAG speisen sollen (zum Beispiel Supportartikel, Produkthandbücher oder anonymisierte klinische Notizen).

Erstellen und Veröffentlichen einer Datensammlung

Als Data Engineer oder Data Scientist möchten Sie die ausgewählte Teilmenge in eine RAG-ready Sammlung umwandeln:

"Erstellen einer Datensammlung" aus dem Arbeitsbereich unter Verwendung ausgewählter Filter.
"Veröffentlichen Sie die Datensammlung" und überwachen Sie die Indizierung, bis sie den Ready Zustand erreicht.
Kopieren Sie die Retrieval-Endpunkt-URI für die ausgewählte Collection und stellen Sie sie den Data Scientists oder Anwendungsentwicklern zur Verfügung.
"Status der Datenerfassung und Vektor-Fußabdruck anzeigen" nach Bedarf.

Was kommt als Nächstes?

Data-to-RAG-Schnellstart für AI Data Engine

Creating your file...