Skip to main content
AI Data Engine
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

FAQ per NetApp AI Data Engine

Collaboratori netapp-dbagwell

Questa FAQ copre le domande più comuni su NetApp AI Data Engine (AIDE), inclusa la sua architettura, distribuzione, tipologie di utenti, caratteristiche tecniche, integrazione e licenze.

Nozioni di base su AIDE

Che cos'è NetApp AI Data Engine (AIDE)?

NetApp AI Data Engine (AIDE) è un servizio dati integrato nello storage che copre l'intero ciclo di vita dell'AI, dalla scoperta e preparazione dei dati raw alla fornitura di endpoint di recupero per alimentare l'AI generativa (GenAI), la Retrieval-Augmented Generation (RAG), l'AI agentica e le AI factory. AIDE automatizza la sincronizzazione e il rilevamento delle modifiche, fornendo una vista unificata e aggiornata dei dati selezionati per la scoperta e la cura dei dati.

Come funziona AIDE?

AIDE si integra direttamente con i sistemi di storage NetApp ONTAP per creare una vista globale e strutturata dell'intero patrimonio di dati NetApp con rilevamento automatico delle modifiche e sincronizzazione. AIDE offre vettorizzazione real-time con compressione e deduplicazione, Data Guardrails basati su policy e integrazione con strumenti di AI.

Utenti e ruoli

Chi utilizza l'AI Data Engine?

Gli utenti principali di AIDE includono:

  1. Amministratori di storage ONTAP: gestiscono l'infrastruttura, le esigenze di storage specifiche per l'AI, la sicurezza e la conformità.

  2. Data engineers: gestiscono spostamento dei dati, preparazione e integrazione tra gli ambienti.

  3. Data scientists: preparano e trasformano i dati rilevanti per il consumo da parte dell'AI.

Requisiti e deployment

Quale hardware è necessario?

AIDE richiede sistemi AFX per l'implementazione (inclusi un controller AFX, uno shelf di dischi e uno switch di rete), ma può utilizzare i dati dei cluster che eseguono ONTAP 9 tramite SnapMirror e peering di cluster. Per le implementazioni di AIDE sono necessari almeno quattro nodi controller AFX per garantire elevata disponibilità e prestazioni.

AIDE viene eseguito su un nodo di calcolo dati NetApp (DCN). Sono necessari tre DCN. Il DCN ospita il software AIDE, che include Metadata Engine, Data Sync, Data Curator e Data Guardrails.

Posso usare il mio DCN?

No. Il DCN è un nodo hardware di elaborazione dati fornito da NetApp ed è l'unico meccanismo di distribuzione per l'AI Data Engine.

Qual è il numero minimo di DCN richiesto?

Sono necessari esattamente tre DCN.

Quale sistema operativo è in esecuzione sui DCN?

I DCN eseguono uno stack software fornito da NetApp con AIDE.

È possibile implementare AIDE senza AFX?

No. AIDE richiede AFX per il deployment. AIDE utilizza Trident per consumare i volumi AFX per lo storage interno (volumi persistenti). Il cluster AFX che fornisce storage per AIDE può essere collegato in peering con un sistema o cluster ONTAP 9. Utilizza il peering tra cluster e SnapMirror per sincronizzare i dati dal cluster ONTAP remoto al sistema AFX.

Gestione e interfacce

AIDE Console fa parte di NetApp Console o è un'interfaccia separata?

La AIDE Console è un'interfaccia di gestione separata che viene eseguita sui DCN. Utilizzi la AIDE Console per gestire i servizi AIDE, come Data Guardrails e Data Curator. Puoi anche utilizzare ONTAP System Manager per monitorare il cluster AIDE.

Funzionalità e capacità

Quali sono le caratteristiche principali di AIDE?

Ci sono quattro caratteristiche principali di AIDE:

Metadata Engine
  • Genera automaticamente una visualizzazione strutturata, aggiornata e interattiva dei tuoi dati.

  • Funziona con i dati memorizzati su ONTAP.

  • Consente ai professionisti dei dati di collaborare con gli amministratori dello storage per trovare e comprendere i dati.

  • Le API interrogano i metadati per fornire funzionalità riducendo il carico del traffico NFS sui sistemi di storage.

  • La funzionalità di estrazione e catalogazione dei metadati è stata sviluppata appositamente per AIDE e funziona in modo continuo, sfruttando le funzionalità ONTAP come gli snapshot.

Sincronizzazione dati
  • Mantiene automaticamente l'attualità dei dati man mano che i dati di origine cambiano senza intervento manuale.

  • Gli amministratori definiscono l'intervallo di refresh in giorni o ore.

  • Fornisce mobilità incrementale dei dati e sincronizzazione tra i dati per eliminare copie ridondanti dei dati di AI.

Data Guardrails
  • Identifica e protegge automaticamente i dati sensibili durante l'intero ciclo di vita dell'AI. È accessibile tramite AI Data Engine Console.

  • Esegue continuamente la scansione, la classificazione e la categorizzazione dei dati.

  • Identifica dati sensibili (come PII) e rischi.

  • Facilita la creazione di policy per la gestione automatica dei dati sensibili in linea con gli standard aziendali e normativi.

  • Fornisce la redazione automatica delle informazioni sensibili per la protezione dei dati.

  • Limita l'accesso ai file sensibili secondo necessità.

Data Curator
  • Consente agli scienziati dei dati di cercare dati rilevanti attraverso lo storage.

  • Crea raccolte di dati curate con i dati esistenti sui volumi AFX.

  • Genera incorporamenti vettoriali nel layer di storage per ridurre la crescita eccessiva dei dati e aumentare le prestazioni.

  • Fornisce un endpoint di recupero per applicazioni AI con ricerca semantica vettoriale e re-ranking.

Integrazione e interoperabilità

AIDE supporta metadati federati su più cluster ONTAP?

AIDE può connettersi a più cluster ONTAP tramite SnapMirror e il cluster peering, consentendo la visibilità centralizzata dei metadati.

Dove vengono archiviati i metadati?

AIDE memorizza i metadati sul cluster AFX connesso utilizzando un volume persistente fornito da AFX. I DCN utilizzano l'archiviazione locale per le operazioni interne.

AIDE Metadata Engine classifica i dati?

No. Il Metadata Engine cataloga i metadati del filesystem e fornisce API per interrogare questi metadati catalogati.

Quali fonti di dati sono supportate?

AIDE supporta volumi ONTAP (locali o remoti) come sorgenti di dati. I cluster ONTAP remoti devono eseguire ONTAP 9 ed essere connessi tramite cluster peering e SnapMirror.

I bucket ONTAP S3 e gli oggetti StorageGRID non sono supportati come origini dati in AIDE 9.18.1.

Quali tipi di file può AIDE elaborare per la classificazione, la vettorializzazione e la ricerca semantica?

AIDE supporta un'ampia gamma di tipi di file, tra cui PDF, DOCX, PPTX, TXT e file immagine con funzionalità OCR.

AIDE supporta la classificazione di dati non inglesi?

AIDE supporta solo dati in lingua inglese.

Quali integrazioni supporta AIDE?

AIDE fornisce un endpoint API RAG accessibile tramite chiamate API dirette o tramite un server Model Context Protocol (MCP). Questo supporta l'integrazione con framework e strumenti agentic AI.

Distribuzione e licenze

Quali sono le opzioni di distribuzione?

AIDE è distribuito on-premises sull'infrastruttura AFX con DCN. Si integra direttamente con NetApp ONTAP AFX.

Come viene concessa in licenza AIDE?

AIDE richiede una licenza software per eseguire Data Guardrails e Data Curator.

Se hai bisogno solo del Metadata Engine, la licenza ONTAP One, inclusa in tutti i sistemi AFX, fornisce il diritto alle funzionalità solo del Metadata Engine.