Skip to main content
AI Data Engine
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Crea uno spazio di lavoro in AI Data Engine

Collaboratori netapp-dbagwell

Dopo aver configurato un cluster, puoi creare un workspace. I workspace consentono di segmentare i dati sul cluster, controllare l'accesso ai dati per i singoli utenti ed escludere i dati a cui AI Data Engine (AIDE) non deve accedere.

Se gestisci l'archiviazione, utilizzerai ONTAP System Manager per creare e gestire workspaces.

Le organizzazioni creano spazi di lavoro in base a team, progetti, livelli di sensibilità dei dati o altri criteri rilevanti. Ad esempio, se lavori nel settore sanitario, potresti segmentare i dati clinici in uno spazio di lavoro ma escludere i dati relativi a IT, legale o altri reparti.

Informazioni su questa attività

I limiti di elaborazione del sistema influiscono sulla creazione di workspace (in genere fino a 15 GB al giorno per cluster). Se crei più workspace in parallelo o in rapida successione, ciascun workspace potrebbe richiedere più tempo per essere elaborato e potresti riscontrare ritardi significativi.

Monitora lo stato di creazione dell'area di lavoro dalla pagina Inventario delle aree di lavoro. Per risultati ottimali, evita di creare molte aree di lavoro contemporaneamente se hai bisogno di accedere immediatamente a queste funzionalità.

Prima di iniziare
  • Sono necessari i privilegi di storage administrator per creare spazi di lavoro e associare raccolte di dati.

  • Hai determinato le origini dati remote (peered) e locali che intendi utilizzare con l'area di lavoro e con AI Data Engine.

  • Hai "creato almeno un container di dati" a disposizione che l'area di lavoro può utilizzare, come un volume locale o un volume da un cluster peered.

    Importante Aggiungi un volume a un'area di lavoro che non eliminerai durante il periodo di validità previsto di tale area di lavoro. Se elimini un volume dopo averlo aggiunto a un'area di lavoro, l'area di lavoro entrerà in stato di errore. Conferma la fattibilità a lungo termine del volume prima di creare un'area di lavoro.
  • Assicurarsi che NFS sia abilitato sul volume ma che CIFS non sia abilitato. Le aree di lavoro supportano solo volumi con NFS. I volumi con CIFS (SMB) non sono supportati.

Crea uno spazio di lavoro

Crea un workspace e associa i container di dati che contengono i dati che desideri utilizzare con AI Data Engine.

Passaggi
  1. In ONTAP System Manager, vai su Data Engine > Workspaces.

  2. Seleziona Aggiungi.

  3. Nella finestra di dialogo Aggiungi area di lavoro, seleziona almeno un container di dati disponibile da associare all'area di lavoro.

  4. Configura "cluster peered" in modo che i dati di tali cluster possano essere accessibili all'interno dell'area di lavoro

  5. Se desideri configurare l'accesso utente all'area di lavoro, puoi farlo ora o "attendere fino a quando l'area di lavoro è stata creata".

  6. Configura un intervallo di refresh per la frequenza con cui l'area di lavoro si sincronizza con i container di dati associati per acquisire dati nuovi o aggiornati (ad esempio, sei ore).

    Suggerimento Scegli un intervallo che bilanci la freschezza dei dati con le prestazioni del sistema. Se aggiungi un container di dati a più aree di lavoro, il sistema utilizza automaticamente l'intervallo più aggressivo (il più breve). Per ulteriori informazioni, consulta la documentazione su aggiornamenti e versioning dell'area di lavoro.
  7. Seleziona Continua.

  8. Nella finestra di dialogo Finalize workspace, inserire un nome e una descrizione per l'area di lavoro.

  9. Selezionare Aggiungi per creare l'area di lavoro.

Risultato

Il processo di creazione dell'area di lavoro richiede da diversi minuti a diverse ore per essere completato, a seconda del set di dati associato, del numero di file, delle dimensioni dei file e di altri fattori.

Il sistema estrae automaticamente i metadati da tutte le fonti di dati e li memorizza in un catalogo di metadati che gli utenti possono utilizzare per individuare i file necessari per i loro progetti. Dopo aver assegnato gli utenti all'area di lavoro, gli utenti data engineer possono configurare e interagire con i componenti affiliati all'area di lavoro dalla AI Data Engine Console.

Il nuovo spazio di lavoro viene visualizzato nella pagina Spazi di lavoro in Creating stato finché il processo non viene completato e lo stato cambia in ready.

Rivedi i dettagli dell'area di lavoro

Dopo la creazione dell'area di lavoro, rivedi i dettagli dell'area di lavoro.

Passaggi
  1. Esamina i dettagli dell'area di lavoro, incluse le dimensioni totali, la percentuale della capacità del cluster utilizzata e la data dell'aggiornamento più recente dell'area di lavoro.

  2. Selezionare il nome dell'area di lavoro per aprire la pagina dei dettagli.

  3. Nella scheda Panoramica, visualizza i dettagli dell'area di lavoro che includono contenitori di dati associati, utenti e attività.

Aggiornamenti e versioning dell'area di lavoro

Ogni aggiornamento dell'area di lavoro crea una versione immutabile che cattura lo stato corrente di tutti i file e gli oggetti nell'area di lavoro. Le versioni includono metadati completi, riferimenti agli snapshot utilizzati durante l'estrazione e un ID di processo per la tracciabilità. Ciò supporta la data lineage, la riproducibilità e l'audit.

Gli aggiornamenti vengono eseguiti in base alla pianificazione configurata (ad esempio ogni sei ore) oppure quando vengono attivati manualmente. L'intervallo di refresh minimo supportato è di un'ora; il massimo è di un anno. Se un container di dati è incluso in più aree di lavoro, il sistema utilizza l'intervallo di refresh più frequente e di durata più breve per pianificare l'estrazione dei metadati.

Per impostazione predefinita, il sistema conserva le versioni precedenti, attuali e successive (in corso). Il sistema conserva le versioni meno recenti in base alla policy della tua organizzazione e può eliminarle se necessario.

È possibile elencare tutte le versioni di un'area di lavoro e visualizzare le differenze tra le versioni per identificare quali file o oggetti sono stati aggiunti, modificati o eliminati. Ciò consente di monitorare le modifiche nel tempo e comprendere l'evoluzione dei dati dell'area di lavoro.