NVA-1173 NetApp FlexPod con sistemi NVIDIA DGX - componenti software
Questa sezione si concentra sui componenti software dell'FlexPod con sistemi NVIDIA DGX NetApp.
Software NVIDIA
Comando base NVIDIA
NVIDIA base Command™ è alla base di ogni DGX BasePOD, che consente alle organizzazioni di sfruttare il meglio dell'innovazione software NVIDIA. Le aziende possono liberare il pieno potenziale del proprio investimento con una piattaforma comprovata che include orchestrazione di livello Enterprise e gestione dei cluster, librerie che accelerano calcolo, infrastruttura di storage e rete e un sistema operativo ottimizzato per i carichi di lavoro ai.
Soluzione NVIDIA BaseCommand
NVIDIA GPU CLOUD (NGC)
NVIDIA NGC™ fornisce un software per soddisfare le esigenze di data scientist, sviluppatori e ricercatori con vari livelli di esperienza nel campo dell'intelligenza artificiale. Il software ospitato su NGC viene sottoposto a scansioni contro un insieme aggregato di vulnerabilità ed esposizioni (CVE), crittografia e chiavi private comuni. È stata testata e progettata per scalare a più GPU e, in molti casi, a più nodi, garantendo agli utenti di massimizzare il proprio investimento nei sistemi DGX.
NVIDIA GPU Cloud
NVIDIA ai Enterprise
NVIDIA ai Enterprise è la piattaforma software end-to-end che porta l'ai generativa nella portata di ogni azienda, offrendo il runtime più veloce ed efficiente per modelli di base ai generativi ottimizzati per l'esecuzione sulla piattaforma NVIDIA DGX. Con sicurezza, stabilità e gestibilità di livello produttivo, ottimizza lo sviluppo di soluzioni ai generative. NVIDIA ai Enterprise è inclusa con DGX BasePOD per gli sviluppatori aziendali per accedere a modelli preformati, framework ottimizzati, microservizi, librerie accelerate e supporto Enterprise.
Software NetApp
NetApp ONTAP
ONTAP 9, l'ultima generazione di software per la gestione dello storage NetApp, consente alle aziende di modernizzare l'infrastruttura e passare a un data center predisposto per il cloud. Sfruttando le funzionalità di gestione dei dati leader del settore, ONTAP consente la gestione e la protezione dei dati con un singolo set di strumenti, indipendentemente dalla posizione dei dati. Puoi anche spostare liberamente i dati ovunque siano necessari: Edge, core o cloud. ONTAP 9 include numerose funzionalità che semplificano la gestione dei dati, accelerano e proteggono i dati critici e abilitano le funzionalità dell'infrastruttura di nuova generazione nelle architetture di cloud ibrido.
Accelera e proteggi i dati
ONTAP offre livelli superiori di performance e protezione dei dati ed estende queste funzionalità nei seguenti modi:
-
Performance e latenza ridotta. ONTAP offre il massimo throughput possibile con la latenza più bassa possibile, incluso il supporto per NVIDIA GPUDirect Storage (GDS) utilizzando NFS su RDMA, Parallel NFS (pNFS) e NFS session trunking.
-
Protezione dei dati. ONTAP offre funzionalità di data Protection integrate e la più solida garanzia anti-ransomware del settore con una gestione comune su tutte le piattaforme.
-
NetApp Volume Encryption (NVE). ONTAP offre crittografia nativa a livello di volume con supporto per la gestione delle chiavi sia integrata che esterna.
-
Multi-tenancy dello storage e autenticazione multifattore. ONTAP consente la condivisione delle risorse dell'infrastruttura con i massimi livelli di sicurezza.
Semplifica la gestione dei dati
La gestione dei dati è fondamentale per le operazioni IT aziendali e per i data scientist, in modo che le risorse appropriate vengano utilizzate per le applicazioni ai e per la formazione dei set di dati ai/ML. Le seguenti informazioni aggiuntive sulle tecnologie NetApp non rientrano nell'ambito di questa convalida, ma potrebbero essere rilevanti a seconda dell'implementazione.
Il software per la gestione dei dati ONTAP include le seguenti funzionalità per ottimizzare e semplificare le operazioni e ridurre il costo totale delle operazioni:
-
Snapshot e cloni favoriscono la collaborazione, la sperimentazione parallela e una governance dei dati migliorata per i flussi di lavoro ML/DL.
-
SnapMirror consente lo spostamento perfetto dei dati negli ambienti di cloud ibrido e multisito, fornendo i dati dove e quando è necessario.
-
Compaction dei dati inline e deduplica estesa. La compattazione dei dati riduce lo spazio sprecato all'interno dei blocchi di storage e la deduplica aumenta significativamente la capacità effettiva. Ciò vale per i dati memorizzati localmente e per i dati a più livelli nel cloud.
-
Qualità del servizio (AQoS) minima, massima e adattativa. I controlli granulari della qualità del servizio (QoS) aiutano a mantenere i livelli di performance per le applicazioni critiche in ambienti altamente condivisi.
-
I NetApp FlexGroup consentono la distribuzione dei dati in tutti i nodi del cluster storage, offrendo capacità elevata e performance più elevate per set di dati estremamente grandi.
-
NetApp FabricPool. Offre il tiering automatico dei dati cold per le opzioni di cloud storage pubblico e privato, tra cui Amazon Web Services (AWS), Azure e la soluzione di storage NetApp StorageGRID. Per ulteriori informazioni su FabricPool, vedere "TR-4598: Best practice FabricPool".
-
NetApp FlexCache. Offre funzionalità di caching remoto dei volumi che semplificano la distribuzione dei file, riducono la latenza WAN e riducono i costi della larghezza di banda WAN. FlexCache consente lo sviluppo distribuito di prodotti su più siti, oltre a un accesso accelerato ai set di dati aziendali da ubicazioni remote.
Infrastruttura a prova di futuro
ONTAP aiuta a soddisfare le esigenze di business esigenti e in continua evoluzione con le seguenti funzionalità:
-
Scalabilità perfetta e operazioni senza interruzioni. ONTAP supporta l'aggiunta online di capacità ai controller esistenti e ai cluster scale-out. I clienti possono eseguire l'upgrade alle tecnologie più recenti, come NVMe e 32GB FC, senza costose migrazioni dei dati o interruzioni.
-
Connessione al cloud. ONTAP è il software di gestione dello storage più connesso al cloud, con opzioni per ONTAP Select (software-defined storage) e istanze native del cloud (Google Cloud NetApp Volumes) in tutti i cloud pubblici.
-
Integrazione con le applicazioni emergenti. ONTAP offre servizi dati di livello Enterprise per piattaforme e applicazioni di prossima generazione, come veicoli autonomi, città intelligenti e industria 4.0, utilizzando la stessa infrastruttura che supporta le applicazioni aziendali esistenti.
NetApp DataOps Toolkit
Il NetApp DataOps Toolkit è uno strumento basato su Python che semplifica la gestione degli spazi di lavoro di sviluppo/formazione e dei server di inferenza supportati dallo storage NetApp scale-out dalle performance elevate. DataOps Toolkit può funzionare come utility standalone ed è ancora più efficace negli ambienti Kubernetes sfruttando NetApp Trident per automatizzare le operazioni storage. Le funzionalità principali includono:
-
Provisioning rapido di nuove aree di lavoro JupyterLab ad alta capacità supportate da storage NetApp scale-out dalle performance elevate.
-
Provisioning rapido delle nuove istanze di NVIDIA Triton Inference Server supportate dallo storage NetApp di livello Enterprise.
-
Clonazione quasi istantanea di spazi di lavoro JupyterLab ad alta capacità per consentire la sperimentazione o l'iterazione rapida.
-
Istantanee quasi istantanee di spazi di lavoro JupyterLab ad alta capacità per backup e/o tracciabilità/baseline.
-
Provisioning, cloning e Snapshot quasi istantanei di volumi di dati a elevata capacità e performance elevate.
Trident di NetApp
Trident è un orchestrator di storage open-source, completamente supportato, per container e distribuzioni Kubernetes, incluso anthos. Trident funziona con l'intero portfolio storage di NetApp, inclusi NetApp ONTAP, e supporta anche le connessioni NFS, NVMe/TCP e iSCSI. Trident accelera il workflow DevOps consentendo agli utenti finali di eseguire il provisioning e gestire lo storage dai sistemi storage NetApp senza richiedere l'intervento di un amministratore dello storage.