NVA-1173 NetApp AIPod mit NVIDIA DGX Systemen – Softwarekomponenten
Der Schwerpunkt dieses Abschnitts liegt auf den Softwarekomponenten des NetApp AIPod mit NVIDIA DGX Systemen.
NVIDIA Software
NVIDIA Base-Befehl
NVIDIA Base Command™ unterstützt jeden DGX BasePOD, sodass Unternehmen das Beste aus der innovativen NVIDIA-Software ausschöpfen können. Unternehmen schöpfen das volle Potenzial ihrer Investitionen aus: Mit einer bewährten Plattform, die Orchestrierung und Cluster-Management der Enterprise-Klasse umfasst, Bibliotheken zur Beschleunigung von Computing-, Storage- und Netzwerkinfrastruktur sowie ein für KI-Workloads optimiertes Betriebssystem.
NVIDIA BaseCommand Solution
NVIDIA GPU CLOUD (NGC)
NVIDIA NGC™ bietet Software, die die Anforderungen von Data Scientists, Entwicklern und Forschern mit unterschiedlichen KI-Fachkenntnissen erfüllt. Software, die auf NGC gehostet wird, wird anhand einer aggregierten Reihe von gängigen Schwachstellen und Expositionen (CVEs), Crypto und privaten Schlüsseln untersucht. Die Lösung wurde getestet und zur Skalierung auf mehrere GPUs und in vielen Fällen auf Multi-Node-Systeme konzipiert, damit Benutzer ihre Investitionen in DGX-Systeme maximal ausschöpfen können.
NVIDIA GPU Cloud
NVIDIA AI Enterprise
NVIDIA AI Enterprise ist die End-to-End-Softwareplattform, die generative KI für jedes Unternehmen zugänglich macht und die schnellste und effizienteste Laufzeit für generative KI-Grundmodelle bietet, die für die Ausführung auf der NVIDIA DGX-Plattform optimiert sind. Mit Sicherheit, Stabilität und Verwaltbarkeit auf Produktionsniveau optimiert es die Entwicklung generativer KI-Lösungen. NVIDIA AI Enterprise ist in DGX BasePOD integriert, damit Entwickler Zugriff auf vortrainierte Modelle, optimierte Frameworks, Microservices, beschleunigte Bibliotheken und Enterprise-Support haben.
NetApp Software
NetApp ONTAP
ONTAP 9, die jüngste Generation der Storage-Managementsoftware von NetApp, ermöglicht Unternehmen eine Modernisierung der Infrastruktur und den Übergang zu einem Cloud-fähigen Datacenter. Dank der erstklassigen Datenmanagementfunktionen lassen sich mit ONTAP sämtliche Daten mit einem einzigen Toolset managen und schützen, ganz gleich, wo sich diese Daten befinden. Zudem können Sie die Daten problemlos dorthin verschieben, wo sie benötigt werden: Zwischen Edge, Core und Cloud. ONTAP 9 umfasst zahlreiche Funktionen, die das Datenmanagement vereinfachen, geschäftskritische Daten beschleunigen und schützen und Infrastrukturfunktionen der nächsten Generation über Hybrid-Cloud-Architekturen hinweg ermöglichen.
Beschleunigung und Sicherung von Daten
ONTAP bietet überdurchschnittliche Performance und Datensicherung, erweitert diese Funktionen auf folgende Weise:
-
Performance und niedrige Latenz: ONTAP bietet höchstmöglichen Durchsatz bei geringstmöglicher Latenz, einschließlich Unterstützung für NVIDIA GPUDirect Storage (GDS) mit NFS over RDMA, Parallel NFS (pNFS) und NFS Session Trunking.
-
Datensicherung ONTAP bietet integrierte Funktionen für die Datensicherung und die branchenweit stärkste Garantie für Ransomware-Schutz mit einem einheitlichen Management über alle Plattformen hinweg.
-
NetApp Volume Encryption (NVE) ONTAP bietet native Verschlüsselung auf Volume-Ebene und unterstützt sowohl Onboard- als auch externes Verschlüsselungsmanagement.
-
Storage-Mandantenfähigkeit und Multi-Faktor-Authentifizierung. ONTAP ermöglicht die gemeinsame Nutzung von Infrastrukturressourcen mit höchstmöglicher Sicherheit.
Vereinfachtes Datenmanagement
Für den Enterprise IT-Betrieb und die Data Scientists spielt Datenmanagement eine zentrale Rolle, damit für KI-Applikationen die entsprechenden Ressourcen zum Training von KI/ML-Datensätzen verwendet werden. Die folgenden zusätzlichen Informationen über NetApp Technologien sind bei dieser Validierung nicht im Umfang enthalten, können jedoch je nach Ihrer Implementierung relevant sein.
Die ONTAP Datenmanagement-Software umfasst die folgenden Funktionen, um den Betrieb zu optimieren und zu vereinfachen und damit Ihre Gesamtbetriebskosten zu senken:
-
Snapshots und Klone ermöglichen Zusammenarbeit, parallele Experimente und erweiterte Daten-Governance für ML/DL-Workflows.
-
SnapMirror ermöglicht die nahtlose Datenverschiebung in Hybrid-Cloud- und Multi-Site-Umgebungen, sodass Daten jederzeit und überall zur Verfügung stehen.
-
Inline-Data-Compaction und erweiterte Deduplizierung: Data-Compaction reduziert den ungenutzten Speicherplatz in Storage-Blöcken, während Deduplizierung die effektive Kapazität deutlich steigert. Dies gilt für lokal gespeicherte Daten und für Daten-Tiering in die Cloud.
-
Minimale, maximale und adaptive Quality of Service (AQoS): Durch granulare QoS-Einstellungen (Quality of Service) können Unternehmen ihre Performance-Level für kritische Applikationen auch in Umgebungen mit vielen unterschiedlichen Workloads garantieren.
-
NetApp FlexGroups ermöglichen die Verteilung von Daten auf alle Nodes im Storage Cluster und sorgen für äußerst große Datensätze mit enormer Kapazität und höherer Performance.
-
NetApp FabricPool: Bietet automatisches Tiering von „kalten“ Daten in Private- und Public-Cloud-Storage-Optionen, einschließlich Amazon Web Services (AWS), Azure und NetApp StorageGRID Storage-Lösung. Weitere Informationen zu FabricPool finden Sie unter "TR-4598: FabricPool Best Practices".
-
NetApp FlexCache: Mit Remote-Caching-Funktionen für Volumes vereinfachen Sie die Dateiverteilung und senken die WAN-Latenz sowie die Kosten für die WAN-Bandbreite. FlexCache ermöglicht eine über mehrere Standorte verteilte Produktentwicklung sowie einen schnelleren Zugriff auf Unternehmensdatensätze von Remote-Standorten aus.
Zukunftssichere Infrastruktur
ONTAP bietet folgende Funktionen, um anspruchsvolle und sich ständig ändernde Geschäftsanforderungen zu erfüllen:
-
Nahtlose Skalierung und unterbrechungsfreier Betrieb: Die ONTAP unterstützt das Online-Hinzufügen von Kapazität zu vorhandenen Controllern und das Scale-out von Clustern. Kunden können Upgrades auf die neuesten Technologien wie NVMe und 32 GB FC ohne teure Datenmigrationen oder Ausfälle durchführen.
-
Cloud-Anbindung: ONTAP ist die Storage-Managementsoftware mit der umfassendsten Cloud-Integration und bietet Optionen für softwaredefinierten Storage (ONTAP Select) und Cloud-native Instanzen (Google Cloud NetApp Volumes) in allen Public Clouds.
-
Integration in moderne Applikationen: ONTAP bietet Datenservices der Enterprise-Klasse für Plattformen und Applikationen der neuesten Generation, wie autonome Fahrzeuge, Smart Citys und Industrie 4.0, auf derselben Infrastruktur, die bereits vorhandene Unternehmensanwendungen unterstützt.
NetApp DataOps Toolkit
Das NetApp DataOps Toolkit ist ein Python-basiertes Tool zur Vereinfachung des Managements von Entwicklungs-/Trainings-Workspaces und Inferenzservern, die durch hochleistungsfähigen, horizontal skalierbaren NetApp Storage gesichert werden. Das DataOps Toolkit kann als eigenständiges Dienstprogramm ausgeführt werden. Noch effektiver ist es in Kubernetes-Umgebungen, in denen NetApp Trident Storage-Vorgänge automatisiert. Die wichtigsten Funktionen:
-
Schnelle Bereitstellung neuer JupyterLab Workspaces mit hoher Kapazität, die durch hochperformanten horizontal skalierbaren NetApp Storage unterstützt werden
-
Schnelle Bereitstellung neuer NVIDIA Triton Inferenz Server Instanzen, die durch NetApp Storage der Enterprise-Klasse unterstützt werden
-
Nahezu sofortiges Klonen von JupyterLab Workspaces mit hoher Kapazität für Experimentierfreudigkeit oder schnelle Iterationen
-
Nahezu sofortige Snapshots von JupyterLab Workspaces mit hoher Kapazität für Backups und/oder Rückverfolgbarkeit/Baselining.
-
Bereitstellung, Klonen und Snapshots hochperformanter Daten-Volumes nahezu sofort
NetApp Trident
Trident ist ein vollständig unterstützter Open-Source-Storage-Orchestrator für Container und Kubernetes-Distributionen, einschließlich Anthos. Trident kann mit dem gesamten NetApp Storage-Portfolio, einschließlich NetApp ONTAP, eingesetzt werden. Darüber hinaus werden NFS-, NVMe/TCP- und iSCSI-Verbindungen unterstützt. Trident beschleunigt den DevOps-Workflow, da Endbenutzer Storage über ihre NetApp Storage-Systeme bereitstellen und managen können, ohne dass ein Storage-Administrator eingreifen muss.