Details zur AFX-Speichersystemarchitektur
Die AFX-Architektur besteht aus mehreren Hardware- und Softwarekomponenten. Diese Systemkomponenten sind in verschiedene Kategorien unterteilt.
Physische Komponenten
Wenn Sie zum ersten Mal mit AFX beginnen, ist es hilfreich, zunächst einen Überblick über die physischen Komponenten zu erhalten, wie sie in Ihrem Rechenzentrum installiert sind.
Controller-Knoten
Auf AFX-Controllerknoten wird eine spezielle Persönlichkeit der ONTAP -Software ausgeführt, die zur Unterstützung der Anforderungen der AFX-Umgebung entwickelt wurde. Clients greifen über mehrere Protokolle auf die Knoten zu, darunter NFS, SMB und S3. Jeder Knoten verfügt über eine vollständige Ansicht des Speichers, auf den er basierend auf den Clientanforderungen zugreifen kann. Die Knoten sind zustandsbehaftet und verfügen über einen nichtflüchtigen Speicher, um kritische Statusinformationen beizubehalten und zusätzliche, auf die Ziel-Workloads zugeschnittene Verbesserungen zu beinhalten.
Lagerregale und -platten
AFX-Speicherregale verwenden Non-Volatile Memory Express over Fabrics (NVMe-oF), um SSDs mit hoher Dichte anzuschließen. Die Festplatten kommunizieren über ein Fabric mit extrem geringer Latenz mithilfe von RDMA over Converged Ethernet (RoCE). Die Speicherregale, einschließlich der E/A-Module, Netzwerkkarten, Lüfter und Netzteile, sind vollständig redundant und weisen keine einzelne Fehlerquelle auf. Mithilfe selbstverwalteter Technologie werden alle Aspekte der RAID-Konfiguration und des Festplattenlayouts verwaltet und gesteuert.
Cluster-Speicher-Switch-Netzwerk
Redundante und leistungsstarke Switches verbinden die AFX-Controllerknoten mit den Speicherregalen. Zur Leistungsoptimierung werden erweiterte Protokolle verwendet. Das Design basiert auf VLAN-Tagging mit mehreren Netzwerkpfaden sowie Tech-Refresh-Konfigurationen, um einen kontinuierlichen Betrieb und einfache Upgrades zu gewährleisten.
Kundenschulungsumgebung
Die Client-Trainingsumgebung ist eine Laborumgebung mit vom Kunden bereitgestellter Hardware, wie z. B. GPU-Clustern und KI-Workstations. Es ist in der Regel für die Unterstützung von Modelltraining, Inferenz und anderen KI/ML-bezogenen Arbeiten konzipiert. Clients greifen über Industriestandardprotokolle wie NFS, SMB und S3 auf AFX zu.
Client-Netzwerk
Dieses interne Netzwerk verbindet die Client-Trainingsumgebung mit dem AFX-Speichercluster. Das Netzwerk wird vom Kunden bereitgestellt und verwaltet, NetApp erwartet jedoch, Empfehlungen für Anforderungen und Design vor Ort abzugeben.
Logische Komponenten
In AFX sind mehrere logische Komponenten enthalten. Sie werden zusammen mit den physischen Komponenten des Clusters in Software implementiert. Die logischen Komponenten erzwingen eine Struktur, die die Verwendung und Konfiguration der AFX-Systeme bestimmt.
Gemeinsamer Speicherpool
Die Storage Availability Zone (SAZ) ist ein gemeinsamer Speicherpool für den gesamten Cluster. Es handelt sich um eine Sammlung von Festplatten in den Speicherregalen, die allen Controllerknoten einen einzigen einheitlichen Namespace bereitstellt. Die SAZ bietet ein Bereitstellungsmodell ohne feste Einschränkungen hinsichtlich der von den Knoten verwendeten Speicherregale. Kunden können freien Speicherplatz und Speichernutzung als Eigenschaften des gesamten AFX-Clusters anzeigen.
FlexVolumes, FlexGroups und Buckets
FlexVolumes, FlexGroups und S3-Buckets sind die Datencontainer, die den AFX-Administratoren basierend auf den Clientzugriffsprotokollen zur Verfügung gestellt werden. Diese skalierbaren Container sind darauf ausgelegt, viele der komplexen internen Speicherdetails zu abstrahieren.
Datenlayout und -zugriff
Das Datenlayout und der Datenzugriff sind auf nahtlosen Zugriff und effiziente Nutzung der GPUs abgestimmt. Dies spielt eine entscheidende Rolle bei der Beseitigung von Engpässen und der Aufrechterhaltung einer konstanten Leistung.
SVMs und Mandantenfähigkeit
AFX bietet ein Mandantenmodell, das auf dem mit AFF und FAS Systemen verfügbaren SVM-Modell aufbaut. Das AFX-Mietermodell wurde zur Vereinfachung der Verwaltung optimiert.
AFX-Clusterbereitstellung
Die folgende Abbildung veranschaulicht eine typische AFX-Clusterbereitstellung. Controllerknoten sind von den Speicherregalen entkoppelt und über ein gemeinsames Netzwerk verbunden.
