Présentation de l'architecture
La solution BeeGFS sur NetApp inclut des critères de conception architecturale qui permettent de déterminer l'équipement, le câblage et les configurations qui sont requis pour prendre en charge les workloads validés.
Architecture modulaire
Le système de fichiers BeeGFS peut être déployé et adapté de différentes manières, en fonction des besoins en stockage. Par exemple, certains cas d'utilisation mettant en avant de nombreux fichiers de petite taille bénéficieront d'une performance et d'une capacité supplémentaires de métadonnées, tandis que les cas d'utilisation comportant moins de fichiers volumineux peuvent favoriser une capacité de stockage et des performances supérieures pour le contenu réel des fichiers. Ces considérations ont un impact sur les différentes dimensions du déploiement d'un système de fichiers parallèle, ce qui ajoute de la complexité à la conception et au déploiement d'un système de fichiers.
En réponse à ces défis, NetApp a conçu une architecture d'éléments de base standard qui permet une évolutivité horizontale de chaque catégorie. De façon générale, les éléments de base BeeGFS sont déployés dans l'un des trois profils de configuration suivants :
-
Un élément de base unique, incluant la gestion BeeGFS, les métadonnées et les services de stockage
-
Des métadonnées BeeGFS plus un élément de base du stockage
-
Un élément de base de stockage BeeGFS uniquement
Le seul changement matériel entre ces trois options est l'utilisation de lecteurs plus petits pour les métadonnées BeeGFS. Dans le cas contraire, toutes les modifications de configuration sont appliquées via le logiciel. En outre, avec Ansible comme moteur de déploiement, la configuration du profil souhaité pour un élément de base particulier simplifie les tâches de configuration.
Pour plus de détails, voir Conception matérielle vérifiée.
Services de système de fichiers
Le système de fichiers BeeGFS inclut les principaux services suivants :
-
Service de gestion. registres et contrôle tous les autres services.
-
Service de stockage. stocke le contenu des fichiers d'utilisateur distribués appelé fichiers de bloc de données.
-
Service de métadonnées. assure le suivi de la disposition du système de fichiers, du répertoire, des attributs de fichier, etc.
-
Service client. monte le système de fichiers pour accéder aux données stockées.
La figure suivante présente les composants et les relations de la solution BeeGFS utilisés avec les systèmes NetApp E-Series.
En tant que système de fichiers parallèle, BeeGFS répartit ses fichiers sur plusieurs nœuds de serveur afin de maximiser les performances en lecture/écriture et l'évolutivité. Les nœuds de serveur fonctionnent ensemble pour fournir un système de fichiers unique pouvant être monté et accessible simultanément par d'autres nœuds de serveur, communément appelés clients. Ces clients peuvent voir et consommer le système de fichiers distribué de la même manière qu'un système de fichiers local tel que NTFS, XFS ou ext4.
Les quatre services principaux fonctionnent sur un large éventail de distributions Linux prises en charge et communiquent via n'importe quel réseau compatible TCP/IP ou RDMA, y compris InfiniBand (IB), Omni-Path (OPA) et RDMA over Converged Ethernet (RoCE). Les services de serveur BeeGFS (gestion, stockage et métadonnées) sont des démons d'espace utilisateur, alors que le client est un module de noyau natif (sans patchless). Tous les composants peuvent être installés ou mis à jour sans redémarrage. Vous pouvez en outre exécuter n'importe quelle combinaison de services sur le même nœud.
Architecture HAUTE DISPONIBILITÉ
BeeGFS sur NetApp étend les fonctionnalités de la version BeeGFS Enterprise en créant une solution entièrement intégrée avec du matériel NetApp qui offre une architecture haute disponibilité (HA) de disque partagé.
L'édition communautaire BeeGFS peut être utilisée gratuitement. Cependant, l'édition entreprise exige l'achat d'un contrat d'abonnement de support professionnel auprès d'un partenaire comme NetApp. L'édition entreprise permet d'utiliser plusieurs fonctions supplémentaires, notamment la résilience, l'application de quotas et les pools de stockage. |
La figure suivante compare les architectures haute disponibilité sans partage et à disque partagé.
Pour plus d'informations, voir "Annonce de la haute disponibilité pour BeeGFS prise en charge par NetApp".
Nœuds vérifiés
La solution BeeGFS sur NetApp a vérifié les nœuds répertoriés ci-dessous.
Nœud | Sous-jacent | Détails |
---|---|---|
Bloc |
Système de stockage EF600 de NetApp |
Une baie de stockage 2U 100 % NVMe haute performance conçue pour les workloads exigeants |
Fichier |
Serveur Lenovo ThinkSystem SR665 V3 |
Serveur 2U à deux sockets avec PCIe 5.0, deux processeurs AMD EPYC 9124. Pour plus d'informations sur le Lenovo SR665 V3, reportez-vous à la section "Site Web de Lenovo". |
Serveur Lenovo ThinkSystem SR665 |
Serveur 2U à deux sockets avec PCIe 4.0, deux processeurs AMD EPYC 7003. Pour plus d'informations sur le Lenovo SR665, reportez-vous à la section "Site Web de Lenovo". |
Conception matérielle vérifiée
Les éléments de base de la solution (illustrés dans la figure suivante) utilisent les serveurs de nœuds de fichiers vérifiés pour la couche de fichiers BeeGFS et deux systèmes de stockage EF600 comme couche bloc.
La solution BeeGFS sur NetApp s'exécute sur tous les éléments de base du déploiement. Le premier élément de base déployé doit exécuter les services de gestion, de métadonnées et de stockage BeeGFS (également appelés éléments de base). Tous les éléments de base suivants peuvent être configurés via le logiciel pour étendre les métadonnées et les services de stockage, ou pour fournir des services de stockage exclusivement. Cette approche modulaire permet de faire évoluer le système de fichiers en fonction des besoins d'une charge de travail, tout en utilisant les mêmes plateformes matérielles sous-jacentes et la même conception d'éléments de base.
Il est possible de déployer jusqu'à cinq éléments de base pour former un cluster Linux HA autonome. Cela optimise la gestion des ressources avec Pacemaker et maintient une synchronisation efficace avec Corosync. Un ou plusieurs de ces clusters haute disponibilité BeeGFS autonomes sont combinés pour créer un système de fichiers BeeGFS accessible aux clients comme un seul namespace de stockage. Côté matériel, un seul rack 42U peut accueillir jusqu'à cinq éléments de base, ainsi que deux commutateurs InfiniBand 1U pour le réseau de stockage/données. Voir le graphique ci-dessous pour une représentation visuelle.
Un minimum de deux éléments de base est requis pour établir le quorum dans le cluster de basculement. Un cluster à deux nœuds présente des limites qui peuvent empêcher un basculement réussi. Vous pouvez configurer un cluster à deux nœuds en incorporant un troisième périphérique comme disjoncteur d'attache ; cependant, cette documentation ne décrit pas cette conception. |
Ansible
BeeGFS sur NetApp est fourni et déployé à l'aide d'Ansible Automation, qui est hébergé sur GitHub et Ansible Galaxy (la collection BeeGFS est disponible sur "Galaxy Ansible" et "NetApp E-Series GitHub"). Bien qu'Ansible soit principalement testé avec le matériel utilisé pour assembler les éléments de base BeeGFS, vous pouvez le configurer de sorte qu'il s'exécute sur presque tous les serveurs x86 à l'aide d'une distribution Linux prise en charge.
Pour plus d'informations, voir "Déploiement de BeeGFS avec E-Series Storage".