Composants de cluster et pourquoi ils peuvent être en conflit
Vous pouvez identifier les problèmes de performances du cluster lorsqu’un composant du cluster entre en conflit. Les performances des charges de travail qui utilisent le composant ralentissent et leur temps de réponse (latence) aux demandes des clients augmente, ce qui déclenche un événement dans Unified Manager.
Un composant en conflit ne peut pas fonctionner à un niveau optimal. Ses performances ont diminué et les performances des autres composants et charges de travail du cluster, appelés victimes, pourraient avoir une latence accrue. Pour sortir un composant de la compétition, vous devez réduire sa charge de travail ou augmenter sa capacité à gérer davantage de travail, afin que les performances puissent revenir à des niveaux normaux. Étant donné qu'Unified Manager collecte et analyse les performances de la charge de travail à des intervalles de cinq minutes, il détecte uniquement lorsqu'un composant de cluster est systématiquement surutilisé. Les pics transitoires de surconsommation qui ne durent que peu de temps dans l’intervalle de cinq minutes ne sont pas détectés.
Par exemple, un agrégat de stockage peut être en conflit car une ou plusieurs charges de travail sur celui-ci sont en concurrence pour que leurs demandes d'E/S soient satisfaites. D’autres charges de travail sur l’agrégat peuvent être affectées, ce qui entraîne une diminution de leurs performances. Pour réduire la quantité d'activité sur l'agrégat, vous pouvez prendre différentes mesures, telles que déplacer une ou plusieurs charges de travail vers un agrégat ou un nœud moins occupé, afin de réduire la demande de charge de travail globale sur l'agrégat actuel. Pour un groupe de politiques QoS, vous pouvez ajuster la limite de débit ou déplacer les charges de travail vers un autre groupe de politiques, afin que les charges de travail ne soient plus limitées.
Unified Manager surveille les composants de cluster suivants pour vous alerter lorsqu'ils sont en conflit :
-
Réseau
Représente le temps d'attente des demandes d'E/S par les protocoles réseau externes sur le cluster. Le temps d'attente est le temps passé à attendre que les transactions « transfert prêt » se terminent avant que le cluster puisse répondre à une demande d'E/S. Si le composant réseau est en conflit, cela signifie qu'un temps d'attente élevé au niveau de la couche de protocole a un impact sur la latence d'une ou plusieurs charges de travail.
-
Traitement réseau
Représente le composant logiciel du cluster impliqué dans le traitement des E/S entre la couche de protocole et le cluster. Le traitement du réseau de gestion des nœuds a peut-être changé depuis la détection de l'événement. Si le composant de traitement réseau est en conflit, cela signifie qu'une utilisation élevée au niveau du nœud de traitement réseau a un impact sur la latence d'une ou plusieurs charges de travail.
Lorsque vous utilisez un cluster All SAN Array dans une configuration active-active, la valeur de latence de traitement réseau s'affiche pour les deux nœuds afin que vous puissiez vérifier que les nœuds partagent la charge de manière égale.
-
Limite QoS Max
Représente le paramètre de débit maximal (pic) du groupe de politiques de qualité de service (QoS) de stockage attribué à la charge de travail. Si le composant du groupe de stratégies est en conflit, cela signifie que toutes les charges de travail du groupe de stratégies sont limitées par la limite de débit définie, ce qui a un impact sur la latence d'une ou plusieurs de ces charges de travail.
-
Limite QoS minimale
Représente la latence d'une charge de travail provoquée par le paramètre de débit QoS minimum (attendu) attribué à d'autres charges de travail. Si le minimum de QoS défini sur certaines charges de travail utilise la majorité de la bande passante pour garantir le débit promis, d'autres charges de travail seront limitées et verront plus de latence.
-
Interconnexion de cluster
Représente les câbles et les adaptateurs avec lesquels les nœuds en cluster sont physiquement connectés. Si le composant d'interconnexion du cluster est en conflit, cela signifie que le temps d'attente élevé pour les demandes d'E/S au niveau de l'interconnexion du cluster a un impact sur la latence d'une ou plusieurs charges de travail.
-
* Data Processing*
Représente le composant logiciel du cluster impliqué dans le traitement des E/S entre le cluster et l'agrégat de stockage qui contient la charge de travail. Le nœud gérant le traitement des données peut avoir changé depuis la détection de l'événement. Si le composant de traitement des données est en conflit, cela signifie qu'une utilisation élevée au niveau du nœud de traitement des données a un impact sur la latence d'une ou plusieurs charges de travail.
-
Activation du volume
Représente le processus qui suit l’utilisation de tous les volumes actifs. Dans les environnements de grande taille où plus de 1 000 volumes sont actifs, ce processus suit le nombre de volumes critiques qui doivent accéder aux ressources via le nœud en même temps. Lorsque le nombre de volumes actifs simultanés dépasse le seuil maximal recommandé, certains volumes non critiques subiront une latence comme indiqué ici.
-
* Ressources MetroCluster *
Représente les ressources MetroCluster , y compris la NVRAM et les liaisons inter-commutateurs (ISL), utilisées pour mettre en miroir les données entre les clusters dans une configuration MetroCluster . Si le composant MetroCluster est en conflit, cela signifie que le débit d'écriture est élevé à partir des charges de travail sur le cluster local ou qu'un problème d'intégrité de la liaison affecte la latence d'une ou plusieurs charges de travail sur le cluster local. Si le cluster n’est pas dans une configuration MetroCluster , cette icône ne s’affiche pas.
-
Opérations d'agrégation ou d'agrégation SSD
Représente l’agrégat de stockage sur lequel les charges de travail s’exécutent. Si le composant agrégé est en conflit, cela signifie qu'une utilisation élevée de l'agrégat a un impact sur la latence d'une ou plusieurs charges de travail. Un agrégat se compose de tous les disques durs, ou d'un mélange de disques durs et de SSD (un agrégat Flash Pool), ou d'un mélange de disques durs et d'un niveau cloud (un agrégat FabricPool ). Un « agrégat SSD » se compose de tous les SSD (un agrégat entièrement flash) ou d'un mélange de SSD et d'un niveau cloud (un agrégat FabricPool ).
-
Latence du cloud
Représente le composant logiciel du cluster impliqué dans le traitement des E/S entre le cluster et le niveau cloud sur lequel les données utilisateur sont stockées. Si le composant de latence du cloud est en conflit, cela signifie qu'une grande quantité de lectures provenant de volumes hébergés sur le niveau cloud a un impact sur la latence d'une ou plusieurs charges de travail.
-
Synchroniser SnapMirror
Représente le composant logiciel du cluster impliqué dans la réplication des données utilisateur du volume principal vers le volume secondaire dans une relation synchrone SnapMirror . Si le composant de synchronisation SnapMirror est en conflit, cela signifie que l'activité des opérations synchrones SnapMirror a un impact sur la latence d'une ou plusieurs charges de travail.