Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Résoudre les problèmes liés aux services de plateforme

Contributeurs

Les terminaux utilisés dans les services de plateforme sont créés et gérés par les utilisateurs locataires dans le Gestionnaire de locataires. Toutefois, si un locataire a des problèmes de configuration ou d'utilisation des services de plateforme, vous pouvez utiliser le Gestionnaire de grille pour résoudre le problème.

Problèmes liés aux nouveaux terminaux

Avant qu'un locataire ne puisse utiliser les services de plateforme, il doit créer un ou plusieurs terminaux à l'aide du Gestionnaire des locataires. Chaque terminal représente une destination externe pour un service de plateforme unique, par exemple un compartiment StorageGRID S3, un compartiment Amazon Web Services, un thème simple Service de notification ou un cluster Elasticsearch hébergé localement ou sur AWS. Chaque noeud final comprend à la fois l'emplacement de la ressource externe et les informations d'identification nécessaires pour accéder à cette ressource.

Lorsqu'un locataire crée un noeud final, le système StorageGRID valide que ce dernier existe et qu'il peut être atteint à l'aide des identifiants spécifiés. La connexion au noeud final est validée à partir d'un nœud sur chaque site.

Si la validation du noeud final échoue, un message d'erreur explique pourquoi la validation du noeud final a échoué. L'utilisateur locataire doit résoudre le problème, puis essayer de créer à nouveau le noeud final.

Remarque La création de point final échoue si les services de plate-forme ne sont pas activés pour le compte de locataire.

Problèmes avec les terminaux existants

En cas d'erreur lorsqu'StorageGRID tente d'atteindre un terminal existant, un message s'affiche sur le tableau de bord dans le Gestionnaire de locataires.

Message d'erreur du noeud final sur le tableau de bord

Les utilisateurs locataires peuvent accéder à la page noeuds finaux pour consulter le message d'erreur le plus récent pour chaque noeud final et déterminer la durée de l'erreur. La colonne dernière erreur affiche le message d'erreur le plus récent pour chaque noeud final et indique la durée de l'erreur. Erreurs incluant le Icône X rouge l'icône s'est produite au cours des 7 derniers jours.

Capture d'écran de la page des points de terminaison affichant la colonne dernière erreur
Remarque Certains messages d'erreur dans la colonne dernière erreur peuvent inclure un LogId entre parenthèses. Un administrateur de grille ou le support technique peut utiliser cet ID pour trouver des informations plus détaillées sur l'erreur dans bycast.log.

Problèmes liés aux serveurs proxy

Si vous avez configuré un proxy de stockage entre des nœuds de stockage et des terminaux de service de plateforme, des erreurs peuvent se produire si votre service proxy n'autorise pas les messages de StorageGRID. Pour résoudre ces problèmes, vérifiez les paramètres de votre serveur proxy afin de vous assurer que les messages relatifs au service de la plate-forme ne sont pas bloqués.

Déterminez si une erreur s'est produite

Si des erreurs de point final se sont produites au cours des 7 derniers jours, le tableau de bord du Gestionnaire des locataires affiche un message d'alerte. Vous pouvez accéder à la page noeuds finaux pour obtenir plus de détails sur l'erreur.

Échec des opérations client

Certains problèmes de service de plateforme peuvent entraîner l'échec des opérations client dans le compartiment S3. Par exemple, les opérations client S3 échouent si le service RSM (Replicated State machine) interne s'arrête ou s'il y a trop de messages de services de plate-forme en file d'attente pour la livraison.

Pour vérifier l'état des services :

  1. Sélectionnez SUPPORT > Outils > topologie de grille.

  2. Sélectionnez site Storage Node SSM Services.

Erreurs récupérables et récupérables du point final

Une fois les noeuds finaux créés, des erreurs de demande de service de plate-forme peuvent se produire pour diverses raisons. Certaines erreurs peuvent être récupérées avec l'intervention de l'utilisateur. Par exemple, des erreurs récupérables peuvent se produire pour les raisons suivantes :

  • Les informations d'identification de l'utilisateur ont été supprimées ou ont expiré.

  • Le compartiment de destination n'existe pas.

  • La notification ne peut pas être envoyée.

Si StorageGRID rencontre une erreur récupérable, la demande de service de plate-forme sera relancée jusqu'à ce qu'elle réussisse.

D'autres erreurs sont irrécupérables. Par exemple, une erreur irrécupérable se produit si le noeud final est supprimé.

Si StorageGRID rencontre une erreur de point final irrécupérable, l'alarme d'événements totaux (SMTT) héritée est déclenchée dans le Gestionnaire de grille. Pour afficher l'alarme Total Events hérité :

  1. Sélectionnez SUPPORT > Outils > topologie de grille.

  2. Sélectionnez site node SSM Events.

  3. Afficher le dernier événement en haut du tableau.

    Les messages d'événement sont également répertoriés dans le /var/local/log/bycast-err.log.

  4. Suivez les instructions fournies dans le contenu de l'alarme SMTT pour corriger le problème.

  5. Sélectionnez l'onglet Configuration pour réinitialiser le nombre d'événements.

  6. Notifier le locataire des objets dont les messages de services de plate-forme n'ont pas été livrés.

  7. Demandez au locataire de déclencher à nouveau la réplication ou la notification ayant échoué en mettant à jour les métadonnées ou balises de l'objet.

    Le locataire peut soumettre de nouveau les valeurs existantes afin d'éviter toute modification non souhaitée.

Les messages des services de plate-forme ne peuvent pas être transmis

Si la destination rencontre un problème qui l'empêche d'accepter des messages de services de plate-forme, l'opération client sur le compartiment réussit, mais le message des services de plate-forme n'est pas livré. Par exemple, cette erreur peut se produire si les informations d'identification sont mises à jour sur la destination de sorte que StorageGRID ne puisse plus s'authentifier auprès du service de destination.

Si les messages des services de la plate-forme ne peuvent pas être envoyés en raison d'une erreur irrécupérable, l'alarme Total Events (SMTT) TDA/TDE/MMS (Total Events (SMTT) TDA/TDE) se déclenche dans le Grid Manager.

Des performances plus lentes pour les demandes de services de plateforme

Le logiciel StorageGRID peut canaliser les demandes S3 entrantes pour un compartiment si le taux d'envoi des demandes dépasse le taux à partir duquel le terminal de destination peut recevoir les demandes. La restriction ne se produit que lorsqu'il existe un arriéré de demandes en attente d'envoi vers le noeud final de destination.

Le seul effet visible est que les requêtes S3 entrantes prennent plus de temps à s'exécuter. Si vous commencez à détecter les performances beaucoup plus lentes, vous devez réduire le taux d'entrée ou utiliser un terminal avec une capacité plus élevée. Si l'carnet de commandes des requêtes continue d'augmenter, les opérations S3 des clients (par EXEMPLE, LES requêtes PUT) finiront par échouer.

Les demandes CloudMirror sont plus susceptibles d'être affectées par les performances du terminal de destination, car ces demandes impliquent généralement plus de transfert de données que les demandes d'intégration de recherche ou de notification d'événements.

Les demandes de service de la plateforme échouent

Pour afficher le taux d'échec de la demande pour les services de plate-forme :

  1. Sélectionnez NOEUDS.

  2. Sélectionnez site Platform Services.

  3. Afficher le tableau des taux d'erreur de demande.

    Nœuds page Services de plateforme au niveau du site

Alerte de services de plate-forme non disponibles

L'alerte Platform services unavailable indique qu'aucune opération de service de plate-forme ne peut être effectuée sur un site car trop de nœuds de stockage avec le service RSM sont en cours d'exécution ou disponibles.

Le service RSM garantit que les demandes de service de plate-forme sont envoyées à leurs points de terminaison respectifs.

Pour résoudre cette alerte, déterminez quels nœuds de stockage du site incluent le service RSM. (Le service RSM est présent sur les nœuds de stockage qui incluent également le service ADC.) Ensuite, assurez-vous que la plupart de ces nœuds de stockage sont exécutés et disponibles.

Remarque Si plusieurs nœuds de stockage contenant le service RSM échouent sur un site, vous perdez toute demande de service de plateforme en attente pour ce site.

Conseils de dépannage supplémentaires pour les terminaux des services de plateforme

Pour plus d'informations sur le dépannage des terminaux de services de plate-forme, reportez-vous aux instructions de la section utilisation d'un compte de locataire.