Skip to main content
La version française est une traduction automatique. La version anglaise prévaut sur la française en cas de divergence.

Afficher l'état du système AIDE et l'état du cluster

Contributeurs netapp-dbagwell

En tant qu'administrateur de stockage, vous pouvez utiliser ONTAP System Manager pour accéder au tableau de bord et afficher l'état du cluster. Il s'agit d'une bonne première étape avant de commencer vos tâches d'administration AIDE ou si vous suspectez un problème opérationnel.

Avant de commencer
  • Vous devez disposer des privilèges d'administrateur de stockage pour effectuer des tâches administratives liées à AIDE ONTAP.

Surveillez la santé et la capacité d'AIDE depuis le tableau de bord

  1. Connectez-vous à ONTAP System Manager en utilisant l'adresse de gestion du cluster :

    https://$FQDN_OR_IP/

  2. Sign in avec un compte administrateur.

  3. Sélectionnez Dashboard dans le volet de navigation de gauche.

  4. Consultez la vignette Health :

    • Confirmer l'état général du cluster.

    • Vérifiez le nombre et l'état des Data compute nodes et leur statut.

    • Vérifiez les alertes :

      • Problèmes de nœud DCN ou problèmes de connectivité

      • Espaces de travail ou collecte de données en erreur (par exemple, échecs de publication de collecte)

  5. Consultez la tuile Capacité :

    • Notez la capacité totale du cluster et la capacité utilisée.

    • Pour les clusters AIDE, vérifiez :

      • Capacité utilisée par les métadonnées AIDE et les volumes d'applications (VM de stockage de métadonnées)

      • Capacité utilisée par les espaces de travail et les collectes de données (si disponible)

  6. Vous pouvez également consulter les vignettes Réseau et Performances pour comprendre le comportement global du cluster qui pourrait avoir un impact sur les charges de travail AIDE (par exemple, la congestion du réseau ou le retard de protection).

Consulter les données DCN sur la santé et l'utilisation

  1. Dans le volet de navigation, sélectionnez Cluster et ensuite Overview.

  2. Sélectionnez l’onglet Data compute.

    Cet onglet affiche tous les nœuds DCN du cluster avec :

    • Nom du nœud, modèle, numéro de série et version logicielle

    • État global du nœud

    • Utilisation du CPU et de la mémoire

    • Utilisation du GPU (si des GPU sont présents)

    • Indicateurs d'erreur au niveau des nœuds

  3. Développez un nœud DCN pour ouvrir la vue détaillée et vérifiez :

    • Utilisation du processeur et de la mémoire du système

    • Utilisation de la mémoire GPU

    • Problèmes matériels ou de service signalés

  4. Sélectionnez Câblage sur la page Cluster > Vue d'ensemble pour vérifier que les nœuds DCN sont correctement câblés aux commutateurs du cluster et pour identifier tout problème de port ou de liaison.

Surveiller les espaces de travail et l'encombrement des métadonnées

  1. Dans le volet de navigation, sélectionnez Data engine puis Workspaces.

  2. Consultez le résumé de l'espace de travail en haut de la page :

    • Nombre d'espaces de travail et leurs états (par exemple, Processing, Healthy, Error).

    • Taille totale de l'espace de travail.

    • Pourcentage de la capacité du cluster consommée par tous les espaces de travail.

  3. Examinez la grille de l'espace de travail :

    • Vérifiez que les espaces de travail critiques affichent un état Healthy.

    • Vérifiez les tailles des espaces de travail et la consommation de capacité.

    • Recherchez les espaces de travail en Error ou en Processing état de longue durée.

  4. Pour consulter les détails d'un espace de travail spécifique, sélectionnez son nom :

    • Dans l'onglet Aperçu, confirmez :

      • État et taille de l'espace de travail

      • Conteneurs de données (volumes) inclus et leur nombre d'éléments

      • Dernière heure de mise à jour pour chaque source de données

    • Dans l'onglet Collecte de données, confirmez :

      • Quelles collections de données existent pour cet espace de travail (les collections de données sont en lecture seule dans System Manager)

      • Leur état, leur taille et leur dernière date de mise à jour

    • Dans l'onglet Utilisateurs, vérifiez quels utilisateurs AI Data Engine Console ont accès.

Surveillez les métadonnées Storage VM et la protection gérée par AIDE

  1. Dans le volet de navigation, sélectionnez Cluster puis Storage VMs.

  2. Localisez la Storage VM avec le sous-type data-engine (la metadata SVM) :

    • Confirmez que le SVM de métadonnées est en ligne.

    • Vous pouvez également ouvrir ses détails pour voir les comptes pour :

      • Volumes

      • LIFs avec type Data compute network (utilisées pour la communication DCN-ONTAP)

  3. Sélectionnez Protection puis Relationships pour afficher la protection des sources de données distantes utilisées dans les espaces de travail :

    • Identifiez les relations SnapMirror créées par AIDE selon le modèle de dénomination :

      • Volume de destination <source_volume_name>_dest_<source_volume_UUID>

      • Politique: <source_volume_name>_dest_aide_policy_<source_volume_UUID>

    • Utilisez cette vue pour vérifier que les relations sont saines et que le délai de latence correspond aux attentes de rafraîchissement de l'espace de travail.

Important Ne modifiez pas la machine virtuelle de stockage des métadonnées, les relations SnapMirror créées par AIDE, ni les snapshots gérés par AIDE (ou leurs plannings) directement dans ONTAP. Les modifications peuvent perturber l'historique des versions d'AIDE. "Ajuster les paramètres d'actualisation de l'espace de travail" si vous devez ajuster le comportement d'actualisation.

Consultez les alertes et notifications relatives à AIDE

  1. Dans le volet de navigation, sélectionnez Events & Jobs puis System alerts.

  2. Passez en revue toutes les alertes actives liées à :

    • État ou connectivité du nœud DCN

    • Problèmes de réseau du data engine

    • Erreurs d'espace de travail ou de collecte de données

    • Incompatibilités de versions logicielles entre ONTAP et le cluster DCN

  3. Au besoin, configurez les destinations de notification (par exemple, e-mail, syslog) dans Cluster > Settings > Notification management pour vous assurer que les alertes liées à AIDE sont transmises à vos outils d'exploitation.