Skip to main content
Die deutsche Sprachversion wurde als Serviceleistung für Sie durch maschinelle Übersetzung erstellt. Bei eventuellen Unstimmigkeiten hat die englische Sprachversion Vorrang.

Latenzprobleme in Workload Factory für EDA analysieren

Beitragende netapp-sineadd
Änderungen vorschlagen

Erkennen Sie erkannte Latenzereignisse und nutzen Sie automatisierte Analysetools, um die Ursachen zu identifizieren und Leistungsengpässe in Ihren FSx for ONTAP Volumes zu beheben.

Bevor Sie beginnen

Sie müssen "konfigurierte Latenzüberwachung" haben, bevor Sie Latenzereignisse anzeigen und analysieren können.

Latenzereignisse anzeigen

Die Tabelle der Latenzereignisse bietet eine zentrale Übersicht über alle Warn- und kritischen Ereignisse, die in den letzten 72 Stunden erkannt wurden.

Über diese Aufgabe
  • Es wird jeweils nur der letzte Sicherheitsvorfall pro Volume angezeigt. Bei mehreren Sicherheitsvorfällen pro Volume wird nur das aktuellste Ereignis angezeigt.

  • Ereignisse werden nach 72 Stunden automatisch entfernt.

  • Es werden maximal 200 Ereignisse angezeigt. Ältere Ereignisse werden entfernt, sobald neue hinzugefügt werden.

  • Ereignisse werden auch dann angezeigt, wenn kein Link mit dem Dateisystem verknüpft ist. Ein Link ist erforderlich, um grundlegende Analysedetails anzuzeigen und die AI-Agentenanalyse auszuführen.

Schritte
  1. Melden Sie sich mit einem der folgenden Dienste an: "Konsolenerlebnisse"Die

  2. Wählen Sie das Menü Das Hamburger-Menüsymbol und wählen Sie dann EDA aus.

  3. Wählen Sie die Registerkarte Latenz aus.

  4. Überprüfen Sie die Informationen zu jedem Ereignis in der Tabelle der Latenzereignisse.

  5. Um Details zu einem Latenzereignis anzuzeigen, wählen Sie das Ereignis in der Spalte Schweregrad aus. Dadurch wird ein Latenzanalyse-Panel für dieses Ereignis geöffnet.

  6. Um die Tabelle zu sortieren, wählen Sie eine beliebige Spaltenüberschrift aus. Standardmäßig werden kritische Ereignisse zuerst nach Zeit sortiert angezeigt, gefolgt von Warnereignissen, ebenfalls nach Zeit sortiert.

  7. Um ein oder mehrere Ereignisse zu verwerfen, wählen Sie neben dem jeweiligen Ereignis Das Aktionsmenü-SymbolVerwerfen.

  8. Um der Tabelle Spalten hinzuzufügen, wählen Sie Das Spaltensymbol, wählen Sie die Spalten aus und wählen Sie Anwenden.

  9. Um Latenztrends im Zeitverlauf zu analysieren, wählen Sie ein Ereignis aus, um das Latenzanalyse-Panel zu öffnen. Verwenden Sie die Registerkarte Zeitverlauf, um das interaktive Latenzdiagramm anzuzeigen. Siehe "Latenztrends analysieren" für Details.

Analysiere ein Latenzereignis

Eine Basisanalyse hilft Ihnen, die Ursache von Latenzproblemen schnell und ohne manuelle Untersuchung zu identifizieren.

Latenzanalyse-Panel

Wählen Sie ein Latenzereignis in der Spalte Schweregrad aus, um das Latenzanalyse-Panel für dieses Ereignis zu öffnen. Das Panel enthält Registerkarten, die verschiedene Ansichten des Latenzereignisses bieten:

  • Übersicht: Zeigt grundlegende Analyseergebnisse an, die anzeigen, welche Komponente die Latenz verursacht

  • Im Zeitverlauf: Zeigt ein interaktives Latenzdiagramm mit historischen Daten

Registerkarte „Übersicht“

Auf der Registerkarte Übersicht werden die Ergebnisse der automatisierten Basisanalyse angezeigt, wobei ermittelt wird, welche Komponente die Latenz verursacht.

Wenn ein Amazon Bedrock-Modell-ARN konfiguriert ist, enthält die Registerkarte Übersicht auch eine Option zur Durchführung einer KI-Agentenanalyse für Daten- und Clusterszenarien. Wenn Bedrock nicht konfiguriert ist, zeigt die Registerkarte einen Link zur Konfigurationsseite für Storage workloads des jeweiligen Dateisystems an, wo Sie den Bedrock-Zugriff konfigurieren können.

Registerkarte „Over time“

Die Registerkarte Over time zeigt ein interaktives Latenzdiagramm, das CloudWatch-Latenzmetriken im Zeitverlauf für das betroffene Volume anzeigt. Das Diagramm zeigt entweder die Lese- oder die Schreiblatenz an, abhängig davon, welcher Alarmtyp das Ereignis ausgelöst hat. Sie können verschiedene Zeitrahmen (1H, 3H, 12H, 24H, 72H) auswählen, um das Latenzverhalten über unterschiedliche Zeiträume hinweg anzuzeigen.

Eine detaillierte Anleitung zur Verwendung des Diagramms finden Sie unter "Latenztrends analysieren".

Schritte

  1. Suchen Sie auf der Registerkarte Latenz das Ereignis, das Sie analysieren möchten.

  2. Wählen Sie in der Spalte Schweregrad ein Latenzereignis aus, um ein Analysefenster für dieses Ereignis zu öffnen.

    Wenn kein Link mit dem Dateisystem verknüpft ist, wird eine Aufforderung angezeigt, die Sie auffordert, einen Link mit dem betroffenen Dateisystem zu verknüpfen. Wählen Sie die Aufforderung aus, um zur Link-Einrichtungsseite für dieses Dateisystem weitergeleitet zu werden.

  3. Überprüfen Sie die Registerkarte Übersicht, um die grundlegenden Analyseergebnisse zu verstehen und die Latenzquelle zu identifizieren.

  4. Optional können Sie die Registerkarte Im Zeitverlauf auswählen, um die Latenztrends für das betroffene Volume anzuzeigen.

  5. Falls die Ursache der Latenz eine genauere Untersuchung erfordert (Daten- oder Cluster-Szenarien), führen Sie eine KI-Agentenanalyse durch.

KI-Agentenanalyse ausführen

Die Analyse mittels KI-Agenten ermöglicht eine tiefergehende Untersuchung, um die genaue Ursache und mögliche Abhilfemaßnahmen zu ermitteln.

Bevor Sie beginnen

Konfigurieren Sie einen Amazon Bedrock-Modell-ARN in den Workload Factory-Einstellungen, siehe "Grundlegende GenAI-Anforderungen".

Über diese Aufgabe

Bei der Ausführung der KI-Agentenanalyse aktualisiert das System automatisch die Basisanalysedaten und verwendet diese als Eingabe für den KI-Agenten.

Schritte
  1. Suchen Sie auf der Registerkarte Latenz das Ereignis, das Sie analysieren möchten.

  2. Wählen Sie in der Spalte Schweregrad ein Latenzereignis aus, um ein Analysefenster für dieses Ereignis zu öffnen.

    Wenn kein Link mit dem Dateisystem verknüpft ist, wird eine Aufforderung angezeigt, die Sie auffordert, einen Link mit dem betroffenen Dateisystem zu verknüpfen. Wählen Sie die Aufforderung aus, um zur Link-Einrichtungsseite für dieses Dateisystem weitergeleitet zu werden.

  3. Überprüfen Sie die Registerkarte Übersicht, um die grundlegenden Analyseergebnisse zu verstehen und die Latenzquelle zu identifizieren.

  4. Wenn die Latenzquelle als Daten oder Cluster identifiziert wird, wählen Sie Analysieren, um die KI-Agentenanalyse auszuführen.

  5. Überprüfen Sie die Ergebnisse der KI-Agentenanalyse, einschließlich:

    • Mögliche Ursachenerklärung

    • Liste der betroffenen EC2-Clients

    • Empfohlene Abhilfemaßnahmen

  6. Setzen Sie die empfohlenen Maßnahmen zur Behebung des Latenzproblems um.

  7. Nach der Behebung sollte die Tabelle der Latenzereignisse überwacht werden, um zu überprüfen, ob das Problem behoben ist.

Best Practices

Beachten Sie diese Empfehlungen bei der Analyse von Latenzproblemen:

  • Trends überwachen: Überprüfen Sie regelmäßig die Tabelle der Latenzereignisse, um Muster oder wiederkehrende Probleme zu identifizieren, die auf zugrunde liegende Konfigurationsprobleme hinweisen könnten.

  • KI-Agentenanalyse strategisch einsetzen: Führen Sie die KI-Agentenanalyse für Daten- und Cluster-Szenarien durch, bei denen die Basisanalyse dies empfiehlt. Die KI-Agentenanalyse liefert tiefere Einblicke in komplexe Leistungsprobleme, die eine detaillierte Fehlerbehebung erfordern.

  • Überprüfung abgewiesener Ereignisse: Überprüfen Sie regelmäßig, warum Ereignisse abgewiesen wurden, um Möglichkeiten zur Anpassung der Schwellenwerte oder Infrastrukturverbesserungen zu identifizieren.

Für bewährte Methoden zur Analyse von Latenztrends siehe "Graphinterpretation".