Analysieren Sie Latenztrends für EDA in Workload Factory
Nachdem ein Latenzereignis erkannt wurde, können Sie mithilfe des interaktiven Diagramms das Latenzverhalten des Volumes im Zeitverlauf analysieren. Dies hilft Ihnen, Muster zu erkennen, zu verstehen, ob Leistungsprobleme wiederkehrend oder vereinzelt auftreten, und datengestützte Entscheidungen zur Behebung zu treffen.
Bevor Sie beginnen
Sie müssen "konfigurierte Latenzüberwachung" und mindestens ein Latenzereignis erkannt haben.
Latenztrends analysieren
Das Latenzdiagramm bietet eine visuelle Darstellung des Volumen-Latenzverhaltens im Zeitverlauf.
Das Latenzdiagramm zeigt CloudWatch-Latenzdaten für das betroffene Volume an. Das Diagramm zeigt automatisch die Lese- oder Schreiblatenz an, je nachdem, welcher Alarm das Ereignis ausgelöst hat. Sie können den Zeitraum anpassen, um das Latenzverhalten über verschiedene Zeiträume zu betrachten.
Es beinhaltet:
-
Latenz-Metriklinie: Zeigt die tatsächlichen Latenzwerte (in Millisekunden) an, die im Laufe der Zeit von CloudWatch erfasst wurden.
-
Schwellenwertlinien: Gepunktete horizontale Linien, die Ihre konfigurierten Warn- und kritischen Schwellenwerte anzeigen
-
Überschreitungsindikatoren: Visuelle Markierungen, die anzeigen, wann und wie oft Schwellenwerte während des Zeitraums überschritten wurden
-
Details zum Verstoß: Für jeden Verstoß werden der mittlere Latenzwert, der Prozentsatz über dem Schwellenwert, die QoS-Verzögerungszentrumsdaten und die Erkennungszeit angezeigt.
-
Wählen Sie im Tab Latenz ein Latenzereignis aus der Ereignistabelle aus.
Das Panel zur Latenzanalyse öffnet sich.
-
Wählen Sie die Registerkarte Over time aus.
-
Schauen Sie sich die standardmäßige Diagrammansicht an, die Latenzdaten der letzten 3 Stunden anzeigt.
-
Ändern Sie den Zeitbereich, um verschiedene Perioden zu analysieren und Muster zu erkennen.
-
Beobachten Sie die Latenz-Trendlinie im Verhältnis zu den Schwellenwertlinien.
-
Überprüfen Sie die Indikatoren für Sicherheitsverstöße im Diagramm:
Werden die Schwellenwerte während des angezeigten Zeitraums mehrfach überschritten, zeigen Überschreitungsmarkierungen an, wann die Schwellenwerte überschritten wurden.
-
Um Einzelheiten zum Sicherheitsvorfall anzuzeigen, bewegen Sie den Mauszeiger über einen Indikator für den Sicherheitsvorfall oder wählen Sie ihn aus.
-
Überprüfen Sie die Zusammenfassung der Verstöße:
Das Diagramm zeigt die Gesamtzahl der während des ausgewählten Zeitraums festgestellten Warn- oder kritischen Verstöße.
-
Nutzen Sie die Erkenntnisse aus den Diagrammen, um:
-
Ermitteln Sie, ob Latenzprobleme vereinzelt oder wiederkehrend auftreten
-
Identifizieren Sie tageszeitliche Muster, die mit hoher Latenz korrelieren
-
Beurteilen Sie, ob die Latenzspitzen kurz oder kontinuierlich sind
-
Korrelieren Sie Latenzereignisse mit Arbeitslastmustern oder Systemänderungen
-
Sie erhalten einen umfassenden Überblick über das Latenzverhalten des Volumes im Zeitverlauf, was Ihnen hilft, fundierte Entscheidungen darüber zu treffen, ob sofortige Abhilfemaßnahmen erforderlich sind, Schwellenwerte angepasst werden müssen oder zugrunde liegende Infrastrukturprobleme untersucht werden müssen.
|
|
Das Latenzdiagramm zeigt CloudWatch-Metrikdaten, die aufgrund unterschiedlicher Erfassungsmethoden geringfügig von den ONTAP QoS-Verzögerungszentrum-Daten abweichen können. Beide Datenquellen werden für eine umfassende Analyse bereitgestellt. |
Graphinterpretation
Beachten Sie diese Empfehlungen bei der Analyse von Latenztrends:
-
Verwenden Sie mehrere Zeiträume: Analysieren Sie das Diagramm über verschiedene Zeiträume hinweg, um zwischen einzelnen Leistungsspitzen und kontinuierlicher Leistungsverschlechterung zu unterscheiden. Beginnen Sie mit der 24H-Ansicht für den Kontext, zoomen Sie dann in kürzere Zeiträume, um spezifische Vorfälle zu analysieren, oder erweitern Sie auf 72H, um tägliche Muster zu erkennen.
-
Schwellenwerte visuell vergleichen: Nutzen Sie die Schwellenwertlinien im Diagramm, um zu beurteilen, ob die von Ihnen konfigurierten Warn- und kritischen Werte für Ihre Arbeitslastmuster geeignet sind. Wenn die Latenz den Schwellenwert häufig erreicht, ihn aber nicht überschreitet, prüfen Sie, ob Ihr Schwellenwert zu hoch eingestellt ist. Wenn Sie viele kurze Schwellenwertüberschreitungen feststellen, die den Betrieb nicht beeinträchtigen, ist Ihr Schwellenwert möglicherweise zu empfindlich.
-
Tagesmuster erkennen: Nutzen Sie die 24H- und 72H-Ansichten, um tageszeitliche Muster zu identifizieren. Treten Latenzspitzen zu vorhersehbaren Zeiten auf, können Sie ressourcenintensive Vorgänge proaktiv in Zeiten geringer Auslastung planen oder die Kapazität zur Bewältigung von Lastspitzen erhöhen.
-
Unterscheidung der Spike-Typen: Kurze, abrupte Spitzen deuten auf vorübergehende Probleme hin (wie eine temporäre Ressourcenkonkurrenz), während kontinuierlich erhöhte Latenz auf systemische Probleme (wie Kapazitätsengpässe oder Konfigurationsprobleme) hindeutet. Jede erfordert unterschiedliche Behebungsansätze.
-
Trends nach Änderungen überwachen: Nach dem Anpassen von Schwellenwerten, dem Hinzufügen von Kapazität oder dem Ändern von Konfigurationen sollten Sie den Graphen mindestens 72 Stunden lang beobachten, um sicherzustellen, dass Ihre Änderungen den gewünschten Effekt haben.