Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

Workload Factory에서 EDA의 지연 시간 추세 분석

기여자 netapp-sineadd

지연 이벤트가 감지되면 대화형 그래프를 사용하여 시간 경과에 따른 볼륨 지연 동작을 분석할 수 있습니다. 이를 통해 패턴을 파악하고, 성능 문제가 반복적인지 아니면 일시적인지 판단하고, 데이터 기반의 문제 해결 방안을 결정할 수 있습니다.

시작하기 전에

"구성된 지연 시간 모니터링" 및 최소 하나 이상의 지연 이벤트가 감지되어야 합니다.

지연 시간 추세 분석

지연 시간 그래프는 시간에 따른 볼륨 지연 시간 동작을 시각적으로 보여줍니다.

이 작업 정보

지연 시간 그래프는 영향을 받는 볼륨에 대한 CloudWatch 지연 시간 데이터를 표시합니다. 그래프는 이벤트를 발생시킨 알람에 따라 읽기 지연 시간 또는 쓰기 지연 시간을 자동으로 표시합니다. 시간 범위를 조정하여 다양한 기간 동안의 지연 시간 동작을 확인할 수 있습니다.

다음 내용이 포함됩니다.

  • 지연 시간 메트릭 라인: 시간 경과에 따라 CloudWatch에서 수집된 실제 지연 시간 값(밀리초)을 표시합니다

  • 임계값 선: 구성된 경고 및 위험 임계값을 나타내는 점선 가로선

  • 위반 지표: 해당 기간 동안 임계값이 초과된 시점과 횟수를 시각적으로 보여주는 표시

  • 위반 세부 정보: 각 위반에 대해 중앙값 지연 시간 값, 임계값 초과 백분율, QoS 지연 센터 데이터 및 감지 시간을 확인합니다

단계
  1. 지연 시간 탭의 이벤트 테이블에서 지연 시간 이벤트를 선택합니다.

    지연 시간 분석 패널이 열립니다.

  2. Over time 탭을 선택합니다.

  3. 지난 3시간 동안의 지연 시간 데이터를 표시하는 기본 그래프 보기를 검토하십시오.

  4. 시간 범위를 변경하여 다양한 기간을 분석하고 패턴을 파악하십시오.

  5. 지연 시간 추세선을 임계값 선과 비교하여 관찰하십시오.

  6. 그래프에서 위반 지표를 검토하십시오.

    표시된 기간 동안 임계값이 여러 번 초과될 경우, 위반 표시는 임계값이 초과된 시점을 나타냅니다.

  7. 위반 세부 정보를 보려면 위반 표시기 위에 마우스를 올리거나 선택하십시오.

  8. 침해 건수 요약을 검토하십시오.

    이 그래프는 선택한 기간 동안 감지된 경고 또는 위험 위반의 총 수를 표시합니다.

  9. 그래프 인사이트를 사용하여 다음을 수행하십시오.

    • 지연 문제가 일회성인지 반복적인 문제인지 판단하십시오

    • 높은 지연 시간과 상관관계가 있는 시간대 패턴을 파악합니다

    • 지연 시간 급증이 일시적인지 지속적인지 평가하십시오.

    • 지연 이벤트와 워크로드 패턴 또는 시스템 변경 사항 간의 상관관계를 분석합니다.

결과

시간 경과에 따른 볼륨 지연 시간 동작을 종합적으로 파악할 수 있으므로 즉각적인 해결이 필요한지, 임계값을 조정해야 하는지, 또는 기본 인프라 문제를 조사해야 하는지에 대해 정보에 입각한 결정을 내릴 수 있습니다.

참고 지연 시간 그래프는 CloudWatch 메트릭 데이터를 보여줍니다. 이 데이터는 수집 방식의 차이로 인해 ONTAP QoS 지연 센터 데이터와 약간의 차이가 있을 수 있습니다. 종합적인 분석을 위해 두 가지 데이터 소스가 모두 제공됩니다.

그래프 해석

지연 시간 추세를 분석할 때 다음 권장 사항을 고려하십시오.

  • 다양한 시간 범위를 활용하세요: 그래프를 여러 시간 범위에 걸쳐 검토하여 일시적인 성능 급증과 지속적인 성능 저하를 구분하세요. 먼저 24H 보기를 통해 전체적인 맥락을 파악한 다음, 더 짧은 기간으로 확대하여 특정 사건을 분석하거나 72H로 확장하여 일별 패턴을 확인하세요.

  • 임계값을 시각적으로 비교하세요: 그래프의 임계값 선을 사용하여 구성한 경고 및 임계값이 워크로드 패턴에 적합한지 평가하세요. 지연 시간이 임계값에 자주 근접하지만 넘지 않는다면 임계값이 너무 높게 설정된 것은 아닌지 검토하세요. 반대로 작업에 영향을 미치지 않는 짧은 시간 동안의 임계값 통과가 자주 발생한다면 임계값이 너무 민감할 수 있습니다.

  • 일일 패턴 파악: 24H 및 72H 보기를 사용하여 시간대별 패턴을 파악하십시오. 지연 시간 급증이 예측 가능한 시간에 발생하는 경우 리소스 집약적인 작업을 사용률이 낮은 기간 동안 사전에 예약하거나 피크 로드를 처리하기 위해 용량을 추가할 수 있습니다.

  • 스파이크 유형 구분: 짧고 급격한 스파이크는 일시적인 문제(예: 일시적인 리소스 경합)를 나타내는 반면, 지속적인 지연 시간 증가는 시스템적인 문제(예: 용량 제약 또는 구성 문제)를 시사합니다. 각 유형에는 서로 다른 해결 접근 방식이 필요합니다.

  • 변경 후 추세 모니터링: 임계값을 조정하거나, 용량을 추가하거나, 구성을 변경한 후에는 최소 72시간 동안 그래프를 모니터링하여 변경 사항이 원하는 효과를 가져오는지 확인하십시오.