성능 분석에서 지연 시간 예측이 사용되는 방식
Unified Manager는 모니터링되는 워크로드에 대한 일반적인 I/O 대기 시간(응답 시간) 활동을 나타내기 위해 대기 시간 예측을 사용합니다. 워크로드의 실제 지연 시간이 지연 예측의 상한을 초과하여 동적 성능 이벤트가 발생하는 경우 알림을 보내 성능 문제를 분석하고 이를 해결하기 위한 시정 조치를 취할 수 있도록 해줍니다.
지연 시간 예측은 작업 부하에 대한 성능 기준을 설정합니다. 시간이 지남에 따라 Unified Manager는 과거 성능 측정 결과를 학습하여 작업 부하에 대한 예상 성능 및 활동 수준을 예측합니다. 예상 범위의 상한은 동적 성능 임계값을 설정합니다. Unified Manager는 기준선을 사용하여 실제 지연 시간이 임계값보다 높거나 낮은지, 또는 예상 범위를 벗어나는지를 확인합니다. 실제 값과 예상 값을 비교하면 작업 부하에 대한 성능 프로필이 생성됩니다.
클러스터 구성 요소의 경합으로 인해 워크로드의 실제 대기 시간이 동적 성능 임계값을 초과하면 대기 시간이 길어지고 워크로드가 예상보다 느리게 수행됩니다. 동일한 클러스터 구성 요소를 공유하는 다른 작업 부하의 성능도 예상보다 느릴 수 있습니다.
Unified Manager는 임계값 초과 이벤트를 분석하고 해당 활동이 성능 이벤트인지 여부를 판별합니다. 높은 작업 부하 활동이 장기간(예: 몇 시간) 일관되게 유지되면 Unified Manager는 해당 활동을 정상적인 활동으로 간주하고 대기 시간 예측을 동적으로 조정하여 새로운 동적 성능 임계값을 형성합니다.
일부 작업 부하에서는 활동이 지속적으로 낮을 수 있으며, 이 경우 대기 시간에 대한 대기 시간 예측이 시간에 따라 크게 변하지 않습니다. 성능 이벤트 분석 중 이벤트 수를 최소화하기 위해 Unified Manager는 예상보다 작업 및 대기 시간이 훨씬 긴 저활동 볼륨에 대해서만 이벤트를 트리거합니다.
이 예에서 볼륨의 지연 시간은 회색으로 가장 낮은 작업당 3.5밀리초(ms/op)이고 가장 높은 작업당 5.5ms/op로 예측됩니다. 파란색으로 표시된 실제 지연 시간이 네트워크 트래픽의 간헐적 급증이나 클러스터 구성 요소의 경합으로 인해 갑자기 10ms/op로 증가하면 지연 시간 예측을 넘어서고 동적 성능 임계값을 초과한 것입니다.
네트워크 트래픽이 감소하거나 클러스터 구성 요소가 더 이상 경쟁하지 않으면 지연 시간은 지연 시간 예측 범위 내로 돌아갑니다. 지연 시간이 장시간 10ms/op 이상으로 유지되는 경우 이벤트를 해결하기 위해 시정 조치를 취해야 할 수도 있습니다.