Responder a un evento de rendimiento dinámico causado por la toma de control de HA
Puede usar Unified Manager para investigar un evento de rendimiento causado por un alto procesamiento de datos en un nodo de clúster que se encuentra en un par de alta disponibilidad (HA). También puede utilizar Unified Manager para verificar el estado de los nodos y ver si algún evento de estado reciente detectado en los nodos contribuyó al evento de rendimiento.
-
Debe tener el rol de Operador, Administrador de aplicaciones o Administrador de almacenamiento.
-
Deben existir eventos de desempeño nuevos, reconocidos u obsoletos.
-
Muestra la página Detalles del evento para ver información sobre el evento.
-
Lea la Descripción, que describe las cargas de trabajo involucradas en el evento y el componente del clúster en contención.
Hay un volumen víctima cuya latencia se vio afectada por el componente del clúster en contención. El nodo de procesamiento de datos, que asumió todas las cargas de trabajo de su nodo asociado, es el componente del clúster en contienda. En Componente en contención, el ícono de Data Processing se resalta en rojo y el nombre del nodo que estaba manejando el procesamiento de datos en el momento del evento se muestra entre paréntesis.
-
En la Descripción, haga clic en el nombre del volumen.
Se muestra la página Explorador de rendimiento de volumen. En la parte superior de la página, en la línea de tiempo de Eventos, un ícono de evento de cambio (
) indica la hora en que Unified Manager detectó el inicio de la toma de control de HA. -
Apunte el cursor al ícono del evento de cambio para la toma de control de HA y los detalles sobre la toma de control de HA se mostrarán en el texto flotante.
En el gráfico de latencia, un evento indica que el volumen seleccionado cruzó el umbral de rendimiento debido a una alta latencia aproximadamente al mismo tiempo que la toma de control de HA.
-
Haga clic en Vista de zoom para mostrar el gráfico de latencia en una nueva página.
-
En el menú Ver, seleccione Componentes del clúster para ver la latencia total por componente del clúster.
-
Apunte el cursor del mouse al ícono de evento de cambio para el inicio de la adquisición de HA y compare la latencia del procesamiento de datos con la latencia total.
En el momento de la adquisición de HA, hubo un aumento en el procesamiento de datos debido a la mayor demanda de carga de trabajo en el nodo de procesamiento de datos. El aumento del uso de la CPU aumentó la latencia y desencadenó el evento.
-
Después de reparar el nodo fallido, utilice ONTAP System Manager para realizar una devolución de alta disponibilidad, que mueve las cargas de trabajo del nodo asociado al nodo reparado.
-
Una vez completada la devolución de HA, luego del siguiente descubrimiento de configuración en Unified Manager (aproximadamente 15 minutos), busque el evento y la carga de trabajo que se activaron con la toma de control de HA en la página de inventario Administración de eventos.
El evento desencadenado por la toma de control de HA ahora tiene un estado obsoleto, lo que indica que el evento está resuelto. La latencia en el componente de procesamiento de datos ha disminuido, lo que ha disminuido la latencia total. El nodo que el volumen seleccionado ahora utiliza para el procesamiento de datos ha resuelto el evento.