Ejecute comprobaciones del estado del almacenamiento de Element antes de actualizar el almacenamiento
Debe ejecutar comprobaciones del estado antes de actualizar el almacenamiento Element para garantizar que todos los nodos de almacenamiento del clúster estén listos para la siguiente actualización de almacenamiento de Element.
-
Servicios de administración: Ha actualizado el último paquete de servicios de administración (2.10.27 o posterior).
Debe actualizar al paquete de servicios de gestión más reciente antes de actualizar el software Element. -
Nodo de gestión:está ejecutando el nodo de administración 11.3 o posterior.
-
Software Element: La versión del clúster ejecuta el software NetApp Element 11.3 o posterior.
-
Contrato de licencia para el usuario final (CLUF): A partir de los servicios de gestión 2.20.69, debe aceptar y guardar el CLUF antes de utilizar la IU o API de control de cloud híbrido de NetApp para ejecutar comprobaciones del estado del almacenamiento de Element:
-
Abra la dirección IP del nodo de gestión en un navegador web:
https://<ManagementNodeIP>
-
Inicie sesión en Hybrid Cloud Control de NetApp proporcionando las credenciales de administrador del clúster de almacenamiento.
-
Seleccione Actualizar cerca de la parte superior derecha de la interfaz.
-
Aparece el EULA. Desplácese hacia abajo, seleccione Acepto para actualizaciones actuales y futuras y seleccione Guardar.
-
Puede realizar comprobaciones del estado con la interfaz de usuario de control de cloud híbrido de NetApp, la API de control de cloud híbrido de NetApp o la suite HealthTools:
También puede obtener más información sobre las comprobaciones del estado del almacenamiento que realiza el servicio:
Utilice Cloud Control de NetApp híbrido para ejecutar comprobaciones del estado del almacenamiento Element antes de actualizar el almacenamiento
Con Hybrid Cloud Control de NetApp, puede comprobar que un clúster de almacenamiento está listo para actualizarse.
-
Abra la dirección IP del nodo de gestión en un navegador web:
https://<ManagementNodeIP>
-
Inicie sesión en Hybrid Cloud Control de NetApp proporcionando las credenciales de administrador del clúster de almacenamiento.
-
Seleccione Actualizar cerca de la parte superior derecha de la interfaz.
-
En la página actualizaciones, seleccione la ficha almacenamiento.
-
Seleccione la comprobación del estado para el clúster que desea comprobar si está listo para la actualización.
-
En la página Comprobación del estado del almacenamiento, seleccione Ejecutar comprobación del estado.
-
Si hay problemas, haga lo siguiente:
-
Vaya al artículo de la base de conocimientos específico indicado para cada problema o realice la solución especificada.
-
Si se especifica un KB, complete el proceso descrito en el artículo de la base de conocimientos correspondiente.
-
Después de resolver los problemas del clúster, seleccione Volver a ejecutar comprobación del estado.
-
Una vez que la comprobación del estado se completa sin errores, el clúster de almacenamiento está listo para actualizar. Consulte actualización del nodo de almacenamiento "instrucciones" para continuar.
Utilice API para ejecutar comprobaciones del estado del almacenamiento de Element antes de actualizar el almacenamiento
Es posible utilizar API DE REST para verificar que un clúster de almacenamiento esté listo para actualizarse. La comprobación del estado verifica que no hay obstáculos para la actualización, como los nodos pendientes, los problemas de espacio en disco y los fallos del clúster.
-
Busque el ID del clúster de almacenamiento:
-
Abra la interfaz de usuario de LA API DE REST del nodo de gestión en el nodo de gestión:
https://<ManagementNodeIP>/mnode
-
Seleccione autorizar y complete lo siguiente:
-
Introduzca el nombre de usuario y la contraseña del clúster.
-
Introduzca el ID de cliente as
mnode-client
si el valor no se ha rellenado todavía. -
Seleccione autorizar para iniciar una sesión.
-
Cierre la ventana de autorización.
-
-
En la interfaz de usuario de API de REST, seleccione
GET /assets
. -
Seleccione probar.
-
Seleccione Ejecutar.
-
De la respuesta, copie la
"id"
desde la"storage"
sección del clúster que pretende comprobar si está listo para la actualización.No utilice la "parent"
Valor de esta sección porque éste es el ID del nodo de administración, no el ID del clúster de almacenamiento.
"config": {}, "credentialid": "12bbb2b2-f1be-123b-1234-12c3d4bc123e", "host_name": "SF_DEMO", "id": "12cc3a45-e6e7-8d91-a2bb-0bdb3456b789", "ip": "10.123.12.12", "parent": "d123ec42-456e-8912-ad3e-4bd56f4a789a", "sshcredentialid": null, "ssl_certificate": null
-
-
Ejecute las comprobaciones del estado en el clúster de almacenamiento:
-
Abra la interfaz de usuario de API DE REST de almacenamiento en el nodo de gestión:
https://<ManagementNodeIP>/storage/1/
-
Seleccione autorizar y complete lo siguiente:
-
Introduzca el nombre de usuario y la contraseña del clúster.
-
Introduzca el ID de cliente as
mnode-client
si el valor no se ha rellenado todavía. -
Seleccione autorizar para iniciar una sesión.
-
Cierre la ventana de autorización.
-
-
Seleccione POST /Health-checks.
-
Seleccione probar.
-
En el campo Parameter, introduzca el ID del clúster de almacenamiento obtenido en el paso 1.
{ "config": {}, "storageId": "123a45b6-1a2b-12a3-1234-1a2b34c567d8" }
-
Seleccione Ejecutar para ejecutar una comprobación del estado en el clúster de almacenamiento especificado.
La respuesta debe indicar el estado como
initializing
:
{ "_links": { "collection": "https://10.117.149.231/storage/1/health-checks", "log": "https://10.117.149.231/storage/1/health-checks/358f073f-896e-4751-ab7b-ccbb5f61f9fc/log", "self": "https://10.117.149.231/storage/1/health-checks/358f073f-896e-4751-ab7b-ccbb5f61f9fc" }, "config": {}, "dateCompleted": null, "dateCreated": "2020-02-21T22:11:15.476937+00:00", "healthCheckId": "358f073f-896e-4751-ab7b-ccbb5f61f9fc", "state": "initializing", "status": null, "storageId": "c6d124b2-396a-4417-8a47-df10d647f4ab", "taskId": "73f4df64-bda5-42c1-9074-b4e7843dbb77" }
-
Copie el
healthCheckID
eso es parte de la respuesta.
-
-
Compruebe los resultados de las comprobaciones de estado:
-
Seleccione GET /Health-checks/{healthCheckId}.
-
Seleccione probar.
-
Introduzca el ID de comprobación del estado en el campo parámetro.
-
Seleccione Ejecutar.
-
Desplácese hasta la parte inferior del cuerpo de respuesta.
Si todas las comprobaciones del estado se realizan correctamente, la devolución es similar al ejemplo siguiente:
"message": "All checks completed successfully.", "percent": 100, "timestamp": "2020-03-06T00:03:16.321621Z"
-
-
Si la
message
return indica que se han producido problemas con el estado del clúster, haga lo siguiente:-
Seleccione GET /Health-checks/{healthCheckId}/log
-
Seleccione probar.
-
Introduzca el ID de comprobación del estado en el campo parámetro.
-
Seleccione Ejecutar.
-
Revise cualquier error específico y obtenga los enlaces asociados del artículo de la base de conocimientos.
-
Vaya al artículo de la base de conocimientos específico indicado para cada problema o realice la solución especificada.
-
Si se especifica un KB, complete el proceso descrito en el artículo de la base de conocimientos correspondiente.
-
Después de resolver los problemas del clúster, ejecute GET /health-checks/{healthCheckId}/log de nuevo.
-
Utilice HealthTools para ejecutar comprobaciones del estado del almacenamiento Element antes de actualizar el almacenamiento
Puede verificar que el clúster de almacenamiento esté listo para actualizar mediante el sfupgradecheck
comando. Este comando verifica información como nodos pendientes, espacio de disco y fallos de clúster.
Si el nodo de gestión se encuentra en un sitio oscuro sin conectividad externa, la comprobación de preparación para la actualización necesita el metadata.json
archivo descargado durante "Actualizaciones de HealthTools" para funcionar correctamente.
Este procedimiento describe cómo tratar las comprobaciones de actualización que generan uno de los siguientes resultados:
-
Ejecutando el
sfupgradecheck
el comando se ejecuta correctamente. Su clúster está listo para la actualización. -
Comprobaciones dentro de
sfupgradecheck
la herramienta falla con un mensaje de error. Su clúster no está listo para la actualización y se requieren pasos adicionales. -
Se produce un error en la comprobación de actualización porque HealthTools no está actualizado.
-
Se produce un error en la comprobación de la actualización porque el nodo de gestión está en un sitio oscuro.
-
Ejecute el
sfupgradecheck
comando:sfupgradecheck -u <cluster-user-name> MVIP
Para las contraseñas que contienen caracteres especiales, añada una barra diagonal inversa ( \
) antes de cada carácter especial. Por ejemplo:mypass!@1
debe introducirse comomypass\!\@
.Comando de entrada de muestra con salida de muestra en la que no aparecen errores y está listo para la actualización:
sfupgradecheck -u admin 10.117.78.244
check_pending_nodes: Test Description: Verify no pending nodes in cluster More information: https://kb.netapp.com/support/s/article/ka11A0000008ltOQAQ/pendingnodes check_cluster_faults: Test Description: Report any cluster faults check_root_disk_space: Test Description: Verify node root directory has at least 12 GBs of available disk space Passed node IDs: 1, 2, 3 More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/ SolidFire-Disk-space-error check_mnode_connectivity: Test Description: Verify storage nodes can communicate with management node Passed node IDs: 1, 2, 3 More information: https://kb.netapp.com/support/s/article/ka11A0000008ltYQAQ/mNodeconnectivity check_files: Test Description: Verify options file exists Passed node IDs: 1, 2, 3 check_cores: Test Description: Verify no core or dump files exists Passed node IDs: 1, 2, 3 check_upload_speed: Test Description: Measure the upload speed between the storage node and the management node Node ID: 1 Upload speed: 90063.90 KBs/sec Node ID: 3 Upload speed: 106511.44 KBs/sec Node ID: 2 Upload speed: 85038.75 KBs/sec
-
Si hay errores, se requieren acciones adicionales. Consulte las siguientes subsecciones para obtener detalles.
Su clúster no está listo para la actualización
Si ve un mensaje de error relacionado con una de las comprobaciones del estado, siga estos pasos:
-
Revise la
sfupgradecheck
mensaje de error.Respuesta de ejemplo:
The following tests failed: check_root_disk_space: Test Description: Verify node root directory has at least 12 GBs of available disk space Severity: ERROR Failed node IDs: 2 Remedy: Remove unneeded files from root drive More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/SolidFire- Disk-space-error check_pending_nodes: Test Description: Verify no pending nodes in cluster More information: https://kb.netapp.com/support/s/article/ka11A0000008ltOQAQ/pendingnodes check_cluster_faults: Test Description: Report any cluster faults check_root_disk_space: Test Description: Verify node root directory has at least 12 GBs of available disk space Passed node IDs: 1, 3 More information: https://kb.netapp.com/support/s/article/ka11A0000008ltTQAQ/SolidFire- Disk-space-error check_mnode_connectivity: Test Description: Verify storage nodes can communicate with management node Passed node IDs: 1, 2, 3 More information: https://kb.netapp.com/support/s/article/ka11A0000008ltYQAQ/mNodeconnectivity check_files: Test Description: Verify options file exists Passed node IDs: 1, 2, 3 check_cores: Test Description: Verify no core or dump files exists Passed node IDs: 1, 2, 3 check_upload_speed: Test Description: Measure the upload speed between the storage node and the management node Node ID: 1 Upload speed: 86518.82 KBs/sec Node ID: 3 Upload speed: 84112.79 KBs/sec Node ID: 2 Upload speed: 93498.94 KBs/sec
En este ejemplo, el nodo 1 tiene poco espacio en disco. Puede encontrar más información en la "base de conocimientos" (KB) artículo incluido en el mensaje de error.
HealthTools está desfasada
Si aparece un mensaje de error que indica que HealthTools no es la última versión, siga estas instrucciones:
-
Revise el mensaje de error y tenga en cuenta que la comprobación de actualización falla.
Respuesta de ejemplo:
sfupgradecheck failed: HealthTools is out of date: installed version: 2018.02.01.200 latest version: 2020.03.01.09. The latest version of the HealthTools can be downloaded from: https://mysupport.netapp.com/NOW/cgi-bin/software/ Or rerun with the -n option
-
Siga las instrucciones descritas en la respuesta.
Su nodo de gestión está en un sitio oscuro
-
Revise el mensaje y tenga en cuenta que la comprobación de actualización falla:
Respuesta de ejemplo:
sfupgradecheck failed: Unable to verify latest available version of healthtools.
-
Descargar una "Archivo JSON" En el sitio de soporte de NetApp de un equipo que no es el nodo de gestión y cambie su nombre
metadata.json
. -
Ejecute el siguiente comando:
sfupgradecheck -l --metadata=<path-to-metadata-json>
-
Para obtener información detallada, consulte adicional "Actualizaciones de HealthTools" información para sitios oscuros.
-
Compruebe que el conjunto HealthTools está actualizado ejecutando el siguiente comando:
sfupgradecheck -u <cluster-user-name> -p <cluster-password> MVIP
Comprobaciones del estado del almacenamiento realizadas por el servicio
Las comprobaciones del estado del almacenamiento realizan las siguientes comprobaciones por clúster.
Nombre de comprobación | Nodo/clúster | Descripción |
---|---|---|
check_asinc_results |
Clúster |
Verifica que el número de resultados asincrónicos en la base de datos está por debajo de un número de umbral. |
check_cluster_errantes |
Clúster |
Comprueba que no hay errores del clúster de bloqueo de actualizaciones (tal y como se define en el origen de elementos). |
compruebe_upload_speed |
Nodo |
Mide la velocidad de carga entre el nodo de almacenamiento y el nodo de gestión. |
comprobación_velocidad_conexión |
Nodo |
Verifica que los nodos tienen conectividad con el nodo de gestión que sirve paquetes de actualización y realiza una estimación de la velocidad de conexión. |
comprobar_núcleos |
Nodo |
Comprueba si hay volcado de bloqueo del kernel y archivos principales en el nodo. Se produce un error en la comprobación de cualquier bloqueo en un período de tiempo reciente (umbral de 7 días). |
check_root_disk_space |
Nodo |
Verifica que el sistema de archivos raíz tiene suficiente espacio libre para realizar una actualización. |
check_var_log_disk_space |
Nodo |
Lo verifica |
check_pending_nodes |
Clúster |
Verifica que no hay nodos pendientes en el clúster. |