Configurar RHEL 7,5 para FCP e iSCSI con almacenamiento de ONTAP
El software de utilidades de host Linux proporciona herramientas de gestión y diagnóstico para hosts Linux que se conectan al almacenamiento de ONTAP. Al instalar las utilidades del host Linux en un host Red Hat Enterprise Linux (RHEL) 7,5, es posible utilizar las utilidades de host para ayudarle a gestionar las operaciones del protocolo FCP e iSCSI con LUN de ONTAP.
|
No es necesario configurar manualmente los ajustes de la máquina virtual basada en kernel (KVM) porque los LUN de ONTAP se asignan automáticamente al hipervisor. |
Paso 1: Opcionalmente, habilite el arranque SAN
Puede configurar su host para que utilice el arranque SAN y simplificar la puesta en marcha y mejorar la escalabilidad.
Utilice "Herramienta de matriz de interoperabilidad" para verificar que el sistema operativo Linux, el adaptador de bus de host (HBA), el firmware del HBA, el BIOS de arranque del HBA y la versión de ONTAP admiten el arranque SAN.
-
Habilite el arranque SAN en el BIOS del servidor para los puertos a los que se asigna la LUN de arranque SAN.
Para obtener información acerca de cómo activar el BIOS HBA, consulte la documentación específica de su proveedor.
-
Compruebe que la configuración se haya realizado correctamente. Para ello, reinicie el host y verifique que el sistema operativo esté activo y en ejecución.
Paso 2: Instale las utilidades del host de Linux
NetApp recomienda la instalación de las utilidades del host Linux para admitir la gestión de las LUN de ONTAP y ayudar al soporte técnico con la recopilación de datos de configuración.
|
La instalación de Linux Host Utilities no cambia ninguna configuración de tiempo de espera del host en el host Linux. |
Paso 3: Confirme la configuración multivía del host
Es posible utilizar accesos múltiples con RHEL 7,5 para administrar los LUN de ONTAP.
Para garantizar que el acceso multivía esté configurado correctamente para el host, verifique que el /etc/multipath.conf
archivo esté definido y que los ajustes recomendados de NetApp estén configurados para los LUN de ONTAP.
-
Compruebe que el
/etc/multipath.conf
archivo existe:ls /etc/multipath.conf
Si el archivo no existe, cree un archivo vacío de cero bytes:
touch /etc/multipath.conf
-
La primera vez que
multipath.conf
se crea el archivo, es posible que deba habilitar e iniciar los servicios multivía para cargar la configuración recomendada:systemctl enable multipathd
systemctl start multipathd
-
Cada vez que arranca el host, el archivo de cero bytes vacío
/etc/multipath.conf
carga automáticamente los parámetros multivía de host recomendados por NetApp como configuración predeterminada. No debería ser necesario realizar cambios en/etc/multipath.conf
el archivo para el host ya que el sistema operativo del host está compilado con los parámetros multivía que reconocen y gestionan correctamente las LUN de ONTAP.En la siguiente tabla se muestra la configuración de los parámetros multivía compilados por el sistema operativo Linux nativo para los LUN de ONTAP.
Muestra la configuración de los parámetros
Parámetro Ajuste detect_prio
sí
dev_loss_tmo
"infinito"
conmutación tras recuperación
inmediata
fast_io_fail_tmo
5
funciones
"3 queue_if_no_path pg_init_retries 50"
flush_on_last_del
"sí"
manipulador_hardware
"0"
no_path_retry
cola
comprobador_de_rutas
"tur"
política_agrupación_ruta
"group_by_prio"
selector_de_rutas
"tiempo de servicio 0"
intervalo_sondeo
5
prioridad
"ONTAP"
producto
LUN.*
retain_attached_hw_handler
sí
rr_weight
"uniforme"
nombres_descriptivos_usuario
no
proveedor
NETAPP
-
Compruebe la configuración de parámetros y el estado de la ruta de sus LUN de ONTAP:
multipath -ll
Los parámetros multivía predeterminados admiten las configuraciones de ASA, AFF y FAS. En estas configuraciones, una única LUN de ONTAP no debería necesitar más de cuatro rutas. Si existen más de cuatro rutas, se pueden producir problemas con las rutas durante un fallo de almacenamiento.
En el siguiente ejemplo, se muestran los ajustes de parámetros y el estado de la ruta correctos para las LUN de ONTAP en una configuración de ASA, AFF o FAS.
Configuración de ASAUna configuración de ASA optimiza todas las rutas a una LUN determinada para mantenerlas activas. Esto mejora el rendimiento, ya que sirve operaciones de I/O en todas las rutas al mismo tiempo.
# multipath -ll 3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode size=80G features='3 queue_if_no_path pg_init_retries 50' hwhandler='1 alua' wp=rw `-+- policy='service-time 0' prio=50 status=active |- 3:0:7:9 sdco 69:192 active ready running |- 3:0:8:9 sddi 71:0 active ready running |- 14:0:8:9 sdjq 65:320 active ready running `- 14:0:7:9 sdiw 8:256 active ready running
Configuración de AFF o FASUna configuración de AFF o FAS debe tener dos grupos de rutas con prioridades superiores e inferiores. La controladora donde se encuentra el agregado ofrece rutas activas/optimizadas de mayor prioridad. Las rutas de prioridad más baja están activas pero no optimizadas debido a que se sirven con una controladora diferente. Las rutas no optimizadas solo se usan cuando las rutas optimizadas no están disponibles.
En el siguiente ejemplo, se muestra el resultado de una LUN de ONTAP con dos rutas activa/optimizada y dos rutas activa/no optimizada:
# multipath -ll 3600a09803831347657244e527766394e dm-5 NETAPP,LUN C-Mode size=80G features='3 queue_if_no_path pg_init_retries 50' hwhandler='1 alua' wp=rw |-+- policy='service-time 0' prio=50 status=active | |- 3:0:3:0 sdd 8:48 active ready running | |- 3:0:4:0 sdx 65:112 active ready running `-+- policy='service-time 0' prio=10 status=enabled |- 14:0:2:0 sdfk 130:96 active ready running `- 14:0:5:0 sdgz 132:240 active ready running
Paso 4: Opcionalmente, excluya un dispositivo de las rutas múltiples
Si es necesario, puede excluir un dispositivo del acceso múltiple agregando el WWID del dispositivo no deseado a la estrofa de la lista negra del multipath.conf
archivo.
-
Determine el WWID:
/lib/udev/scsi_id -gud /dev/sda
“sda” es el disco SCSI local que desea agregar a la lista negra.
Un ejemplo de WWID es
360030057024d0730239134810c0cb833
. -
Añada el WWID a la estrofa «blacklist»:
blacklist { wwid 360030057024d0730239134810c0cb833 devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
Paso 5: Personalice los parámetros multivía para las LUN de ONTAP
Si su host está conectado a LUN de otros proveedores y cualquiera de la configuración de parámetros multivía se ha anulado, debe corregirlos agregando estrofas más adelante en multipath.conf
el archivo que se aplican específicamente a LUN de ONTAP. Si no hace esto, es posible que las LUN de ONTAP no funcionen como se espera.
Compruebe el /etc/multipath.conf
archivo, especialmente en la sección de valores predeterminados, para ver los ajustes que podrían estar anulando el configuración predeterminada para parámetros multivía.
|
No debe anular la configuración de parámetros recomendada para las LUN de ONTAP. Estos ajustes se requieren para el rendimiento óptimo de la configuración del host. Póngase en contacto con el soporte de NetApp, con su proveedor de SO o con ambos para obtener más información. |
El ejemplo siguiente muestra cómo corregir un valor predeterminado anulado. En este ejemplo, el multipath.conf
archivo define valores para path_checker
y no_path_retry
que no son compatibles con LUN de ONTAP, y no puede quitar estos parámetros porque las cabinas de almacenamiento ONTAP siguen conectadas al host. En su lugar, corrija los valores para path_checker
y no_path_retry
agregando una estrofa de dispositivo al multipath.conf
archivo que se aplica específicamente a los LUN de ONTAP.
Muestra el ejemplo
defaults { path_checker readsector0 no_path_retry fail } devices { device { vendor "NETAPP" product "LUN" no_path_retry queue path_checker tur } }
Paso 6: Revise los problemas conocidos
La versión de almacenamiento de RHEL 7,5 con ONTAP presenta los siguientes problemas conocidos:
ID de error de NetApp | Título | Descripción |
---|---|---|
1440718 |
Si se desasigna o se asigna una LUN sin realizar una detección repetida de SCSI, es posible que se dañen los datos del host. |
Cuando se establece el parámetro de configuración multivía "disable_change_wwids" en SÍ, se deshabilita el acceso al dispositivo de ruta en caso de que se produzca un cambio WWID. El acceso multivía deshabilitará el acceso al dispositivo de ruta hasta que el WWID de la ruta se restaure al WWID del dispositivo multivía. Para obtener más información, consulte "Base de conocimientos de NetApp: Daño en el sistema de archivos del LUN de iSCSI en Oracle Linux 7". |
La interrupción del kernel se produce en RHEL7.5 con QLogic QLE2672 FC de 16 GB durante las operaciones de conmutación por error de almacenamiento |
Durante las operaciones de conmutación por error del almacenamiento en el kernel RHEL7U5 con un adaptador de bus de host de canal de fibra de 16 GB QLE2672 de QLogic, la interrupción del kernel se produce debido a una situación de pánico en el kernel. El error de alerta del kernel hace que RHEL 7.5 se reinicie, lo que provoca una interrupción de las aplicaciones. El error de alerta del kernel genera el archivo vmcore en el directorio /var/crash/directory si kdump está configurado. El archivo vmcore se utiliza para comprender la causa del error. En este caso, se observó el pánico en el módulo “get_Next_TIMER_interrupt+440” que se registra en el archivo vmcore con la siguiente cadena: " [Exception RIP: Get_next_timer_interrupt+440]" después de la interrupción del kernel, puede recuperar el sistema operativo reiniciando el sistema operativo host y reiniciando la aplicación según sea necesario. |
|
La interrupción del kernel se produce en RHEL7U5 con QLogic QLE2742 FC de 32 GB durante las operaciones de conmutación por error de almacenamiento |
Durante las operaciones de conmutación por error del almacenamiento en el kernel de Red Hat Enterprise Linux (RHEL) RHEL7U5 con QLogic QLE2742 HBA, la interrupción del kernel se produce debido a una caída del kernel. La alerta del kernel lleva a un reinicio del sistema operativo, lo que provoca una interrupción de la aplicación. El error de alerta del kernel genera el archivo vmcore en el directorio /var/crash/ si se configura kdump. Cuando el kernel produce una alarma, puede utilizar el archivo vmcore para investigar la razón del error. En el siguiente ejemplo se muestra un pánico en el módulo bget_Next_TIMER_interrupt+440b. El pánico se registra en el archivo vmcore con la siguiente cadena: " [Exception RIP: Get_Next_TIMER_interrupt+440]" puede recuperar el sistema operativo reiniciando el sistema operativo host y reiniciando la aplicación según sea necesario. |
|
La interrupción del kernel se produce en RHEL 7.5 con QLogic QLE2742 FC HBA durante las operaciones de conmutación por error de almacenamiento |
Durante las operaciones de conmutación por error del almacenamiento en el kernel Red Hat Enterprise Linux (RHEL) 7.5 con un adaptador de bus de host (HBA) QLE2742 de Fibre Channel (FC) de QLogic, se produce una interrupción del kernel debido a una alerta relacionada con el kernel. El error de alerta del kernel hace que RHEL 7.5 se reinicie, lo que provoca una interrupción de las aplicaciones. Si el mecanismo kdump está habilitado, el evento de alerta del kernel genera un archivo vmcore ubicado en el directorio /var/crash/. Puede analizar el archivo vmcore para determinar la causa del pánico. En este ejemplo, cuando se produce una conmutación por error del almacenamiento con el evento QLogic QLE2742 HBA, se ve afectado el módulo "Native_queued_spin_lock_lentitud+464". Puede localizar el evento en el archivo vmcore encontrándose con la siguiente cadena: " [Exception RIP: Native_queued_spin_lock_slentamente+464]" después de la interrupción del kernel, puede reiniciar el sistema operativo de host y recuperar el sistema operativo y, después, puede reiniciar las aplicaciones según sea necesario. |
|
La interrupción del kernel se produce en RHEL 7.5 con HBA de Emulex durante las operaciones de conmutación por error de almacenamiento |
Durante las operaciones de conmutación por error del almacenamiento en un sistema Red Hat Enterprise Linux (RHEL) 7.5 con adaptadores de bus de host (HBA) Emulex LPe32002-m2 de 32 GB, se produce una interrupción en el kernel. La interrupción del kernel provoca un reinicio del sistema operativo, lo que a su vez provoca una interrupción de las aplicaciones. Si configura kdump, la interrupción del kernel genera el archivo vmcore en el directorio /var/crash/. Puede usar el archivo vmcore para determinar la causa del error. En el siguiente ejemplo, puede ver la interrupción en el módulo "lpfc_hba_clean_txcmplq+368". Esta interrupción se registra en el archivo vmcore con la siguiente cadena: " [Exception RIP: Lpfc_hba_clean_txcmplq+368]" después de la interrupción del kernel, reinicie el sistema operativo host para recuperar el sistema operativo. Reinicie la aplicación según sea necesario. |
El futuro
-
"Obtenga más información sobre el uso de la herramienta Linux Host Utilities" .
-
Obtenga más información sobre la duplicación de ASM.
El mirroring de Gestión Automática de Almacenamiento (ASM) puede requerir cambios en la configuración de multivía de Linux para permitir que ASM reconozca un problema y realice el cambio a un grupo de fallos alternativo. La mayoría de las configuraciones de ASM de ONTAP utilizan redundancia externa, lo que significa que la protección de datos es proporcionada por la cabina externa y ASM no hace mirroring de los datos. Algunos sitios utilizan ASM con redundancia normal para proporcionar duplicación bidireccional, normalmente en diferentes sitios. Consulte "Bases de datos de Oracle en ONTAP" para obtener más información.