Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

Sustituya una tarjeta PCIe o intermedia - AFF A400

Colaboradores

Para sustituir una tarjeta PCIe o intermedia, debe desconectar los cables y cualquier módulo SFP y QSFP de las tarjetas, sustituir el PCIe o la tarjeta intermedia con error y volver a conectar las tarjetas.

  • Puede utilizar este procedimiento con todas las versiones de ONTAP admitidas por el sistema

  • Todos los demás componentes del sistema deben funcionar correctamente; si no es así, debe ponerse en contacto con el soporte técnico.

Paso 1: Apague el controlador dañado

Puede apagar o hacerse cargo de la controladora dañada siguiendo diferentes procedimientos, en función de la configuración del hardware del sistema de almacenamiento.

Opción 1: Mayoría de las configuraciones

Para apagar el controlador dañado, debe determinar el estado del controlador y, si es necesario, tomar el control para que el controlador sano siga sirviendo datos del almacenamiento del controlador dañado.

Acerca de esta tarea
  • Si dispone de un sistema SAN, debe haber comprobado los mensajes de eventos cluster kernel-service show) Para el blade SCSI del controlador dañado. La cluster kernel-service show comando muestra el nombre del nodo, el estado de quórum de ese nodo, el estado de disponibilidad de ese nodo y el estado operativo de ese nodo.

    Cada proceso SCSI-blade debe quórum con los otros nodos del clúster. Todos los problemas deben resolverse antes de continuar con el reemplazo.

  • Si tiene un clúster con más de dos nodos, debe estar en quórum. Si el clúster no tiene quórum o si una controladora en buen estado muestra falso según su condición, debe corregir el problema antes de apagar la controladora dañada; consulte "Sincronice un nodo con el clúster".

Pasos
  1. Si AutoSupport está habilitado, elimine la creación automática de casos invocando un mensaje de AutoSupport: system node autosupport invoke -node * -type all -message MAINT=number_of_hours_downh

    El siguiente mensaje de AutoSupport suprime la creación automática de casos durante dos horas: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. Deshabilite la devolución automática de la consola de la controladora en buen estado: storage failover modify –node local -auto-giveback false

    Nota Cuando vea do desea desactivar la devolución automática?, introduzca y.
  3. Lleve la controladora dañada al aviso DEL CARGADOR:

    Si el controlador dañado está mostrando…​ Realice lo siguiente…​

    El aviso del CARGADOR

    Vaya al paso siguiente.

    Esperando devolución…​

    Pulse Ctrl-C y, a continuación, responda y cuando se le solicite.

    Solicitud del sistema o solicitud de contraseña

    Retome o detenga el controlador dañado del controlador en buen estado: storage failover takeover -ofnode impaired_node_name

    Cuando el controlador dañado muestre esperando devolución…​, pulse Ctrl-C y, a continuación, responda y.

Opción 2: La controladora está en un MetroCluster de dos nodos

Para apagar el controlador dañado, debe determinar el estado del controlador y, si es necesario, cambiar el controlador para que el controlador correcto siga sirviendo datos del almacenamiento del controlador dañado.

Acerca de esta tarea
  • Si utiliza el cifrado de almacenamiento de NetApp, debe haber restablecido el MSID mediante las instrucciones de la sección "devolver una unidad FIPS o SED a modo sin protección" de "Información general del cifrado de NetApp con la interfaz de línea de comandos".

  • Debe dejar las fuentes de alimentación encendidas al final de este procedimiento para proporcionar alimentación a la controladora en buen estado.

Pasos
  1. Compruebe el estado de MetroCluster para determinar si el controlador dañado ha cambiado automáticamente al controlador en buen estado: metrocluster show

  2. En función de si se ha producido una conmutación automática, proceda según la siguiente tabla:

    Si el controlador está dañado…​ Realice lo siguiente…​

    Se ha cambiado automáticamente

    Continúe con el próximo paso.

    No se ha cambiado automáticamente

    Realice una operación de conmutación de sitios planificada desde el controlador en buen estado: metrocluster switchover

    No se ha cambiado automáticamente, ha intentado efectuar una conmutación con el metrocluster switchover y se vetó la conmutación

    Revise los mensajes de veto y, si es posible, resuelva el problema e inténtelo de nuevo. Si no puede resolver el problema, póngase en contacto con el soporte técnico.

  3. Resincronice los agregados de datos ejecutando el metrocluster heal -phase aggregates comando del clúster superviviente.

    controller_A_1::> metrocluster heal -phase aggregates
    [Job 130] Job succeeded: Heal Aggregates is successful.

    Si la curación es vetada, usted tiene la opción de reemitir el metrocluster heal con el -override-vetoes parámetro. Si utiliza este parámetro opcional, el sistema anula cualquier vetoo suave que impida la operación de reparación.

  4. Compruebe que se ha completado la operación con el comando MetroCluster operation show.

    controller_A_1::> metrocluster operation show
        Operation: heal-aggregates
          State: successful
    Start Time: 7/25/2016 18:45:55
       End Time: 7/25/2016 18:45:56
         Errors: -
  5. Compruebe el estado de los agregados mediante storage aggregate show comando.

    controller_A_1::> storage aggregate show
    Aggregate     Size Available Used% State   #Vols  Nodes            RAID Status
    --------- -------- --------- ----- ------- ------ ---------------- ------------
    ...
    aggr_b2    227.1GB   227.1GB    0% online       0 mcc1-a2          raid_dp, mirrored, normal...
  6. Repare los agregados raíz mediante el metrocluster heal -phase root-aggregates comando.

    mcc1A::> metrocluster heal -phase root-aggregates
    [Job 137] Job succeeded: Heal Root Aggregates is successful

    Si la curación es vetada, usted tiene la opción de reemitir el metrocluster heal comando con el parámetro -override-vetoes. Si utiliza este parámetro opcional, el sistema anula cualquier vetoo suave que impida la operación de reparación.

  7. Compruebe que la operación reparar se ha completado mediante el metrocluster operation show comando en el clúster de destino:

    mcc1A::> metrocluster operation show
      Operation: heal-root-aggregates
          State: successful
     Start Time: 7/29/2016 20:54:41
       End Time: 7/29/2016 20:54:42
         Errors: -
  8. En el módulo del controlador dañado, desconecte las fuentes de alimentación.

Paso 2: Extraiga el módulo del controlador

Para acceder a los componentes internos del módulo de controlador, debe extraer el módulo de controlador del chasis.

  1. Si usted no está ya conectado a tierra, correctamente tierra usted mismo.

  2. Suelte los retenes del cable de alimentación y, a continuación, desenchufe los cables de las fuentes de alimentación.

  3. Afloje el gancho y la correa de bucle que sujetan los cables al dispositivo de administración de cables y, a continuación, desconecte los cables del sistema y los SFP (si fuera necesario) del módulo del controlador, manteniendo un seguimiento del lugar en el que estaban conectados los cables.

    Deje los cables en el dispositivo de administración de cables de manera que cuando vuelva a instalar el dispositivo de administración de cables, los cables estén organizados.

  4. Retire el dispositivo de administración de cables del módulo del controlador y colóquelo aparte.

  5. Presione los dos pestillos de bloqueo hacia abajo y, a continuación, gire ambos pestillos hacia abajo al mismo tiempo.

    El módulo de la controladora se mueve ligeramente fuera del chasis.

    drw A400 retire el controlador

    Número de llamada 1

    Pestillos de bloqueo

    Número de llamada 2

    La controladora se mueve ligeramente fuera del chasis

  6. Deslice el módulo de la controladora para sacarlo del chasis.

    Asegúrese de que admite la parte inferior del módulo de la controladora cuando la deslice para sacarlo del chasis.

  7. Coloque el módulo del controlador sobre una superficie plana y estable.

Paso 3: Sustituya una tarjeta PCIe

Para sustituir una tarjeta PCIe, debe localizar la tarjeta PCIe con error, extraer la tarjeta vertical que contiene la tarjeta del módulo de la controladora, sustituir la tarjeta y volver a instalar la tarjeta vertical PCIe en el módulo de la controladora.

Número de llamada 1

Pestillo de bloqueo de la tarjeta vertical

Número de llamada 2

Pestillo de bloqueo de tarjeta PCI

Número de llamada 3

Placa de bloqueo PCI

Número de llamada 4

Tarjeta PCI

  1. Extraiga la tarjeta vertical que contiene la tarjeta que desea sustituir:

    1. Abra el conducto de aire presionando las lengüetas de bloqueo de los lados del conducto de aire, deslícelo hacia la parte posterior del módulo del controlador y gírelo hasta su posición completamente abierta.

    2. Quite todos los módulos SFP o QSFP que puedan estar en las tarjetas PCIe.

    3. Gire el pestillo de bloqueo del elevador en el lado izquierdo del elevador hacia arriba y hacia el conducto de aire.

      La tarjeta vertical se eleva ligeramente del módulo del controlador.

    4. Levante la tarjeta vertical y déjela a un lado en una superficie plana estable,

  2. Extraiga la tarjeta PCIe de la tarjeta vertical:

    1. Gire la tarjeta vertical de forma que pueda acceder a la tarjeta PCIe.

    2. Presione el soporte de bloqueo del lateral de la tarjeta vertical PCIe y gírelo a la posición abierta.

    3. Para elevadores 2 y 3 solamente, gire el panel lateral hacia arriba.

    4. Extraiga la tarjeta PCIe de la tarjeta vertical empujando suavemente el soporte y extráigala del zócalo.

  3. Instale la tarjeta PCIe de repuesto en la tarjeta vertical alineando la tarjeta con la toma, presione la tarjeta en la toma y, a continuación, cierre el panel lateral de la tarjeta vertical, si existe.

    Asegúrese de alinear correctamente la tarjeta en la ranura y ejercer una presión uniforme en la tarjeta cuando la asiente en la toma. La tarjeta PCIe debe estar colocada de forma completa y uniforme en la ranura.

    Nota Si va a instalar una tarjeta en la ranura inferior y no puede ver bien el zócalo de la tarjeta, extraiga la tarjeta superior para que pueda ver el zócalo de la tarjeta, instale la tarjeta y vuelva a instalar la tarjeta que ha extraído de la ranura superior.
  4. Vuelva a instalar la tarjeta vertical:

    1. Alinee la tarjeta vertical con los pasadores en el lado de la toma vertical y baje la tarjeta vertical en los pasadores.

    2. Empuje la tarjeta vertical directamente en la toma de la placa base.

    3. Gire el pestillo hacia abajo al mismo nivel que la chapa metálica de la tarjeta vertical.

Paso 4: Sustituya la tarjeta intermedia

La tarjeta mezzanine se encuentra bajo el número de tarjeta vertical 3 (ranuras 4 y 5). Debe extraer esa tarjeta vertical para acceder a la tarjeta intermedia, sustituir la tarjeta intermedia y volver a instalar la tarjeta vertical número 3. Consulte el mapa de FRU en el módulo de la controladora para obtener más información.

Puede utilizar la animación, ilustración o los pasos escritos siguientes para sustituir la tarjeta mezzanine.

Animación - reemplace la tarjeta mezzanine
drw A400 reemplace la tarjeta mezz

Número de llamada 1

Tarjeta PCI riser

Número de llamada 2

Tornillo de apriete manual del elevador

Número de llamada 3

Tarjeta elevadora

  1. Extraiga la tarjeta vertical número 3 (ranuras 4 y 5):

    1. Abra el conducto de aire presionando las lengüetas de bloqueo de los lados del conducto de aire, deslícelo hacia la parte posterior del módulo del controlador y gírelo hasta su posición completamente abierta.

    2. Quite todos los módulos SFP o QSFP que puedan estar en las tarjetas PCIe.

    3. Gire el pestillo de bloqueo del elevador en el lado izquierdo del elevador hacia arriba y hacia el conducto de aire.

      La tarjeta vertical se eleva ligeramente del módulo del controlador.

    4. Levante la tarjeta vertical y déjela a un lado en una superficie plana y estable.

  2. Sustituya la tarjeta mezzanine:

    1. Retire cualquier módulo QSFP o SFP de la tarjeta.

    2. Afloje los tornillos de apriete manual de la tarjeta intermedia y levante suavemente la tarjeta directamente de la toma y déjela a un lado.

    3. Alinee la tarjeta mezzanine de repuesto sobre la toma y los pasadores guía y empuje suavemente la tarjeta hacia la toma.

    4. Apriete los tornillos de apriete manual de la tarjeta intermedia.

  3. Vuelva a instalar la tarjeta vertical:

    1. Alinee la tarjeta vertical con los pasadores en el lado de la toma vertical y baje la tarjeta vertical en los pasadores.

    2. Empuje la tarjeta vertical directamente en la toma de la placa base.

    3. Gire el pestillo hacia abajo al mismo nivel que la chapa metálica de la tarjeta vertical.

Paso 5: Instale el módulo del controlador

Después de sustituir el componente en el módulo del controlador, debe volver a instalar el módulo del controlador en el chasis y, a continuación, reiniciarlo en el modo de mantenimiento.

  1. Si aún no lo ha hecho, cierre el conducto de aire.

  2. Alinee el extremo del módulo del controlador con la abertura del chasis y, a continuación, empuje suavemente el módulo del controlador hasta la mitad del sistema.

    Nota No inserte completamente el módulo de la controladora en el chasis hasta que se le indique hacerlo.
  3. Recuperar el sistema, según sea necesario.

    Si ha quitado los convertidores de medios (QSFP o SFP), recuerde volver a instalarlos si está utilizando cables de fibra óptica.

  4. Complete la instalación del módulo del controlador:

    1. Conecte el cable de alimentación a la fuente de alimentación, vuelva a instalar el collar de bloqueo del cable de alimentación y, a continuación, conecte la fuente de alimentación.

    2. Con los pestillos de bloqueo, empuje firmemente el módulo de la controladora en el chasis hasta que cumpla con el plano medio y esté completamente asentado.

      Los pestillos de bloqueo se elevan cuando el módulo del controlador está completamente asentado.

      Nota No ejerza una fuerza excesiva al deslizar el módulo del controlador hacia el chasis para evitar dañar los conectores.

    El módulo de la controladora comienza a arrancar tan pronto como se asienta completamente en el chasis. Esté preparado para interrumpir el proceso de arranque.

    1. Coloque completamente el módulo del controlador en el chasis girando los pestillos de bloqueo hacia arriba, inclinándolos de manera que borren los pasadores de bloqueo, empuje suavemente el controlador hasta que encaje y, a continuación, baje los pestillos de bloqueo a la posición de bloqueo.

    2. Si aún no lo ha hecho, vuelva a instalar el dispositivo de administración de cables.

    3. Interrumpa el proceso de arranque normal y arranque en EL CARGADOR pulsando Ctrl-C.

      Nota Si el sistema se detiene en el menú de inicio, seleccione la opción para arrancar EN EL CARGADOR.
    4. En el aviso del CARGADOR, introduzca bye Para reiniciar las tarjetas PCIe y otros componentes y dejar que se reinicie la controladora.

  5. Devuelva el funcionamiento normal de la controladora y devuelva su almacenamiento: storage failover giveback -ofnode impaired_node_name

  6. Si la devolución automática está desactivada, vuelva a habilitarla: storage failover modify -node local -auto-giveback true

Paso 6: Restaure el módulo de la controladora a su funcionamiento

Para restaurar el controlador, debe poder recuperar el sistema, devolver el módulo del controlador y, a continuación, volver a habilitar la devolución automática.

  1. Recuperar el sistema, según sea necesario.

    Si ha quitado los convertidores de medios (QSFP o SFP), recuerde volver a instalarlos si está utilizando cables de fibra óptica.

  2. Devuelva el funcionamiento normal de la controladora y devuelva su almacenamiento: storage failover giveback -ofnode impaired_node_name

  3. Si la devolución automática está desactivada, vuelva a habilitarla: storage failover modify -node local -auto-giveback true

Paso 7: Vuelva a cambiar los agregados en una configuración MetroCluster de dos nodos

Una vez que haya completado el reemplazo de FRU en una configuración de MetroCluster de dos nodos, podrá llevar a cabo la operación de conmutación de estado de MetroCluster. De este modo, la configuración vuelve a su estado operativo normal, con las máquinas virtuales de almacenamiento (SVM) sincronizada en el sitio anteriormente afectado que ahora están activas y sirviendo datos de los pools de discos locales.

Esta tarea solo se aplica a configuraciones MetroCluster de dos nodos.

Pasos
  1. Compruebe que todos los nodos estén en el enabled provincia: metrocluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. Compruebe que la resincronización se haya completado en todas las SVM: metrocluster vserver show

  3. Compruebe que las migraciones LIF automáticas que realizan las operaciones de reparación se han completado correctamente: metrocluster check lif show

  4. Lleve a cabo la conmutación de estado mediante el metrocluster switchback comando desde cualquier nodo del clúster superviviente.

  5. Compruebe que la operación de conmutación de estado ha finalizado: metrocluster show

    La operación de conmutación de estado ya está en ejecución cuando un clúster está en el waiting-for-switchback provincia:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    La operación de conmutación de estado se completa cuando los clústeres están en el normal estado:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    Si una conmutación de regreso tarda mucho tiempo en terminar, puede comprobar el estado de las líneas base en curso utilizando el metrocluster config-replication resync-status show comando.

  6. Restablecer cualquier configuración de SnapMirror o SnapVault.

Paso 8: Devuelva la pieza que falló a NetApp

Devuelva la pieza que ha fallado a NetApp, como se describe en las instrucciones de RMA que se suministran con el kit. Consulte "Retorno de artículo sustituciones" para obtener más información.