简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

还原并验证配置— FAS8200

提供者

您必须验证机箱的 HA 状态,并运行系统级诊断,切回聚合并将故障部件退回给 NetApp ,如套件随附的 RMA 说明所述。

第 1 步:验证并设置机箱的 HA 状态

您必须验证机箱的 HA 状态,并在必要时更新此状态以匹配您的系统配置。

  1. 在维护模式下,从任一控制器模块显示本地控制器模块和机箱的 HA 状态: ha-config show

    所有组件的 HA 状态都应相同。

  2. 如果为机箱显示的系统状态与您的系统配置不匹配:

    1. 设置机箱的 HA 状态: ha-config modify chassis ha-state

      HA 状态的值可以是以下值之一: ha * mcc * mcc-2n * mCCIP * non-ha

    2. 确认设置已更改: ha-config show

  3. 如果尚未执行此操作,请重新对系统的其余部分进行布线。

  4. 下一步取决于您的系统配置。

    如果您的系统位于 …​ 那么 …​

    一种独立配置

    1. 退出维护模式: halt

    2. 转至 "正在完成更换过程"

    与另一个控制器模块的 HA 对

    退出维护模式: halt 此时将显示 LOADER 提示符。

第 2 步:运行系统级诊断

安装新机箱后,应运行互连诊断。

您的系统必须处于 LOADER 提示符处,才能启动系统级诊断。

诊断过程中的所有命令都是从要更换组件的控制器发出的。

  1. 如果要维护的控制器不在 LOADER 提示符处,请执行以下步骤:

    1. 从显示的菜单中选择维护模式选项。

    2. 控制器启动到维护模式后,暂停控制器: halt

      问题描述命令后,您应等待系统停留在 LOADER 提示符处。

    注 在启动过程中,您可以安全地响应 y 提示:
  2. 如果采用 HA 配置,请在第二个控制器上重复上述步骤。

    注 两个控制器必须处于维护模式才能运行互连测试。
  3. 在 LOADER 提示符处,访问专为系统级诊断而设计的特殊驱动程序以正常运行: boot_diags

    在启动过程中,您可以安全地对提示 y 做出响应,直到显示维护模式提示符( * > )为止。

  4. 从维护模式提示符处启用互连诊断测试: sldiag device modify -dev interconnect -SEL enable

    默认情况下,互连测试处于禁用状态,必须启用才能单独运行。

  5. 从维护模式提示符处运行互连诊断测试: sldiag device run -dev interconnect

    您只需要从一个控制器运行互连测试。

  6. 验证更换机箱是否未导致硬件问题: sldiag device status -dev interconnect -long -state failed

    如果没有测试失败,则系统级诊断会返回到提示符,或者会列出因测试组件而导致的失败的完整状态。

  7. 根据上一步的结果继续操作。

    如果系统级诊断测试 …​ 那么 …​

    已完成,无任何故障

    1. 清除状态日志: sldiag device clearstatus

    2. 验证是否已清除日志: sldiag device status

      此时将显示以下默认响应:

      SLDIAG: No log messages are present.
    3. 在两个控制器上退出维护模式: halt

      系统将显示 LOADER 提示符。

      注 您必须在两个控制器上退出维护模式,然后再继续执行任何操作。
    4. 在 LOADER 提示符处对两个控制器输入以下命令: bye

    5. 使控制器恢复正常运行:

    如果您的系统运行的是 ONTAP 那么 …​

    集群中有两个节点

    问题描述以下命令: node :: > cluster ha modify -configured true``node :: > storage failover modify -node node0 -enabled true

    集群中的节点数超过两个

    问题描述此命令:node : > storage failover modify -node node0 -enabled true

    在双节点 MetroCluster 配置中

    继续执行下一步。MetroCluster 切回操作步骤将在更换过程的下一任务中完成。

    在独立配置中

    您在这项特定任务中没有其他步骤。您已完成系统级诊断。

    导致某些测试失败

    确定问题的发生原因。

    1. 退出维护模式: halt

    2. 执行完全关闭,然后断开电源。

    3. 验证您是否已遵循在运行系统级诊断时确定的所有注意事项,缆线是否已牢固连接以及硬件组件是否已正确安装在存储系统中。

    4. 重新连接电源,然后打开存储系统的电源。

    5. 重新运行系统级诊断测试。

第 3 步:切回双节点 MetroCluster 配置中的聚合

在双节点 MetroCluster 配置中完成 FRU 更换后,您可以执行 MetroCluster 切回操作。这样会将配置恢复到其正常运行状态,以前受损站点上的 sync-source Storage Virtual Machine ( SVM )现在处于活动状态,并从本地磁盘池提供数据。

此任务仅限适用场景双节点 MetroCluster 配置。

步骤
  1. 验证所有节点是否处于 enabled 状态: MetroCluster node show

    cluster_B::>  metrocluster node show
    
    DR                           Configuration  DR
    Group Cluster Node           State          Mirroring Mode
    ----- ------- -------------- -------------- --------- --------------------
    1     cluster_A
                  controller_A_1 configured     enabled   heal roots completed
          cluster_B
                  controller_B_1 configured     enabled   waiting for switchback recovery
    2 entries were displayed.
  2. 验证所有 SVM 上的重新同步是否已完成: MetroCluster SVM show

  3. 验证修复操作正在执行的任何自动 LIF 迁移是否已成功完成: MetroCluster check lif show

  4. 在运行正常的集群中的任何节点上使用 MetroCluster switchback 命令执行切回。

  5. 验证切回操作是否已完成: MetroCluster show

    当集群处于 waiting for-switchback 状态时,切回操作仍在运行:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured       	switchover
    Remote: cluster_A configured       	waiting-for-switchback

    当集群处于 normal 状态时,切回操作完成。:

    cluster_B::> metrocluster show
    Cluster              Configuration State    Mode
    --------------------	------------------- 	---------
     Local: cluster_B configured      		normal
    Remote: cluster_A configured      		normal

    如果切回需要很长时间才能完成,您可以使用 MetroCluster config-replication resync-status show 命令检查正在进行的基线的状态。

  6. 重新建立任何 SnapMirror 或 SnapVault 配置。

第 4 步:将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。请参见 "部件退回和放大器;更换" 第页,了解更多信息。