简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

还原并验证系统配置— AFF A700 和 FAS9000

完成硬件更换并启动至维护模式后,您可以验证更换控制器的低级别系统配置,并根据需要重新配置系统设置。

第 1 步:在更换控制器后设置并验证系统时间

您应对照 HA 对中运行状况良好的控制器模块或独立配置中可靠的时间服务器检查更换用的控制器模块上的时间和日期。如果时间和日期不匹配,则必须在更换控制器模块上重置这些值,以防止客户端可能因时间差异而中断。

请务必在正确的系统上应用步骤中的命令:

  • replacement 节点是此操作步骤中更换受损节点的新节点。

  • health 节点是 replacement 节点的 HA 配对节点。

步骤
  1. 如果 replacement 节点不在 LOADER 提示符处,请将系统暂停到 LOADER 提示符处。

  2. health 节点上,检查系统时间: show date

    日期和时间以 GMT 表示。

  3. 在 LOADER 提示符处,检查 replacement 节点上的日期和时间: show date

    日期和时间以 GMT 表示。

  4. 如有必要,请在替代节点上以 GMT 格式设置日期: set date MM/dd/yyy

  5. 如有必要,请在替代节点上设置 GMT 时间: set time hh : mm : ss

  6. 在 LOADER 提示符处,确认 replacement 节点上的日期和时间: show date

    日期和时间以 GMT 表示。

第 2 步:验证并设置控制器模块的 HA 状态

您必须验证控制器模块的 HA 状态,并在必要时更新此状态以匹配您的系统配置。

步骤
  1. 在维护模式下,从新控制器模块验证所有组件是否显示相同的 HA 状态: ha-config show

    ha-state 的值可以是以下值之一:

    • ha

    • mcc

    • mcc-2n

    • mCCIP

    • non-ha

      1. 确认设置已更改: ha-config show

第 3 步:运行系统级诊断

更换控制器时,您应针对特定组件和子系统运行全面或有针对性的诊断测试。

诊断过程中的所有命令都是从要更换组件的节点发出的。

步骤
  1. 如果要维护的节点不在 LOADER 提示符处,请重新启动节点: halt

    问题描述命令后,您应等待系统停留在 LOADER 提示符处。

  2. 在 LOADER 提示符处,访问专为系统级诊断而设计的特殊驱动程序以正常运行: boot_diags

    在启动过程中,您可以安全地对提示 y 做出响应,直到显示维护模式提示符( * > )为止。

  3. 显示并记下控制器模块上的可用设备: sldiag device show -dev MB

    显示的控制器模块设备和端口可以是以下任一项或多项:

    • bootmedia 是系统启动设备。

    • CNA 是未连接到网络或存储设备的融合网络适配器或接口。

    • FCAL 是未连接到光纤通道网络的光纤通道仲裁环路设备。

    • env 是主板环境。

    • mem 是系统内存。

    • NIC 是一种网络接口卡。

    • NVRAM 是非易失性 RAM 。

    • nvmem 是 NVRAM 和系统内存的混合。

    • sas 是未连接到磁盘架的串行连接 SCSI 设备。

  4. 根据需要运行诊断。

    如果要运行诊断测试 …​ 那么 …​

    各个组件

    1. 清除状态日志: sldiag device clearstatus

    2. 显示选定设备的可用测试: sldiag device show -dev dev_name

      dev_name 可以是上一步中标识的任何一个端口和设备。

    3. 检查输出,如果适用,请仅选择要运行的测试: sldiag device modify -dev dev_name -Selection only ` + ` -Selection only` 会禁用您不想对设备运行的所有其他测试。

    4. 运行选定测试: sldiag device run -dev dev_name

      测试完成后,将显示以下消息:

      *> <SLDIAG:_ALL_TESTS_COMPLETED>
    5. 验证测试是否未失败: sldiag device status -dev dev_name -long -state failed

      如果没有测试失败,则系统级诊断会返回到提示符,或者会列出因测试组件而导致的失败的完整状态。

    同时包含多个组件

    1. 查看上述操作步骤输出中已启用和已禁用的设备,并确定要同时运行的设备。

    2. 列出设备的各个测试: sldiag device show -dev dev_name

    3. 检查输出,如果适用,仅选择要运行的测试: sldiag device modify -dev dev_name -Selection only

      仅限 ` 选择` 会禁用您不想对设备运行的所有其他测试。

    4. 验证测试是否已修改: sldiag device show

    5. 对要同时运行的每个设备重复这些子步骤。

    6. 对所有设备运行诊断: sldiag device run

      注 开始运行诊断程序后,请勿添加或修改条目。

      测试完成后,将显示以下消息:

      *> <SLDIAG:_ALL_TESTS_COMPLETED>
    7. 验证节点上是否没有硬件问题: sldiag device status -long -state failed

      如果没有测试失败,则系统级诊断会返回到提示符,或者会列出因测试组件而导致的失败的完整状态。

  5. 根据上一步的结果继续操作:

    如果系统级诊断测试 …​ 那么 …​

    已完成,无任何故障

    1. 清除状态日志: sldiag device clearstatus

    2. 验证是否已清除日志: sldiag device status

      此时将显示以下默认响应:

      SLDIAG: No log messages are present.
    3. 退出维护模式: halt

      节点将显示 LOADER 提示符。

    4. 从加载程序提示符处启动节点: bye

    5. 使节点恢复正常运行:

    HA 对

    执行交还: storage failover giveback -ofnode replacement_node_name

    注 如果禁用了自动交还,请使用 storage failover modify 命令重新启用它。

    双节点 MetroCluster 配置

    继续执行下一步。

    MetroCluster 切回操作步骤将在更换过程的下一任务中完成。

    一种独立配置

    继续执行下一步。

    无需执行任何操作。

    您已完成系统级诊断。

    导致某些测试失败

    确定问题的发生原因:

    1. 退出维护模式: halt

      问题描述命令后,请等待,直到系统停留在 LOADER 提示符处。

    2. 根据机箱中的控制器模块数量,关闭或保持电源打开状态:

      • 如果机箱中有两个控制器模块,请保持电源处于打开状态,以便为另一个控制器模块供电。

      • 如果机箱中有一个控制器模块,请关闭电源并拔下电源插头。

    3. 验证您是否已遵循在运行系统级诊断时确定的所有注意事项,缆线是否已牢固连接以及硬件组件是否已正确安装在存储系统中。

    4. 启动您正在维护的控制器模块,在系统提示您进入启动菜单时按 Ctrl-C 以中断启动:

      • 如果机箱中有两个控制器模块,请将您正在维护的控制器模块完全固定在机箱中。

        控制器模块在完全就位后启动。

      • 如果机箱中有一个控制器模块,请连接电源,然后将其打开。

    5. 从菜单中选择 Boot to maintenance mode 。

    6. 输入以下命令退出维护模式: halt

      问题描述命令后,请等待,直到系统停留在 LOADER 提示符处。

    7. 重新运行系统级诊断测试。