简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

更换 NVDIMM - AFF A800

如果系统记录闪存生命周期接近结束或已识别的 NVDIMM 总体运行状况不佳,则必须更换控制器模块中的 NVDIMM ;否则会导致系统崩溃。

系统中的所有其他组件必须正常运行;否则,您必须联系技术支持。

您必须将故障组件更换为从提供商处收到的替代 FRU 组件。

第 1 步:关闭受损控制器

使用适用于您的配置的操作步骤 关闭或接管受损控制器。

选项 1 :大多数配置

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

关于此任务
  • 如果您使用的是 NetApp 存储加密,则必须按照 _ONTAP 9 NetApp 加密高级指南 _ 的 "`将 SED 返回到未受保护的模式` " 一节中的说明重置 MSID 。

  • 如果您使用的是 SAN 系统,则必须已检查受损控制器 SCSI 刀片式服务器的事件消息(事件日志显示)。

    每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前,必须先解决所有问题。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示 false ,则必须在关闭受损控制器之前更正问题描述 ;请参见 "CLI 管理概述"

  • 如果您使用的是 MetroCluster 配置,则必须确认已配置 MetroCluster 配置状态,并且节点处于已启用且正常的状态(MetroCluster node show )。

步骤
  1. 如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例: ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh

    以下 AutoSupport 消息禁止自动创建案例两小时: cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至 "Remove controller module" 。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符(输入系统密码)

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

选项 2 :系统位于 MetroCluster 中

注 如果您的系统采用双节点 MetroCluster 配置,请勿使用此操作步骤。

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示 false ,则必须在关闭受损控制器之前更正问题描述 ;请参见 "CLI 管理概述"

  • 如果您使用的是 MetroCluster 配置,则必须确认已配置 MetroCluster 配置状态,并且节点处于已启用且正常的状态(MetroCluster node show )。

步骤
  1. 如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例: ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh

    以下 AutoSupport 消息禁止自动创建案例两小时: cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至 "Remove controller module" 。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符(输入系统密码)

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

第 2 步:卸下控制器模块

在更换控制器模块或更换控制器模块内的组件时,您必须从机箱中卸下控制器模块。

  1. 如果您尚未接地,请正确接地。

  2. 从源拔下控制器模块电源。

  3. 释放电源线固定器,然后从电源中拔下缆线。

  4. 松开将缆线绑在缆线管理设备上的钩环带,然后从控制器模块中拔下系统缆线以及 SFP 和 QSFP 模块(如果需要),并跟踪缆线的连接位置。

    将缆线留在缆线管理设备中,以便在重新安装缆线管理设备时,缆线排列有序。

  5. 将缆线管理设备从控制器模块中取出并放在一旁。

  6. 向下按两个锁定闩锁,然后同时向下旋转两个闩锁。

    此控制器模块会从机箱中略微移出。

    卸下 DRW a800 PCM

    锁定闩锁

    锁定销

  7. 将控制器模块滑出机箱。

    将控制器模块滑出机箱时,请确保您支持控制器模块的底部。

  8. 将控制器模块放在平稳的表面上,然后打开通风管:

    1. 朝控制器模块中间按下通风管两侧的锁定片。

    2. 将通风管滑向风扇模块,然后将其向上旋转到完全打开的位置。

      DRW a800 开放式通风管

通风管锁定卡舌

将通风管滑向风扇模块

向风扇模块旋转通风管

第 3 步:更换 NVDIMM

要更换 NVDIMM ,您必须使用通风管顶部的 NVDIMM 映射标签在控制器模块中找到它,或者使用 NVDIMM 旁边的 LED 找到它,然后按照特定步骤顺序进行更换。

注 在暂停系统后,在转存内容时, NVDIMM LED 会闪烁。目标值完成后,此 LED 将熄灭。
  1. 如果要卸下或移动 NVDIMM ,请解锁此提升板上的锁定闩锁,然后卸下相应的提升板。

    更换 DRW a800 NVDIMM

    通风管盖

    提升板 2 和 NVDIMM 11

  2. 记下插槽中 NVDIMM 的方向,以便可以按正确的方向将 NVDIMM 插入更换用的控制器模块中。

  3. 缓慢推离 NVDIMM 两侧的两个 NVDIMM 弹出卡舌,将 NVDIMM 从插槽中弹出,然后将 NVDIMM 滑出插槽并放在一旁。

    注 小心握住 NVDIMM 的边缘,以避免对 NVDIMM 电路板上的组件施加压力。
  4. 从防静电运输袋中取出更换用的 NVDIMM ,拿住 NVDIMM 的边角,然后将其与插槽对齐。

    NVDIMM 上插脚之间的缺口应与插槽中的突起对齐。

  5. 找到要安装 NVDIMM 的插槽。

  6. 将 NVDIMM 垂直插入插槽。

    NVDIMM 紧紧固定在插槽中,但应易于插入。如果没有,请将 NVDIMM 与插槽重新对齐并重新插入。

    注 目视检查 NVDIMM ,确认其已均匀对齐并完全插入插槽。
  7. 小心而稳固地推入 NVDIMM 的上边缘,直到推出器卡舌卡入到位,位于 NVDIMM 两端的缺口上。

  8. 重新安装从控制器模块中卸下的所有提升板。

  9. 关闭通风管。

第 4 步:重新安装控制器模块并启动系统

更换控制器模块中的 FRU 后,您必须重新安装控制器模块并重新启动它。

  1. 如果尚未关闭通风管:

    1. 将通风管一直旋转到控制器模块。

    2. 向提升板滑动通风管,直到锁定卡舌卡入到位。

    3. 检查通风管,确保其正确就位并锁定到位。

      DRW a700s 封闭通风管

    锁定卡舌

    滑动柱塞

  2. 将控制器模块的末端与机箱中的开口对齐,然后将控制器模块轻轻推入系统的一半。

    注 请勿将控制器模块完全插入机箱中,除非系统指示您这样做。
  3. 根据需要重新对系统进行布线。

    如果您已卸下介质转换器( QSFP 或 SFP ),请记得在使用光缆时重新安装它们。

  4. 将电源线插入电源,重新安装电源线锁定环,然后将电源连接到电源。

  5. 完成控制器模块的重新安装:

    1. 将控制器模块牢牢推入机箱,直到它与中板相距并完全就位。

      控制器模块完全就位后,锁定闩锁会上升。

      注 将控制器模块滑入机箱时,请勿用力过大,以免损坏连接器。

    控制器模块一旦完全固定在机箱中,就会开始启动。准备中断启动过程。

    1. 向上旋转锁定闩锁,使其倾斜,以清除锁定销,然后将其降低到锁定位置。

    2. 如果尚未重新安装缆线管理设备,请重新安装该设备。

    3. Ctrl-C 以中断正常启动过程。

第 4 步:运行诊断

更换系统中的某个组件后,您应对该组件运行诊断测试。

您的系统必须处于 LOADER 提示符处,才能启动诊断。

诊断过程中的所有命令都是从要更换组件的控制器发出的。

  1. 如果要维护的控制器不在 LOADER 提示符处,请重新启动控制器: ssystem node halt -node node_name

    问题描述命令后,您应等待系统停留在 LOADER 提示符处。

  2. 在 LOADER 提示符处,访问专为系统级诊断而设计的特殊驱动程序以正常运行: boot_diags

  3. 从显示的菜单中选择 * 扫描系统 * 以启用运行诊断测试。

  4. 从显示的菜单中选择 * 测试内存 * 。

  5. 从显示的菜单中选择 * NVDIMM Test* 。

  6. 根据上一步的结果继续操作:

    • 如果测试失败,请更正此故障,然后重新运行此测试。

    • 如果测试未报告任何故障,请从菜单中选择重新启动以重新启动系统。

第 5 步:将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。请参见 "部件退回和放大器;更换" 第页,了解更多信息。