Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

更换 DIMM - AFX 1K

贡献者 netapp-driley netapp-jsnyder

如果检测到过多可纠正或不可纠正的内存错误,请更换 AFX 1K 存储系统中的 DIMM。此类错误可能会阻止存储系统启动ONTAP。更换过程包括关闭受损的控制器、将其移除、更换 DIMM、重新安装控制器,然后将故障部件返回给NetApp。

开始之前
  • 确保您拥有从NetApp收到的替换组件。

  • 请确保将故障组件更换为从NetApp收到的更换组件。

第 1 步:关闭受损控制器

关闭或接管受损控制器。

要关闭受损控制器,您必须确定控制器的状态,并在必要时执行控制器的存储故障转移接管,以便健康的控制器继续从受损控制器存储提供数据。

关于此任务
  • 如果您的集群具有四个以上的节点,则它必须达到法定人数。要查看有关节点的集群信息,请使用 `cluster show`命令。有关 `cluster show`命令,请参阅"查看ONTAP集群中的节点级详细信息"

  • 如果集群不处于法定人数,或者任何控制器(受损控制器除外)的健康状况或资格显示为错误,则必须在关闭受损控制器之前纠正该问题。看"将节点与集群同步"

步骤
  1. 如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例:

    system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    以下AutoSupport 消息禁止自动创建案例两小时:

    cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 从受损控制器的控制台禁用自动交还:

    storage failover modify -node impaired-node -auto-giveback-of false

    备注 当您看到“您想禁用自动回馈吗?”时,请输入 y
    1. 如果您运行的是ONTAP版本 9.17.1,并且受损控制器无法启动或已被接管,则必须先从正常控制器断开 HA 互连链路,然后再启动受损控制器。这可以防止受损控制器执行自动交还。

      system ha interconnect link off -node healthy-node -link 0

      system ha interconnect link off -node healthy-node -link 1

    备注 如果您运行的不是ONTAP版本 9.17.1,请跳过上述步骤并转到步骤 3。
  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至下一步。

    系统提示符或密码提示符

    从健康控制器接管或停止受损控制器: storage failover takeover -ofnode impaired_node_name -halt true

    -halt true 参数将受损节点带入 LOADER 提示符。

第 2 步:卸下控制器模块

在更换控制器模块或更换控制器模块内部的组件时、您必须从机柜中卸下控制器模块。

  1. 检查系统插槽4/5中的NVRAM状态指示灯。控制器模块的前面板上还有一个NVRAM LED。查找NV图标:

    NVRAM警示和状态LED位置图

    标注编号1

    NVRAM 状态 LED

    标注编号2

    NVRAM警示LED

    • 如果NV LED熄灭、请转至下一步。

    • 如果NV LED闪烁、请等待闪烁停止。如果闪烁持续时间超过5分钟、请联系技术支持以获得帮助。

  2. 如果您尚未接地,请正确接地。

  3. 用双手抓住挡板两侧的开口并向自己方向拉,直至挡板从底盘框架上的球头螺栓上松开,从而拆下挡板(如有必要)。

  4. 在设备正面、将手指钩入锁定凸轮上的孔中、挤压凸轮杆上的卡舌、然后同时朝您的方向轻轻而稳固地旋转两个闩锁。

    控制器模块会稍微移出机柜。

    控制器删除图形

    标注编号1

    锁定凸轮闩锁

  5. 将控制器模块滑出机箱、然后将其放在平稳的表面上。

    将控制器模块滑出机柜时、请确保支撑好其底部。

第 3 步:更换 DIMM

如果系统报告DIMM出现永久故障、则必须更换该DIMM。

  1. 如果您尚未接地,请正确接地。

  2. 打开控制器顶部的控制器通风管。

    1. 将手指插入空气管道远端的凹槽中。

    2. 提起空气管道、将其向上旋转至最远位置。

  3. 找到控制器模块上的DIMM并确定要更换的DIMM。

    使用控制器通风管上的FRU示意图找到DIMM插槽。

  4. 缓慢推动 DIMM 两侧的两个 DIMM 弹出卡舌,将 DIMM 从插槽中弹出,然后将 DIMM 滑出插槽。

    重要说明 小心握住 DIMM 的边缘,以避免对 DIMM 电路板上的组件施加压力。
    更换DIMM

    标注编号1

    DIMM 和 DIMM 弹出器卡舌

  5. 从防静电运输袋中取出更换用的 DIMM ,拿住 DIMM 的边角并将其与插槽对齐。

    DIMM 插脚之间的缺口应与插槽中的突起对齐。

  6. 确保连接器上的 DIMM 弹出器卡舌处于打开位置,然后将 DIMM 垂直插入插槽。

    DIMM 紧紧固定在插槽中,但应很容易插入。如果没有,请将 DIMM 与插槽重新对齐并重新插入。

    重要说明 目视检查 DIMM ,确认其均匀对齐并完全插入插槽。
  7. 小心而稳固地推动 DIMM 的上边缘,直到弹出器卡舌卡入到位,卡入到位于 DIMM 两端的缺口上。

  8. 关闭控制器空气管道。

第 4 步:安装控制器

重新安装并启动控制器模块。

  1. 将空气管道向下旋转到可以移动的位置、确保空气管道完全关闭。

    它必须与控制器模块金属板平齐。

  2. 将控制器模块的一端与机柜中的开口对齐、然后将控制器模块滑入机箱、使拉杆从系统正面转开。

  3. 一旦控制器模块阻止您进一步滑动、请向内旋转凸轮把手、直到它们在风扇下锁紧

    备注 将控制器模块滑入机箱时、请勿用力过度、以免损坏连接器。

    控制器模块在盘柜中完全就位后、即开始启动。

  4. 将表圈与球头螺栓对齐,然后轻轻将表圈推入到位。

  5. 当控制台消息停止时、按<enter>。

    • 如果看到登录提示,请转到下一步。

    • 如果您没有看到登录提示,请登录合作伙伴节点。

  6. 仅返回具有 override-destination-checks 选项的根:

    storage failover giveback -ofnode impaired-node -only-root true -override -destination-checks true

    备注 以下命令仅在诊断模式权限级别下可用。有关权限级别的更多信息,请参阅"了解ONTAP CLI 命令的权限级别"

    如果遇到错误,请联系 "NetApp 支持"

  7. 等待交还报告完成后 5 分钟,然后检查故障转移和交还状态:

    storage failover show`和 `storage failover show-giveback

    备注 以下命令仅在诊断模式权限级别下可用。
  8. 如果 HA 互连链路已断开,请将其恢复:

    system ha interconnect link on -node healthy-node -link 0

    system ha interconnect link on -node healthy-node -link 1

  9. 如果已禁用自动交还、请重新启用它:

    storage failover modify -node local -auto-giveback-of true

  10. 通过交还存储使受损控制器恢复正常运行:

    storage failover giveback -ofnode impaired_node_name

  11. 如果启用了AutoSupport、则还原/取消禁止自动创建案例:

    system node autosupport invoke -node * -type all -message MAINT=END

第 5 步:将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。