更换 DIMM - AFX 1K
如果检测到过多可纠正或不可纠正的内存错误,请更换 AFX 1K 存储系统中的 DIMM。此类错误可能会阻止存储系统启动ONTAP。更换过程包括关闭受损的控制器、将其移除、更换 DIMM、重新安装控制器,然后将故障部件返回给NetApp。
-
确保您拥有从NetApp收到的替换组件。
-
请确保将故障组件更换为从NetApp收到的更换组件。
第 1 步:关闭受损控制器
关闭或接管受损控制器。
要关闭受损控制器,您必须确定控制器的状态,并在必要时执行控制器的存储故障转移接管,以便健康的控制器继续从受损控制器存储提供数据。
-
如果您的集群具有四个以上的节点,则它必须达到法定人数。要查看有关节点的集群信息,请使用 `cluster show`命令。有关 `cluster show`命令,请参阅"查看ONTAP集群中的节点级详细信息"。
-
如果集群不处于法定人数,或者任何控制器(受损控制器除外)的健康状况或资格显示为错误,则必须在关闭受损控制器之前纠正该问题。看"将节点与集群同步" 。
-
如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
以下AutoSupport 消息禁止自动创建案例两小时:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
从受损控制器的控制台禁用自动交还:
storage failover modify -node impaired-node -auto-giveback-of false
当您看到“您想禁用自动回馈吗?”时,请输入 y
。-
如果您运行的是ONTAP版本 9.17.1,并且受损控制器无法启动或已被接管,则必须先从正常控制器断开 HA 互连链路,然后再启动受损控制器。这可以防止受损控制器执行自动交还。
system ha interconnect link off -node healthy-node -link 0
system ha interconnect link off -node healthy-node -link 1
如果您运行的不是ONTAP版本 9.17.1,请跳过上述步骤并转到步骤 3。 -
-
将受损控制器显示为 LOADER 提示符:
如果受损控制器显示 … 那么 … LOADER 提示符
转至下一步。
系统提示符或密码提示符
从健康控制器接管或停止受损控制器:
storage failover takeover -ofnode impaired_node_name -halt true
-halt true 参数将受损节点带入 LOADER 提示符。
第 2 步:卸下控制器模块
在更换控制器模块或更换控制器模块内部的组件时、您必须从机柜中卸下控制器模块。
-
检查系统插槽4/5中的NVRAM状态指示灯。控制器模块的前面板上还有一个NVRAM LED。查找NV图标:
NVRAM 状态 LED
NVRAM警示LED
-
如果NV LED熄灭、请转至下一步。
-
如果NV LED闪烁、请等待闪烁停止。如果闪烁持续时间超过5分钟、请联系技术支持以获得帮助。
-
-
如果您尚未接地,请正确接地。
-
用双手抓住挡板两侧的开口并向自己方向拉,直至挡板从底盘框架上的球头螺栓上松开,从而拆下挡板(如有必要)。
-
在设备正面、将手指钩入锁定凸轮上的孔中、挤压凸轮杆上的卡舌、然后同时朝您的方向轻轻而稳固地旋转两个闩锁。
控制器模块会稍微移出机柜。
锁定凸轮闩锁
-
将控制器模块滑出机箱、然后将其放在平稳的表面上。
将控制器模块滑出机柜时、请确保支撑好其底部。
第 3 步:更换 DIMM
如果系统报告DIMM出现永久故障、则必须更换该DIMM。
-
如果您尚未接地,请正确接地。
-
打开控制器顶部的控制器通风管。
-
将手指插入空气管道远端的凹槽中。
-
提起空气管道、将其向上旋转至最远位置。
-
-
找到控制器模块上的DIMM并确定要更换的DIMM。
使用控制器通风管上的FRU示意图找到DIMM插槽。
-
缓慢推动 DIMM 两侧的两个 DIMM 弹出卡舌,将 DIMM 从插槽中弹出,然后将 DIMM 滑出插槽。
小心握住 DIMM 的边缘,以避免对 DIMM 电路板上的组件施加压力。 DIMM 和 DIMM 弹出器卡舌
-
从防静电运输袋中取出更换用的 DIMM ,拿住 DIMM 的边角并将其与插槽对齐。
DIMM 插脚之间的缺口应与插槽中的突起对齐。
-
确保连接器上的 DIMM 弹出器卡舌处于打开位置,然后将 DIMM 垂直插入插槽。
DIMM 紧紧固定在插槽中,但应很容易插入。如果没有,请将 DIMM 与插槽重新对齐并重新插入。
目视检查 DIMM ,确认其均匀对齐并完全插入插槽。 -
小心而稳固地推动 DIMM 的上边缘,直到弹出器卡舌卡入到位,卡入到位于 DIMM 两端的缺口上。
-
关闭控制器空气管道。
第 4 步:安装控制器
重新安装并启动控制器模块。
-
将空气管道向下旋转到可以移动的位置、确保空气管道完全关闭。
它必须与控制器模块金属板平齐。
-
将控制器模块的一端与机柜中的开口对齐、然后将控制器模块滑入机箱、使拉杆从系统正面转开。
-
一旦控制器模块阻止您进一步滑动、请向内旋转凸轮把手、直到它们在风扇下锁紧
将控制器模块滑入机箱时、请勿用力过度、以免损坏连接器。 控制器模块在盘柜中完全就位后、即开始启动。
-
将表圈与球头螺栓对齐,然后轻轻将表圈推入到位。
-
当控制台消息停止时、按<enter>。
-
如果看到登录提示,请转到下一步。
-
如果您没有看到登录提示,请登录合作伙伴节点。
-
-
仅返回具有 override-destination-checks 选项的根:
storage failover giveback -ofnode impaired-node -only-root true -override -destination-checks true
以下命令仅在诊断模式权限级别下可用。有关权限级别的更多信息,请参阅"了解ONTAP CLI 命令的权限级别"。 如果遇到错误,请联系 "NetApp 支持"。
-
等待交还报告完成后 5 分钟,然后检查故障转移和交还状态:
storage failover show`和 `storage failover show-giveback
以下命令仅在诊断模式权限级别下可用。 -
如果 HA 互连链路已断开,请将其恢复:
system ha interconnect link on -node healthy-node -link 0
system ha interconnect link on -node healthy-node -link 1
-
如果已禁用自动交还、请重新启用它:
storage failover modify -node local -auto-giveback-of true
-
通过交还存储使受损控制器恢复正常运行:
storage failover giveback -ofnode impaired_node_name
-
如果启用了AutoSupport、则还原/取消禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=END
第 5 步:将故障部件退回 NetApp
按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。