更换 DIMM - AFF A250
提供者
如果系统注册的可更正错误更正代码( ECC )数量不断增加,则必须更换控制器模块中的 DIMM ;否则会导致系统崩溃。
系统中的所有其他组件必须正常运行;否则,您必须联系技术支持。
您必须将故障组件更换为从提供商处收到的替代 FRU 组件。
第 1 步:关闭受损控制器
要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。
-
如果您使用的是NetApp存储加密、则必须按照中的说明重置MSID "将SED恢复到未受保护的模式"。
-
如果您使用的是SAN系统、则必须已检查事件消息
cluster kernel-service show
)。。cluster kernel-service show
command可显示节点名称、该节点的仲裁状态、该节点的可用性状态以及该节点的运行状态。每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前,必须先解决所有问题。
-
If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述 ;请参见 "将节点与集群同步"。
-
如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh
以下AutoSupport 消息禁止自动创建案例两小时:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
从运行正常的控制器的控制台禁用自动交还:
storage failover modify – node local -auto-giveback false
当您看到_Do you want to disable auto-giveback?_时、输入`y`。 -
将受损控制器显示为 LOADER 提示符:
如果受损控制器显示 … 那么 … LOADER 提示符
转至 "Remove controller module" 。
正在等待交还
按 Ctrl-C ,然后在出现提示时回答
y
。系统提示符或密码提示符
从运行正常的控制器接管或暂停受损的控制器:
storage failover takeover -ofnode impaired_node_name
当受损控制器显示 Waiting for giveback… 时,按 Ctrl-C ,然后回答
y
。
第 2 步:卸下控制器模块
更换控制器模块内部的组件时,必须从机箱中卸下控制器模块。
请确保为这些缆线贴上标签,以便您知道这些缆线来自何处。
-
如果您尚未接地,请正确接地。
-
从源拔下控制器模块电源。
-
释放电源线固定器,然后从电源中拔下缆线。
-
将前掌插入控制器模块两侧的锁定装置中,用拇指按下控制杆,然后将控制器轻轻拉出机箱几英寸。
如果在卸下控制器模块时遇到困难,请将食指从内部穿过指孔(通过跨越臂)。 控制杆
锁定机制
-
用双手抓住控制器模块两侧,将其轻轻拉出机箱,并将其放在平稳的表面上。
-
逆时针转动控制器模块正面的翼形螺钉,然后打开控制器模块盖板。
翼形螺钉
控制器模块盖板。
-
取下通风管盖。
第 3 步:更换 DIMM
要更换DIMM、您必须使用通风管顶部的DIMM映射标签在控制器模块中找到该DIMM、然后按照特定步骤顺序进行更换。
使用以下视频或表格中的步骤更换 DIMM :
-
更换控制器模块上损坏的 DIMM 。
DIMM 位于主板上的插槽 3 或 1 中。插槽 2 和 4 为空。请勿尝试在这些插槽中安装 DIMM 。
-
记下插槽中 DIMM 的方向,以便可以按正确的方向插入更换用的 DIMM 。
-
缓慢地将 DIMM 两侧的 DIMM 弹出卡舌分开,然后将 DIMM 滑出插槽。
-
使连接器上的 DIMM 弹出器卡舌保持打开状态。
-
从防静电运输袋中取出更换用的 DIMM ,拿住 DIMM 的边角并将其与插槽对齐。
握住 DIMM 的边缘,以避免对 DIMM 电路板上的组件施加压力。 -
将更换用的 DIMM 垂直插入插槽。
DIMM 紧紧固定在插槽中。如果没有,请重新插入 DIMM ,使其与插槽重新对齐。
-
目视检查 DIMM ,确认其均匀对齐并完全插入插槽。
第 4 步:安装控制器模块
更换控制器模块中的组件后,必须将控制器模块重新安装到机箱中,然后将其启动至维护模式。
您可以使用下图或写入的步骤在机箱中安装替代控制器模块。
-
如果尚未安装此通风管,请安装此通风管。
-
合上控制器模块盖并拧紧翼形螺钉。
控制器模块盖板
翼形螺钉
-
将控制器模块插入机箱:
-
确保锁定机制臂锁定在完全展开的位置。
-
用双手将控制器模块对齐并轻轻滑入锁定装置臂,直到其停止。
-
将食指从锁定装置内侧的指孔中穿过。
-
用拇指向下按压闩锁装置顶部的橙色卡舌,然后将控制器模块轻轻推至停止位置上方。
-
从锁定机制顶部释放拇指,然后继续推动,直到锁定机制卡入到位。
控制器模块一旦完全固定在机箱中,就会开始启动。准备中断启动过程。
控制器模块应完全插入,并与机箱边缘平齐。
-
-
仅为管理和控制台端口布线,以便您可以访问系统以执行以下各节中的任务。
您将在此操作步骤中稍后将其余缆线连接到控制器模块。
第 5 步:运行诊断
更换系统中的某个组件后,您应对该组件运行诊断测试。
您的系统必须处于 LOADER 提示符处,才能启动诊断。
诊断过程中的所有命令都是从要更换组件的控制器发出的。
-
如果要维护的控制器不在 LOADER 提示符处,请重新启动控制器:
ssystem node halt -node node_name
问题描述命令后,您应等待系统停留在 LOADER 提示符处。
-
在 LOADER 提示符处,访问专为系统级诊断而设计的特殊驱动程序以正常运行:
boot_diags
-
从显示的菜单中选择 * 扫描系统 * 以启用运行诊断测试。
-
从显示的菜单中选择 * 测试内存 * 。
-
根据上一步的结果继续操作:
-
如果测试失败,请更正此故障,然后重新运行此测试。
-
如果测试未报告任何故障,请从菜单中选择重新启动以重新启动系统。
-
第 6 步:将故障部件退回 NetApp
按照套件随附的 RMA 说明将故障部件退回 NetApp 。请参见 "部件退回和放大器;更换" 第页,了解更多信息。