更换NVRAM - AFX 1K
当非易失性存储器出现故障或需要升级时,请更换 AFX 1K 存储系统中的NVRAM 。更换过程包括关闭受损的控制器、更换NVRAM模块或NVRAM DIMM,并将故障部件退回给NetApp。
NVRAM模块由NVRAM12硬件和现场可更换DIMM组成。You can replace a failed NVRAM module or the DIMMs inside the NVRAM module.
-
确保您已准备好更换部件。您必须使用从NetApp收到的更换组件来更换故障组件。
-
确保存储系统中的所有其他组件均正常运行;如果未正常运行,请联系 "NetApp 支持"。
第 1 步:关闭受损控制器
关闭或接管受损控制器。
要关闭受损控制器,您必须确定控制器的状态,并在必要时执行控制器的存储故障转移接管,以便健康的控制器继续从受损控制器存储提供数据。
-
如果您的集群具有四个以上的节点,则它必须达到法定人数。要查看有关节点的集群信息,请使用 `cluster show`命令。有关 `cluster show`命令,请参阅"查看ONTAP集群中的节点级详细信息"。
-
如果集群不处于法定人数,或者任何控制器(受损控制器除外)的健康状况或资格显示为错误,则必须在关闭受损控制器之前纠正该问题。看"将节点与集群同步" 。
-
如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
以下AutoSupport 消息禁止自动创建案例两小时:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
从受损控制器的控制台禁用自动交还:
storage failover modify -node impaired-node -auto-giveback-of false
当您看到“您想禁用自动回馈吗?”时,请输入 y
。-
如果您运行的是ONTAP版本 9.17.1,并且受损控制器无法启动或已被接管,则必须先从正常控制器断开 HA 互连链路,然后再启动受损控制器。这可以防止受损控制器执行自动交还。
system ha interconnect link off -node healthy-node -link 0
system ha interconnect link off -node healthy-node -link 1
如果您运行的不是ONTAP版本 9.17.1,请跳过上述步骤并转到步骤 3。 -
-
将受损控制器显示为 LOADER 提示符:
如果受损控制器显示 … 那么 … LOADER 提示符
转至下一步。
系统提示符或密码提示符
从健康控制器接管或停止受损控制器:
storage failover takeover -ofnode impaired_node_name -halt true
-halt true 参数将受损节点带入 LOADER 提示符。
步骤2:更换NVRAM模块或NVRAM DIMM
使用以下相应选项更换NVRAM模块或NVRAM DIMM。
要更换NVRAM模块、请在机箱的插槽4/5中找到该模块、然后按照特定步骤顺序进行操作。
-
如果您尚未接地,请正确接地。
-
从控制器上拔下 PSU 的电源线。
-
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
-
从机柜中卸下受损NVRAM模块:
-
按下锁定凸轮按钮。
凸轮按钮移离机柜。
-
将凸轮闩锁向下旋转到最远位置。
-
通过将手指插入凸轮拉杆开口并将受损NVRAM模块拉出机柜、从机柜中卸下受损NVRAM模块。
凸轮锁定按钮
DIMM锁定卡舌
-
-
将NVRAM模块放在稳定的表面上。
-
从受损NVRAM模块中逐一卸下DIMM、然后将其安装到更换用的NVRAM模块中。
-
将更换用的NVRAM模块安装到机柜中:
-
将模块与插槽4/5中机箱开口的边缘对齐。
-
将模块轻轻滑入插槽中、然后将凸轮闩锁一直向上旋转、以将模块锁定到位。
-
-
将缆线管理托架向上旋转到关闭位置。
要更换NVRAM模块中的NVRAM DIMM、必须先卸下NVRAM模块、然后再更换目标DIMM。
-
如果您尚未接地,请正确接地。
-
从 PSU 上拔下电源线。
-
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
-
从机柜中卸下目标NVRAM模块。
凸轮锁定按钮
DIMM锁定卡舌
-
将NVRAM模块放在稳定的表面上。
-
找到NVRAM模块内要更换的DIMM。
请参阅NVRAM模块侧面的FRU示意图标签、以确定DIMM插槽1和2的位置。 -
向下按DIMM锁定卡舌并将DIMM从插槽中提出、以卸下DIMM。
-
安装更换用的 DIMM ,方法是将 DIMM 与插槽对齐,然后将 DIMM 轻轻推入插槽,直到锁定卡舌锁定到位。
-
将NVRAM模块安装到机柜中:
-
将模块轻轻滑入插槽、直到凸轮闩锁开始与I/O凸轮销啮合、然后一直向上旋转凸轮闩锁以将模块锁定到位。
-
-
将缆线管理托架向上旋转到关闭位置。
第3步:重新启动控制器
更换 FRU 后,必须重新启动控制器模块。
-
将电源线重新插入 PSU。
系统将开始重新启动、通常会显示加载程序提示符。
-
进入 `bye`在 LOADER 提示符下。
步骤 4:完成NVRAM替换
执行以下步骤以完成NVRAM替换。
-
从控制器上的加载程序提示符处、启动控制器、并在系统因系统ID不匹配而提示覆盖系统ID时输入_y_。
以下是覆盖系统 ID 的提示示例:
WARNING: System ID mismatch. This usually occurs when replacing a boot device or NVRAM cards! Override system ID? {y|n}
-
从健康的控制器验证新的合作伙伴系统 ID 是否已自动分配:
storage failover show
在命令输出中,您应该会看到一条显示存储替换当前状态的消息。在以下示例中,node2 已完成替换,并显示当前状态为“接管中”。
node1:> storage failover show Takeover Node Partner Possible State Description ------------ ------------ -------- ------------------------------------- node1 node2 false In takeover node2 node1 - Waiting for giveback
-
交还控制器:
-
从健康的控制器中归还被替换控制器的存储:
storage failover giveback -ofnode replacement_node_name
控制器将收回其存储并完成启动。
如果交还被否决,您可以考虑覆盖此否决。
有关详细信息,请参见 "手动交还命令" 主题以覆盖否决。
-
完成交还后、确认HA对运行状况良好且可以进行接管:storage Failover show
storage failover show
命令的输出不应包含 System ID changed on partner 消息。
-
-
验证每个控制器是否存在预期的卷:
vol show -node node-name
-
当控制台消息停止时、按<enter>。
-
如果您看到_login_提示,请转到下一步。
-
如果您没有看到登录提示,请登录合作伙伴节点。
-
-
在恢复报告完成后等待5分钟、然后检查故障转移状态和恢复状态:
storage failover show`和 `storage failover show-giveback
以下命令仅在诊断模式权限级别下可用。 -
如果 HA 互连链路已断开,请将其恢复:
system ha interconnect link on -node healthy-node -link 0
system ha interconnect link on -node healthy-node -link 1
-
通过交还存储使受损控制器恢复正常运行:
storage failover giveback -ofnode impaired_node_name
-
如果已禁用自动交还、请重新启用它:
storage failover modify -node local -auto-giveback-of true
-
如果启用了AutoSupport、则还原/取消禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=END
第 5 步:将故障部件退回 NetApp
按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。