更换NVRAM - AFF A1K
NVRAM模块由NVRAM12硬件和现场可更换DIMM组成。You can replace a failed NVRAM module or the DIMMs inside the NVRAM module.要更换发生故障的NVRAM模块、您必须从机柜中卸下该模块、将DIMM移至更换模块、然后将更换用的NVRAM模块安装到机柜中。
系统中的所有其它组件必须正常工作;如果不能正常工作,则必须与联系 "NetApp 支持"。
您必须将故障组件更换为从提供商处收到的替代 FRU 组件。
第 1 步:关闭受损控制器
使用以下选项之一关闭或接管受损控制器。
要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。
-
如果您使用的是SAN系统,则必须已检查受损控制器SCSI刀片的事件消息
cluster kernel-service show
。 `cluster kernel-service show`命令(在priv高级模式下)可显示该节点的节点名称"仲裁状态"、该节点的可用性状态以及该节点的运行状态。每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前,必须先解决所有问题。
-
If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述 ;请参见 "将节点与集群同步"。
-
如果启用了AutoSupport、则通过调用AutoSupport消息禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=<# of hours>h
以下AutoSupport 消息禁止自动创建案例两小时:
cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
-
从运行正常的控制器的控制台禁用自动交还:
storage failover modify – node local -auto-giveback false
当您看到_Do you want to disable auto-giveback?_时、输入`y`。 -
将受损控制器显示为 LOADER 提示符:
如果受损控制器显示 … 那么 … LOADER 提示符
转至下一步。
正在等待交还
按 Ctrl-C ,然后在出现提示时回答
y
。系统提示符或密码提示符
从运行正常的控制器接管或暂停受损的控制器:
storage failover takeover -ofnode impaired_node_name
当受损控制器显示 Waiting for giveback… 时,按 Ctrl-C ,然后回答
y
。
要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。
-
If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述 ;请参见 "将节点与集群同步"。
-
您必须确认已配置MetroCluster配置状态,并且节点处于启用和正常状态(
metrocluster node show
)。
-
如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例:
ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh
以下 AutoSupport 消息禁止自动创建案例两小时:
cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h
-
从运行正常的控制器的控制台禁用自动交还:
storage failover modify – node local -auto-giveback false
-
将受损控制器显示为 LOADER 提示符:
如果受损控制器显示 … 那么 … LOADER 提示符
转至下一节。
正在等待交还
按 Ctrl-C ,然后在出现提示时回答
y
。系统提示符或密码提示符(输入系统密码)
从运行正常的控制器接管或暂停受损的控制器:
storage failover takeover -ofnode impaired_node_name
当受损控制器显示 Waiting for giveback… 时,按 Ctrl-C ,然后回答
y
。
第 2 步:更换 NVRAM 模块
要更换NVRAM模块、请在机箱的插槽4/5中找到该模块、然后按照特定步骤顺序进行操作。
-
如果您尚未接地,请正确接地。
-
从两个PSU上拔下电源线。
-
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
-
从机柜中卸下受损NVRAM模块:
-
按下锁定凸轮按钮。
凸轮按钮移离机柜。
-
将凸轮闩锁向下旋转到最远位置。
-
通过将手指插入凸轮拉杆开口并将受损NVRAM模块拉出机柜、从机柜中卸下受损NVRAM模块。
凸轮锁定按钮
DIMM锁定卡舌
-
-
将NVRAM模块放在稳定的表面上。
-
从受损NVRAM模块中逐一卸下DIMM、然后将其安装到更换用的NVRAM模块中。
-
将更换用的NVRAM模块安装到机柜中:
-
将模块与插槽4/5中机箱开口的边缘对齐。
-
将模块轻轻滑入插槽中、然后将凸轮闩锁一直向上旋转、以将模块锁定到位。
-
-
重新对PSU进行分组。
-
将缆线管理托架向上旋转到关闭位置。
第 3 步:更换 NVRAM DIMM
要更换NVRAM模块中的NVRAM DIMM、必须先卸下NVRAM模块、然后再更换目标DIMM。
-
如果您尚未接地,请正确接地。
-
从两个PSU上拔下电源线。
-
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
-
从机柜中卸下目标NVRAM模块。
凸轮锁定按钮
DIMM锁定卡舌
-
将NVRAM模块放在稳定的表面上。
-
找到NVRAM模块内要更换的DIMM。
请参阅NVRAM模块侧面的FRU示意图标签、以确定DIMM插槽1和2的位置。 -
向下按DIMM锁定卡舌并将DIMM从插槽中提出、以卸下DIMM。
-
安装更换用的 DIMM ,方法是将 DIMM 与插槽对齐,然后将 DIMM 轻轻推入插槽,直到锁定卡舌锁定到位。
-
将NVRAM模块安装到机柜中:
-
将模块轻轻滑入插槽、直到凸轮闩锁开始与I/O凸轮销啮合、然后一直向上旋转凸轮闩锁以将模块锁定到位。
-
-
重新对PSU进行分组。
-
将缆线管理托架向上旋转到关闭位置。
第4步:重新启动控制器
更换 FRU 后,必须重新启动控制器模块。
-
要从加载程序提示符处启动ONTAP、请输入_BYE_。
-
通过交还存储使受损控制器恢复正常运行:
storage failover giveback -ofnode _impaired_node_name
。 -
如果已禁用自动交还,请重新启用它:
storage failover modify -node local -auto-giveback true
。 -
如果启用了AutoSupport,则还原/取消禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=END
。
第 5 步:重新分配磁盘
您必须在启动控制器时确认系统ID更改、然后验证是否已实施此更改。
只有在更换NVRAM模块时才需要重新分配磁盘、而不适用于NVRAM DIMM更换。 |
-
如果控制器处于维护模式(显示
*>
提示符)、请退出维护模式并转到加载程序提示符:_halt _ -
从控制器上的加载程序提示符处、启动控制器、并在系统因系统ID不匹配而提示覆盖系统ID时输入_y_。
-
等待直到等待返回… 消息、然后从运行状况良好的控制器确认已自动分配新的配对系统ID:storage Failover show
在命令输出中,您应看到一条消息,指出受损控制器上的系统 ID 已更改,其中显示了正确的旧 ID 和新 ID 。In the following example, node2 has undergone replacement and has a new system ID of 151759706.
node1:> storage failover show Takeover Node Partner Possible State Description ------------ ------------ -------- ------------------------------------- node1 node2 false System ID changed on partner (Old: 151759755, New: 151759706), In takeover node2 node1 - Waiting for giveback (HA mailboxes)
-
交还控制器:
-
从运行状况良好的控制器中、交还更换后的控制器的存储:storage故障转移gi交还-ofnode re更换 节点名称
控制器将收回其存储并完成启动。
如果由于系统ID不匹配而提示您覆盖系统ID、则应输入_y_。
如果交还被否决,您可以考虑覆盖此否决。
有关详细信息,请参见 "手动交还命令" 主题以覆盖否决。
-
完成交还后、确认HA对运行状况良好且可以进行接管:storage Failover show
storage failover show
命令的输出不应包含 System ID changed on partner 消息。
-
-
验证是否已正确分配磁盘:
storage disk show -ownership
属于控制器的磁盘应显示新的系统ID。在以下示例中、node1拥有的磁盘现在显示新的系统ID 151759706:
node1:> storage disk show -ownership Disk Aggregate Home Owner DR Home Home ID Owner ID DR Home ID Reserver Pool ----- ------ ----- ------ -------- ------- ------- ------- --------- --- 1.0.0 aggr0_1 node1 node1 - 151759706 151759706 - 151759706 Pool0 1.0.1 aggr0_1 node1 node1 151759706 151759706 - 151759706 Pool0 . . .
-
如果系统采用MetroCluster配置、请监控控制器的状态:nnode show MetroCluster
在更换后, MetroCluster 配置需要几分钟才能恢复到正常状态,此时,每个控制器将显示已配置状态,并启用 DR 镜像并显示正常模式。命令输出将
metrocluster node show -fields node-systemid
显示受损的系统ID、直到MetroCluster配置恢复正常状态为止。 -
如果控制器采用 MetroCluster 配置,则根据 MetroCluster 状态,如果原始所有者是灾难站点上的控制器,请验证 DR 主 ID 字段是否显示磁盘的原始所有者。
如果同时满足以下条件,则必须执行此操作:
-
MetroCluster 配置处于切换状态。
-
控制器是灾难站点上磁盘的当前所有者。
-
-
如果您的系统采用MetroCluster配置、请验证是否已配置每个控制器:nnode MetroCluster show - fields configure-state
node1_siteA::> metrocluster node show -fields configuration-state dr-group-id cluster node configuration-state ----------- ---------------------- -------------- ------------------- 1 node1_siteA node1mcc-001 configured 1 node1_siteA node1mcc-002 configured 1 node1_siteB node1mcc-003 configured 1 node1_siteB node1mcc-004 configured 4 entries were displayed.
-
验证每个控制器是否存在所需的卷:
vol show -node node-name
-
通过交还存储使受损控制器恢复正常运行:
storage failover giveback -ofnode impaired_node_name
。 -
如果已禁用自动交还,请重新启用它:
storage failover modify -node local -auto-giveback true
。 -
如果启用了AutoSupport,则还原/取消禁止自动创建案例:
system node autosupport invoke -node * -type all -message MAINT=END
。
第 6 步:将故障部件退回 NetApp
按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。