简体中文版经机器翻译而成，仅供参考。如与英语版出现任何冲突，应以英语版为准。

更换NVRAM - AFF A1K

07/10/2026 贡献者

PDF

当非易失性内存出现故障或需要升级时，请更换AFF A1K系统中的NVRAM。更换过程包括关闭受损控制器、更换NVRAM模块或NVRAM DIMM、重新分配磁盘以及将故障部件返回给NetApp。

NVRAM模块由NVRAM12硬件和现场可更换DIMM组成。You can replace a failed NVRAM module or the DIMMs inside the NVRAM module.

开始之前

确保您已准备好更换部件。您必须使用从NetApp收到的更换组件来更换故障组件。
确保存储系统中的所有其他组件均正常运行；如果未正常运行，请联系 "NetApp 支持"。

第 1 步：关闭受损控制器

使用以下选项之一关闭或接管受损控制器。

选项 1 ：大多数系统

接管并停止受损的控制器，以便健康控制器继续从受损的控制器的存储中提供数据。为此，您需要在 AutoSupport 中禁止自动创建案例，禁用自动回馈，并将受损的控制器带到 LOADER 提示符处。LOADER 提示符是安全停止状态，您可以从中更换 FRU。

关于此任务

如果您使用的是SAN系统，则必须已检查受损控制器SCSI刀片的事件消息 cluster kernel-service show。 `cluster kernel-service show`命令(在priv高级模式下)可显示该节点的节点名称"仲裁状态"、该节点的可用性状态以及该节点的运行状态。

每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前，必须先解决所有问题。
If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述；请参见 "将节点与集群同步"。

步骤

如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例：

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

这可以防止在计划的维护时段内打开自动支持案例。最大抑制持续时间为 72 小时。如果维护提前完成，您可以通过调用带有 MAINT=END 的 AutoSupport 消息来重新启用案例创建。有关详细信息，请参见 "如何在计划维护窗口期间禁止自动创建案例"。

以下AutoSupport 消息禁止自动创建案例两小时：

cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
禁用自动交还：
1. 从健康控制器的控制台输入以下命令：
  
  storage failover modify -node impaired_node_name -auto-giveback false
2. 进入 `y`当您看到提示“您是否要禁用自动回馈？”时

将受损控制器显示为 LOADER 提示符：

如果受损控制器显示 … 那么 …

如果受损控制器显示 …	那么 …
LOADER 提示符	转至下一步。
正在等待交还	按 Ctrl-C ，然后在出现提示时回答 `y` 。
系统提示符或密码提示符	从运行正常的控制器接管或暂停受损控制器： `storage failover takeover -ofnode impaired_node_name -halt true` -halt true参数将进入Loader提示符。

LOADER 提示符

转至下一步。

正在等待交还

按 Ctrl-C ，然后在出现提示时回答 y 。

系统提示符或密码提示符

从运行正常的控制器接管或暂停受损控制器：

storage failover takeover -ofnode impaired_node_name -halt true

-halt true参数将进入Loader提示符。

选项 2 ：控制器位于 MetroCluster 中

If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述；请参见 "将节点与集群同步"。
您必须确认已配置MetroCluster配置状态、并且节点处于启用和正常状态：

metrocluster node show

步骤

如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例：

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

这可以防止在计划的维护时段内打开自动支持案例。最大抑制持续时间为 72 小时。如果维护提前完成，您可以通过调用带有 MAINT=END 的 AutoSupport 消息来重新启用案例创建。有关详细信息，请参见 "如何在计划维护窗口期间禁止自动创建案例"。

以下AutoSupport 消息禁止自动创建案例两小时：

cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
禁用自动交还：
1. 从健康控制器的控制台输入以下命令：
  
  storage failover modify -node local -auto-giveback false
2. 进入 `y`当您看到提示“您是否要禁用自动回馈？”时

将受损控制器显示为 LOADER 提示符：

如果受损控制器显示 … 那么 …

如果受损控制器显示 …	那么 …
LOADER 提示符	转至下一节。
正在等待交还	按 Ctrl-C ，然后在出现提示时回答 `y` 。
系统提示符或密码提示符（输入系统密码）	从运行正常的控制器接管或暂停受损控制器： `storage failover takeover -ofnode impaired_node_name -halt true` -halt true参数将进入Loader提示符。

LOADER 提示符

转至下一节。

正在等待交还

按 Ctrl-C ，然后在出现提示时回答 y 。

系统提示符或密码提示符（输入系统密码）

从运行正常的控制器接管或暂停受损控制器：

storage failover takeover -ofnode impaired_node_name -halt true

-halt true参数将进入Loader提示符。

步骤2：更换NVRAM模块或NVRAM DIMM

使用以下相应选项更换NVRAM模块或NVRAM DIMM。

选项1：更换NVRAM模块

要更换NVRAM模块、请在机箱的插槽4/5中找到该模块、然后按照特定步骤顺序进行操作。

步骤

如果您尚未接地，请正确接地。
从 PSU 上拔下电源线。
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
从机柜中卸下受损NVRAM模块：
1. 按下锁定凸轮按钮。
  
  凸轮按钮移离机柜。
2. 将凸轮闩锁向下旋转到最远位置。
3. 通过将手指插入凸轮拉杆开口并将受损NVRAM模块拉出机柜、从机柜中卸下受损NVRAM模块。
凸轮锁定按钮

DIMM锁定卡舌
将NVRAM模块放在稳定的表面上。
从受损NVRAM模块中逐一卸下DIMM、然后将其安装到更换用的NVRAM模块中。
将更换用的NVRAM模块安装到机柜中：
1. 将模块与插槽4/5中机箱开口的边缘对齐。
2. 将模块轻轻滑入插槽中、然后将凸轮闩锁一直向上旋转、以将模块锁定到位。
重新连接控制器。
将缆线管理托架向上旋转到关闭位置。

选项2：更换NVRAM DIMM

要更换NVRAM模块中的NVRAM DIMM、必须先卸下NVRAM模块、然后再更换目标DIMM。

步骤

如果您尚未接地，请正确接地。
从 PSU 上拔下电源线。
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
从机柜中卸下目标NVRAM模块。

凸轮锁定按钮

DIMM锁定卡舌
将NVRAM模块放在稳定的表面上。
找到NVRAM模块内要更换的DIMM。

请参阅NVRAM模块侧面的FRU示意图标签、以确定DIMM插槽1和2的位置。
向下按DIMM锁定卡舌并将DIMM从插槽中提出、以卸下DIMM。
安装更换用的 DIMM ，方法是将 DIMM 与插槽对齐，然后将 DIMM 轻轻推入插槽，直到锁定卡舌锁定到位。
将NVRAM模块安装到机柜中：
1. 将模块轻轻滑入插槽、直到凸轮闩锁开始与I/O凸轮销啮合、然后一直向上旋转凸轮闩锁以将模块锁定到位。
重新连接控制器。
将缆线管理托架向上旋转到关闭位置。

第3步：重新启动控制器

更换 FRU 后，必须将电源线重新插入 PSU 来重新启动控制器模块。

步骤

将电源线重新插入 PSU。

系统将开始重新启动、通常会显示加载程序提示符。
在加载程序提示符处输入_BYE_。
通过交还存储使受损控制器恢复正常运行： storage failover giveback -ofnode _impaired_node_name。
如果已禁用自动交还，请重新启用它： storage failover modify -node local -auto-giveback true。
如果启用了AutoSupport，则还原/取消禁止自动创建案例： system node autosupport invoke -node * -type all -message MAINT=END。

Step 4: Reassign disks

您必须在启动控制器时确认系统ID更改、然后验证是否已实施此更改。

只有在更换NVRAM模块时才需要重新分配磁盘、而不适用于NVRAM DIMM更换。

步骤

如果控制器处于维护模式(显示 *> 提示符)、请退出维护模式并转到加载程序提示符：_halt _
从控制器上的加载程序提示符处、启动控制器、并在系统因系统ID不匹配而提示覆盖系统ID时输入_y_。

等待直到等待返回… 消息、然后从运行状况良好的控制器确认已自动分配新的配对系统ID：storage Failover show

在命令输出中，您应看到一条消息，指出受损控制器上的系统 ID 已更改，其中显示了正确的旧 ID 和新 ID 。In the following example, node2 has undergone replacement and has a new system ID of 151759706.

node1:> storage failover show
                                    Takeover
Node              Partner           Possible     State Description
------------      ------------      --------     -------------------------------------
node1             node2             false        System ID changed on partner (Old:
                                                  151759755, New: 151759706), In takeover
node2             node1             -            Waiting for giveback (HA mailboxes)

交还控制器：
1. 从运行状况良好的控制器中、交还更换后的控制器的存储：storage故障转移gi交还-ofnode re更换节点名称
  
  控制器将收回其存储并完成启动。
  
  如果由于系统ID不匹配而提示您覆盖系统ID、则应输入_y_。
  
  如果交还被否决，您可以考虑覆盖此否决。
有关详细信息，请参见 "手动交还命令" 主题以覆盖否决。
1. 完成交还后、确认HA对运行状况良好且可以进行接管：storage Failover show
  
  storage failover show 命令的输出不应包含 System ID changed on partner 消息。

验证是否已正确分配磁盘： storage disk show -ownership

属于控制器的磁盘应显示新的系统ID。在以下示例中、node1拥有的磁盘现在显示新的系统ID 151759706：

node1:> storage disk show -ownership

Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
1.0.0  aggr0_1  node1 node1  -        151759706  151759706  -       151759706 Pool0
1.0.1  aggr0_1  node1 node1           151759706  151759706  -       151759706 Pool0
.
.
.

如果系统采用MetroCluster配置、请监控控制器的状态：nnode show MetroCluster

在更换后， MetroCluster 配置需要几分钟才能恢复到正常状态，此时，每个控制器将显示已配置状态，并启用 DR 镜像并显示正常模式。命令输出将 metrocluster node show -fields node-systemid 显示受损的系统ID、直到MetroCluster配置恢复正常状态为止。
如果控制器采用 MetroCluster 配置，则根据 MetroCluster 状态，如果原始所有者是灾难站点上的控制器，请验证 DR 主 ID 字段是否显示磁盘的原始所有者。

如果同时满足以下条件，则必须执行此操作：
- MetroCluster 配置处于切换状态。
- 控制器是灾难站点上磁盘的当前所有者。
  
  请参见 "在四节点 MetroCluster 配置中，磁盘所有权会在 HA 接管和 MetroCluster 切换期间发生更改" 有关详细信息 …

如果您的系统采用MetroCluster配置、请验证是否已配置每个控制器：nnode MetroCluster show - fields configure-state

node1_siteA::> metrocluster node show -fields configuration-state

dr-group-id            cluster node           configuration-state
-----------            ---------------------- -------------- -------------------
1 node1_siteA          node1mcc-001           configured
1 node1_siteA          node1mcc-002           configured
1 node1_siteB          node1mcc-003           configured
1 node1_siteB          node1mcc-004           configured

4 entries were displayed.

验证每个控制器是否存在所需的卷： vol show -node node-name
通过交还存储使受损控制器恢复正常运行： storage failover giveback -ofnode impaired_node_name。
如果已禁用自动交还，请重新启用它： storage failover modify -node local -auto-giveback true。
如果启用了AutoSupport，则还原/取消禁止自动创建案例： system node autosupport invoke -node * -type all -message MAINT=END。

第 5 步：将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。