简体中文版经机器翻译而成，仅供参考。如与英语版出现任何冲突，应以英语版为准。

更换NVRAM - AFF C80

07/10/2026 贡献者

PDF

当非易失性存储器出现故障或需要升级时，请更换AFF C80 系统中的NVRAM 。更换过程包括关闭受损的控制器、将控制器拉出几英寸以完全切断电源、更换NVRAM模块或NVRAM DIMM、重新分配磁盘，以及将故障部件返回给NetApp。

开始之前

确保您已准备好更换部件。您必须使用从NetApp收到的更换组件来更换故障组件。
确保存储系统中的所有其他组件均正常运行；如果未正常运行，请联系 "NetApp 支持"。

第 1 步：关闭受损控制器

使用以下选项之一关闭或接管受损控制器。

选项 1 ：大多数系统

接管并停止受损的控制器，以便健康控制器继续从受损的控制器的存储中提供数据。为此，您需要在 AutoSupport 中禁止自动创建案例，禁用自动回馈，并将受损的控制器带到 LOADER 提示符处。LOADER 提示符是安全停止状态，您可以从中更换 FRU。

关于此任务

如果您使用的是SAN系统，则必须已检查受损控制器SCSI刀片的事件消息 cluster kernel-service show。 `cluster kernel-service show`命令(在priv高级模式下)可显示该节点的节点名称"仲裁状态"、该节点的可用性状态以及该节点的运行状态。

每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前，必须先解决所有问题。
If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述；请参见 "将节点与集群同步"。

步骤

如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例：

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

这可以防止在计划的维护时段内打开自动支持案例。最大抑制持续时间为 72 小时。如果维护提前完成，您可以通过调用带有 MAINT=END 的 AutoSupport 消息来重新启用案例创建。有关详细信息，请参见 "如何在计划维护窗口期间禁止自动创建案例"。

以下AutoSupport 消息禁止自动创建案例两小时：

cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h
禁用自动交还：
1. 从健康控制器的控制台输入以下命令：
  
  storage failover modify -node impaired_node_name -auto-giveback false
2. 进入 `y`当您看到提示“您是否要禁用自动回馈？”时

将受损控制器显示为 LOADER 提示符：

如果受损控制器显示 … 那么 …

如果受损控制器显示 …	那么 …
LOADER 提示符	转至下一步。
正在等待交还	按 Ctrl-C ，然后在出现提示时回答 `y` 。
系统提示符或密码提示符	从运行正常的控制器接管或暂停受损控制器： `storage failover takeover -ofnode impaired_node_name -halt true` -halt true参数将进入Loader提示符。

LOADER 提示符

转至下一步。

正在等待交还

按 Ctrl-C ，然后在出现提示时回答 y 。

系统提示符或密码提示符

从运行正常的控制器接管或暂停受损控制器：

storage failover takeover -ofnode impaired_node_name -halt true

-halt true参数将进入Loader提示符。

选项 2 ：控制器位于 MetroCluster 中

If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述；请参见 "将节点与集群同步"。
您必须确认已配置MetroCluster配置状态、并且节点处于启用和正常状态：

metrocluster node show

步骤

如果启用了AutoSupport 、则通过调用AutoSupport 消息禁止自动创建案例：

system node autosupport invoke -node * -type all -message MAINT=<number of hours down>h

这可以防止在计划的维护时段内打开自动支持案例。最大抑制持续时间为 72 小时。如果维护提前完成，您可以通过调用带有 MAINT=END 的 AutoSupport 消息来重新启用案例创建。有关详细信息，请参见 "如何在计划维护窗口期间禁止自动创建案例"。

以下AutoSupport 消息禁止自动创建案例两小时：

cluster1:*> system node autosupport invoke -node * -type all -message MAINT=2h
禁用自动交还：
1. 从健康控制器的控制台输入以下命令：
  
  storage failover modify -node local -auto-giveback false
2. 进入 `y`当您看到提示“您是否要禁用自动回馈？”时

将受损控制器显示为 LOADER 提示符：

如果受损控制器显示 … 那么 …

如果受损控制器显示 …	那么 …
LOADER 提示符	转至下一节。
正在等待交还	按 Ctrl-C ，然后在出现提示时回答 `y` 。
系统提示符或密码提示符（输入系统密码）	从运行正常的控制器接管或暂停受损控制器： `storage failover takeover -ofnode impaired_node_name -halt true` -halt true参数将进入Loader提示符。

LOADER 提示符

转至下一节。

正在等待交还

按 Ctrl-C ，然后在出现提示时回答 y 。

系统提示符或密码提示符（输入系统密码）

从运行正常的控制器接管或暂停受损控制器：

storage failover takeover -ofnode impaired_node_name -halt true

-halt true参数将进入Loader提示符。

步骤2：更换NVRAM模块或NVRAM DIMM

使用适当的选项更换NVRAM模块或NVRAM DIMM。

在安装和维护过程中，请始终佩戴连接到已验证接地点的接地腕带。未遵循正确的 ESD 预防措施可能会对控制器节点、存储架和网络交换机造成永久性损坏。

NVRAM 模块不可热插拔。在更换之前，请重新拔插驱动器，关闭节点，拔下控制器电源，然后将控制器从机箱中拉出几英寸。

选项1：更换NVRAM模块

要更换NVRAM模块、请在机箱的插槽4/5中找到该模块、然后按照特定步骤顺序进行操作。

使用拇指推动每个驱动器、直至感觉到强制停止、以确保机箱中的所有驱动器都牢固地固定在中板上。

视频 - 确认驾驶员座椅
根据系统状态检查控制器驱动器：
1. 在运行正常的控制器上，检查是否存在任何处于降级状态、故障状态或两者兼有的状态：
  storage aggregate show -raidstatus !*normal*
  - 如果命令返回 `There are no entries matching your query.`继续进入下一个子步骤，检查是否存在缺失的驱动器。。
  - 如果该命令返回任何其他结果，请从两个控制器收集AutoSupport数据，并联系NetApp支持部门以获取进一步帮助。
    
    system node autosupport invoke -node * -type all -message '<message_name>'
2. 检查文件系统或备用驱动器是否存在缺失驱动器问题：
  event log show -severity * -node * -message-name *disk.missing*
  - 如果命令返回 `There are no entries matching your query.`继续进入下一步。
  - 如果该命令返回任何其他结果，请从两个控制器收集AutoSupport数据，并联系NetApp支持部门以获取进一步帮助。
    
    system node autosupport invoke -node * -type all -message '<message_name>'
前往底盘后方。
拔下控制器的 PSU。

如果您的系统使用直流电源、请断开电源块与PSU的连接。
按下控制器上的两个锁定闩锁，同时向下旋转两个闩锁，然后将控制器拉出约 3 或 4 英寸。
向下旋转缆线管理托架、方法是拉动缆线管理托架内部的按钮、然后向下旋转。
从机箱中删除目标 NVRAM 模块：
1. 按下凸轮闩锁按钮。
  
  凸轮按钮离开机箱。
2. 将凸轮闩锁旋转到最远位置。
3. 从机箱中卸下受损NVRAM模块、方法是将手指插入凸轮拉杆开口并将模块拉出机箱。
凸轮锁定按钮

DIMM锁定卡舌
将NVRAM模块放在稳定的表面上。
从受损NVRAM模块中逐一卸下DIMM、然后将其安装到更换用的NVRAM模块中。
将更换用的 NVRAM 模块安装到机箱中：
1. 将模块与插槽4/5中机箱开口的边缘对齐。
2. 将模块轻轻滑入插槽中、然后将凸轮闩锁一直向上推、以将模块锁定到位。
重新安装控制器模块。控制器完全插入后立即重新启动。
1. 将控制器模块牢牢推入机箱，直到它与中板相距并完全就位。
  
  控制器模块完全就位后，锁定闩锁会上升。
将控制器模块滑入机箱时，请勿用力过大，以免损坏连接器。
1. 将锁定闩锁向上旋转到锁定位置。
将电源线插入电源。

如果您有直流电源，请将电源块重新连接到电源。
将缆线管理托架向上旋转到关闭位置。
通过交还存储使受损控制器恢复正常运行： storage failover giveback -ofnode impaired_node_name。
如果已禁用自动交还，请重新启用它： storage failover modify -node local -auto-giveback true。
如果启用了AutoSupport，则还原/取消禁止自动创建案例： system node autosupport invoke -node * -type all -message MAINT=END。

选项2：更换NVRAM DIMM

要更换 NVRAM 模块中的 NVRAM DIMM，首先必须卸下 NVRAM 模块，然后更换目标 DIMM。

如果您尚未接地，请正确接地。
使用拇指推动每个驱动器、直至感觉到强制停止、以确保机箱中的所有驱动器都牢固地固定在中板上。

视频 - 确认驾驶员座椅
根据系统状态检查控制器驱动器：
1. 在运行正常的控制器上，检查是否存在任何处于降级状态、故障状态或两者兼有的状态：
  storage aggregate show -raidstatus !*normal*
  - 如果命令返回 `There are no entries matching your query.`继续进入下一个子步骤，检查是否存在缺失的驱动器。。
  - 如果该命令返回任何其他结果，请从两个控制器收集AutoSupport数据，并联系NetApp支持部门以获取进一步帮助。
    
    system node autosupport invoke -node * -type all -message '<message_name>'
2. 检查文件系统或备用驱动器是否存在缺失驱动器问题：
  event log show -severity * -node * -message-name *disk.missing*
  - 如果命令返回 `There are no entries matching your query.`继续进入下一步。
  - 如果该命令返回任何其他结果，请从两个控制器收集AutoSupport数据，并联系NetApp支持部门以获取进一步帮助。
    
    system node autosupport invoke -node * -type all -message '<message_name>'
前往底盘后方。
拔下控制器的 PSU。

如果您的系统使用直流电源、请断开电源块与PSU的连接。
按下控制器上的两个锁定闩锁，同时向下旋转两个闩锁，然后将控制器拉出约 3 或 4 英寸。
轻轻拉动缆线管理托架两端的插销并向下旋转托架、向下旋转该托架。
从机箱中删除目标 NVRAM 模块：
1. 按下凸轮按钮。
  
  凸轮按钮离开机箱。
2. 将凸轮闩锁旋转到最远位置。
3. 从机箱中卸下NVRAM模块、方法是将手指插入凸轮拉杆开口并将模块拉出机箱。
凸轮锁定按钮

DIMM锁定卡舌
将NVRAM模块放在稳定的表面上。
找到NVRAM模块内要更换的DIMM。

请参阅NVRAM模块侧面的FRU示意图标签、以确定DIMM插槽1和2的位置。
向下按DIMM锁定卡舌并将DIMM从插槽中提出、以卸下DIMM。
安装更换用的 DIMM ，方法是将 DIMM 与插槽对齐，然后将 DIMM 轻轻推入插槽，直到锁定卡舌锁定到位。
将 NVRAM 模块安装到机箱中：
1. 将模块轻轻滑入插槽、直到凸轮闩锁开始与I/O凸轮销啮合、然后一直向上旋转凸轮闩锁以将模块锁定到位。
重新安装控制器模块。控制器完全插入后立即重新启动。
1. 将控制器模块牢牢推入机箱，直到它与中板相距并完全就位。
  
  控制器模块完全就位后，锁定闩锁会上升。
将控制器模块滑入机箱时，请勿用力过大，以免损坏连接器。
1. 将锁定闩锁向上旋转到锁定位置。
将电源线插入电源。

如果您有直流电源，请将电源块重新连接到电源。
将缆线管理托架向上旋转到关闭位置。
通过交还存储使受损控制器恢复正常运行： storage failover giveback -ofnode impaired_node_name。
如果已禁用自动交还，请重新启用它： storage failover modify -node local -auto-giveback true。
如果启用了AutoSupport，则还原/取消禁止自动创建案例： system node autosupport invoke -node * -type all -message MAINT=END。

Step 3: Reassign disks

您必须在启动控制器时确认系统ID更改、然后验证是否已实施此更改。

只有在更换NVRAM模块时才需要重新分配磁盘、而不适用于NVRAM DIMM更换。

步骤

如果控制器处于维护模式（显示 `*>`提示符），退出维护模式并进入 LOADER 提示符：

halt
从控制器上的加载程序提示符处、启动控制器、并在系统因系统ID不匹配而提示覆盖系统ID时输入_y_。

等到更换模块的控制器控制台上显示等待交还消息，然后从健康的控制器验证是否已自动分配新的合作伙伴系统 ID：

storage failover show

在命令输出中，您应该看到一条消息，表明受损控制器上的系统 ID 已更改，并显示正确的旧 ID 和新 ID。在以下示例中，节点 2 已完成替换，并具有新的系统 ID 151759706。

node1:> storage failover show
                                    Takeover
Node              Partner           Possible     State Description
------------      ------------      --------     -------------------------------------
node1             node2             false        System ID changed on partner (Old:
                                                  151759755, New: 151759706), In takeover
node2             node1             -            Waiting for giveback (HA mailboxes)

交还控制器：
1. 从正常运行的控制器中，归还已更换控制器的存储：
  
  storage failover giveback -ofnode replacement_node_name
  
  控制器将收回其存储并完成启动。
  
  如果由于系统ID不匹配而提示您覆盖系统ID、则应输入_y_。
  
  如果交还被否决，您可以考虑覆盖此否决。
有关详细信息，请参阅 "手动交还命令"推翻否决。
1. 完成交还后、确认HA对运行状况良好且可以进行接管：storage Failover show
  
  storage failover show 命令的输出不应包含 System ID changed on partner 消息。

验证磁盘是否已正确分配：

storage disk show -ownership

属于控制器的磁盘应显示新的系统ID。在以下示例中、node1拥有的磁盘现在显示新的系统ID 151759706：

node1:> storage disk show -ownership

Disk  Aggregate Home  Owner  DR Home  Home ID    Owner ID  DR Home ID Reserver  Pool
----- ------    ----- ------ -------- -------    -------    -------  ---------  ---
1.0.0  aggr0_1  node1 node1  -        151759706  151759706  -       151759706 Pool0
1.0.1  aggr0_1  node1 node1           151759706  151759706  -       151759706 Pool0
.
.
.

如果系统采用MetroCluster配置、请监控控制器的状态：nnode show MetroCluster

在更换后， MetroCluster 配置需要几分钟才能恢复到正常状态，此时，每个控制器将显示已配置状态，并启用 DR 镜像并显示正常模式。The metrocluster node show -fields node-systemid command output displays the old system ID until the MetroCluster configuration returns to a normal state.
如果控制器采用 MetroCluster 配置，则根据 MetroCluster 状态，如果原始所有者是灾难站点上的控制器，请验证 DR 主 ID 字段是否显示磁盘的原始所有者。

如果同时满足以下条件，则必须执行此操作：
- MetroCluster 配置处于切换状态。
- 控制器是灾难站点上磁盘的当前所有者。
  
  请参见 "在四节点 MetroCluster 配置中，磁盘所有权会在 HA 接管和 MetroCluster 切换期间发生更改" 有关详细信息 …

如果您的系统采用MetroCluster配置、请验证是否已配置每个控制器：nnode MetroCluster show - fields configure-state

node1_siteA::> metrocluster node show -fields configuration-state

dr-group-id            cluster node           configuration-state
-----------            ---------------------- -------------- -------------------
1 node1_siteA          node1mcc-001           configured
1 node1_siteA          node1mcc-002           configured
1 node1_siteB          node1mcc-003           configured
1 node1_siteB          node1mcc-004           configured

4 entries were displayed.

验证每个控制器是否存在预期的卷：

vol show -node node-name
如果启用了存储加密、则必须还原功能。
通过交还存储使受损控制器恢复正常运行：

storage failover giveback -ofnode impaired_node_name(英文)
如果已禁用自动交还、请重新启用它：

storage failover modify -node local -auto-giveback true(英文)
如果启用了AutoSupport、则还原/取消禁止自动创建案例：

system node autosupport invoke -node * -type all -message MAINT=END(英文)

第 4 步：将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。 "部件退回和更换"有关详细信息、请参见页面。

更换NVRAM - AFF C80

Creating your file...

第 1 步：关闭受损控制器

步骤2：更换NVRAM模块或NVRAM DIMM

Step 3: Reassign disks

第 4 步：将故障部件退回 NetApp