准备要升级的节点
更换控制器的过程从一系列预检开始。此外、您还会收集有关原始节点的信息、以供稍后在操作步骤中使用、并根据需要确定正在使用的自加密驱动器的类型。
-
列出在旧控制器上运行的服务处理器(SP)或底板管理控制器(BMC)固件版本:
service-processor show
验证是否具有受支持的SP或BMC固件版本:
旧控制器 SP或BMC 最低固件版本 AFF A800
BMC
10.9
AFF A220
BMC
11.9P1
AFF A200
SP
5.11P1
AFF C190
BMC
11.9P1
FAS2620
SP
5.11P1
FAS2720
BMC
11.9P1
-
在 ONTAP 命令行的高级权限模式下输入以下命令,开始控制器更换过程:
set -privilege advanced
ssystem controller replace start -nodes node_names
您将看到类似于以下示例的输出。输出将显示集群上运行的ONTAP版本:
Warning: 1. Current ONTAP version is 9.15.1 2. Verify that NVMEM or NVRAM batteries of the new nodes are charged, and charge them if they are not. You need to physically check the new nodes to see if the NVMEM or NVRAM batteries are charged. You can check the battery status either by connecting to a serial console or using SSH, logging into the Service Processor (SP) or Baseboard Management Controller (BMC) for your system, and use the system sensors to see if the battery has a sufficient charge. Attention: Do not try to clear the NVRAM contents. If there is a need to clear the contents of NVRAM, contact NetApp technical support. 3. If a controller was previously part of a different cluster, run wipeconfig before using it as the replacement controller. 4. Note: This is not a MetroCluster configuration. Controller replacement supports only ARL based procedures. Do you want to continue? {y|n}: y
-
选择
y
。您将看到以下输出:Controller replacement operation: Prechecks in progress. Controller replacement operation has been paused for user intervention.
在预检查阶段,系统会在后台运行以下检查列表。
预检查 Description 集群运行状况检查
检查集群中的所有节点以确认其运行状况良好。
聚合重新定位状态检查
检查聚合重新定位是否已在进行中。如果正在进行另一个聚合重新定位,则检查将失败。
型号名称检查
检查此操作步骤是否支持这些控制器型号。如果不支持这些型号,则此任务将失败。
集群仲裁检查
检查要更换的节点是否处于仲裁状态。如果节点未处于仲裁状态,则此任务将失败。
映像版本检查
检查要更换的节点是否运行相同版本的 ONTAP 。如果 ONTAP 映像版本不同,则此任务将失败。新节点上安装的 ONTAP 9.x 版本必须与原始节点上安装的版本相同。如果新节点安装的 ONTAP 版本不同,则在安装新控制器后,需要通过网络启动这些控制器。有关如何升级 ONTAP 的说明,请参见 "参考资料" 链接到 _Upgrade ONTAP 。
HA 状态检查
检查要更换的两个节点是否采用高可用性( HA )对配置。如果未为控制器启用存储故障转移,则任务将失败。
聚合状态检查
如果要更换的节点自身的聚合不是主所有者,则此任务将失败。节点不应拥有任何非本地聚合。
磁盘状态检查
如果要更换的任何节点缺少磁盘或磁盘出现故障,则此任务将失败。如果缺少任何磁盘、请参见"参考资料"链接到_Disk and聚合管理(使用命令行界面_)、逻辑存储管理(使用命令行界面_)和_HA对管理_、以便为HA对配置存储。
数据 LIF 状态检查
检查要更换的任何节点是否具有非本地数据 LIF 。节点不应包含其不是主所有者的任何数据 LIF 。如果其中一个节点包含非本地数据 LIF ,则任务将失败。
集群 LIF 状态
检查两个节点的集群 LIF 是否均已启动。如果集群 LIF 已关闭,则此任务将失败。
ASUP 状态检查
如果未配置 AutoSupport 通知,则任务将失败。在开始更换控制器操作步骤 之前,必须启用 AutoSupport 。
CPU 利用率检查
检查要更换的任何节点的 CPU 利用率是否超过 50% 。如果 CPU 使用率在相当长的一段时间内超过 50% ,则此任务将失败。
聚合重建检查
检查是否正在任何数据聚合上进行重建。如果正在进行聚合重建,则此任务将失败。
节点关联性作业检查
检查是否正在运行任何节点关联作业。如果节点关联性作业正在运行,则检查将失败。
-
在启动控制器更换操作并完成预检后,此操作将暂停,以便收集稍后在控制器升级过程中可能需要的输出信息。
-
按照系统控制台上控制器更换操作步骤的指示运行以下一组命令。
从连接到每个节点的串行端口运行命令、分别运行并保存命令的输出:
-
vserver services name-service dns show
-
network interface show -curr-node local -role cluster,intercluster,node-mgmt,cluster-mgmt,data
-
network port show -node local -type physical
-
service-processor show -node local -instance
-
network fcp adapter show -node local
-
network port ifgrp show -node local
-
system node show -instance -node local
-
run -node local sysconfig
-
run -node local sysconfig -ac
-
run -node local aggr status -r
-
vol show -fields type
-
run local aggr options data_aggregate_name
-
vol show -fields type , space-guarantee
-
storage aggregate show -node local
-
volume show -node local
-
storage array config show -switch switch_name
-
system license show -owner local
-
s存储加密磁盘 show
-
s安全密钥管理器板载 show-backup
-
security key-manager external show
-
s安全密钥管理器外部 show-status
-
network port reachability show -detail -node local
如果正在使用板载密钥管理器进行NetApp卷加密(NVE)或NetApp聚合加密(NAE)、请保留密钥管理器密码短语、以便稍后在操作步骤中完成密钥管理器重新同步。
-
-
如果您的系统使用自加密驱动器、请参见知识库文章 "如何判断驱动器是否已通过FIPS认证" 确定要升级的HA对上使用的自加密驱动器的类型。ONTAP 软件支持两种类型的自加密驱动器:
-
经FIPS认证的NetApp存储加密(NSE) SAS或NVMe驱动器
-
非FIPS自加密NVMe驱动器(SED)
不能在同一节点或HA对上混用FIPS驱动器和其他类型的驱动器。
您可以在同一节点或HA对上混用SED和非加密驱动器。
-
如果 ARL 预检失败,请更正聚合所有权
如果聚合状态检查失败,您必须将配对节点拥有的聚合返回到主所有者节点,然后重新启动预检过程。
-
将配对节点当前拥有的聚合返回到主所有者节点:
s存储聚合重新定位start -node source_node-destination destination-node-aggregate-list *
-
验证 node1 和 node2 均不拥有其当前所有者(而不是主所有者)的聚合:
storage aggregate show -nodes node_name-is-home false -fields owner-name、home-name、state
以下示例显示了当节点同时是聚合的当前所有者和主所有者时命令的输出:
cluster::> storage aggregate show -nodes node1 -is-home true -fields owner-name,home-name,state aggregate home-name owner-name state --------- --------- ---------- ------ aggr1 node1 node1 online aggr2 node1 node1 online aggr3 node1 node1 online aggr4 node1 node1 online 4 entries were displayed.
完成后
您必须重新启动控制器更换过程:
ssystem controller replace start -nodes node_names