使用带有system controller Replace命令的切换和切回升级四节点MetroCluster IP配置中的控制器(ONTAP 9.13.1及更高版本)
您可以使用此引导式自动MetroCluster 切换操作在四节点MetroCluster IP配置上执行无中断控制器升级。无法在此操作步骤中升级其他组件(例如存储架或交换机)。
支持使用system controller Replace命令升级MetroCluster IP控制器
从本节的MetroCluster控制器升级表中查找您的*Source*平台。如果*Source*平台行与*Target*平台列的交叉点为空,则不支持升级。
开始升级之前、请查看以下注意事项、以验证您的配置是否受支持。
-
如果未列出您的平台、则表示没有受支持的控制器升级组合。
-
执行控制器升级时,旧平台类型和新平台类型*Must*匹配:
-
您可以将FAS系统升级到FAS系统、或者将AFF A系列升级到AFF A系列。
-
您不能将FAS系统升级到AFF A系列、也不能将AFF A系列升级到AFF C系列。
例如、如果要升级的平台是FAS8200、则可以升级到FAS9000。您不能将FAS8200系统升级到AFF A700系统。
-
-
MetroCluster配置中的所有节点(旧节点和新节点)都必须运行相同版本的ONTAP。
下表显示了在MetroCluster IP配置中使用system controller Replace命令升级AFF或FAS系统时支持的平台组合:
-
注1:运行ONTAP 9.131或更高版本的系统支持控制器升级。
-
注2:目标平台必须在控制器升级完成后才能具有内部驱动器。您可以在升级后添加内部驱动器。
-
注3:需要更换控制器模块。
不支持在ASA系统上使用命令升级控制器 system controller replace
。
请参见 "选择升级或刷新方法" 以了解其他过程。
关于此任务
-
此操作步骤只能用于控制器升级。
无法同时升级配置中的其他组件,例如存储架或交换机。
-
升级配置中的现有控制器和新控制器必须支持MetroCluster IP交换机(交换机类型、供应商和型号)以及固件版本。
有关支持的交换机和固件版本、请参见 "NetApp Hardware Universe" 或 "IMT" 。
-
MetroCluster 系统必须在两个站点上运行相同版本的ONTAP。
-
您可以使用此操作步骤 通过基于NSO的自动切换和切回来升级四节点MetroCluster IP配置中的控制器。
四节点MetroCluster IP配置不支持使用聚合重新定位(ARL)和"system controller Replace commands"(system controller Replace命令)执行升级。 -
如果在系统上启用了此功能、则 "禁用端到端加密" 在执行升级之前执行此操作。
-
您必须使用自动化NSO控制器升级操作步骤 按顺序升级两个站点上的控制器。
-
此基于 NSO 的自动控制器升级操作步骤使您能够对 MetroCluster 灾难恢复( DR )站点启动控制器更换。一次只能在一个站点启动控制器更换。
-
要在站点 A 启动控制器更换,您需要从站点 B 运行 controller replacement start 命令此操作仅会指导您更换站点 A 上两个节点的控制器。要更换站点 B 的控制器,您需要从站点 A 运行 controller replacement start 命令此时将显示一条消息,指出要更换控制器的站点。
此操作步骤使用以下示例名称:
-
site_A
-
升级前:
-
node_A_1-old
-
node_A_2-old
-
-
升级后:
-
node_A_1-new
-
node_A_2-new
-
-
-
站点 B
-
升级前:
-
node_B_1-old
-
node_B_2-old
-
-
升级后:
-
node_B_1-new
-
node_B_2-new
-
-
启用控制台日志记录
NetApp强烈建议您在使用的设备上启用控制台日志记录、并在执行此过程时执行以下操作:
-
在维护期间保持AutoSupport处于启用状态。
-
在维护前后触发维护AutoSupport消息、以便在维护活动期间禁用案例创建。
请参阅知识库文章 "如何在计划的维护时段禁止自动创建案例"。
-
为任何命令行界面会话启用会话日志记录。有关如何启用会话日志记录的说明,请查看知识库文章中的“日志记录会话输出”部分 "如何配置PuTTY以优化与ONTAP系统的连接"。
在现有系统上设置所需的启动程序
如果要升级到AFF A70、AFF A90或AFF A1K系统、请按照以下步骤设置启动程序。 hw.cxgbe.toe_keepalive_disable=1
如果您要升级到AFF A70、AFF A90或AFF A1K系统,您*必须*在执行升级前完成此任务。此任务*仅*适用于从受支持的系统升级到AFF A70、AFF A90或AFF A1K系统。对于所有其他升级,您可以跳过此任务并直接转到 准备升级。。 |
-
暂停每个站点上的一个节点、并允许其HA配对节点对该节点执行存储接管:
halt -node <node_name>
-
在暂停节点的提示符处
LOADER
、输入以下内容:setenv hw.cxgbe.toe_keepalive_disable 1
saveenv
printenv hw.cxgbe.toe_keepalive_disable
-
启动节点:
boot_ontap
-
当节点启动时、在提示符处对节点执行一次返回:
storage failover giveback -ofnode <node_name>
-
对要升级的灾难恢复组中的每个节点重复上述步骤。
准备升级。
要为控制器升级做准备,您需要执行系统预检并收集配置信息。
在启动预检之前、如果安装了ONTAP 调解器、则会自动检测并删除该调解器。要确认删除、系统会提示您输入用户名和密码。完成升级后、或者如果预检失败或您选择不继续升级、则必须执行此操作 手动重新配置ONTAP 调解器。
在升级期间的任何阶段,您都可以从站点 A 运行 ssystem controller replace show
或 ssystem controller replace show-details
命令来检查状态。如果这些命令返回空白输出,请等待几分钟,然后重新运行此命令。
-
从站点 A 启动自动控制器更换操作步骤,以更换站点 B 的控制器:
system controller replace start -nso true
自动操作将执行预检。如果未发现任何问题,此操作将暂停,以便您可以手动收集与配置相关的信息。
-
如果不运行
system controller replace start -nso true
命令时、控制器升级操作步骤 会选择基于NSO的自动切换和切回作为MetroCluster IP系统上的默认操作步骤。 -
此时将显示当前源系统和所有兼容的目标系统。如果您将源控制器更换为 ONTAP 版本不同或平台不兼容的控制器,则在启动新节点后,自动化操作将暂停并报告错误。要将集群恢复为运行状况良好的状态,您需要按照手动恢复操作步骤进行操作。
scontroller replace start
命令可能会报告以下预检错误:Cluster-A::*>system controller replace show Node Status Error-Action ----------- -------------- ------------------------------------ Node-A-1 Failed MetroCluster check failed. Reason : MCC check showed errors in component aggregates
检查此错误是否是由于未镜像聚合或其他聚合问题描述而发生的。验证所有镜像聚合是否运行正常,并且未降级或镜像降级。如果此错误仅由未镜像聚合引起,则可以通过在
ssystem controller replace start
命令中选择 ` skip-metrocluster-check true` 选项来覆盖此错误。如果可以访问远程存储,则未镜像聚合会在切换后联机。如果远程存储链路发生故障,未镜像的聚合将无法联机。
-
-
s站点 B 并按照控制台消息中列出的命令在
system controller replace shows或
system controller replace show-details 命令下手动收集配置信息。
在升级之前收集信息
在升级之前,如果根卷已加密,则必须收集备份密钥和其他信息以使用旧的加密根卷启动新控制器。
此任务将对现有MetroCluster IP配置执行。
-
为现有控制器的缆线贴上标签,以便在设置新控制器时轻松识别缆线。
-
显示用于捕获备份密钥和其他信息的命令:
ssystem controller replace show
从配对集群运行
show
命令下列出的命令。。
show
命令输出显示三个表、其中包含MetroCluster 接口IP、系统ID和系统UID。稍后、要在启动新节点时设置bootargs、需要在操作步骤 中提供此信息。 -
收集 MetroCluster 配置中节点的系统 ID :
MetroCluster node show -fields node-systemID , dr-partner-systemID
在升级操作步骤期间、您将使用新控制器模块的系统ID替换这些旧系统ID。
在此示例中、对于四节点MetroCluster IP配置、将检索以下旧系统ID:
-
node_A_1-old : 4068741258
-
node_A_2-old : 4068741260
-
node_B_1-old : 4068741254
-
node_B_2-old : 4068741256
metrocluster-siteA::> metrocluster node show -fields node-systemid,ha-partner-systemid,dr-partner-systemid,dr-auxiliary-systemid dr-group-id cluster node node-systemid ha-partner-systemid dr-partner-systemid dr-auxiliary-systemid ----------- --------------- ---------- ------------- ------------------- ------------------- --------------------- 1 Cluster_A Node_A_1-old 4068741258 4068741260 4068741256 4068741256 1 Cluster_A Node_A_2-old 4068741260 4068741258 4068741254 4068741254 1 Cluster_B Node_B_1-old 4068741254 4068741256 4068741258 4068741260 1 Cluster_B Node_B_2-old 4068741256 4068741254 4068741260 4068741258 4 entries were displayed.
在此双节点MetroCluster IP配置示例中、检索到以下旧系统ID:
-
node_A_1 : 4068741258
-
node_B_1 : 4068741254
metrocluster node show -fields node-systemid,dr-partner-systemid dr-group-id cluster node node-systemid dr-partner-systemid ----------- ---------- -------- ------------- ------------ 1 Cluster_A Node_A_1-old 4068741258 4068741254 1 Cluster_B node_B_1-old - - 2 entries were displayed.
-
-
收集每个旧节点的端口和LIF信息。
您应收集每个节点的以下命令输出:
-
network interface show -role cluster , node-mgmt
-
network port show -node <node-name> -type physical
-
network port vlan show -node <node-name>
-
network port ifgrp show -node <node-name> -instance
-
network port broadcast-domain show
-
网络端口可访问性 show -detail
-
network IPspace show
-
volume show
-
s存储聚合显示
-
system node run -node <node-name> sysconfig -a
-
aggr show -r
-
d展示
-
system node run <node-name> disk show
-
vol show -fields type
-
vol show -fields type , space-guarantee
-
SVM FCP 启动程序 show
-
s存储磁盘显示
-
MetroCluster configuration-settings interface show
-
-
如果 MetroCluster 节点采用 SAN 配置,请收集相关信息。
您应收集以下命令的输出:
-
fcp adapter show -instance
-
fcp interface show -instance
-
iscsi interface show
-
ucadmin show
-
-
如果根卷已加密,请收集并保存用于 key-manager 的密码短语:
security key-manager backup show
-
如果 MetroCluster 节点对卷或聚合使用加密,请复制有关密钥和密码短语的信息。
对于追加信息,请参见 "手动备份板载密钥管理信息"。
-
如果配置了板载密钥管理器:
s安全密钥管理器板载 show-backup
您稍后将在升级操作步骤中需要此密码短语。
-
如果配置了企业密钥管理( KMIP ),请问题描述执行以下命令:
security key-manager external show -instance
s安全密钥管理器密钥查询
-
-
收集完配置信息后,恢复此操作:
s系统控制器更换恢复
从 Tiebreaker 或其他监控软件中删除现有配置
如果使用 MetroCluster Tiebreaker 配置或其他可启动切换的第三方应用程序(例如 ClusterLion )监控现有配置,则在更换旧控制器之前,必须先从 Tiebreaker 或其他软件中删除 MetroCluster 配置。
-
"删除现有 MetroCluster 配置" 来自 Tiebreaker 软件。
-
从可以启动切换的任何第三方应用程序中删除现有 MetroCluster 配置。
请参见该应用程序的文档。
更换旧控制器并启动新控制器
收集信息并恢复操作后,自动化将继续执行切换操作。
此自动化操作将启动切换操作。完成这些操作后、此操作会在*暂停以供用户干预*、以便您可以将控制器装入机架并进行安装、启动配对控制器、以及使用从闪存备份将根聚合磁盘重新分配给新控制器模块 sysids
已提前收集。
在启动切换之前,自动化操作将暂停,以便您可以手动验证站点 B 上的所有 LIF 是否为 "`up` "如有必要,请将任何 " down
" 移至 "`up` " ,然后使用 ssystem controller replace resume
命令恢复自动化操作。
准备旧控制器的网络配置
要确保新控制器上的网络连接恢复正常,必须将 LIF 移动到一个通用端口,然后删除旧控制器的网络配置。
-
必须对每个旧节点执行此任务。
-
您将使用中收集的信息 准备升级。。
-
启动旧节点,然后登录到这些节点:
boot_ontap
-
修改旧控制器上的集群间LUN、使其使用与新控制器上用于HA互连或MetroCluster IP DR互连的端口不同的主端口。
要成功升级、需要执行此步骤。 旧控制器上的集群间LUN必须使用与新控制器上用于HA互连或MetroCluster IP DR互连的端口不同的主端口。例如、在升级到AFF A90控制器时、HA互连端口为e1a和e7a、MetroCluster IP DR互连端口为e2b和e3b。如果旧控制器托管在端口e1a、e7a、e2b或e3b上、则必须移动这些控制器上的集群间LUN。
有关新节点上的端口分布和分配,请参阅 "NetApp Hardware Universe"。
-
在旧控制器上、查看集群间的Sifs:
network interface show -role intercluster
根据旧控制器上的集群间是否使用与新控制器上用于HA互连或MetroCluster IP DR互连的端口相同的端口、执行以下操作之一。
如果集群间的IFS… 转至 … 使用相同的主端口
使用其他主端口
-
[[controller_REPLACE _UPREPREPARE NETWORM_ports_2b]]修改集群间LI以使用其他主端口:
network interface modify -vserver <vserver> -lif <intercluster_lif> -home-port <port-not-used-for-ha-interconnect-or-mcc-ip-dr-interconnect-on-new-nodes>
-
验证所有集群间的SIFs是否都位于其新的主端口上:
network interface show -role intercluster -is-home false
此命令输出应为空、表示所有集群间的Rifs都位于各自的主端口上。
-
如果主端口上没有任何LUN、请使用以下命令将其还原:
network interface revert -lif <intercluster_lif>
对不在主端口上的每个集群间LIF重复此命令。
-
-
[[controller_Replace _upgrade prepare_network_ports_3]]将旧控制器上所有数据LI的主端口分配给新旧控制器模块上相同的通用端口。
-
显示 LIF :
network interface show
包括 SAN 和 NAS 在内的所有数据 LIF 都将为 admin "`up` " 和 Operationally "`down` " ,因为这些 LIF 在切换站点( cluster_A )上已启动。
-
查看输出以查找未用作集群端口的旧控制器和新控制器上相同的通用物理网络端口。
例如, "`e0d` " 是旧控制器上的物理端口,也存在于新控制器上。"`e0d` " 不会用作集群端口,也不会在新控制器上使用。
有关平台型号的端口使用情况,请参见 "NetApp Hardware Universe"
-
修改所有数据 LIF 以使用通用端口作为主端口:
network interface modify -vserver <svm-name> -lif <data-lif> -home-port <port-id>
在以下示例中,此值为 "`e0d` " 。
例如:
network interface modify -vserver vs0 -lif datalif1 -home-port e0d
-
-
修改广播域以删除需要删除的 VLAN 和物理端口:
broadcast-domain remove-ports -broadcast-domain <broadcast-domain-name>-ports <node-name:port-id>
对所有 VLAN 和物理端口重复此步骤。
-
删除使用集群端口作为成员端口的所有 VLAN 端口,以及使用集群端口作为成员端口的接口组。
-
删除 VLAN 端口:
network port vlan delete -node <node-name> -vlan-name <portid-vlandid>
例如:
network port vlan delete -node node1 -vlan-name e1c-80
-
从接口组中删除物理端口:
network port ifgrp remove-port -node <node-name> -ifgrp <interface-group-name> -port <portid>
例如:
network port ifgrp remove-port -node node1 -ifgrp a1a -port e0d
-
从广播域中删除VLAN和接口组端口:
network port broadcast-domain remove-ports -ipspace <ipspace> -broadcast-domain <broadcast-domain-name>-ports <nodename:portname,nodename:portname>,..
-
根据需要修改接口组端口以使用其他物理端口作为成员。:
ifgrp add-port -node <node-name> -ifgrp <interface-group-name> -port <port-id>
-
-
暂停节点:
halt -inhibit-takeover true -node <node-name>
必须在两个节点上执行此步骤。
-
验证节点是否位于提示符处
LOADER
、然后收集并保留当前环境变量。 -
收集 bootarg 值:
printenv
-
关闭要升级控制器的站点上的节点和磁盘架。
设置新控制器
您必须将新控制器装入机架并进行布线。
-
根据需要规划新控制器模块和存储架的位置。
机架空间取决于控制器模块的平台型号,交换机类型以及配置中的存储架数量。
-
正确接地。
-
如果您的升级需要更换控制器模块、例如、从AFF 800升级到AFF A90系统、则在更换控制器模块时、您必须从机箱中卸下控制器模块。对于所有其他升级,请跳至 第 4 步。
在机箱正面、用拇指用力推入每个驱动器、直到您感觉到有一定的停机。这可确认驱动器已牢固地固定在机箱中板上。
-
[[IP_U台 升级_REPLACE _4]]安装控制器模块。
您执行的安装步骤取决于您的升级是否需要更换控制器模块、例如从AFF 800升级到AFF A90系统。 需要更换控制器模块的升级单独安装新控制器不适用于磁盘和控制器位于同一机箱中的集成系统的升级、例如、从AFF A800系统升级到AFF A90系统。关闭旧控制器电源后、必须交换新控制器模块和I/O卡、如下图所示。
以下示例图像仅用于表示、控制器模块和I/O卡可能因系统而异。
所有其他升级在机架或机柜中安装控制器模块。
-
按照中所述、为控制器的电源、串行控制台和管理连接布线 "为MetroCluster IP交换机布线"
此时,请勿连接与旧控制器断开连接的任何其他缆线。
-
打开新节点的电源、并在系统提示时按Ctrl-C以显示
LOADER
提示符。
通过网络启动新控制器
安装新节点后,您需要通过网络启动来确保新节点运行的 ONTAP 版本与原始节点相同。术语 netboot 表示从远程服务器上存储的 ONTAP 映像启动。在准备网络启动时,您必须将 ONTAP 9 启动映像的副本放在系统可以访问的 Web 服务器上。
此任务将对每个新控制器模块执行。
-
访问 "NetApp 支持站点" 下载用于执行系统网络启动的文件。
-
从 NetApp 支持站点的软件下载部分下载相应的 ONTAP 软件,并将 ontap-version_image.tgz 文件存储在可通过 Web 访问的目录中。
-
转到可通过 Web 访问的目录,并验证所需文件是否可用。
您的目录列表应包含一个包含内核文件 ontap-version_image.tgz 的 netboot 文件夹
您不需要提取 ontap-version_image.tgz 文件。
-
在提示符处
LOADER
、为管理LIF配置网络启动连接:-
如果 IP 地址为 DHCP ,请配置自动连接:
ifconfig e0M -auto
-
如果 IP 地址是静态的,请配置手动连接:
ifconfig e0M -addr=ip_addr -mask=netmask
` gw=gateway`
-
-
执行网络启动。
netboot http://web_server_ip/path_to_web-accessible_directory/ontap-version_image.tgz
-
从启动菜单中,选择选项 * ( 7 ) Install new software first* ,将新软件映像下载并安装到启动设备。
Disregard the following message: "This procedure is not supported for Non-Disruptive Upgrade on an HA pair". It applies to nondisruptive upgrades of software, not to upgrades of controllers. . 如果系统提示您继续运行操作步骤,请输入 `y` ,然后在系统提示您输入软件包时,输入映像文件的 URL : ` \http://web_server_ip/path_to_web-accessible_directory/ontap-version_image.tgz`
Enter username/password if applicable, or press Enter to continue.
-
当您看到类似以下内容的提示时,请务必输入
n
以跳过备份恢复:Do you want to restore the backup configuration now? {y|n}
-
当您看到类似以下内容的提示时,输入
y
以重新启动:The node must be rebooted to start using the newly installed software. Do you want to reboot now? {y|n}
清除控制器模块上的配置
在 MetroCluster 配置中使用新控制器模块之前,必须清除现有配置。
-
如有必要,暂停节点以显示 LOADER 提示符:
halt
-
在 LOADER 提示符处,将环境变量设置为默认值:
set-defaults
-
保存环境:
saveenv
-
在 LOADER 提示符处,启动启动菜单:
boot_ontap 菜单
-
在启动菜单提示符处,清除配置:
wipeconfig
对确认提示回答
yes
。节点将重新启动,并再次显示启动菜单。
-
在启动菜单中,选择选项 * 5* 将系统启动至维护模式。
对确认提示回答
yes
。
还原 HBA 配置
根据控制器模块中是否存在 HBA 卡以及 HBA 卡的配置,您需要根据站点的使用情况正确配置这些卡。
-
在维护模式下,为系统中的任何 HBA 配置设置:
-
检查端口的当前设置:
ucadmin show
-
根据需要更新端口设置。
如果您具有此类型的 HBA 和所需模式 …
使用此命令 …
CNA FC
ucadmin modify -m fc -t initiator <adapter-name>
CNA 以太网
ucadmin modify -mode cna <adapter-name>
FC 目标
fcadmin config -t target <adapter-name>
FC 启动程序
fcadmin config -t initiator <adapter-name>
-
-
退出维护模式:
halt
运行命令后、请等待、直到节点停留在提示符处
LOADER
。 -
将节点重新启动至维护模式,以使配置更改生效:
boot_ontap maint
-
验证所做的更改:
如果您使用的是此类型的 HBA…
使用此命令 …
CNA
ucadmin show
FC
fcadmin show
在新控制器和机箱上设置 HA 状态
您必须验证控制器和机箱的 HA 状态,并在必要时更新此状态以匹配您的系统配置。
-
在维护模式下,显示控制器模块和机箱的 HA 状态:
ha-config show
所有组件的 HA 状态均应为
mCCIP
。 -
如果显示的控制器或机箱系统状态不正确,请设置 HA 状态:
ha-config modify controller mccip
ha-config modify chassis mccip
-
验证并修改连接到NS224磁盘架或存储交换机的以太网端口。
-
验证连接到NS224磁盘架或存储交换机的以太网端口:
storage port show
-
将连接到以太网磁盘架或存储交换机的所有以太网端口(包括用于存储和集群的共享交换机)设置为
storage
模式:storage port modify -p <port> -m storage
示例:
*> storage port modify -p e5b -m storage Changing NVMe-oF port e5b to storage mode
要成功升级、必须在所有受影响的端口上设置此值。 输出将报告连接到以太网端口的磁盘架中的磁盘
sysconfig -v
。
有关要升级到的系统的存储端口的信息、请参见 "NetApp Hardware Universe" 。
-
验证是否
storage
已设置模式、并确认端口是否处于联机状态:storage port show
-
-
暂停节点:
halt
节点应停止在
loader>
提示符处。 -
在每个节点上,检查系统日期,时间和时区:
show date
-
如有必要,请以 UTC 或 GMT 格式设置日期:
set date <MM/dd/yyy>
-
在启动环境提示符处使用以下命令检查时间:
show time
-
如有必要,请以 UTC 或 GMT 格式设置时间:
set time <hh : mm : ss>
-
保存设置:
saveenv
-
收集环境变量:
printenv
更新交换机 RCF 文件以适应新平台
您必须将交换机更新为支持新平台型号的配置。
您可以在包含当前正在升级的控制器的站点上执行此任务。在此操作步骤中显示的示例中,我们首先升级 site_B 。
当 site_A 上的控制器升级后, site_A 上的交换机将进行升级。
-
准备 IP 交换机以应用新的 RCF 文件。
按照适用于您的交换机供应商的部分中的步骤进行操作:
-
下载并安装 RCF 文件。
按照适用于您的交换机供应商的部分中的步骤进行操作:
设置 MetroCluster IP bootarg 变量
必须在新控制器模块上配置某些 MetroCluster IP bootarg 值。这些值必须与旧控制器模块上配置的值匹配。
在此任务中,您将使用中先前升级过程中确定的UID和系统ID 在升级之前收集信息。
-
在
loader>
提示符处,在 site_B 的新节点上设置以下 bootarg :setenv bootarg.mcc.port_a_ip_config <local-IP-address/local-IP-mask,0,HA-partner-IP-address,DR-partner-IP-address,DR-aux-partnerIP-address,vlan-id>
setenv bootarg.mcc.port_b_ip_config <local-IP-address/local-IP-mask,0,HA-partner-IP-address,DR-partner-IP-address,DR-aux-partnerIP-address,vlan-id>
以下示例将使用VLAN 120 (第一个网络)和VLAN 130 (第二个网络)为NODE_B_1设置值:
setenv bootarg.mcc.port_a_ip_config 172.17.26.10/23,0,172.17.26.11,172.17.26.13,172.17.26.12,120 setenv bootarg.mcc.port_b_ip_config 172.17.27.10/23,0,172.17.27.11,172.17.27.13,172.17.27.12,130
以下示例将使用VLAN 120 (第一个网络)和VLAN 130 (第二个网络)为NODE_B_2设置值:
setenv bootarg.mcc.port_a_ip_config 172.17.26.11/23,0,172.17.26.10,172.17.26.12,172.17.26.13,120 setenv bootarg.mcc.port_b_ip_config 172.17.27.11/23,0,172.17.27.10,172.17.27.12,172.17.27.13,130
以下示例将使用默认VLAN为所有MetroCluster IP DR连接设置NODE_B_1的值:
setenv bootarg.mcc.port_a_ip_config 172.17.26.10/23,0,172.17.26.11,172.17.26.13,172.17.26.12 setenv bootarg.mcc.port_b_ip_config 172.17.27.10/23,0,172.17.27.11,172.17.27.13,172.17.27.12
以下示例将使用默认VLAN为所有MetroCluster IP DR连接设置NODE_B_2的值:
setenv bootarg.mcc.port_a_ip_config 172.17.26.11/23,0,172.17.26.10,172.17.26.12,172.17.26.13 setenv bootarg.mcc.port_b_ip_config 172.17.27.11/23,0,172.17.27.10,172.17.27.12,172.17.27.13
-
在新节点的
LOADER
提示符处,设置 UUID :setenv bootarg.mgwd.partner_cluster_uuid <partner-cluster-UUID>
setenv bootarg.mgwd.cluster_uuid <local-cluster-UUID>
setenv bootarg.mcc.pri_partner_uuid <DR-partner-node-UUID>
setenv bootarg.mcc.aux_partner_uuid <DR-aux-partner-node-UUID>
setenv bootarg.mcc_iscsi.node_uuid <local-node-UUID>
-
设置NODE_B_1上的UID。
以下示例显示了用于设置NODE_B_1上的UID的命令:
setenv bootarg.mgwd.cluster_uuid ee7db9d5-9a82-11e7-b68b-00a098908039 setenv bootarg.mgwd.partner_cluster_uuid 07958819-9ac6-11e7-9b42-00a098c9e55d setenv bootarg.mcc.pri_partner_uuid f37b240b-9ac1-11e7-9b42-00a098c9e55d setenv bootarg.mcc.aux_partner_uuid bf8e3f8f-9ac4-11e7-bd4e-00a098ca379f setenv bootarg.mcc_iscsi.node_uuid f03cb63c-9a7e-11e7-b68b-00a098908039
-
设置NODE_B_2上的UID:
以下示例显示了用于设置NODE_B_2上的UID的命令:
setenv bootarg.mgwd.cluster_uuid ee7db9d5-9a82-11e7-b68b-00a098908039 setenv bootarg.mgwd.partner_cluster_uuid 07958819-9ac6-11e7-9b42-00a098c9e55d setenv bootarg.mcc.pri_partner_uuid bf8e3f8f-9ac4-11e7-bd4e-00a098ca379f setenv bootarg.mcc.aux_partner_uuid f37b240b-9ac1-11e7-9b42-00a098c9e55d setenv bootarg.mcc_iscsi.node_uuid aa9a7a7a-9a81-11e7-a4e9-00a098908c35
-
-
从已启动的站点运行以下命令、以确定原始系统是否配置了高级驱动器分区(ADP):
d展示
如果配置了ADP、则输出中的"container type"列将显示"shared"
disk show
。如果"container type"具有任何其他值、则系统上未配置ADP。以下示例输出显示了配置了ADP的系统:::> disk show Usable Disk Container Container Disk Size Shelf Bay Type Type Name Owner Info: This cluster has partitioned disks. To get a complete list of spare disk capacity use "storage aggregate show-spare-disks". ---------------- ---------- ----- --- ------- ----------- --------- -------- 1.11.0 894.0GB 11 0 SSD shared testaggr node_A_1 1.11.1 894.0GB 11 1 SSD shared testaggr node_A_1 1.11.2 894.0GB 11 2 SSD shared testaggr node_A_1
-
如果原始系统已配置ADP、则在每个替代节点的提示符处
LOADER
启用ADP:setenv bootarg.mcc.ADP 启用 true
-
设置以下变量:
setenv bootarg.mcc.local_config_id <original-sys-id>
setenv bootarg.mcc.dr_partner <dr-partner-sys-id>
。 setenv bootarg.mcc.local_config_id
变量必须设置为*ORIGINATI*控制器模块NODE_B_1的sys-id。-
在NODE_B_1上设置变量。
以下示例显示了用于设置NODE_B_1上的值的命令:
setenv bootarg.mcc.local_config_id 537403322 setenv bootarg.mcc.dr_partner 537403324
-
在NODE_B_2上设置变量。
以下示例显示了用于设置NODE_B_2上的值的命令:
setenv bootarg.mcc.local_config_id 537403321 setenv bootarg.mcc.dr_partner 537403323
-
-
如果对外部密钥管理器使用加密,请设置所需的 boottargets :
setenv bootarg.kmip.init.ipaddr
setenv bootarg.kmip.kmip.init.netmask
setenv bootarg.kmip.kmip.init.gateway
setenv bootarg.kmip.kmip.init.interface
重新分配根聚合磁盘
使用先前收集的 sysids
将根聚合磁盘重新分配给新控制器模块
此任务在维护模式下执行。
旧系统ID在中标识 在升级之前收集信息。
此操作步骤中的示例使用具有以下系统 ID 的控制器:
节点 |
旧系统 ID |
新系统 ID |
node_B_1 |
4068741254 |
1574774970 |
-
使用缆线将所有其他连接连接到新控制器模块( FC-VI ,存储,集群互连等)。
-
从
LOADER
提示符处暂停系统并启动到维护模式:boot_ontap maint
-
显示 node_B_1-old 拥有的磁盘:
d
展示 -A命令输出将显示新控制器模块( 1574774970 )的系统 ID 。但是,根聚合磁盘仍归旧系统 ID ( 4068741254 )所有。此示例不显示 MetroCluster 配置中其他节点拥有的驱动器。
在继续重新分配磁盘之前、必须验证属于节点根聚合的pool0和pool1磁盘是否显示在输出中 disk show
。在以下示例中、输出列出了由NODE_B_1-Oold拥有的pool0和pool1磁盘。*> disk show -a Local System ID: 1574774970 DISK OWNER POOL SERIAL NUMBER HOME DR HOME ------------ ------------- ----- ------------- ------------- ------------- ... rr18:9.126L44 node_B_1-old(4068741254) Pool1 PZHYN0MD node_B_1-old(4068741254) node_B_1-old(4068741254) rr18:9.126L49 node_B_1-old(4068741254) Pool1 PPG3J5HA node_B_1-old(4068741254) node_B_1-old(4068741254) rr18:8.126L21 node_B_1-old(4068741254) Pool1 PZHTDSZD node_B_1-old(4068741254) node_B_1-old(4068741254) rr18:8.126L2 node_B_1-old(4068741254) Pool0 S0M1J2CF node_B_1-old(4068741254) node_B_1-old(4068741254) rr18:8.126L3 node_B_1-old(4068741254) Pool0 S0M0CQM5 node_B_1-old(4068741254) node_B_1-old(4068741254) rr18:9.126L27 node_B_1-old(4068741254) Pool0 S0M1PSDW node_B_1-old(4068741254) node_B_1-old(4068741254) ...
-
将驱动器架上的根聚合磁盘重新分配给新控制器:
disk reassign -s <old-sysid> -d <new-sysid>
如果您的MetroCluster IP系统配置了高级磁盘分段功能、则必须通过运行来包含DR配对系统ID disk reassign -s old-sysid -d new-sysid -r dr-partner-sysid
命令:以下示例显示了驱动器的重新分配:
*> disk reassign -s 4068741254 -d 1574774970 Partner node must not be in Takeover mode during disk reassignment from maintenance mode. Serious problems could result!! Do not proceed with reassignment if the partner is in takeover mode. Abort reassignment (y/n)? n After the node becomes operational, you must perform a takeover and giveback of the HA partner node to ensure disk reassignment is successful. Do you want to continue (y/n)? Jul 14 19:23:49 [localhost:config.bridge.extra.port:error]: Both FC ports of FC-to-SAS bridge rtp-fc02-41-rr18:9.126L0 S/N [FB7500N107692] are attached to this controller. y Disk ownership will be updated on all disks previously belonging to Filer with sysid 4068741254. Do you want to continue (y/n)? y
-
检查是否已按预期重新分配所有磁盘:
d展示
*> disk show Local System ID: 1574774970 DISK OWNER POOL SERIAL NUMBER HOME DR HOME ------------ ------------- ----- ------------- ------------- ------------- rr18:8.126L18 node_B_1-new(1574774970) Pool1 PZHYN0MD node_B_1-new(1574774970) node_B_1-new(1574774970) rr18:9.126L49 node_B_1-new(1574774970) Pool1 PPG3J5HA node_B_1-new(1574774970) node_B_1-new(1574774970) rr18:8.126L21 node_B_1-new(1574774970) Pool1 PZHTDSZD node_B_1-new(1574774970) node_B_1-new(1574774970) rr18:8.126L2 node_B_1-new(1574774970) Pool0 S0M1J2CF node_B_1-new(1574774970) node_B_1-new(1574774970) rr18:9.126L29 node_B_1-new(1574774970) Pool0 S0M0CQM5 node_B_1-new(1574774970) node_B_1-new(1574774970) rr18:8.126L1 node_B_1-new(1574774970) Pool0 S0M1PSDW node_B_1-new(1574774970) node_B_1-new(1574774970) *>
-
显示聚合状态:
聚合状态
*> aggr status Aggr State Status Options aggr0_node_b_1-root online raid_dp, aggr root, nosnap=on, mirrored mirror_resync_priority=high(fixed) fast zeroed 64-bit
-
在配对节点( node_B_2-new )上重复上述步骤。
启动新控制器
您必须从启动菜单重新启动控制器,才能更新控制器闪存映像。如果配置了加密,则需要执行其他步骤。
您可以重新配置 VLAN 和接口组。如果需要,请在使用 ssystem controller replace resume
命令恢复操作之前手动修改集群 LIF 的端口和广播域详细信息。
必须对所有新控制器执行此任务。
-
暂停节点:
halt
-
如果配置了外部密钥管理器,请设置相关的 boottargets :
setenv bootarg.kmip.init.ipaddr <ip-address>
setenv bootarg.kmip.init.netmask <netmask>
setenv bootarg.kmip.init.gateway <gateway-address>
setenv bootarg.kmip.init.interface <interface-id>
-
显示启动菜单:
boot_ontap 菜单
-
如果使用根加密,请为密钥管理配置选择启动菜单选项。
如果您使用的是 …
选择此启动菜单选项 …
板载密钥管理
选项 "`10` "
按照提示提供恢复和还原密钥管理器配置所需的输入。
外部密钥管理
选项 "`11` "
按照提示提供恢复和还原密钥管理器配置所需的输入。
-
从启动菜单中,运行选项 "`6` " 。
选项 "`6` " 将在完成前重新启动节点两次。 对系统 ID 更改提示回答 "`y` " 。等待第二条重新启动消息:
Successfully restored env file from boot media... Rebooting to load the restored env file...
在选项"`6`"后的一次重新启动期间、将显示确认提示
Override system ID? {y|n}
显示。输入 …y
。 -
如果使用根加密,请为密钥管理配置再次选择启动菜单选项。
如果您使用的是 …
选择此启动菜单选项 …
板载密钥管理
选项 "`10` "
按照提示提供恢复和还原密钥管理器配置所需的输入。
外部密钥管理
选项 "`11` "
按照提示提供恢复和还原密钥管理器配置所需的输入。
根据密钥管理器设置,执行恢复操作步骤的方法是在第一个启动菜单提示符处选择选项 "`10` " 或选项 "`11` " ,然后选择选项 "`6` " 。要完全启动节点,您可能需要重复恢复操作步骤,然后选择 "`1` " (正常启动)。
-
启动节点:
boot_ontap
-
等待更换的节点启动。
如果任一节点处于接管模式,请使用
storage failover giveback
命令执行交还。 -
验证所有端口是否都位于广播域中:
-
查看广播域:
network port broadcast-domain show
-
如果为新升级的控制器上的数据端口创建了新的广播域、请删除此广播域:
仅删除新广播域。请勿删除在开始升级之前存在的任何广播域。 broadcast-domain delete -broadcast-domain <broadcast_domain_name>
-
根据需要向广播域添加任何端口。
-
将用于托管集群间LIF的物理端口添加到相应的广播域中。
-
修改集群间 LIF 以使用新的物理端口作为主端口。
-
集群间 LIF 启动后,检查集群对等状态,并根据需要重新建立集群对等关系。
您可能需要重新配置集群对等关系。
-
根据需要重新创建 VLAN 和接口组。
VLAN 和接口组成员资格可能与旧节点不同。
-
验证配对集群是否可访问、以及配置是否已在配对集群上成功重新同步:
metrocluster switchback -simulate true
-
-
如果使用加密,请使用适用于您的密钥管理配置的正确命令还原密钥。
如果您使用的是 …
使用此命令 …
板载密钥管理
sSecurity key-manager 板载同步
有关详细信息,请参见 "还原板载密钥管理加密密钥"。
外部密钥管理
`security key-manager external restore -vserver <svm-name> -node <node-name> -key-server <host_name
-
在恢复此操作之前,请验证是否已正确配置 MetroCluster 。检查节点状态:
MetroCluster node show
验证新节点( site_B )是否处于 * 正在等待 site_A 的切回状态 *
-
恢复操作:
s系统控制器更换恢复
完成升级
此自动化操作将运行验证系统检查,然后暂停,以便您可以验证网络可访问性。验证后,将启动资源重新获取阶段,自动化操作将在站点 A 执行切回,并在升级后检查时暂停。恢复自动化操作后,它将执行升级后检查,如果未检测到错误,则会将升级标记为完成。
-
按照控制台消息验证网络可访问性。
-
完成验证后,恢复此操作:
s系统控制器更换恢复
-
此时将执行自动化操作
heal-aggregate
, `heal-root-aggregate`和站点A上的切回操作以及升级后检查。操作暂停后,手动检查 SAN LIF 状态,并按照控制台消息验证网络配置。 -
完成验证后,恢复此操作:
s系统控制器更换恢复
-
检查升级后检查状态:
ssystem controller replace show
如果升级后检查未报告任何错误,则说明升级已完成。
-
完成控制器升级后,登录站点 B 并验证是否已正确配置更换的控制器。
还原 Tiebreaker 监控
如果先前已将 MetroCluster 配置配置为由 Tiebreaker 软件监控,则可以还原 Tiebreaker 连接。
-
使用中的步骤 "正在添加 MetroCluster 配置"。
配置端到端加密
如果系统支持、则可以对MetroCluster IP站点之间的后端流量(例如NVlog和存储复制数据)进行加密。请参见 "配置端到端加密" 有关详细信息 …