还原ONTAP集群之前要执行的系统验证
在还原ONTAP集群之前、您应验证集群运行状况、存储运行状况和系统时间。您还应验证集群上是否未运行任何作业。
验证集群运行状况
在还原ONTAP集群之前、您应验证节点是否运行状况良好、是否有资格加入集群、以及集群是否处于仲裁状态。
-
验证集群中的节点是否已联机且符合加入集群的条件:
cluster show
在此示例中、所有节点均运行状况良好、有资格加入集群。
cluster1::> cluster show Node Health Eligibility --------------------- ------- ------------ node0 true true node1 true true
如果任何节点运行状况不正常或不符合条件,请检查 EMS 日志中的错误并采取更正措施。
-
将权限级别设置为高级:
set -privilege advanced
输入 …
y
以继续。 -
验证每个 RDB 进程的配置详细信息。
-
每个节点的关系数据库 epoch 和数据库 epochs 应匹配。
-
所有节点的每环仲裁主机都应相同。
请注意,每个环可能具有不同的仲裁主环。
要显示此 RDB 进程 … 输入此命令 … 管理应用程序
cluster ring show -unitname mgmt
卷位置数据库
cluster ring show -unitname vldb
虚拟接口管理器
cluster ring show -unitname vifmgr
SAN 管理守护进程
cluster ring show -unitname bcomd
此示例显示了卷位置数据库过程:
cluster1::*> cluster ring show -unitname vldb Node UnitName Epoch DB Epoch DB Trnxs Master Online --------- -------- -------- -------- -------- --------- --------- node0 vldb 154 154 14847 node0 master node1 vldb 154 154 14847 node0 secondary node2 vldb 154 154 14847 node0 secondary node3 vldb 154 154 14847 node0 secondary 4 entries were displayed.
-
-
返回到管理权限级别:
set -privilege admin
-
如果您在 SAN 环境中运行,请验证每个节点是否处于 SAN 仲裁状态:
event log show -severity informational -message-name scsiblade.*
每个节点的最新 scsiblade 事件消息应指示 SCSI 刀片处于仲裁状态。
cluster1::*> event log show -severity informational -message-name scsiblade.* Time Node Severity Event --------------- ---------- -------------- --------------------------- MM/DD/YYYY TIME node0 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ... MM/DD/YYYY TIME node1 INFORMATIONAL scsiblade.in.quorum: The scsi-blade ...
验证存储运行状况
还原ONTAP集群之前、您应验证磁盘、聚合和卷的状态。
-
验证磁盘状态:
要检查 … 执行此操作 … 磁盘已损坏
-
显示任何损坏的磁盘:
storage disk show -state broken
-
卸下或更换任何损坏的磁盘。
正在进行维护或重建的磁盘
-
显示处于维护,待定或重建状态的任何磁盘:
storage disk show -state maintenance
pending
reconstructing ---- .. 等待维护或重建操作完成,然后再继续。
-
-
通过显示物理和逻辑存储(包括存储聚合)的状态来验证所有聚合是否均已联机:+
storage aggregate show -state !online
此命令将显示 not 联机的聚合。在执行重大升级或还原之前和之后,所有聚合都必须处于联机状态。
cluster1::> storage aggregate show -state !online There are no entries matching your query.
-
通过显示任何 not 联机的卷来验证所有卷是否均已联机:
volume show -state !online
在执行重大升级或还原之前和之后,所有卷都必须处于联机状态。
cluster1::> volume show -state !online There are no entries matching your query.
-
验证是否没有不一致的卷:
volume show -is-inconsistent true
请参见知识库文章 "卷显示WAFL 不一致" 有关如何处理不一致的卷的信息。
验证系统时间
在还原ONTAP集群之前、您应验证是否已配置NTP、以及集群中的时间是否同步。
-
验证集群是否已与NTP服务器关联:
cluster time-service ntp server show
-
验证每个节点的日期和时间是否相同:
cluster date show
cluster1::> cluster date show Node Date Timezone --------- ------------------- ------------------------- node0 4/6/2013 20:54:38 GMT node1 4/6/2013 20:54:38 GMT node2 4/6/2013 20:54:38 GMT node3 4/6/2013 20:54:38 GMT 4 entries were displayed.
确认没有正在运行的作业
还原ONTAP集群之前、您应验证集群作业的状态。如果任何聚合、卷、NDMP (转储或还原)或Snapshot作业(例如创建、删除、移动、修改、复制和挂载作业)正在运行或已排队、则应允许这些作业成功完成或停止已排队的条目。
-
查看任何正在运行或已排队的聚合、卷或Snapshot作业的列表:
job show
在此示例中、有两个作业已排队:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 8629 Vol Reaper cluster1 - Queued Description: Vol Reaper Job 8630 Certificate Expiry Check cluster1 - Queued Description: Certificate Expiry Check
-
删除任何正在运行或已排队的聚合、卷或Snapshot副本作业:
job delete -id <job_id>
-
验证是否没有聚合、卷或Snapshot作业正在运行或已排队:
job show
在此示例中,已删除所有正在运行和已排队的作业:
cluster1::> job show Owning Job ID Name Vserver Node State ------ -------------------- ---------- -------------- ---------- 9944 SnapMirrorDaemon_7_2147484678 cluster1 node1 Dormant Description: Snapmirror Daemon for 7_2147484678 18377 SnapMirror Service Job cluster1 node0 Dormant Description: SnapMirror Service Job 2 entries were displayed