简体中文版经机器翻译而成，仅供参考。如与英语版出现任何冲突，应以英语版为准。

还原ONTAP集群之前要执行的系统验证

07/09/2026 贡献者

PDF

在还原ONTAP集群之前、您应验证集群运行状况、存储运行状况和系统时间。您还应验证集群上是否未运行任何作业。

验证集群运行状况

在还原ONTAP集群之前、您应验证节点是否运行状况良好、是否有资格加入集群、以及集群是否处于仲裁状态。

步骤

验证集群中的节点是否已联机且符合加入集群的条件：
```
cluster show
```
在此示例中、所有节点均运行状况良好、有资格加入集群。
```
cluster1::> cluster show
Node                  Health  Eligibility
--------------------- ------- ------------
node0                 true    true
node1                 true    true
```
如果任何节点运行状况不正常或不符合条件，请检查 EMS 日志中的错误并采取更正措施。
将权限级别设置为高级：
```
set -privilege advanced
```
输入 … y 以继续。

验证每个 RDB 进程的配置详细信息。

每个节点的关系数据库 epoch 和数据库 epochs 应匹配。

每个环仲裁主节点对于所有节点都应相同。

请注意，每个环可能具有不同的仲裁主节点。

要显示此 RDB 进程 … 输入此命令 …

要显示此 RDB 进程 …	输入此命令 …
管理应用程序	`cluster ring show -unitname mgmt`
卷位置数据库	`cluster ring show -unitname vldb`
虚拟接口管理器	`cluster ring show -unitname vifmgr`
SAN 管理守护进程	`cluster ring show -unitname bcomd`

管理应用程序

cluster ring show -unitname mgmt

卷位置数据库

cluster ring show -unitname vldb

虚拟接口管理器

cluster ring show -unitname vifmgr

SAN 管理守护进程

cluster ring show -unitname bcomd

此示例显示了卷位置数据库过程：

cluster1::*> cluster ring show -unitname vldb
Node      UnitName Epoch    DB Epoch DB Trnxs Master    Online
--------- -------- -------- -------- -------- --------- ---------
node0     vldb     154      154      14847    node0     master
node1     vldb     154      154      14847    node0     secondary
node2     vldb     154      154      14847    node0     secondary
node3     vldb     154      154      14847    node0     secondary
4 entries were displayed.

返回到管理权限级别：
```
set -privilege admin
```

如果您在 SAN 环境中运行，请验证每个节点是否处于 SAN 仲裁状态：

event log show  -severity informational -message-name scsiblade.*

每个节点的最新 scsiblade 事件消息应指示 SCSI 刀片处于仲裁状态。

cluster1::*> event log show  -severity informational -message-name scsiblade.*
Time             Node       Severity       Event
---------------  ---------- -------------- ---------------------------
MM/DD/YYYY TIME  node0      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...
MM/DD/YYYY TIME  node1      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...

验证存储运行状况

还原ONTAP集群之前、您应验证磁盘、聚合和卷的状态。

步骤

验证磁盘状态：

要检查 … 执行此操作 …

要检查 …	执行此操作 …
磁盘已损坏	显示任何损坏的磁盘： `storage disk show -state broken` 卸下或更换任何损坏的磁盘。
正在进行维护或重建的磁盘	显示处于维护，待定或重建状态的任何磁盘： `storage disk show -state maintenance`
pending	reconstructing ---- .. 等待维护或重建操作完成，然后再继续。

磁盘已损坏

显示任何损坏的磁盘：
```
storage disk show -state broken
```
卸下或更换任何损坏的磁盘。

正在进行维护或重建的磁盘

显示处于维护，待定或重建状态的任何磁盘：
```
storage disk show -state maintenance
```

pending

reconstructing ---- .. 等待维护或重建操作完成，然后再继续。

通过显示物理和逻辑存储(包括存储聚合)的状态来验证所有聚合是否均已联机：+
```
storage aggregate show -state !online
```
此命令将显示 not 联机的聚合。在执行重大升级或还原之前和之后，所有聚合都必须处于联机状态。
```
cluster1::> storage aggregate show -state !online
There are no entries matching your query.
```
通过显示任何 not 联机的卷来验证所有卷是否均已联机：
```
volume show -state !online
```
在执行重大升级或还原之前和之后，所有卷都必须处于联机状态。
```
cluster1::> volume show -state !online
There are no entries matching your query.
```
验证是否没有不一致的卷：
```
volume show -is-inconsistent true
```
查看"NetApp知识库：显示WAFL不一致的卷"如何解决不一致的问题。

验证系统时间

在还原ONTAP集群之前、您应验证是否已配置NTP、以及集群中的时间是否同步。

步骤

验证集群是否已与NTP服务器关联：
```
cluster time-service ntp server show
```

验证每个节点的日期和时间是否相同：

cluster date show

cluster1::> cluster date show
Node      Date                Timezone
--------- ------------------- -------------------------
node0     4/6/2013 20:54:38   GMT
node1     4/6/2013 20:54:38   GMT
node2     4/6/2013 20:54:38   GMT
node3     4/6/2013 20:54:38   GMT
4 entries were displayed.

确认没有正在运行的作业

还原ONTAP集群之前、您应验证集群作业的状态。如果任何聚合、卷、NDMP (转储或还原)或快照作业(例如创建、删除、移动、修改、复制和挂载作业)正在运行或已排队、则应允许这些作业成功完成或停止已排队的条目。

步骤

查看任何正在运行或已排队的聚合、卷或快照作业的列表：

job show

在此示例中、有两个作业已排队：

cluster1::> job show
                            Owning
Job ID Name                 Vserver    Node           State
------ -------------------- ---------- -------------- ----------
8629   Vol Reaper           cluster1   -              Queued
       Description: Vol Reaper Job
8630   Certificate Expiry Check
                            cluster1   -              Queued
       Description: Certificate Expiry Check

删除任何正在运行或已排队的聚合、卷或快照作业：
```
job delete -id <job_id>
```

验证是否没有聚合、卷或快照作业正在运行或已排队：

job show

在此示例中，已删除所有正在运行和已排队的作业：

cluster1::> job show
                            Owning
Job ID Name                 Vserver    Node           State
------ -------------------- ---------- -------------- ----------
9944   SnapMirrorDaemon_7_2147484678
                            cluster1   node1          Dormant
       Description: Snapmirror Daemon for 7_2147484678
18377  SnapMirror Service Job
                            cluster1   node0          Dormant
       Description: SnapMirror Service Job
2 entries were displayed

还原ONTAP集群之前要执行的系统验证

Creating your file...

验证集群运行状况

验证存储运行状况

验证系统时间

确认没有正在运行的作业