Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

还原ONTAP集群之前要执行的系统验证

贡献者

在还原ONTAP集群之前、您应验证集群运行状况、存储运行状况和系统时间。您还应验证集群上是否未运行任何作业。

验证集群运行状况

在还原ONTAP集群之前、您应验证节点是否运行状况良好、是否有资格加入集群、以及集群是否处于仲裁状态。

步骤
  1. 验证集群中的节点是否已联机且符合加入集群的条件:

    cluster show

    在此示例中、所有节点均运行状况良好、有资格加入集群。

    cluster1::> cluster show
    Node                  Health  Eligibility
    --------------------- ------- ------------
    node0                 true    true
    node1                 true    true

    如果任何节点运行状况不正常或不符合条件,请检查 EMS 日志中的错误并采取更正措施。

  2. 将权限级别设置为高级:

    set -privilege advanced

    输入 …​ y 以继续。

  3. 验证每个 RDB 进程的配置详细信息。

    • 每个节点的关系数据库 epoch 和数据库 epochs 应匹配。

    • 所有节点的每环仲裁主机都应相同。

      请注意,每个环可能具有不同的仲裁主环。

      要显示此 RDB 进程 …​ 输入此命令 …​

      管理应用程序

      cluster ring show -unitname mgmt

      卷位置数据库

      cluster ring show -unitname vldb

      虚拟接口管理器

      cluster ring show -unitname vifmgr

      SAN 管理守护进程

      cluster ring show -unitname bcomd

      此示例显示了卷位置数据库过程:

    cluster1::*> cluster ring show -unitname vldb
    Node      UnitName Epoch    DB Epoch DB Trnxs Master    Online
    --------- -------- -------- -------- -------- --------- ---------
    node0     vldb     154      154      14847    node0     master
    node1     vldb     154      154      14847    node0     secondary
    node2     vldb     154      154      14847    node0     secondary
    node3     vldb     154      154      14847    node0     secondary
    4 entries were displayed.
  4. 返回到管理权限级别:

    set -privilege admin
  5. 如果您在 SAN 环境中运行,请验证每个节点是否处于 SAN 仲裁状态:

    event log show  -severity informational -message-name scsiblade.*

    每个节点的最新 scsiblade 事件消息应指示 SCSI 刀片处于仲裁状态。

    cluster1::*> event log show  -severity informational -message-name scsiblade.*
    Time             Node       Severity       Event
    ---------------  ---------- -------------- ---------------------------
    MM/DD/YYYY TIME  node0      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...
    MM/DD/YYYY TIME  node1      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...
相关信息

"系统管理"

验证存储运行状况

还原ONTAP集群之前、您应验证磁盘、聚合和卷的状态。

步骤
  1. 验证磁盘状态:

    要检查 …​ 执行此操作 …​

    磁盘已损坏

    1. 显示任何损坏的磁盘:

      storage disk show -state broken
    2. 卸下或更换任何损坏的磁盘。

    正在进行维护或重建的磁盘

    1. 显示处于维护,待定或重建状态的任何磁盘:

      storage disk show -state maintenance

    pending

    reconstructing ---- .. 等待维护或重建操作完成,然后再继续。

  2. 通过显示物理和逻辑存储(包括存储聚合)的状态来验证所有聚合是否均已联机:+

    storage aggregate show -state !online

    此命令将显示 not 联机的聚合。在执行重大升级或还原之前和之后,所有聚合都必须处于联机状态。

    cluster1::> storage aggregate show -state !online
    There are no entries matching your query.
  3. 通过显示任何 not 联机的卷来验证所有卷是否均已联机:

    volume show -state !online

    在执行重大升级或还原之前和之后,所有卷都必须处于联机状态。

    cluster1::> volume show -state !online
    There are no entries matching your query.
  4. 验证是否没有不一致的卷:

    volume show -is-inconsistent true

    请参见知识库文章 "卷显示WAFL 不一致" 有关如何处理不一致的卷的信息。

验证系统时间

在还原ONTAP集群之前、您应验证是否已配置NTP、以及集群中的时间是否同步。

步骤
  1. 验证集群是否已与NTP服务器关联:

    cluster time-service ntp server show
  2. 验证每个节点的日期和时间是否相同:

    cluster date show
    cluster1::> cluster date show
    Node      Date                Timezone
    --------- ------------------- -------------------------
    node0     4/6/2013 20:54:38   GMT
    node1     4/6/2013 20:54:38   GMT
    node2     4/6/2013 20:54:38   GMT
    node3     4/6/2013 20:54:38   GMT
    4 entries were displayed.

确认没有正在运行的作业

还原ONTAP集群之前、您应验证集群作业的状态。如果任何聚合、卷、NDMP (转储或还原)或Snapshot作业(例如创建、删除、移动、修改、复制和挂载作业)正在运行或已排队、则应允许这些作业成功完成或停止已排队的条目。

步骤
  1. 查看任何正在运行或已排队的聚合、卷或Snapshot作业的列表:

    job show

    在此示例中、有两个作业已排队:

    cluster1::> job show
                                Owning
    Job ID Name                 Vserver    Node           State
    ------ -------------------- ---------- -------------- ----------
    8629   Vol Reaper           cluster1   -              Queued
           Description: Vol Reaper Job
    8630   Certificate Expiry Check
                                cluster1   -              Queued
           Description: Certificate Expiry Check
  2. 删除任何正在运行或已排队的聚合、卷或Snapshot副本作业:

    job delete -id <job_id>
  3. 验证是否没有聚合、卷或Snapshot作业正在运行或已排队:

    job show

    在此示例中,已删除所有正在运行和已排队的作业:

    cluster1::> job show
                                Owning
    Job ID Name                 Vserver    Node           State
    ------ -------------------- ---------- -------------- ----------
    9944   SnapMirrorDaemon_7_2147484678
                                cluster1   node1          Dormant
           Description: Snapmirror Daemon for 7_2147484678
    18377  SnapMirror Service Job
                                cluster1   node0          Dormant
           Description: SnapMirror Service Job
    2 entries were displayed